plot()을 활용한 콘존별 속도, 교통량 산점도 20180130
# 서론
우선 가성비가 좋은 'R을 이용한 데이터 분석 실무' 책을 이용하였다.
이는 놀랍게도 저자가 공짜로 뿌린 책이라 무료로 PDF를 다운받을 수 있다.
가성비가 좋다.
http://r4pda.co.kr
R을 이용한 데이터 분석 실무
저자 서민구( http://mkseo.pe.kr/ ) 도서 소개 이 책은 소프트웨어 개발의 측면에 집중하여 R프로그래밍을 설명했다. 기본적인 프로그래밍 방법부터, 통계, 선형회귀, 그래픽, 기계학습, 문서 분류 등의 주제를 다루고 있다. R사용자의 입장에서 가장 필요한 데이터 조작의 측면에 많은 분량을 할애하였고 가능한 코드가 독립적이게하고 결과를 항상 제시하여 읽는 것 만으로도 쉽게 이해할 수 있도록 저술하였다. 도서 다운로드(무료) R을 이용한 데이터 처리&분석 실무(구입) 저작권 고지 : 이 책은 무료로 인터넷에 공개됩
r4pda.co.kr
죄송해요 민구형 주소 올렸어요 열심히 공부하겠습니다.
# plot()
plot(x,y)을 하면 놀랍게도 적절한 형태의 그래프를 그려준다.
R 프로그래밍 또한 공짜이기 때문에 굉장히 가성비가 좋다고 할 수 있다.
후에 내 블로그를 크롤링한다면 가성비라는 단어가 제일 많이 나올 것이라 판단된다.
민구형님께서는 cars 패키지의 데이터를 사용하였지만
나는 콘존별 시간교통량, 속도 데이터를 활용하여 plot을 과감하게 도전하였고 결과는 아래와 같다.
간단한 구성요소로는 xlab= x축이름, xlim= x축 범위, cex= 점 크기, pch="" 점형태 되시겠다.
넘모 간단한 과정이지만 그래프의 개형을 본다는 것이 정말 재미있다.
# 그래프 위에 낙서
이미 그려진 그래프 위에 낙서를 하는 방법으로는 points(),lines()가 되겠다.
이를 활용한 방법으로는 line(lowess(data))를 통해 회귀직선을 위에 그릴수 있으며
abline(mean(),lty=2,col="")을 통해 점선으로 해당 축 평균값을 그릴 수 있다.
이 과정에서 민구형님께서 x의 mean과 y의 mean이 만나는 점을 지나지 않으면 회귀직선이 아니라고
하셨는 데 이는 굉장히 재밌었고 수리통계학을 왜 2학기로 배우는지 알 것 같다.
그리고 q-u그래프위에 회귀 직선을 꽂으려 했지만 거절당해서 고민을 해봐야할 것 같다.
Error in lowess(k$교통량, k$속도) :
'delta'는 반드시 유한해야 하고 0 보다 커야 합니다
# jitter()
민9형님께서는 산점도를 통해 그릴경우 이산형 데이터 특히 자연수 값을 가지는 경우 겹치는 게 많아
많이 존재해도 1개로 보일 때가 있을 것이라 했다.
민9형님의 말을 생각해보니 오늘 교수님께서 말씀하신 분포도에 유용한 것 같아 기억하기로 했다.
이는 민9형님과 같게 Ozone data를 사용했으며 가르침을 그대로 실천하였다.
이를 통해 얼마나 많은 점이 찍히는지 알 수 있게 되었다.
# type=""
그라프를 그리기 전에 점이 찍고 싶은 변태적인 상황이 올 경우
당황하지 않고 plot() 안에 type="n" 을 때려박자. 이건 그냥 적어봤다.
# par(mfrow=c(,))
이거 나도 잘 모름 걍 mfrow 로 그래프 여러개 그릴 수 있는거 암
또한 par()로 다시 먹여주면 애가 원상복귀됨 ㅅㄱ
# 앞으로 할 내용
1. 전체 사고 위에 졸음사고만 platter
2. 전체 사고 위에 차-차, 차-시설 사고 platter
3. 속도-시간 표에서 높은 확률 가지는 곳 분석
+ 교통량과 속도를 합치면서 시간과 사고를 나타낼 수 있는 방법 생각
ㄱH 허접이라 반박시 수용 가능