그럴 수도 있지

발전의 의지/R프로그래밍 4

연속형 변수 계급으로 나누고 분할표 그리기 20180320

이제 for문 안쓰고 계급 나누고 분할표도 그림 r에서 for문쓰면 바보래 기록용으로 스크립트랑 결과물 좀 남겨봄 3d 그래프로 보여주고 싶은데 용지에 인쇄하기 힘들고 색깔도 좋은거 같아서 걍 엑셀로 색 입힘 지교방 인턴의 심화과정 정도라고 생각 졸작하기 싫다 결과가 별로야 datacc$differ_us_vol

민구형의 분류 알고리즘 20180202

# 서론 그냥 해보고 싶어짐 자주 다루던 iris로 하니까 따라할 수 있을 거 같아짐 # 데이터 탐색 및 시각화 summary(iris)를 통해 데이터를 살펴보고 plot()을 활용해 그림도 그려본다 library(caret) featurePlot(iris[,1:4], iris$Species, "ellpse") 집단 별로 구분 잘시켜주니까 이 함수를 사용하여 시각화하는게 좋지 # 전처리 cbind(as.data.frame(scale(iris[1:4])),iris$Species) 데이터를 정규화 시키고 정규화 과정에서 종이 빠졌으니 cbind 해준다 - PCA 차원감소 너무 feature가 많아서 계산이 힘드니까 어느 것이 분산을 많이 설명해주는지 뽑아야함 근데 나 방금 밥 먹고 기사 신청함 ㅋ 우리는 할..

시간-속도 사고율 표 검토 20180131

# 서론 저번 주에 만들어놓은 표에서 정말로 저 속도, 시간대에 졸음사고 확률이 높은지 아니면 걍 교통량이 많은 건지를 확인해볼 필요를 느낌 표는 사고건수/해당 속성의 콘존 수 집에서 뚝딱해서 만든 표인데 딱히 뭐가 위험한 수준인지 몰라서 내가 결정한 5% 이상의 시간-속도를 골랐다. 이는 아래와 같다. 50km/h - 10시, 11시, 13시 70km/h - 12시 90km/h - 1시, 2시 120km/h - 5시 위에 해당하는 졸음사고 row를 뽑아 특성을 한번 보고 교통량을 어떻게 적용할지 생각해보자. # R에 raw 데이터 불러오기 이거 개쉬움 install.packages("readxl") library(readxl) rawdata%filter(속도==70, 시간==12), wantdata%>..

plot()을 활용한 콘존별 속도, 교통량 산점도 20180130

# 서론 우선 가성비가 좋은 'R을 이용한 데이터 분석 실무' 책을 이용하였다. 이는 놀랍게도 저자가 공짜로 뿌린 책이라 무료로 PDF를 다운받을 수 있다. 가성비가 좋다. http://r4pda.co.kr R을 이용한 데이터 분석 실무 저자 서민구( http://mkseo.pe.kr/ ) 도서 소개 이 책은 소프트웨어 개발의 측면에 집중하여 R프로그래밍을 설명했다. 기본적인 프로그래밍 방법부터, 통계, 선형회귀, 그래픽, 기계학습, 문서 분류 등의 주제를 다루고 있다. R사용자의 입장에서 가장 필요한 데이터 조작의 측면에 많은 분량을 할애하였고 가능한 코드가 독립적이게하고 결과를 항상 제시하여 읽는 것 만으로도 쉽게 이해할 수 있도록 저술하였다. 도서 다운로드(무료) R을 이용한 데이터 처리&분석 실무..