그럴 수도 있지

발전의 의지/파이썬

해볼만한 것

OnlyMyStuff 2024. 8. 13. 19:29

1. 화물차가 많다고 경제가 좋은 걸까?

 

화물차 비율과 상관관계가 있을까?

경제가 좋다는 것은 어떤 지수로 보면 좋을까?

주가?

 

- 경제 지표 여러개를 kosis에서 제공해줘서 다 넣어서 비교함

- 크게 화물차 교통량과 비율을 봤음

- 상관계수의 절대값이 0.65 이상인 경우만 확인해보니 눈에 띄는건 건설업 비율과 교통량이 유의해보임

- pairplot은 아래와 같음

- 각지표가 뭘 의미하는지 모르며, 경제 지표 간 관계가 있을터인데 이를 고려하지 않아 그냥 재미로 해본 것

- 경제지표가 90개가 넘어서 다 보기 힘듦

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np
import matplotlib.font_manager as fm


traffic = pd.read_csv(r"C:\python\cargo_economy\traffic.csv", encoding='cp949')
traffic = traffic[['시점','차종구분(1)','교통량','구성비']].set_index('시점')
traffic.columns = ['type','volume','ratio']
index = pd.read_csv(r"C:\python\cargo_economy\index.csv",encoding='cp949')
index= index.set_index('시점')

df_data = pd.merge(traffic,index,how='outer',left_index=True,right_index=True)
df_data_truck = df_data[df_data['type']=='화물차'].iloc[:,1:]


#%%

for i in np.arange(0,1,0.05):
    corr_mat = df_data_truck.corr()
    corr_mat = corr_mat[(corr_mat.abs() >= i) & (corr_mat != 1.0)]
    
    melted_corr = corr_mat.reset_index().melt(id_vars='index',var_name='var',value_name='corr').dropna()
    melted_corr= melted_corr[melted_corr['var'].isin(['volume','ratio'])]
    
    col_list = melted_corr['index'].unique().tolist()
    print(i)
    print(len(col_list))
    
    # 0.55 : 18, 0.60 : 8, 0.65 : 3
    
corr_mat = df_data_truck.corr()
corr_mat = corr_mat[(corr_mat.abs() >= 0.65) & (corr_mat != 1.0)]
    
melted_corr = corr_mat.reset_index().melt(id_vars='index',var_name='var',value_name='corr').dropna()
melted_corr= melted_corr[melted_corr['var'].isin(['volume','ratio'])]
    
col_list = melted_corr['index'].unique().tolist()

    
col_list = col_list+['volume','ratio']

df_data_truck_target = df_data_truck[col_list]

#%%

corr_mat = df_data_truck_target.corr()

font_path = r"C:\Users\Administrator\AppData\Local\Microsoft\Windows\Fonts\malgunsl.ttf"
fontprop = fm.FontProperties(fname=font_path)

plt.rc('font',family=fontprop.get_name())

plt.figure(figsize=(15,15))
plt.title('Corr Mat')

sns.heatmap(corr_mat, annot=True, cmap='coolwarm', fmt='.2f')


#%%

font_path = r"C:\Users\Administrator\AppData\Local\Microsoft\Windows\Fonts\malgunsl.ttf"
fontprop = fm.FontProperties(fname=font_path)

plt.rc('font',family=fontprop.get_name())

plt.figure(figsize=(30,30))
plt.title('Corr Mat')

sns.pairplot(df_data_truck_target, kind='hist')
plt.show()

 

2. 휴게소 데이터로 터미널 폐업을 예측할 수 있을까?

 

로지스틱 회귀모형으로 각 피쳐의 영향을 알 수 있을까?

'발전의 의지 > 파이썬' 카테고리의 다른 글

SUMO 맛보기(2)  (0) 2025.01.10
SUMO 맛보기  (0) 2025.01.09
stackplot  (0) 2024.06.19
청렴소통포탈 워드클라우드  (0) 2024.01.08
교통사고 등급 클러스터링  (1) 2023.12.21