본문 바로가기
- 배움이 있는 삶/- Software

[Python] - Pandas 함수를 이용한 머신러닝 알고리즘 연습

by story of interesting 2020. 3. 6.
반응형

 

Error - 파일을 읽어 들이기 위해서 pd.read_excel('xxx.xlsx') 를 사용하나, --> excle 파일을 인식하지 못하는 error 가 발생함.

--> 원인은 파이선 오류 로 guessing 하고 있으나, 아직 정확하진 않음

- 해결방법 : excel을 csv 파일로 변화하여 --> pd.read_csv('xxx.csv') 로 read 하여 사용 함.

 

--- 아래는 타이타닉 database를 이용하여, csv 파일을 read 한 후 pie 챠트를 만들어 본 것임 ---- 

 

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

sns.set()

train = pd.read_csv('Data-Titanic_csv.csv')
test = pd.read_csv('Data-Titanic_csv.csv')

# print(train.head())

print('train data shape: ', train.shape)
print('--------------- information --------------')
print(train.info())


def pie_chart(feature):
feature_ration = train[feature].value_counts(sort=False)
feature_size = feature_ration.size
feature_index = feature_ration.index
survived = train[train["Survived"] == 1][feature].value_counts()
dead = train[train["Survived"] == 0][feature].value_counts()

plt.plot(aspect='auto')
plt.pie(feature_ration, labels=feature_index, autopct='%1.1f%%')
plt.title(feature + '\'s ration in total')
plt.show()

pie_chart('Sex')

반응형