혼자 공부하는 판다스 - 데이터 사전처리(정규화, 시계열 데이터)
정규화 각 변수에 들어 있는 숫자 데이터의 상대적 크기 차이 때문에 분석 결과가 달라질 수 있다. 그렇기 때문에 숫자 데이터의 상대적 크기 차이를 제거할 필요가 있는데, 각 열에 속하는 데이터 값을 동일한 크기 기준으로 나눈 비율로 나타내는 것을 정규화라고 한다. 정규화 과정을 거치게 되면, 데이터의 범위는 0~1 또는 -1 ~ 1이 된다. df = pd.read_csv('/content/drive/MyDrive/part5/auto-mpg.csv', header=None) df.columns = ['mpg','cylinders','displacement','horsepower','weight', 'acceleration', 'model_year','origin','name'] df['horsepower'..
2022. 4. 22.