전체 글38 혼자 공부하는 판다스 - 머신러닝 (KNN, SVM) 분류 알고리즘은 예측하려는 대상의 속성(설명 변수)을 입력 받고, 목표 변수가 갖고 있는 카테고리(범주형) 값 중에서 어느 한 값으로 분류하여 예측한다. 훈련 데이터에 목표 변수 값(0 또는 1)을 함께 입력하므로 지도 학습 유형에 속한다. KNN K-Nearest-Neighbors로 k개의 가까운 이웃이라는 뜻이다. 새로운 관측값이 주어지면 기존 데이터에서 가장 속성이 비슷한 k개의 이웃을 먼저 찾고, 가까운 이웃들이 갖고 있는 목표 값과 같은 값으로 분류하여 예측하는 것이다. import pandas as pd import seaborn as sns df = sns.load_dataset('titanic') print(df.head()) print('\n') pd.set_option('display... 2022. 4. 29. 혼자 공부하는 판다스 - 머신러닝 데이터 분석 (머신러닝 개요, 회귀분석) 머신러닝 개요 머신러닝이란 기계 스스로 데이터를 학습하여 서로 다른 변수 간의 관계를 찾아 나가는 과정 머신러닝은 크게 두가지 유형으로 분류된다. 지도 학습은 정답 데이터를 다른 데이터와 함께 컴퓨터 알고리즘에 입력하는 방식이다 반면 비지도 학습은 정답 데이터 없이 컴퓨터 알고리즘 스스로 데이터로부터 숨은 패턴을 찾아내는 방식이다. 지도학습의 대표적인 방법은 회귀분석, 분류 모형이 있고 비지도학습에는 군집 분석이 있다. 머신러닝의 프로세스는 다음과 같다. 1. 컴퓨터 알고리즘이 이해할 수 있는 형태로 데이터를 변환하는 작업을 진행 2. 여러 속성 간의 관계를 분석하여 결과를 예측하는 모형을 학습을 통해 찾는다. 3. 검증 과정을 통해 학습을 마친 모형의 예측 능력을 평가하고, 평가 결과를 바탕으로 최종모.. 2022. 4. 29. 혼자 공부하는 머신러닝 + 딥러닝 - 합성곱 신경망의 시각화 가중치 시각화 각 필터는 커널이라 부르는 가중치와 절편을 가지고 있다. 절편은 시각적으로 의미가 있지 않다. 가중치는 입력 이미지의 2차원 영역에 적용되어 어떤 특징을 크게 두드러지게 표현하는 역할을 한다. 이전 글에서 만든 모델이 어떤 가중치를 학습했는지 확인하고자 체크포인트 파일로 읽어오자. from tensorflow import keras model = keras.models.load_model('best-cnn-model.h5') 케라스 모델에 추가한 층은 layers 속성에 저장되어 있다. model.layers [, , , , , , , ] 보다시피 layers는 파이썬 리스트 속성이다. 첫 번째 합성곱 층의 가중치를 알아보자. 가중치와 절편은 층의 weights 속성에 저장되어 있다. we.. 2022. 4. 27. 혼자 공부하는 머신러닝 + 딥러닝 - 합성곱 신경망을 사용한 이미지 분류 이전 글에서 합성곱 신경망에 등장하는 개념들을 살펴보았다면, 이번 글에서는 이를 적용해 이미지를 분류하는 것을 진행하고자 한다. 패션 MNIST 데이터 불러오기 데이터를 불러오는 과정이 기존의 연결 신경망하고는 약간 다르다. 완전 연결 신경망에서는 이미지를 일렬로 펼쳐야하기 때문에 reshape() 메서드를 사용하거나 Flatten 클래스를 사용했다. 그렇지만, 합성곱 신경망에서는 2차원 이미지를 그대로 사용한다. 그런데 합성곱 신경망에서는 크기에 깊이라는 차원이 더해진 3차원 배열임을 상기해야한다. 기존의 2차원 배열에 차원을 추가하기 위해 reshape() 메서드를 사용하면 되는데 전체 배열 차원을 그대로 유지하면서 마지막에 차원을 추가해보도록 하자. from tensorflow import kera.. 2022. 4. 27. 이전 1 2 3 4 5 ··· 10 다음