혼자 공부하는 머신러닝 + 딥러닝 - 트레이닝 셋과 테스트 셋
머신러닝 알고리즘은 크게 지도 학습과 비지도 학습으로 나눌 수 있다. 지도 학습 알고리즘은 훈련하기 위한 데이터 셋과 정답이 필요하다. 데이터 셋을 입력, 정답을 타깃 이라고 하며 이 둘을 합쳐 훈련 데이터라고 한다. 비지도 학습 알고리즘은 타깃 없이 입력 데이터만 사용한다. 이전에 k-최근접 이웃 알고리즘은 지도 학습 알고리즘이다. 쉽게 얘기해서, 평가에 사용하는 데이터를 테스트 셋, 훈련에 사용되는 데이터를 트레이닝 셋이라고 부른다. 훈련에 사용한 데이터로 모델을 평가하는 것은 옳지 않다. 즉, 훈련에 사용하지 않은 데이터로 평가 해야한다. 훈련 데이터에서 일부를 떼어 내어 테스트 셋으로 사용한다. fish_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, ..
2022. 3. 7.
혼자 공부하는 머신러닝 + 딥러닝 - 마켓과 머신러닝
생선 이름을 자동으로 알려주는 머신 러닝을 간단히 만들어보자. 도미 그룹의 길이와 무게, 빙어 그룹의 길이와 무게를 각각 생성한다. bream_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0, 31.5, 32.0, 32.0, 32.0, 33.0, 33.0, 33.5, 33.5, 34.0, 34.0, 34.5, 35.0, 35.0, 35.0, 35.0, 36.0, 36.0, 37.0, 38.5, 38.5, 39.5, 41.0, 41.0] bream_weight = [242.0, 290.0, 340.0, 363.0, 430.0, 450.0, 500.0, 390.0, 450.0, 500.0, 475.0, 500.0..
2022. 3. 7.