머신러닝의 기본 용어와 개념.
머신 러닝은 일종의 프로그램이라고 할 수 있다. 기존의 프로그래밍 방법에서는 케이스 하나하나의 조건을 다 주고 처리한다. 하지만 스팸 필터나 자율 주행 자동차와 같은 경우 수많은 케이스들이 있을 것이기 때문에 하나하나 프로그래밍 해주기는 무리가 있다. 그래서 프로그램에 그런 경우들을 학습 시켜서 처리하도록 하기 위해 머신 러닝이 나타났다.
Supervised : 정해져 있는 데이터. Training set을 가지고 학습을 하는 형태이다. 예를 들면 고양이 사진들, 개 사진들 이런걸 "cat" 또는 "dog" 이런 label을 가지고 있는 이미지들로 학습을 시키는 경우 Supervised Learning 이라 할 수 있다.
Unsupervised : label을 다 정하기 어려운 데이터. 예를 들면 구글이 비슷한 뉴스들을 찾아 그룹화했던 서비스나 비슷한 단어들을 찾는 경우에 해당한다. label을 직접 만들어 주는 게 아니라 데이터를 보고 스스로 학습한다.
X | Y |
---|---|
3, 6, 9 | 3 |
2, 5, 7 | 2 |
2, 3, 5 | 1 |