기본 용어와 개념

머신러닝의 기본 용어와 개념.

  1. 머신 러닝은 무엇인가?

    머신 러닝은 일종의 프로그램이라고 할 수 있다. 기존의 프로그래밍 방법에서는 케이스 하나하나의 조건을 다 주고 처리한다. 하지만 스팸 필터나 자율 주행 자동차와 같은 경우 수많은 케이스들이 있을 것이기 때문에 하나하나 프로그래밍 해주기는 무리가 있다. 그래서 프로그램에 그런 경우들을 학습 시켜서 처리하도록 하기 위해 머신 러닝이 나타났다.

  2. Supervised / Unsupervised learning - 학습 방법에 따른 분류

    Supervised : 정해져 있는 데이터. Training set을 가지고 학습을 하는 형태이다. 예를 들면 고양이 사진들, 개 사진들 이런걸 "cat" 또는 "dog" 이런 label을 가지고 있는 이미지들로 학습을 시키는 경우 Supervised Learning 이라 할 수 있다.
    Unsupervised : label을 다 정하기 어려운 데이터. 예를 들면 구글이 비슷한 뉴스들을 찾아 그룹화했던 서비스나 비슷한 단어들을 찾는 경우에 해당한다. label을 직접 만들어 주는 게 아니라 데이터를 보고 스스로 학습한다.

  3. Supervised learning 상세설명
    • 이미지 라벨링
    • 이메일 스팸 필터
    • 시험 성적과 공부시간 데이터에 따른 시험 성적 예측
  4. Training Data set 어떤 조건들(X)에 대한 결과(Y)를 표시한다. Y 값이 우리가 추측하고자 하는 데이터이다.
X Y
3, 6, 9 3
2, 5, 7 2
2, 3, 5 1
5. Supervised learning 의 종류
  • regression : 공부한 시간에 따른 시험 점수를 예측하는 경우처럼 범위(ex. 시험점수 0~100)로 예측하는 경우
  • binary classification : 공부한 시간에 따른 시험 점수를 pass / non-pass 와 같이 예측할 경우
  • multi-label classification : 공부한 시간에 따른 시험 점수를 A, B, C, D, F 와 같이 예측할 경우

results for ""

    No results matching ""