Supervised learning

이미 분류되어 레이블이 달려있는 training set 을 통해 학습하는 방법

ex

  • 이미지 라벨링: 태그된 이미지를 training set으로 학습한다.
  • 스팸 필터 : 스팸메일과 스팸메일이 아닌것으로 분류된 training set을 학습한다.
  • 시험점수 예상 : 시험공부 시간과 시험점수를 매칭한 training set을 학습한다.

Training data set

Supervised learning 방법은 feature와 value가 담겨있는 레이블(Training data set)을 학습해서 모델을 생성한다.

ex

AlphaGo

레이블의 예시

X Y
1,2,3 1

생성한 모델과 동작 방식

위와 같은 레이블을 학습해서 만든 모델에 X의 값으로 [1,2,3] 을 넘겨주면 Y 값으로 1이라는 결과를 반환한다.

Y = f(X)

Supervised learning 의 종류

regression

범위 안에 속한 값을 예측하는 방법
ex) 시험점수 예상

hours score
10 90
9 80
3 50
2 30

위의 레이블을 학습했을때 regression 모델이 생성되고 hours 값으로 7을 줬을때 75라는 score 를 예측해 반환한다.

binary classification

레이블을 통해 이분법(yes or no)으로 값을 예측하는 방법
ex) 패스, 논패스

hours pass/fail
10 P
9 P
3 F
2 F

위의 레이블을 학습했을때 binary classification 모델이 생성되고 hours 값으로 10을 줬을때 P 라는 결과를 예측해 반환한다.

multi-label classification

여러 레이블을 대상으로 예측해보고 매칭된 레이블과 연결된 값을 예측결과로 하는 방법
ex) 학점 예상 A, B, C, E, F. 각 학점마다 레이블이 있다.

hours grade
10 A
9 B
3 D
2 F

위의 레이블을 학습했을때 multi-label classification 모델이 생성되고 hours 값으로 9를 줬을때 B라는 결과를 예측해 반환한다.

Unsupervised learning

일일이 분류해서 레이블을 달아줄 수 없을때 데이터를 보고 자동으로 유사한 것들을 분류하는 학습 방법

+ Recent posts