Supervised learning
이미 분류되어 레이블이 달려있는 training set 을 통해 학습하는 방법
ex
- 이미지 라벨링: 태그된 이미지를 training set으로 학습한다.
- 스팸 필터 : 스팸메일과 스팸메일이 아닌것으로 분류된 training set을 학습한다.
- 시험점수 예상 : 시험공부 시간과 시험점수를 매칭한 training set을 학습한다.
Training data set
Supervised learning 방법은 feature와 value가 담겨있는 레이블
(Training data set)을 학습해서 모델을 생성한다.
ex
AlphaGo
레이블의 예시
X | Y |
---|---|
1,2,3 | 1 |
생성한 모델과 동작 방식
위와 같은 레이블을 학습해서 만든 모델에 X의 값으로 [1,2,3] 을 넘겨주면 Y 값으로 1이라는 결과를 반환한다.
Y = f(X)
Supervised learning 의 종류
regression
범위 안에 속한 값을 예측하는 방법
ex) 시험점수 예상
hours | score |
---|---|
10 | 90 |
9 | 80 |
3 | 50 |
2 | 30 |
위의 레이블을 학습했을때 regression 모델이 생성되고 hours 값으로 7을 줬을때 75라는 score 를 예측해 반환한다.
binary classification
레이블을 통해 이분법(yes or no)으로 값을 예측하는 방법
ex) 패스, 논패스
hours | pass/fail |
---|---|
10 | P |
9 | P |
3 | F |
2 | F |
위의 레이블을 학습했을때 binary classification 모델이 생성되고 hours 값으로 10을 줬을때 P 라는 결과를 예측해 반환한다.
multi-label classification
여러 레이블을 대상으로 예측해보고 매칭된 레이블과 연결된 값을 예측결과로 하는 방법
ex) 학점 예상 A, B, C, E, F. 각 학점마다 레이블이 있다.
hours | grade |
---|---|
10 | A |
9 | B |
3 | D |
2 | F |
위의 레이블을 학습했을때 multi-label classification 모델이 생성되고 hours 값으로 9를 줬을때 B라는 결과를 예측해 반환한다.
Unsupervised learning
일일이 분류해서 레이블을 달아줄 수 없을때 데이터를 보고 자동으로 유사한 것들을 분류하는 학습 방법