본문 바로가기

【1】Deep Learning 시작하기/머신러닝의 종류

지도학습(Supervised Learning)

머신러닝의 종류는 다양한 기준으로 나눌 수 있는데 그중 학습하는 방식과 사용하는 데이터에 의해 다음의 4가지로 구분 가능하다. 

 

   ·  지도학습

   ·  비지도학습

   ·  반지도학습

   ·  강화학습 

 

이렇게 분류가 가능한 것은 학습 목적이 달라 그로 인해 학습 방식에도 차이가 있기 때문이다. 학습 방식이 다르니 학습에 사용되는 데이터의 형태에도 차이가 있어 이러한 특징을 이용해 종류를 나눌 수 있는 것이다. 이제 지도학습부터 하나씩 다뤄보도록 하겠다. 여러분은 각 학습 마다 데이터, 방식, 목적이라는 세가지 키워드에 초점을 맞추어 따라오기 바란다. 

 

 

"지도학습(Supervised Learning)"

 

지도학습은 말그대로 학습과정을 지도하는 것이다. 그러므로 학습 데이터에는x x에 대한 라벨인  y가 함께 있으며 컴퓨터는 x1y1, x2y2 라고 알려주는 지도자의 도움을 받아 학습이 이루어진다. 학습을 통해 컴퓨터는 x y의 관계를 파악하는데 이를 이용해 학습에 등장하지 않은 새로운 입력 데이터에 대해 예측을 할 수 있는 것이다.

 

이때 데이터 y에 따라 지도 학습의 목적은 크게 두가지로 나눌 수 있다. 위 그림에서와 같이 y데이터의 형태가 10, 20, 30 처럼 연속적인 값(real number)의 형태를 생각해보자. 학습이 잘 되었다면 낯선 데이터 4가 입력으로 들어왔을 때 예측 값 40을 반환할 것이다. 이러한 사용 목적을 회귀(Regression)라고 한다. 

 

두 번째로는 y 데이터의 형태가 범주형 값(categorical number) 인 경우를 생각해 볼 수 있다. 강아지와 고양이 사진을 분류하는 상황을 생각해보면 y 값은 강아지이다(0), 고양이이다(1)의 두가지 값 만을 가질 것이다. 이를 통해 새로운 사진을 입력 받으면 1과 0 으로 이 사진이 강아지인지 고양이인지 판단할 것이다. 이러한 과정을 분류(Classification)라고 한다. 


정리해보면 지도학습은 데이터에 x, y 값이 존재하며 y 의 형태에 따라 값을 예측하거나 분류를 할 수 있는 학습 방법이다.

 

 

 

 

 

 

 


작성자 홍다혜 ghdek11@gmail.com / 이원재 wonway333@gmail.com