강화학습은 앞서 소개한 세 종류의 학습과는 조금 다른 개념으로 컴퓨터의 동작이 적절한지에 대해 피드백이 있는 학습 방법을 말한다. 학습하는 컴퓨터를 에이전트라고 하며 에이전트가 어떠한 환경(environment) 안에서 하나의 행동(action)을 했을 때 옳다면 보상을(reward), 잘못되었다면 벌점(penalty)을 부여한다. 즉, 특정 환경에서 에이전트가 가장 많은 보상을 받기 위해 어떻게 행동해야 하는지 강조하는 것이다. 강화학습은 입력과 출력에 대한 데이터 쌍을 필요로 하지 않으며 차선의 행동도 허용하지 않는 특징이 있다.
강화학습에 대한 설명은 이정도로 끝내겠다. 강화학습에 대해 자세히 알고 싶은 독자는 서튼 교수의 [Reinforcement Learning]의 책을 참고하기 바란다.
작성자 홍다혜 ghdek11@gmail.com / 이원재 wonway333@gmail.com
'【1】Deep Learning 시작하기 > 머신러닝의 종류' 카테고리의 다른 글
반지도학습 (Semi-Supervised Learning) (0) | 2020.01.29 |
---|---|
비지도학습 (Unsupervised Learning) (0) | 2020.01.28 |
지도학습(Supervised Learning) (0) | 2020.01.21 |