정의
머신러닝 즉 ML(Machine learning)은 학습하는 방법을 이해하고 구축하며, 데이터를 활용하여 성능을 향상시키는 분야이다.
역사
기계 학습이라는 용어는 1959년 IBM 직원이자 컴퓨터 게임 및 인공 지능 분야의 선구자인 Arthur Samuel에 의해 만들어졌다. 자가 학습 컴퓨터라는 동의어도 이 기간에 사용되었다.
1960년대 초에 Raytheon Company는 천공 테이프 메모리를 사용하는 실험적인 "학습 기계"인 CyberTron을 개발하여 기본적인 강화 학습을 사용하여 소나 신호, 심전도 및 음성 패턴을 분석했다. 인간 운영자/교사가 반복적으로 "훈련"하여 패턴을 인식하고 잘못된 결정을 재평가하도록 "멍청이" 버튼을 장착했다. 1960년대 머신러닝 연구의 대표적인 저서는 Nilsson의 Learning Machines에 관한 저서로 주로 패턴 분류를 위한 머신러닝을 다루고 있다. 패턴 인식과 관련된 관심은 1973년 Duda와 Hart가 설명한 것처럼 1970년대까지 계속되었다. 1981년에 신경망이 컴퓨터 단말기에서 40개의 문자(26개의 문자, 10개의 숫자 및 4개의 특수 기호)를 인식하는 방법을 학습하도록 교육 전략을 사용하는 것에 대한 보고서가 제공되었다.
Tom M. Mitchell은 기계 학습 분야에서 연구된 알고리즘에 대해 널리 인용되고 보다 공식적인 정의를 제공했다. P로 측정한 T의 경우 경험 E와 함께 개선된다. 기계 학습과 관련된 작업에 대한 이러한 정의는 인지적 용어로 필드를 정의하기보다는 근본적으로 조작적인 정의를 제공한다. 이것은 Alan Turing이 그의 논문 "Computing Machinery and Intelligence"에서 "기계가 생각할 수 있는가?"라는 질문에 대한 제안을 따르는 것이다. "기계가 우리(생각하는 실체로서)가 할 수 있는 일을 할 수 있습니까?"라는 질문으로 대체된다.
현대 기계 학습에는 두 가지 목표가 있다. 하나는 개발된 모델을 기반으로 데이터를 분류하는 것이고 다른 하나는 이러한 모델을 기반으로 미래 결과를 예측하는 것이다. 데이터 분류에 특정한 가상 알고리즘은 암성 두더지를 분류하도록 훈련시키기 위해 지도 학습과 결합된 두더지의 컴퓨터 비전을 사용할 수 있다. 주식 거래를 위한 기계 학습 알고리즘은 거래자에게 미래의 잠재적인 예측을 알려줄 수 있다.
종류
1.
지도학습 (supervised learning): 선생님이 문제를 내고 그 다음 바로 정답까지 같이 알려주는 방식의 학습 방법이다. 즉, 여러 문제와 답을 같이 학습함으로써 미지의 문제에 대한 올바른 답을 예측하고자 하는 방법이다.
2.
비지도 학습 (unsupervised learning): 문제는 알려주되 정답까지는 알려주지 않는 학습 방식이다. 즉, 여러 문제를 학습함으로써 해당 데이터의 패턴, 특성 및 구조를 스스로 파악하여, 이를 통해 새로운 데이터에서 일정한 규칙성을 찾는 방법이다.
3.
강화학습 (reinforcement learning): 강화 학습은 어떤 환경 안에서 정의된 주체(agent)가 현재의 상태(state)를 관찰하여 선택할 수 있는 행동(action)들 중에서 가장 최대의 보상(reward)을 가져다주는지 행동이 무엇인지를 학습하는 것이다.
세부분야
•
컴퓨터 비전: 컴퓨터를 통해 이미지, 비디오 및 기타 입력에서 정보를 추출할 수 있도록 하는 인공지능(AI)의 한 분야
•
자연어처리: 컴퓨터가 인간의 언어를 이해, 생성, 조작할 수 있도록 해주는 인공 지능(AI)의 한 분야