본문 바로가기

ComputerScience/Pattern Recognition

패턴인식 - 1. Introduction

728x90

1. 패턴인식?

- 사람의 학습, 추리/추론 능력을 컴퓨터로 구현해 내는 것이 인공지능 분야이다.

- 패턴인식은 그중 특히 어떤 대상을 인식하는 문제를 주로 다루는 분야이다.

- 즉 학습을 통해 패턴(형태, 양식 또는 유형)을 인식하고 그 내용을 가지고 추리/추론하는 것이다.

 

- 패턴인식에서 요즘 가장 인기있는 갈래가 ML, DeepLearning이다.

- 머신러닝은 데이터를 학습하여 모델을 만들어낸다. (데이터 중심, bottom-up)

- 예를들면 2차원 좌표계에 점이 찍혀 있을때 이 점들의 경향을 잘 나타내는, 구분할 수 있는 커브(모델)를 피팅하는 것.

 

- 우리가 이 강좌에서 배울 패턴인식의 갈래는 모델을 정하고 데이터로부터 튜닝하는 방법을 배울 것이다. (top-down)

- 예를들면 2차원 좌표계에 점이 찍혀 있을때 y=ax^2+bx+c(모델)를 정의하고나서 데이터들을 통해 a,b,c를 찾아내는 것.

 

- 사물들을 구분하는 각 class들이 가지는 속성, 특징 feature를 찾는다. 궁극적으로 분류를 위해 특징을 추출하고 특징들을 가지고 어떤 class에 속하는지 결정하는 수학적 방법론을 배운다.

2. 사람의 인지

- 사람이 실제로 대상을 인지하는 과정을 각 관점에 따라 생각해보자.

1단계, 감각 sensation : 빛 등

2단계, 지각 perception : 색, 윤곽선

3단계, 인식 cognition : 사람 얼굴이구나

4단계, 재인 recognition : 수지 얼굴이다.

5단계, 추론 inference : 영화에 나온 장면같다. (사실 여기 까지 가야 실제 지능이라고 볼 수 있다.)

- 여기까지를 포괄적으로 intelligence라고 할 수 있다.

추가단계 감정 Emotion : 아름답다. 시각을 보고 있지만 연상을 통해 청각, 후각등의 다양한 감정과 상호작용할 수 있다.

- 이번 강좌에서는 cognition과 recognition단계에서 이루어지는, 분류를 나누는 판단에 사용되는 mathematical solutions와 이를 근사 연산으로 해결하기 위한 compuational models 내용들을 공부할 것이다.

3. (번외) 데이터 과학

- 데이터가 아주 많아짐에 따라 데이터 안에 중요한 것이 무엇이고? 그 데이터에서 파생되는 유의미한 정보들은? 등의 의문에 관심을 갖는 학문이다.

- 예를들면 버스카드를 찍고 내린 정보들만 가지고도 성별, 나이, 지역, 교통량 등 유의미한 정보들을 꺼낼 수 있을 것이다.

- 데이터에 포함된 노이즈를 제거하거나 중요한 내용을 더 잘 표현(display, visualization)하는 방법 등에 관심을 갖는다. 

4. 단서와 판단(맛보기)

- 남자인지 여자인지를 판단할때 feature로 머리카락 길이를 선정했다고 하자.

- 우리가 통계적으로 P(긴머리 | 여자) > P(긴머리 | 남자)임을 알고 있다고 하자. (학습을 통해 알아낸 사전확률)

- 사전에 알고있는 지식으로부터 P(여자 | 긴머리) ><= P(남자 | 긴머리) 라는 새로운 지식으로 변환할 수 있다. (판단의 근거가 되는 사후확률) 

- 즉 패턴인식의 본질은 조건부 확률의 계산이다. 

 

- 피처와 클래스가 많아진 경우를 살펴보자.

- P(피처벡터 | 클래스벡터)는 데이터로부터 얻을 수 있는 사전 정보들이다. 여기서 판단의 근거가 되는 확률인 P(클래스벡터 | 피처벡터)를 계산을 통해 구해야 한다.

- 그러나 feature 혹은 클래스가 많아지면 다차원 공간에서 확률분포(모델)가 만들어진다.

- 개념적으로는 쉬우나 피처 추가되는 경우 문제의 문제의 복잡도가 늘어날 수 있다.

 

- 즉 앞으로 패턴 인식의 문제를 conditional probability를 통해 해결하는 방법을 배울 것이다.

728x90
반응형