▣ 대충 그려도 인식, 핵심은 해당 개체에 대한 대용량 데이터베이스


지금까지의「인공지능(AI)」은 "이것이 토끼다" 라는 사실을 알아내기 위해서는 인간이 미리 토끼가 가지고 있는 특징을 프로그램에 입력해야만 인식할 수 있었다. 컴퓨터는 미리 프로그래밍 된 범위까지만 인식할 수 있기 때문이다. 

 

 

따라서 인간처럼 복잡한 것을 알아보고 추상적인 사고를 하는 일은 인공지능에 대한 연구가 꽤 오래된 지금까지도 쉽지 않은 일이었다. 특히, 사물에 대한 이미지를 인식하는 기술은 손가락의 지문이나 인쇄된 문자를 인식하는 것과는 비교할 수 없을 정도로 어려운 분야라는 것이 대다수 전문가들의 의견이다.


예를 들어 위의 그림에서 보듯, 대충 그려진 다양한 형태의 토끼 모양을 보고 사람들은  단번에 토끼라는 생각을 떠올릴 수 있지만, 컴퓨터에게는 이것이 매우 어려운 일인 것이다. 하지만 최근 독일의 연구진이 이런 어려움들을 극복하고 획기적인 이미지 인식 프로그램을 개발해 화제가 되고 있다.


○ 높은 인식률을 가진 스케치 인식 프로그램 개발


과학전문 매체인 ‘ScienceDaily'는 독일의 브라운대와 베를린 기술대의 연구원들이 스케치처럼 대충 그려진 그림 등 아무리 다양한 형태로 그려져 있더라도 컴퓨터가 알아 맞출 수 있는, 놀랄 만한 인식률을 가진 프로그램을 개발하는 데 성공했다고 최근 보도했다.

 

 
베를린 기술대에서 관련 연구진과 공동으로 새로운 프로그램을 개발한 제임스 헤이즈(James Hays) 교수는 “사람들에게 토끼를 스케치 하듯 대충 그려 보라고 하면, 대부분 큰 귀와 튀어나온 이빨을 가진 모습으로 그리지만 사람들마다 모두 차이가 있기 때문에 이를 컴퓨터가 인식하도록 하는 것에는 문제가 있었던 것이 사실”이라고 밝혔다.


헤이즈 교수는 “그럼에도 불구하고 이 그림을 컴퓨터가 아닌 다른 사용자들이 이를 토끼라고 올바르게 인지하는 것은 사람인 사용자들 모두가 같은 방식의 인지교육을 통해 성장했기 때문”이라면서 “그림을 그린다는 작업에 대해 컴퓨터에게 새로운 이해가 필요한 시점”이라고 언급했다.

 

○ 인식률의 열쇠는 대용량 데이터베이스

 

프로그램을 개발한 연구진은 “컴퓨터가 아직까지 만화나 색상 등을 통하여 표현된 이미지를 바로 이해한다는 것은 어려운 작업임에 틀림없다”고 전제하면서 “이번에 발표한 새로운 프로그램을 개발하는 데 있어 인식률을 높이기 위한 가장 중요한 핵심은 해당 개체에 대한 대용량 데이터베이스”라고 말했다.


다양한 이미지들의 데이터베이스 축적은 컴퓨터가 인간의 스케치 대상을 파악하는 알고리즘을 이해하는 기본적인 단계이다. 연구진은 250개 개체들의 카테고리 집합에 대해 2만 개 스케치들을 설정했고, 각 범주에서 개체를 스케치하도록 하는 사람들을 고용하는 것 외에도 아마존에서 운영하는 클라우드 소싱 기법까지 적용했다.


연구진이 밝힌 바에 따르면 이 프로그램은 아직까지 사람이 사전에 입력한 카테고리만 인식이 가능하지만, 현재 250개의 카테고리 어휘를 가지고 카테고리의 주변까지 확대 적용하면서 다양한 데이터를 수집하는 작업을 수행하고 있는 것으로 나타났다. 그리고 이를 효율적으로 지원할 수 있는 아이폰과 아이패드용 앱도 개발 중이라는 것이 연구진의 설명이다.

 

○ 응용범위가 무궁무진한 이미지 인식 프로그램


물론 이 프로그램이 모든 형태의 그림을 알아 맞추는 것은 아니다. 현재 이 프로그램은 대략 56%의 정확도로 그림을 식별할 수 있는 것으로 알려졌는데, 이는 실제 인간 사용자가 스케치 그림을 식별할 때의 정확도가 73% 정도인 것을 감안하면 나쁘지 않은 수준이라는 것이 전문가들의 판단이다.

또한 이 프로그램은 현재까지 백지 위에 그린 단순한 그림만 인식하고 판별할 수 있는 수준이다. 하지만 전문가들은 이 프로그램이 추상적이면서 개략적인 이미지에 대해서도 추론이 가능한 최초의 시맨틱 차원 컴퓨터 애플리케이션이 될 수 있을 것으로 기대하고 있고, 더 복잡한 형태의 그림을 인식하고 상황을 이해하는 수준으로까지 발전하는 것으로 목표를 삼고 있다.


연구진은 앞으로 이런 기술들의 응용범위가 더욱 무궁무진할 것으로 예상하고 있다. 예를 들면 사람의 초상화나 사진을 보고 누구인지를 정확히 인식하는 것부터 시작해 대충 흘려서 쓴 한자처럼 복잡한 글자나 스마트폰으로 친구의 얼굴을 인식하는 일까지 가능할 것으로 본다.


이 외에도 연구진은 프로그램이 사물을 인식하는 수준에서 더욱 발전한다면 재미로 사물을 인식하거나 게임에 적용되는 경우를 넘어, 보다 발전한 스케치 기반의 인터페이스와 검색 애플리케이션을 개발하는 프로젝트에 접목되어 사용될 수 있을 것으로도 예상하고 있다.


터치스크린이 보다 광범위하게 보급되고 있지만, 스케치 기반의 검색기술은 아직 보편화되지 않은 것이 사실이다. 따라서 좀 더 발전한 형태의 스케치 기반의 인터페이스는 컴퓨터에 대한 접근성을 개선시킬 수 있을 것으로 기대되고, 특정 비주얼 형태를 찾도록 만드는 방법들이 특정 도메인을 중심으로 보다 용이하게 수행될 수 있을 것으로도 전망되고 있다.


한편 브라운대와 베를린 기술대의 연구자들은 현재 개발된 인식 프로그램보다 더욱 발전된 전문가 버전 연구에 박차를 가하고 있다고 밝혔으며, 전문가 버전은 스케치 기반의 인터페이스와 검색 애플리케이션 기능까지 탑재하고 있는 것으로 알려졌다.
 

김준래 객원기자 joonrae@naver.com

 

URL :


<출처>ScienceTimes, 2012.10.24

Posted by TopARA

댓글을 달아 주세요