▣ 스마트폰, 개인비서로 써볼까?

 

 

"출근 시간 지하철, A군은 아침까지 거래처에 보내주기로 한 중요한 메일이 생각났다. 꼼짝달싹 할수 없이 붐비는 지하철에서 A군은 어떻게 메일을 보낼 수 있을까? 고민하던 A군 앞에 어떤 직장인이 보인다. 그는 이어폰으로 스마트폰에 음성 명령을 내려가며 메일을 쓰고 있었다. A군은 생각한다. '아! 스마트폰 음성인식!''


음성인식(Speech Recognition)이란 음성을 컴퓨터가 분석하여 문자 데이터로 변환하여 처리하는 기술을 말한다. 키보드 등별도의 입력 장치를 이용하지 않고 음성으로 빠르고 쉽게 정보를 입력할 수 있다는 점에서 주목받고 있는 기술 중 하나다. 몇년 전까지만 해도 영화에서나 볼 수 있는 첨단 기술이라고 여겨졌던 음성인식 기술이 어느새 일상 생활에 한 걸음 가까이 다가왔다. 바로 스마트폰에 적용된 여러가지 음성인식 서비스 때문이다.

 


○ 스마트폰과 음성인식 기술

 

스마트폰에서 음성인식은 여러가지 방법으로 응용되어 사용되고 왔다. 아이폰은 [음성 명령] 기능을 제공하여 앱 실행 등 간단한 명령을 음성으로 실행할 수 있도록 했고, 구글은 음성으로 웹 검색을 할 수 있는 서비스를 제공하였다.

 

 


이외에도 사용자의 음성을 입력 받아 다른 언어로 말해주는 번역 애플리케이션이나 사용자의 음정이 바른지 검사해주는 애플리케이션들도 음성인식 기술을 이용한 예라고 볼 수 있다.

 



이러한 가운데 ‘시리’의 등장은 음성인식 기술의 새로운 도약을 제시했다. 시리(Siri)는 애플에서 제공하는 음성인식 서비스로 2011년 아이폰4S에 처음 등장했다. 원래는 군사용으로 개발된 CALO 프로젝트의 일부 서비스가 상용화되면서 개발된 것으로 아이폰 3GS에 애플리케이션으로 처음 제공되어 많은 인기를 누리다가 2010년 4월 애플에서 시리를 독점 인수하여 현재의 애플의 시리가 탄생하게 되었다. 시리의 특징은 단순히 음성을 인식하는 것이 아니라 다양한 애플리케이션과 연동하여 모든 작업을 한 번의 음성 명령으로 해결할 수 있도록 하였고, 학습인식 기능을 제공하여 사용자의 목소리를 학습하여 인식률을 높이는 기능도 제공하고 있으며, 특히 대화 처리를 이용한 데이터베이스 센터를 바탕으로 여러 가지 다양한 질의에 대한 답변할 수 있는 알고리즘을 갖추고 있다는 점이다. 또한, 시리가 유독 인기를 끌었던 이유는 사람과 대화하듯이 자유로운 표현이 가능하다는 점이었다. 기존의 음성인식 서비스들이 지정된 형태의 문장으로 말해야만 성공적으로 인식되었던 것에 비하면 가히 놀랄만한 발전이라고 할 수 있다.

 


이후 삼성전자의 S보이스, LG전자의 Q보이스, 펜텍의 스마트보이스 등 음성인식 서비스들이 등장하며, 보다 편리하게 스마트폰을 이용할 수 있는 환경이 마련되고 있는 중이다. 음성인식 서비스는 최근에 출시된 스마트폰에만 지원되는 경우가 많다. 음성인식 서비스를 이용하려면 자신의 스마트폰이 음성인식 서비스를 지원하는지 확인해보도록 하자. 만일 해당 서비스 업체에서 제공하는 음성인식 서비스가 사용 가능한데도 불구하고 설치가 되어 있지 않다면 시스템 업데이트를 하도록 한다.

 

 

 

 

지능형 음성인식 기능, '음성 비서' 이용하는 방법

 

서비스 실행하기
시리나 S보이스는 음성 명령을 받아 적절한 대답이나 기능을 구현해주는 지능형 음성인식 서비스다. 아이폰의 시리는 아이폰의 홈 버튼을 길게 눌러 실행하고, 갤럭시의 S보이스는 홈 버튼을 두 번 눌러 실행한다, 옵티머스의 Q보이스는 메뉴 버튼을 길게 눌러 실행할 수 있고, 베가는 볼륨과 전원 버튼을 함께 눌러 스마트보이스를 실행할 수 있다. 음성 명령이 실행되면 화면에 마이크 등의 아이콘이 나타나고 ‘띵’ 소리가 나면 음성으로 명령을 내릴 수 있다. 명령을 내린 후 ‘띵’ 소리가 나면 음성을 처리해 텍스트와 음성으로 결과를 보여주며 대화 내용은 메신저의 대화창처럼 풍선말처럼 표시된다. 음성 명령을 더 이상이 내리지 않으면 마이크의 빛의 꺼지는데 마이크를 다시 눌러 명령을 내릴 수 있다. S보이스는 ‘하이 갤럭시’라고 말하여 음성 서비스를 활성화시킬 수 있다.


음성 처리하는 과정은 매우 빠르게 진행되기 때문에 마치 스마트폰에서 직접 처리되는 것처럼 느껴지지만 실제로는 스마트폰에서 명령을 받아서 데이터 센터에 전송하는 역할과 데이터 센터에서 처리된 결과를 받아서 출력하는 역할만 수행한다. 음성을 분석하고 결과를 처리하는 역할을 데이터 센터에서 수행하기 때문에 인터넷에 연결되어 있지 않으면 음성 서비스를 이용할 수 없다.

 

 

 

명령 내리기
음성 명령은 친구에게 말하듯이 자유롭게 명령를 내리거나 핵심 단어를 나열하여 명령을 내릴 수 있다. 시리는 인포메이션 버튼을 누르면 나타나는 명령 샘플을 참고해 명령을 내릴 수 있다. 샘플 리스트에는 시리로 실행할 수 있는 대략적인 명령들을 보여주기 때문에 샘플을 참조해 음성 명령을 내리면 오류없이 결과를 처리할 수 있을 것이다.


'음성 비서'마다 차이는 있지만, '음성 비서' 서비스를 통해 전화번호 검색 및 전화 걸기, 음악 불러오기, 메시지 전송, 일정 관리, 지도 검색, 인터넷 검색 등의 작업을 처리할 수 있다.

 

 

 

꼬리표를 이용해 음성 명령 내리기
시리는 부모님 또는 친구 등의 꼬리표 단어를 이용해 전화 또는 메일을 보내는 작업을 처리할 수 있다. 이러한 명령을 내리려면 연락처에서 자신의 정보 편집을 실행한 후 '관련된 사람'필드에 꼬리표를 등록한다. 기본적으로 등록되어 있는 ‘어머니’, ‘아버지’ 항목에 부모님 연락처를 등록하고 그외에 디폴트로 제공하는 다른 꼬리표를 이용하려면 ‘어머니’, '아버지' 등의 항목을 누르면 나타나는 꼬리표 목록에서 추가한다. 꼬리표 목록 마지막에 있는 '사용자 설정 꼬리표 추가' 항목을 클릭하면 사용자가 원하는 꼬리표를 정해서 등록할 수도 있다.또는 시리를 실행한 후 꼬리표로 등록할 이름과 꼬리표 이름을 말하여 명령을 내려 등록할 수 도 있다.

 

 


이렇게 꼬리표를 등록하면 시리를 이용할 때 ‘어머니에게 전화 걸어’, ‘친구에게 메시지 보내’ 등의 명령을 내릴 수 있게 된다. 만일 ‘친구’ 꼬리표로 등록된 사람이 여러 명일 경우에는 꼬리표 목록을 보여주므로 사용자가 선택해서 명령을 실행할 수 있도록 해준다.

 

 

 

음성으로 메시지 보내기
스마트폰에 트위터 또는 페이스북를 연동시켜두면 음성 명령을 이용하여 게시물을 올릴 수 있다. 아이폰은 [설정]에서 트위터와 페이지북 계정을 등록할 수 있고 S보이스는 S보이스의 [설정]에서 계정을 등록할 수 있다. 계정을 등록해두면 ‘트위터’ 또는 ‘페이스북’이라고 말하고 게시할 글을 음성으로 말하면 게시물이 등록된다.

 

 

 

 

이외에 메일은 ‘메일’, 메시지는 ‘문자’ 또는 ‘메시지’ 명령을 이용하여 메시지를 보낼 수 있다. 메일이나 메시지를 보낼 때 연락처에 등록되어 있는 사람 이름과 보낼 내용과 함께 ‘메일 보내기’ 또는 ‘메시지 보내기’로 한 번의 명령으로 보내거나, ‘메일 보내기’ 또는 ‘메시지 보내기’라고 명령을 내린 후 질문에 따라 받는 사람, 받을 내용을 음성으로 작성해서 보낼 수 도 있다.

 

 


음성으로 일정 기록하기
음성 명령을 이용하여 일정도 기록할 수 있다. 일정은 캘린더 앱에 기본적으로 등록되며 시간을 지정한 경우 해당 시간이 되었을 때 알람이 울린다. 시리는 지정된 시간 뿐만 아니라 지정된 위치에서 벗어날 때 알림을 알려주는 [미리알림]을 이용하여 알림을 기록할 수 있다. 지정된 시간으로 등록하고 싶을 경우에는 ‘~시간에 ~라고 미리 알려줘’라고 명령을 내리고 현재 장소에서 벗어날 때 알림을 등록하고 싶을 경우에는 ‘~여기서 떠나면 ~라고 미리 알려줘’라고 명령을 내릴 수 있다.

 

 


시리는 음성 명령을 내린 후에도 텍스트를 편집해서 명령을 수정할 수 있다. 풍선말에 입력된 텍스트를 탭하면 나타나는 가상 키보드를 이용하여 글자를 수정해서 명령을 수정해서 실행할 수 있다. 전송할 메시지를 작성한 경우 음성으로 ‘~라고 수정’이라고 명령을 내려 메시지 내용을 수정할 수 도 있다.

 

 

 

음성으로 문서 작성하는 방법

 

음성인식을 이용하여 음성을 분석해서 텍스트로 표시할 수 있다. 애플은 메모장 등에서 글을 작성할 때 나타나는 가상 키보드에서 마이크 버튼을 누르고 음성을 말한 후 [완료] 버튼을 누르면 음성 내용을 텍스트로 표시해준다. 안드로이드폰은 가상 키보드에서 설정 버튼을 길게 누르면 나타나는 메뉴에서 마이크 아이콘을 선택한 후 음성을 말하면 텍스트로 표시해준다.

 

 

 

반대로 텍스트를 음성으로 읽어주는 기능도 제공한다. 아이폰은 [설정]-[손쉬운 사용] 메뉴에서 [자동 텍스트 말하기]와 [선택 항목 말하기] 항목을 활성화시킨 후 텍스트를 선택하고 [말하기] 버튼을 누르면 음성으로 읽어준다. 안드로이드폰은 [환경설정]-[접근성] 메뉴에서 [TalkBack] 항목을 활성화하면 명령과 텍스트를 모두 음성으로 읽어준다.

 

 

 

음성인식으로 애플리케이션 제어하기

 

음성인식을 이용하면 애플리케이션을 조작하는 기능도 가능하다. 갤럭시S3 모델은 음성으로 전화, 알람, 카메라, 음악 동작을 제어하는 기능을 제공하는데 [환경설정]-[언어 및 입력] 메뉴에서 [애플리케이션 음성제어]를 활성화하고 4개의 목록 중 음성으로 제어한 기능을 선택해서 설정을 지정할 수 있다. 설정이 완료되면 전화, 알람, 카메라, 음악 앱을 실행할 때 음성으로 지정된 명령을 말하여 제어할 수 있다. 예를 들어 전화가 왔을 때 음성으로 ‘수신’이라고 말하면 전화를 받을 수 있고 ‘거절’이라고 말하여 전화를 끊을 수 있고 카메라 앱을 실행한 후 ‘찰칵’이라고 말하면 촬영을 실행할 수 있게 된다.

 

 

 

안창현 /코드미디어

전문 테크닉컬 라이터로 모바일, 카메라, PC 등에 관련된 도서 및 강의 등 정보 콘텐츠 개발하고 있으며 현재 콘텐츠 개발 업체 코드미디어 대표로 활동 중이다.


외부 필진이 제공한 컨텐츠로 NHN의 입장과 다를 수 있습니다.

 

<출처>네이버캐스트, 2012.09.27.

Posted by TopARA

댓글을 달아 주세요