본문 바로가기

직장/Voice

[펌] VUI 디자인

출처 블로그 > orientblue
원본 http://blog.naver.com/orientblue/80005577649

저희 회사에서 매월 발간하는 온라인 소식지인 예스레터의 9월호 커버스토리를 작성했습니다.

부진한 포스트 작성을 만회하고자 여기에 올립니다. ^^

예스레터 받아보고 싶으신 분들은 리플에 멜 주소를 넣어주세염...



컴퓨터와 대화하기 - VUI 디자인에 대해

 

 

대화에 대한 기대

 

어릴 적 읽었던 공상과학 소설 속의 로봇 렉스는 아이들에게는 친구가 되어주고 청소 및 세탁기를 돌리는 일까지 척척 해내는 만능 로봇이었다. 초등학교 2학년 시절 읽었던 로봇 렉스의 이름과 그 이미지가 아직도 내 마음 속에 생생한 것은, 그가 뛰어난 성능의 로봇이었기 때문이 아니라, 주인공 아이와 함께 이야기하고, 인간과 로봇 사이의 공유할 수 없는 부분까지 이해해주는(급기야 눈물까지 흘렸던 것으로 기억되지만) 다소 인간적인 감성을 지닌 로봇이었기 때문일 것이다. 물론 로봇의 특성, 즉 잠을 자는 대신, 스위치를 끄고 눈을 뜨고 대기하며, 밥을 먹는 대신 충전을 하고, 정해진 프로그램 외의 행동이나 사고를 할 경우 중앙 장치에 무리가 가게 되는 것 등의 진부한 특성은 다 갖추고 있었지만, 렉스의 중요한 기본 기능 중 하나는, 사람과 아주 자연스럽게 대화한다는 것(친구로 느껴질 만큼)이다.

그러나, 지난 호에서 다뤄진 것처럼, 현재는 당장에 로봇이 아니라, 음성인식기 자체도 우리의 모든 말을 다 알아들을 수는 없다. 즉 렉스의 기본 기능이었던, 무제한의 자연스런 대화 자체도 현재는 어려운 것이다. 모든 일엔 과정이 있듯이, 조금 더 기술이 발전하면 사람의 다양한 요구를 수용하는 무한음성인식기가 보편화가 되고, 언젠가는 우리의 아이들이 렉스를 만나게 될 수도 있을지 모른다. 하지만 지금은 렉스를 꿈꾸던 우리의 기대에는 훨씬 못 미치는 수준이다.

우리보다 십년 정도 앞서 음성기술을 도입한 외국에서도, 초기의 가장 큰 난점이 기술에 대한 회의론이었다고 한다. 하지만 이제 그곳에서는 음성 기술이 성공적으로 활용되고 있다고들 한다. 실제 이들의 기술이 그 당시 보다 급격히 진보하거나, 현재 우리의 기술보다 월등하게 우월해서 라기 보다, 계속된 기술 향상을 거듭하면서, 현재의 기술로 적용할 수 있는 적합한 도메인을 찾아, 사용자에 편리하고 친숙한 서비스를 제공하고자 노력했기 때문이다. 그들은 이제 기술 자체가 음성 시장 발전의 걸림돌이라고 말하지않는다. 문제는 현재의 기술력으로 사용자의 목적을 성공적으로 수행하는 동시에 편리함과 만족을 최대화 시키려는 음성 사용자 인터페이스(VUI)라고 한다. 이것은 외국에서 뿐 아니라, 발전을 거듭하고 있는 음성 기술을 사용하는 어느 곳이든 가장 중요한 이슈가 되고 있다.

 

대화의 가능성

 

VUI란 사람과 음성언어 어플리케이션 사이의 상호작용을 말한다. 쉽게 말해 컴퓨터와 사람 사이의 대화를 말하는 것이다. 컴퓨터와의 대화를 위해서는 세 가지가 필요하다. 첫번째는 프롬프트(prompt)로써, 시스템이 사람에게 말하는 음성, 즉 성우를 통해 녹음되거나 합성된 기계 음성 들을 말한다. 두 번째는, 컴퓨터가 사람의 말을 알아들을 수 있도록, 프롬프트에 대한 사용자의 응답을 예측하여 미리 작성한 그레머(Grammar)이다. 지난 호에서 알아본 것처럼, 시스템은 그레머에 포함된 단어나 문장이나 구들만을 이해할 수 있다. 세번째 요소는 대화의 흐름을 정의한 다이얼로그 로직(call-flow)이다. 이는 사용자의 응답에 대한 시스템의 대응이나, 데이터베이스로부터 가져온 정보들을 읽어주는 등의 행동들을 정의한 것이다. 이러한 세 가지의 요소가 미리 정의되어있어야 컴퓨터와의 대화가 가능해지며, 이러한 일을 하는 것이 바로 VUI 디자인이다. VUI 디자인을 어떻게 하느냐에 따라 사용자가 목적에 얼마나 빠르고 편리하게 성공할 수 있는지, 동시에 얼마나 친근한 느낌을(대화를 하듯) 줄 수 있는지가 결정된다. 숙련된 VUI 디자이너일수록, 위의 요소들을 정의하고 설계하는 것에 뛰어날 것이다. 물론 중요한 것은, 디자인에 앞서 현재의 음성기술에 적합한 서비스를 찾는 것이다. 서비스가 선정이 되면, 디자이너는 사용자 분석과 서비스 분석으로 시작하여 여러 단계를 거치면서, 많은 이슈들을 수용하여 결국 하나의 서비스를 디자인하게 된다.

 

대화의 어려움

 

세세한 디자인 과정과 이슈들은 뒤로 미루고, 우리가 컴퓨터와 대화하는 것에는 몇 가지 난점(難點)들이 존재한다. 이러한 난점들은 대화를 구성하는 VUI 디자인에도 본질적으로 작용하게 된다.

먼저, VUI는 청각적 인터페이스(auditory interface)라는 것이다. 즉 사용자와 컴퓨터가 순수히 서로의 소리만으로 상호작용한다. 이 소리라는 것에는 사용자의 실제 음성 입력, 시스템의 녹음되거나 합성된 음성 출력, 그리고 디자인된 효과음들이나 배경음악 등이 포함된다. 비쥬얼 웹 인터페이스는 시간이 지나도 자유자재로 접속할 수 있으며, 원하는 정보나 화면은 사용자가 다른 화면을 클릭하기 전까지는 유지된다. 그러나 청각적 인터페이스는 이러한 지속력이 없다. 단지 일시적이고 지속성이 없는 메시지만이 사용자와 시스템을 연결시켜주는 유일한 매개인 것이다. 따라서 무엇보다 사용자가 시스템의 메시지를 기억할 수 있도록 디자인해야 하고, 사용자의 기억력이나 학습능력을 요구하는데도 주의를 기울여야 한다. 또한 시스템의 음성의 속도와 크기 또한 잘 조절해야 한다.

두 번째, VUI는 구어 인터페이스(spoken language interface)이다. 음성을 통한 의사소통은 대화를 통해 이루어지며, 실제 대화적인 관습이나 사람들 사이의 공유된 생각들을 통해 이루어진다. 따라서 우리가 읽거나 쓰는 것과 다르게 말하며, 각자가 자각하지 못하는 발성 습관도 존재하게 된다. 사람마다의 이러한 특성들을 컴퓨터에 인지시키기는 어렵다. 따라서, VUI 디자이너는 사람들의 대화적 관습들을 이해하고, 최대한 사용자들의 용어로 디자인해야 한다.

 

대화의 이점

 

아무리 뛰어난 VUI 디자이너라도 위의 난점들을 완전히 극복하지는 못할 것이다. 그렇다면, 아직까지 많은 한계와 난점을 가진 컴퓨터와의 대화를 시도하려는 이유는 무엇일까? 지금까지는 전화버튼을 눌러 여러 서비스를 이용하거나 상담원과의 직접적인 통화를 선호하기도 했다. 회사들이 음성을 도입하려는 이유에는 몇 가지가 있다.

먼저, 비용의 절감이다. 전화 교환원 대신 음성인식 자동교환 시스템을 사용하여 고용 비용을 절감하고, 터치톤 시스템을 사용할 경우 보다 콜 지속 시간을 월등히 줄임으로써 전화 비용을 절감할 수 있다. 또한 음성인식 시스템을 통해 적합한 목소리, 원하는 분위기를 조성하여 회사가 원하는 이미지를 만들 수 있다. 이를 통해 회사의 이미지와 상품의 이미지를 더욱 효과적으로 사용자에게 전달할 수 있게 된다.

사용자 측면에서는 언제 어디서든 통화가 가능하므로, 웹에 접속할 상황이 아니어도 수신한 이메일을 청취할 수 있으며, 자동차 밖에서도 자동차를 제어할 수 있고, 상담원 퇴근 시간 후에도 원하는 정보를 얻을 수 있다. 또한 운전 시처럼 손을 사용하기 힘든 상황이나, 손과 눈이 불편한 장애인들도 불편했던 서비스를 편리하게 이용할 수 있게 될 것이다. 직관적으로도 증권종목번호를 일일이 누르는 것 보다 종목명을 바로 말하는 것이, 통화하려는 사람의 전화번호를 일일이 기억하기보다 그 사람의 이름을 말하는 것이 더 편리할 것이기 때문이다.

 

자연스런 대화를 위해

 

위와 같은 음성기술에 적합한 서비스를 찾아내는 것은 VUI디자이너의 몫이 아닐지도 모른다. 하지만 디자이너는 기본적으로 사람과 사람 사이의 대화에서 일어나는 모든 현상들을 숙지하고 있어야 한다.  VUI는 예술과 과학의 두 영역에 모두 속한다라는 말은 VUI 디자인에 얼마나 다양한 분야가 고려야 되어야 하는지를 단적으로 말해주는 것이다. VUI 디자이너들은 예술적인 측면으로써 미학적 판단과 자연스런 언어 표현을 위해 애써야 하고, 인간의 인지적 특질과 언어 행위에 대해서도 과학적으로 사고해야 한다. 또한 디자인에서만 그치는 것이 아니라 디자인 단계마다 적합한 테스트 방법을 적용하여 결과를 도출 및 반영하는 공학적인 수행에도 주의를 기울여야 한다.

우리가 해야 할 것은 무엇인가.어느날 영화 예매를 하려 전화를 걸었을 때, 교통정보를 들으려 할 때, 친구 회사에 전화를 걸었을 때, 음성인식 시스템이라고 말을 건네는 미지의 음성과 조우하게 된다면, 친구와 대화하듯 마음을 가라앉히고 그의 말을 차분히 들어보도록 하자. 혹 내 말을 못 알아 듣는다 해도, 그의 변명에 귀를 기울여보자. 이렇게 몇 해가 지나게 되면, 우리는 어느 순간 렉스를 만나게 될 지도 모른다.

 

 

 

 

                                                

 

 

 

 

반응형