[그것이 궁금] 일상에 스며든 AI 음성인식 서비스
[그것이 궁금] 일상에 스며든 AI 음성인식 서비스
  • 이주영
  • 승인 2022.04.06 15:47
  • 댓글 0
이 기사를 공유합니다

(사진=게티이미지뱅크)
(사진=게티이미지뱅크)

음성인식이란, 사람의 음성을 컴퓨터가 인식해 텍스트화하는 기술이다. 구체적인 순서는 다음과 같다. 우선 잡음 등의 노이즈를 제거하고(잡음·잔향 억제), 음성 데이터의 음의 강약이나 주파수, 소리와 소리의 간격, 시계열 등 여러가지 특징을 추출한다. 이 특징이 어떤 음소(소재가 되는 소리)나 단어에 가까운 지를 판단해(음향 모델), 방대한 데이터를 토대로 단어를 연결한다. 

스마트폰과 스마트 스피커의 대중화로 인해 최근 음성인식 기술을 이용한 VUI(음성 사용자 인터페이스: Voice User Interface)의 활용 사례가 증가하고 있다. VUI란 음성 언어를 사용해 정보 기기를 제어하거나 정보 서비스를 수신할 수 있도록 말과 글을 음성으로 변환하는 인터페이스를 말한다. 눈으로 보고 키보드나 마우스로 입력하는 그래픽 사용자 인터페이스(GUI)에 대비되는 개념이다. 

음성인식의 정확도 향상은 VUI(음성 사용자 인터페이스)의 보급 확대에도 공헌하고 있다. VUI는 NUI(내추럴 유저 인터페이스: Natural User Interface)를 구성하는 인터페이스 중 하나다. 디스플레이의 화상을 보고 마우스를 조작하는 GUI(그래피컬 유저 인터페이스: Graphic User Interface)와 달리 NUI는 대상물을 직접 만지거나 음성을 사용하는 등 사람의 자연스러운 동작을 통해 디지털 기기를 제어하는 환경을 말한다. GUI를 대신하는 차세대 인터페이스로서 NUI에 기대가 모아지는 것은 자연스러운 흐름이라고 할 수 있다.

한편 음성 어시스턴트 서비스를 탑재한 제품이 증가하며 해당 시장규모는 지속적으로 확대할 것으로 예상된다. 쳰잔산업연구원은 ’20년 중국 AI 음성 어시스턴트 시장규모는 241억1000만 위안이었고, CAGR 33.2%로 빠른 성장세를 기록하며 2023년 570억3000만 위안까지 성장할 것으로 전망했다.

AI 음성기술이 가장 많이 사용되는 분야는 음성 어시스턴트(AI 음성비서) 서비스다. 중국 내 음성인식 기술 기업들은 유리한 고지를 선점하기 위해 주로 스마트폰, 웨어러블 제품, 스마트홈 제품, 자동차 내비게이션 기기에 음성 어시스턴트를 탑재해 생활편의 서비스를 제공하고 있다.

스마트폰을 이용한 AI 음성 어시스턴트 서비스는 음성명령을 인식해 정보검색, 일상대화, 일정관리, 메시지 발송, 전화 걸기, 날씨 묻기, 음악송출, 번역 등 다양한 생활 편의를 제공한다.

스마트홈 제품에 있어서도 AI 음성인식 기술은 핵심 기술로 자리잡고 있다. TCL, 샤오미 등 기업들은 AI 음성인식 기술을 탑재한 다양한 스마트홈 제품을 선보이며 경쟁에 뛰어들고 있다. TV, 냉장고, 공기청정기, 조명, 에어컨 등 대부분의 가전제품에 AI 음성비서 서비스가 연동돼 있어 음성명령으로 제어가 가능하다. 또한 가전제품에 탑재된 음성비서 서비스를 통해서도 신문 검색, 날씨 확인 등이 가능하며 소비자들은 점차 이러한 서비스에 익숙해지고 있다.

중국은 의료 서비스 품질 제고를 위해 스마트 의료 환경을 구축하는 가운데 음성기술을 접목한 AI 활용 방안도 적극 모색하고 있다. 대표적인 활용 방안으로는 음성인식 기반 안내 로봇, 의무기록지 음성인식, 스마트 진료 보조 로봇 등이 있다. 의무기록지 음성인식 솔루션은 의무기록을 즉시 음성인식으로 문서화하는 서비스로, 베이징셰허병원(北京协和医院) 포함 대형병원에서 도입하여 업무 효율성이 크게 향상된 것으로 평가하고 있다.

음식점 예약관리 시스템 'ebica'(에비카)를 운영하는 ebisol사는 LINE의 AI 전화 응대 서비스 '라인 아이 콜(LINE Ai Call)'과의 협업을 통해 AI 전화 예약 응대 서비스 'AI 리셉션'을 2020년 10월부터 제공하고 있다.

AI리셉션에서 고객 전화에 응대하는 직원은 AI스탭이다. 고객이 음식점 점원에게 예약 가능 여부를 확인할 때 ‘오늘 방문하고 싶은데 지금 예약 가능한가요?’ 라는 말을 이해하고 인간에 가까운 음성으로 전화를 응대하면서 예약 현황 데이터를 참조해 예약 완료까지 맡아서 진행한다. 예약접수는 물론 예약 확인 전화도 AI 음성으로 대응한다. 희망하는 예약 시간대가 만석일 경우에는 앞뒤 시간이나 인근 체인점의 예약 현황을 실시간으로 안내해준다.

음식점 예약관리 서비스에 이용되는 VUI의 LINE AiCall은 스마트 스피커 'LINE CLOVA'에서도 적용되고 있는 'CLOVA Speech(음성인식) '와 'CLOVA Voice(음성합성)' 및 회화제어의 조합으로 구성돼 있다. LINE사는 CLOVA Voice에 딥러닝 기술을 도입해 인간에 가까운 자연스러운 음성을 재현해내는데 성공했다. LINE AiCall은 AI리셉션의 도입처인 음식점의 점포뿐만 아니라 대형 운송 회사인 야마토 운수에서 배송 의뢰인의 문의 응답에서도 이용되고 있다.

콜센터 업무에 있어서 AI 음성의 역할은 크다. 성수기의 통화량 폭증에 대한 대책으로써 활용될 수 있을 뿐만 아니라 24시간 365일 대응이 가능하기 때문에 기회 손실의 경감과 인력부족 해소로 이어진다.

 


※ 자료 = KOTRA "중국 소비자 일상에 스며든 AI 음성인식 서비스" , "일본의 AI 보이스 테크놀로지 현황" 보고서 발췌