1. "TV 꺼 줘"
"엄마한테 어디냐고 문자 보내 줘"
"인기차트 틀어 줘"
말만으로도 척척, 내가 하는 말을 알아듣는 음성 인식 기술
정말 이것만으로 만족하세요?
2. 인간과 컴퓨터 사이의 인터페이스 방식은 진화 중!
텍스트→그래픽→음성
종류는 다르지만 텍스트는 문자, 그래픽은 아이콘을 이용하는 것처럼 특정 수단을 활용해 인간이 하고자 하는 일을 컴퓨터에게 전달했다.
하지만 음성 인식을 떠올리면 문제점이 생각나기 마련이다.
3. 만약 음성 인식 기기로 엄마는 날씨를 묻고, 아빠는 피자를 주문하며, 아이는 동요를 틀어달라고 한다면?
→사용자의 특성 규정이 어려워짐!
앞으로의 음성 인식 기술은 목소리를 구분해 그에 맞는 사용자의 계정을 연결해 줘야 한다
4. 거실에서 "락 음악 틀어 줘"라고 했을 때, 고3 수험생 방에 있던 기기까지 인식돼 노래가 울려 퍼진다면?
현재로서는 아마존만이 ESP(Echo Spatial Perception) 기술을 탑재해 사용자와 가장 가까이 있는 기기만 반응하도록 설계했다
앞으로는 이러한 기술을 점점 발전해 나가야 한다
5. "김치볶음밥 레시피 알려 줘"
"네, 레시피에 있는 재료 중 마늘이 현재 냉장고에 없는데 주문해 드릴까요?"
이처럼 단순히 명령을 시행하는 것만이 아닌 사용자가 왜 그 명령을 내렸는지 이해하고 관련된 기능이나 서비스도 함께 제공할 수 있어야 한다
이 문제를 해결하려면 기업의 동참이 필수지만, 음성 인식 기반 서비스의 차원을 한 단계 높이는 데도 꼭 필요한 조건임이 틀림없다
6. 시끄러운 장소에서 사람의 음성 명령을 정확히 인식하기만 해도 좋아했던 과거처럼 지금까지의 음성 인식은 기능적 측면에만 관심이 집중됐다.
하지만 이제는?
말소리에서 의도를 파악해 이와 연관되는 서비스를 연결해 줄 수 있도록 연구가 계속되고 있고, 앞으로도 계속돼야 할 것이다.
(사진=게티이미지뱅크)
(데일리팝=이지원 기자, 홍원희 디자이너)