음성인터페이스 기술 개요 및 스마트폰 환경에서의 서비스 동향

  • Published : 2012.03.30

Abstract

본고에서는 최근 스마트폰 등에서 사용자에게 편리한 인터페이스 수단으로 활용되고 있는 음성인식 기술에 대하여 알아본다. 음성인식 기술은 컴퓨터가 인간의 말을 알아듣는 기술로서 50년 이상의 연구개발 역사를 가지고 있다. 그간 꾸준한 기술개발과 상용화 시도를 통하여 지속적인 발전을 이루어왔으며 최근 들어 스마트폰 활성화에 따라 관심도가 급속히 높아지고 있는 분야이다. 음성인식 기술은 언어와 관련된 기술이니만큼 기술측면과 시장측면에서의 특수성이 있으며 이를 충분히 고려한 연구개발전략이 수립되어야 한다. 현재, 구글, 애플, 마이크로소프트 등 세계적인 IT 선도기업이 음성인식 기술 개발에 많은 노력을 기울이고 있으며 특히 스마트폰 환경에서의 음성인식 응용 서비스인 음성검색, 자동통역, 인공지능 개인비서 등을 시작하며 본격적인 기술, 시장 선점 경쟁에 돌입하였다. 이들 서비스에 대하여 자세히 알아보고 이에 따른 시사점 및 국내 대응현황에 대해 알아본다.

Keywords

References

  1. 훤히 보이는 음성언어기술, 전자신문사, 2009
  2. Sadaoki Furui, "50 years of progress in speech recognition technology," in Proc. ICASSP 2007
  3. Hank Liao, Chris Alberti, Michiel Bacchiani, and Olivier Siohan, "Decision Tree State Clustering with Word and Syllable Features," in Proc. Interspeech 2010
  4. Johan Schalkwyk, Doug Beeferman, Fran_coise Beaufays, Bill Byrne, Ciprian Chelba, Mike Cohen, Maryam Garret, Brian Strope "Google Search by Voice:A case study, "in Visions of Speech: Exploring New Voice Apps in Mobile Environments, Call Centers and Clinics, A Neustein, Ed. Springer, 2010.
  5. Brandon Ballingerl, Cyril Allauzen2, Alexander Gruensteinl, Johan Schalkwyk2, "On-Demand Language Model Interpolation for Mobile Speech Input," in Proc. Interspeech 2010
  6. Ciprian Chelba, Thorsten Brants, Will Neveitt, Peng Xu," Study on Interaction between Entropy Pruning and Kneser-Ney Smoothing," in Proc. Interspeech 2010
  7. Global Autonomous Language Exploitation (GALE) - DARPA, (http://www.darpa.mil/Our_Work/I20/Programs/Global_Autonomous_Language_Exploitation_(GALE).aspx)
  8. CLASSiC Project - Computational Learning in Adaptive Systems for Spoken Conversation (http://www.classic-project.org/)
  9. A Aaron et aI., \Speech recognition for Darpa Communicator," in Proc. ICASSP 2001
  10. Hoon Chung, Ikjoo Chung, "Memory Efficient and Fast Speech Recognition system for low-resource mobile devices"IEEE consumer electronics, 2006
  11. Matusov, E., Kanthak, S., Ney, H. "Integrating Speech Recognition and Machine Translation: Where do We Stand?," in Proc. ICASSP 2006