DOI QR코드

DOI QR Code

Examination of a Voice Interaction Model for Smart TV through Conversation Patterns

대화 패턴 연구를 통한 스마트TV 음성 상호작용 모델의 탐구

  • Received : 2016.10.12
  • Accepted : 2016.12.22
  • Published : 2017.02.28

Abstract

As new smart devices are evolved into the intelligent agent who can reflect user intention and use context, user experience design for easy and convenient usability becomes a core competitive edge. Under the assumption that human centered natural interaction is necessary for the optimal smart TV experience, this study explores the types of voice interaction which are peculiar to TV watching context. In order to build a model for the users to naturally interact with Smart TV, conversation patterns were collected by requesting key features of Smart TV to intelligent agent. Collected sentences were applied to CfA model and classified by responses to activate features. The classified conversation patterns were divided into feature activation and information search. This study has identified that CfC1 occurred when voice interaction between Smart TV and users was vague and CfC2 occurred when the requests were complex or conditional. In conclusion, Simple Request Type is the most efficient model and voice interaction is more appropriate to use to clarify users' vague requests.

최근의 스마트 기기들은 사용자의 의도와 사용 맥락을 반영하는 지능형 에이전트의 형태로 발전하고 있으며, 기능을 더 쉽고 편리하게 활용할 수 있는 사용자 경험 설계가 경쟁력의 핵심이 되고 있다. 본 연구는 인간중심의 내추럴 인터랙션이 최적의 스마트TV 경험에 필수적이라는 전제하에 TV에 특화된 음성 인터랙션 방식을 탐구하고자 하였다. 사용자가 자연스러운 행태로 TV를 조작하는 모델을 구축하기 위하여 스마트TV의 주요 기능을 지능형 에이전트에 명령하도록 하였고 대화 패턴을 수집하였다. 수집된 문장은 CfA 모델에 대입하여 기능 실행을 위한 반응 별로 분류하였다. 분류된 5가지 대화 패턴은 스마트TV가 실행하는 기능 특성에 따라 '기능 실행'과 '정보 검색'으로 나눌 수 있었다. 사용자와 TV간의 음성 상호작용에서 모호한 요청의 경우 재확인을 위한 CfC1이 발생하고, 복합 의도나 조건부 요청에 대한 대응이 필요한 경우는 CfC2가 발생한다는 부분도 확인하였다. 본 연구의 결론은 스마트TV에서의 음성 UI 설계에서 Simple Request Type이 가장 효율적 모델이라는 점과 대화형 인터랙션은 가능한 사용자의 모호한 요청을 구체화하기 위한 단계에서만 활용되는 것이 적합하다는 것이다.

Keywords

References

  1. 김종진, 김준석, 김정희, 이현아, 서희철, "음성언어기술 기반 대화형 질의응답 시스템 개발 동향," 전자공학회지, 제41권, 제3호, pp.77-91, 2014.
  2. 문영찬, 김선정, 김진, 고영웅, "홈오토메이션 환경에서 스마트 TV 통합 인터페이스 설계 및 구현," 한국정보기술학회지, 제11권, 제2호, pp.87-94, 2013.
  3. 이혜민, 김승인, "음성인식 기반의 모바일 지능형 개인비서 서비스 사용성 비교 - Samsung S 보이스와 Apple 시리를 중심으로," 디지털디자인학연구, 제14권, 제1호, pp.231-240, 2014.
  4. 박전규, 정훈, 정의석, 강병옥, 박기영, 오유리, 이윤근, "스마트TV를 위한 음성인식 서비스 시스템의 구현," 대한전자공학회 하계종합학술대회, pp.1856-1857, 2013.
  5. 변대호, "감정표현어를 이용한 스마트TV의 사용자경험 평가," 한국콘텐츠학회논문지, 제15권, 제5호, pp.132-141, 2005. https://doi.org/10.5392/JKCA.2015.15.05.132
  6. D. Te'eni, "The language-action perspective as a basis for communication support systems," Communications of the ACM, 제49권, 제5호, pp.65-70. https://doi.org/10.1145/1125944.1125977
  7. T. Winograd and F. Flores, Understanding Computers and Cognition: A New Foundation for Design, Addison-Wesley, 1986.
  8. T. Winograd, "A Language/Action Perspective on the Design of Cooperative Work," Human-Computer Interaction, Vol.3, No.1, pp.3-30, 1987. https://doi.org/10.1207/s15327051hci0301_2
  9. G. Seland, "System designer assessments of role play as a design method: a qualitative study," NordiCHI '06 Proceedings of the 4th Nordic conference on Human-computer interaction: Changing roles, pp.222-231.
  10. K. T. Simsarian, "Take it to the next stage: the roles of role playing in the design process," CHI '03 Extended Abstracts on Human Factors in Computing Systems, pp.1012-1013, 2003.
  11. 조성일, 홍사윤, 홍지영, 양경인, 장구앙, 최진해, "Operation Command 에 따른 스마트 TV 입력방식 연구," 한국HCI학회 학술대회, pp.631-634, 2012.
  12. J. H. Choi and J. Y. Hong, "The natural way of gestures for interacting with smart TV," Journal of the Ergonomics Society of Korea, Vol.31, No.4, pp.567-575, 2012. https://doi.org/10.5143/JESK.2012.31.4.567
  13. 임용기, 21세기 세종 계획: 국어 특수자료 구축 연구보고서, 국립국어원, 2005,
  14. 양경인, 여준희, 이현철, 장세훈, 최지호, 최진해, "인간 대화패턴 연구를 통한 CFA 경험 모델 도출," 2013 한국 HCI학회 학술대회, pp.36-39, 2013.
  15. A. Dix, J. Finlay, G. D. Abowd, and R. Beale, Human-Conputer Interaction, 3rd Ed., Pearson, 2004.
  16. D. Twitchell, M. Adkins, J. Nunamaker, and J. Burgoon, "Using speech act theory to model conversations for automated classification and retrieval," Proceedings of the 9th International Working Conference on the Language-Action Perspective on Communication Modelling, pp.121-129, 2004.
  17. Scott R. Klemmer, Anoop K. Sinha, Jack Chen, James A. Landay, Nadeem Aboobaker, and Annie Wang, "Suede: a Wizard of Oz prototyping tool for speech user interfaces," UIST '00, Proceedings of the 13th annual ACM symposium on User interface software and technology, pp.1-10, 2000.