• Title/Summary/Keyword: 음성인터페이스

Search Result 401, Processing Time 0.037 seconds

Voice User Interface Technology (음성인터페이스 기술)

  • Lee, Y.K.;Park, J.;Kim, S.H.
    • Electronics and Telecommunications Trends
    • /
    • v.20 no.5 s.95
    • /
    • pp.1-15
    • /
    • 2005
  • 음성인터페이스 기술이란 인간의 가장 자연스러운 의사소통 수단 중의 하나인 ‘말’을이용하여 기계와 인간과의 대화를 가능하게 하는 기술이다. 음성인터페이스 기술에 대한 연구는 1960년대부터 이루어져 왔으며 1990년대 후반부터 제한적으로 상용화되기 시작하였다. 아직까지는 기술적 한계에 의해서 간단한 명령어를 알아들을 수 있는 수준이며 응용 분야도 극히 제한되어 있으나 향후 텔레매틱스, 지능형로봇, 홈오토메이션등의 신성장동력 산업이 활성화됨에 따라 기존의 키보드, 마우스 등의 인터페이스 수단들이 충분히 만족스럽지 않은 환경으로 변화하면서, 음성인터페이스 기술은 매우 중요한 대안으로 떠오르고 있다. 본 고에서는 음성인터페이스 기술의 기본 원리 및 요소기술을 설명하고 관련 산업동향 및 응용분야, 그리고 향후 신성장동력 산업을 중심으로 한 발전 전망을 예측해본다.

음성정보기술 국제 표준화 동향

  • 홍기형
    • Korea Information Processing Society Review
    • /
    • v.11 no.2
    • /
    • pp.33-41
    • /
    • 2004
  • 언제, 어디서, 어떤 장치를 사용하더라도 정보의 검색이나 접근이 가능해지는 유비쿼터스 환경이 가시화되고 있어, 음성을 사용한 사용자 인터페이스의 중요성이 증대하고 있다. 음성인식, 합성, 화자인증 등 음성 등의 음성처리엔진의 기술 수준이 상용화 단계에 접어들고, 이동 중과 같이 모니터 등 시각적 인터페이스의 사용이 용이하지 않은 상황에서도 정보 접근기 요구가 증대함에 따라 음성은 정보시스템 의 중요한 인터페이스로 자리매김 하고 있다. 음성정보기술은 인간의 가장 자연스러운 상호작용 수단인 음성을 이용하여. 시스템에 명령을 내리고, 시스템의 명령 수행 결과를 음성으로 전달하는 음성을 이용한 정보 시스템 인터페이스를 구현하기 위 한 기술을 의미한다. 또한, 음성정보시스템은 음성을 이용한 사용자인터페이스가 가능한 정보시스템을 뜻하며, (그림 1)과 같이 음성처리엔진, 사용자 접속망, 사용자 프로파일 및 음성응용시스템으로 구성된다.(중략)

  • PDF

A Study on the Voice Interface for Mobile Environment (모바일기반 음성인터페이스에 관한 연구)

  • Kim, Soo-Hoon;Ahn, Jong-Young
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • /
    • v.13 no.1
    • /
    • pp.199-204
    • /
    • 2013
  • Google's android-based voice interface is limited to the web application and the users are rare. In this paper, We suggest the method that can be done using existing android-based voice engine and develope voice application. We also study the environments of android-based voice interface and present the appropriate voice interface in mobile environment.

A Method of Arrangement of Voice and Sound : For User Interface of Domestic Appliance (음성과 소리의 할당 방법 : 가전제품 UI 를 중심으로)

  • Hong, Ji-Young;Chae, Haeng-Suk;Lee, Seung-Yong;Park, Young-Hyun;Kim, Jun-Hee;Ryu, Hyung-Su;Kim, Jong-Wan;Han, Kwang-Hee
    • 한국HCI학회:학술대회논문집
    • /
    • 2007.02b
    • /
    • pp.478-483
    • /
    • 2007
  • 본 연구는 가전제품 사용자 인터페이스에서 음성 신호와 청각 신호의 최적 할당 방법을 기술하였다. 가정에서 수시로 접하는 가전제품에서 음성 유저 인터페이스(Voice User Interface, 이하 VUI) 는 음성을 매개로 일어나는 인간과 기계 간 인터페이스를 뜻한다. 음성 유저 인터페이스의 단독적 적용보다는 소리 신호와 함께 사용하여 사용자들의 인터페이스를 향상시킬 수 있다. 본 연구에서는 주부 사용자들을 대상으로 F.G.I, 실험, Depth Interview 를 수행하여 가전제품의 음성 생성 및 표현 인터페이스에서 음성과 소리 신호의 배치에 대한 사용자들의 니즈 조사 및 실험 결과를 기반으로 최적의 할당 방법을 제시하였다.

  • PDF

Design of an Automatic Speech translation system on the Telephone Line (전화망을 통한 자동음성번역 서비스 시스템 설계)

  • Lee Sung-Joo;Lee Yunggik;Yang Jea-Woo
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.57-60
    • /
    • 2002
  • 본 논문에서는 현재 ETRI에서 개발 중인 유/무선 전화망을 통한 다국어간 대화체 음성번역서비스 시스템에 대해서 소개한다. 전화망을 통한 자동음성번역서비스 시스템은 여행대화영역을 서비스 대상영역으로 하고 있고 자동음성번역서비스를 필요로 하는 사용자들은 동일한 장소에서 대면하고 있으며 서로 다른 언어를 사용하기 때문에 서로 의사 소통에 어려움을 겪고 있다고 가정한다. 따라서 여기서 말하는 자동음성번역 시스템의 특징은 인간과 기계간의 인터페이스를 그 대상으로 하는 것이 아니라 인간과 인간사이의 인터페이스를 그 대상으로 하고 있다는 정이다. 인간과 인간사이의 인터페이스 상황에서는 인간의 이해력이 시스템 오류를 정정할 수 있는 여지를 지니고 있다. 따라서 시스템이 사용자의 말하는 의도 혹은 개념만 잘 전달할 수 있다면 서로 다른 언어를 사용하는 사용자들 사이에서도 이러한 시스템을 통한 의사소통이 가능하다. 자동음성번역서비스 시스템은 크게 음성인식모듈 문장해석 및 번역 모듈, 음성합성모듈, 시스템통합 모듈 그리고 전화망 인터페이스 모듈로 나뉜다. 여기서는 자동음성번역 서비스 시스템의 각 모듈들의 주요 특징과 상호 인터페이스 방법에 대해서 소개한다.

  • PDF

Natural Language Interface for MPEG IoMT (MPEG IoMT 에서의 자연어 인터페이스 표준화)

  • Choi, Miran
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2019.06a
    • /
    • pp.281-284
    • /
    • 2019
  • 본 논문에서는 최근 인공지능 기반의 자연어이해기술을 활용한 자연어 인터페이스 표준화 현황을 소개하고 사물기반의 미디어 사물간의 기능들을 표준화하고 있는 MPEG IoMT 표준에서의 자연어 인터페이스 구현 내용을 소개한다. 자연어 인터페이스에는 음성인식 기술, 음성합성 기술, 언어처리 기술, 질의응답기술, 음성 자동통역 기술등이 포함되며 언어지능으로서의 자연어 인터페이스를 사물 인터넷 환경에서 구현하기 위해 MPEG IoMT 의 표준화된 포맷과 활용 방식을 소개한다.

  • PDF

Research on Emotional Factors and Voice Trend by Country to be considered in Designing AI's Voice - An analysis of interview with experts in Finland and Norway (AI의 음성 디자인에서 고려해야 할 감성적 요소 및 국가별 음성 트랜드에 관한 연구 - 핀란드와 노르웨이의 전문가 인뎁스 인터뷰를 중심으로)

  • Namkung, Kiechan
    • Journal of the Korea Convergence Society
    • /
    • v.11 no.9
    • /
    • pp.91-97
    • /
    • 2020
  • Use of voice-based interfaces that can interact with users is increasing as AI technology develops. To date, however, most of the research on voice-based interfaces has been technical in nature, focused on areas such as improving the accuracy of speech recognition. Thus, the voice of most voice-based interfaces is uniform and does not provide users with differentiated sensibilities. The purpose of this study is to add a emotional factor suitable for the AI interface. To this end, we have derived emotional factors that should be considered in designing voice interface. In addition, we looked at voice trends that differed from country to country. For this study, we conducted interviews with voice industry experts from Finland and Norway, countries that use their own independent languages.

Design and Implementation of SALT-based Voice Browser (SALT 기반 음성 브라우저의 설계 및 구현)

  • Lee, Yong-Hee;Lee, Dong-Woo;Shin, Hee-Sook;Choi, Eun-Jeong;Park, Jun-Seok
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.11a
    • /
    • pp.574-576
    • /
    • 2005
  • 정보통신 기기의 발전하면서 소형화, 경량화와 함께 이동성을 갖춘 다양한 차세대 PC 기기들이 나타나고 있다. 기존의 마우스나 키보드를 통한 인터페이스뿐만 아니라 음성, 펜, 제스처 등을 이용한 멀티모달 인터페이스에 대한 요구가 증대되면서 이에 대한 연구가 활발히 이루어지고 있다. 또한 최근의 음성 처리 기술이 발전하고 단말기의 성능이 개선되면서 음성을 이용한 인터페이스에 대한 연구가 활발히 이루어지고 있다. 본 논문에서는 브라우저에서 음성 지원을 위해 제안된 SALT를 기반으로 하여 사용자와 음성 인터페이스가 가능한 음성 브라우저를 설계하고 구현한다.

  • PDF

Multimodal interface for Korean inputs using speech and keypad (음성/키 패드를 이용한 한글 단어 입력용 멀티모달 인터페이스)

  • Kim, Won-Woo;Jeon, Ho-Hyun;Park, Sung-Chan
    • 한국HCI학회:학술대회논문집
    • /
    • 2007.02a
    • /
    • pp.417-422
    • /
    • 2007
  • 멀티모달 인터페이스(multimodal interface)는 사람과 기계 사이의 통신을 위해 여러 가지 수단을 사용함을 말한다. 본 고에서는 휴대폰 키 패드를 통한 문자 입력과 마이크를 통한 음성 인식의 두 가지 모드를 함께 사용하여 단어를 입력하는 새로운 인터페이스 방법을 제시함으로써 미래지향적 휴먼 인터페이스의 핵심으로 인지되고 있는 음성인식의 한계, 특히 한국어 인식의 문제점을 해결하고자 한다.

  • PDF

Implementation of Packet Voice Protocol (패킷음성 프로토콜의 구현)

  • 이상길;신병철;김윤관
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.18 no.12
    • /
    • pp.1841-1854
    • /
    • 1993
  • In this paper, the packet voice protocol for the transmission of voice signal onto ethernet is implemented in a personal computer (PC). The packet voice protocol used is a modified one from CCITT G.764 packetized voice protocol. The hardware system to facilitate the voice communication onto ethernet is divided into telephone interface, speech processing, PC interface and controllers. The software structure of the protocol is designed according to the OSI seven layer architecture and is divided into three routines : ethernet device driver, telephone interface, and processing routine of the packet voice protocol. Experiments through ethernet with telephone interface show that this packet voice communication achieves satisfactory quality when the network traffic is light.

  • PDF