• 제목/요약/키워드: voice interface

검색결과 298건 처리시간 0.022초

CDMA 이동통신 망에서의 반향제거기 구현에 관한 연구 (A Study on the Realization of Echo Canceller in CDMA Mobile Communication Networks)

  • 유태훈;박광철;이윤희;김기두
    • 대한전자공학회논문지TE
    • /
    • 제37권5호
    • /
    • pp.36-47
    • /
    • 2000
  • CDMA 방식의 디지털 셀룰러 시스템은 아날로그 방식에 비해 깨끗한 음질을 제공하지만 음성코딩과 전송과정에서 지연이 발생하고 BSC 및 PSTN과의 인터페이스에 의해서 반향이 발생된다. 본 논문에서는 Block Update NLMS 알고리즘을 TMS320C54X DSP에 적용하여 실시간 구현함으로써 반향제거기의 성능개선을 도모하였다. 제안한 방식을 실제로 단말기 내부에 적용하여 다양한 형태의 반향(LE, ESE, AE)을 더욱 정확히 제거할 수 있도록 하였고, 또한 반향경로의 변화에도 반향제거기의 성능을 최대화하기 위하여 VAD를 이용한 지연의 변화 검출과 이 지연을 버퍼에 적용 할 수 있는 구조를 설계하였으며, 동시통화 검출기를 두어 동시통화나 반향경로가 변화하여도 이를 최소의 오차로 판단해낼 수 있게 하였다.

  • PDF

영유아교육기관용 모바일 메신저 어플리케이션 구현 (An Implementation of Mobile Messenger Application for Kindergartens and Nurseries)

  • 한동균
    • 디지털콘텐츠학회 논문지
    • /
    • 제13권3호
    • /
    • pp.401-412
    • /
    • 2012
  • 스마트폰을 통한 사용자간 소통방법은 휴대성과 공간의 제약을 넘어선 새로운 모바일 커뮤니케이션의 패러다임을 만들고 있다. 스마트폰 모바일 인스턴트 메신저(Mobile Instant Messenger: MIM)는 기존의 데스크톱 환경에서 시작하여, 멀티미디어 콘텐츠, 텍스트, 음성 등 다양한 소통 기능을 제공하고 있다. 유치원, 어린이집에서는 학부모와 소통을 위해 홈페이지, 전화, SMS, 프린트된 유인물, 수기작성 알림장 등을 활용하고 있다. 아이즈플러스는 학부모와 교사, 원장과 사진, 동영상, 채팅 및 등/하원 관리를 포함한 스마트폰을 이용한 커뮤니케이션 활성화를 목적으로 개발되었으며 영유아교육기관 전용 모바일 메신저 초기 개발 사례라는데 그 의의가 있다. 본 연구는, 사용자 환경과 커뮤니케이션 유형분석, App의 기획과정과 스토리텔링을 활용한 인터페이스 디자인개발과 사례를 연구함으로써, 특정그룹을 대상으로 하는 모바일 메신저 개발의 접근법을 제시하였다.

키넥트를 활용한 상황인지형 디지털 사이니지 연구 (A Research on Context-aware Digital Signage using a Kinect)

  • 노광현;이석기
    • 한국인터넷방송통신학회논문지
    • /
    • 제14권1호
    • /
    • pp.265-273
    • /
    • 2014
  • 본 논문에서는 제4의 스크린 미디어로 불리며 급성장 중인 디지털 사이니지에 적용할 수 있는 키넥트 센서기반의 상황인지기술을 연구하였다. 디지털 사이니지에 필요한 상황인지기능을 분류하고, 디지털 사이니지 제어를 위한 비접촉 인터페이스를 제공하고, 상황에 맞는 콘텐츠를 능동적으로 제공할 수 있는 상황인지형 디지털 사이니지 플랫폼을 개발하였다. 기본적인 상황인지기능으로는 사용자 인원수, 제스처, 음성, 소리방향 등이 연구되었고, 향후 고급 상황인지기능을 연구할 계획이다. 본 연구에서 개발된 플랫폼은 일반적인 상황인지형 디지털 사이니지 개발시 참고 모델이 될 수 있을 것이다.

Speech Interactive Agent on Car Navigation System Using Embedded ASR/DSR/TTS

  • Lee, Heung-Kyu;Kwon, Oh-Il;Ko, Han-Seok
    • 음성과학
    • /
    • 제11권2호
    • /
    • pp.181-192
    • /
    • 2004
  • This paper presents an efficient speech interactive agent rendering smooth car navigation and Telematics services, by employing embedded automatic speech recognition (ASR), distributed speech recognition (DSR) and text-to-speech (ITS) modules, all while enabling safe driving. A speech interactive agent is essentially a conversational tool providing command and control functions to drivers such' as enabling navigation task, audio/video manipulation, and E-commerce services through natural voice/response interactions between user and interface. While the benefits of automatic speech recognition and speech synthesizer have become well known, involved hardware resources are often limited and internal communication protocols are complex to achieve real time responses. As a result, performance degradation always exists in the embedded H/W system. To implement the speech interactive agent to accommodate the demands of user commands in real time, we propose to optimize the hardware dependent architectural codes for speed-up. In particular, we propose to provide a composite solution through memory reconfiguration and efficient arithmetic operation conversion, as well as invoking an effective out-of-vocabulary rejection algorithm, all made suitable for system operation under limited resources.

  • PDF

Maximum Likelihood-based Automatic Lexicon Generation for AI Assistant-based Interaction with Mobile Devices

  • Lee, Donghyun;Park, Jae-Hyun;Kim, Kwang-Ho;Park, Jeong-Sik;Kim, Ji-Hwan;Jang, Gil-Jin;Park, Unsang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권9호
    • /
    • pp.4264-4279
    • /
    • 2017
  • In this paper, maximum likelihood-based automatic lexicon generation using mixed-syllables is proposed for unlimited vocabulary voice interface for East Asian languages (e.g. Korean, Chinese and Japanese) in AI-assistant based interaction with mobile devices. The conventional lexicon has two inevitable problems: 1) a tedious repetition of out-of-lexicon unit additions to the lexicon, and 2) the propagation of errors during a morpheme analysis and space segmentation. The proposed method provides an automatic framework to solve the above problems. The proposed method produces a level of overall accuracy similar to one of previous methods in the presence of one out-of-lexicon word in a sentence, but the proposed method provides superior results with the absolute improvements of 1.62%, 5.58%, and 10.09% in terms of word accuracy when the number of out-of-lexicon words in a sentence was two, three and four, respectively.

Implementation of Android-based Interactive Edutainment Contents Using Authoring Tool Developed for Interactive Animation

  • Song, Mi-Young
    • 한국컴퓨터정보학회논문지
    • /
    • 제23권4호
    • /
    • pp.71-80
    • /
    • 2018
  • In this paper, we developed an interactive animation authoring tool and developed the Android based interactive edutainment contents. The authoring tool for creating interactive animations developed in this paper is based on a graphical user interface, so users can easily create interactive animations. Interactive animation contents created by this authoring tool can be created as images and xml files so that they can be used directly on mobile devices. In order to increase learning efficiency for children, Android-based interactive edutainment electronic storybooks, which is implemented using this authoring tool, provided a recording function to listen to the parents' voice as well as an interactive action in which the characters move in accordance with the story line. We also provided a STEAM game that combines creativity and imagination with creative science and technology. Therefore, by creating the edutainment contents through the proposed authoring tool for interactive animation, various interactive animation contents could be produced more easily than the code implementation method. Through this study, I hope that it will be helpful for the development of various interactive edutainment contents to provide educational contents considering the quantity and quality to infants.

재사용성을 고려한 항공기 인터콤 오디오 라우팅 처리방안 연구 (A Study on the Audio Routing Processing for Aircraft Intercom Considering Reusability)

  • 이승목
    • 항공우주시스템공학회지
    • /
    • 제11권6호
    • /
    • pp.1-9
    • /
    • 2017
  • 항공기 인터콤 장비는 각종 LRU가 송신한 오디오를 혼합, 분배하고 상황인지용 메세지 재생을 통해 조종사의 원할한 임무 수행에 큰 역할을 담당하는 장비이다. 특히, 수신되는 오디오를 혼합/분배하는 오디오 라우팅의 경우에는 수신되는 오디오 채널에 대해 On/Off 제어를 하고, 연동 LRU에 오디오를 송신하여 임무에 대한 상황전파 및 공유를 통해 임무 수행에 매우 중요한 기능이다. 이러한 오디오 라우팅 처리는 다양한 연동 신호를 수반하고 있어 다양한 조합이 발생해 이에 대한 예외처리가 복잡해지므로 응집도를 낮고 결합도를 높여 유지보수성과 재사용성을 낮춘다. 이를 방지고자 소프트웨어 변경 시 영향을 최소화하고 재사용성과 유지보수성을 높인 항공기 인터콤용 오디오 라우팅을 효율적으로 처리하는 방안을 제시한다.

IP에 기반한 블루투스 기저대역 모듈의 설계 및 구현 (Design and Implementation of a Bluetooth Baseband Module based on IP)

  • 임지숙;천익재;김보관
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (하)
    • /
    • pp.1285-1288
    • /
    • 2002
  • Bluetooth wireless technology is a publicly available specification proposed for Radio Frequency (RF) communication for short-range and point-to- multipoint voice and data transfer. It operates in the 2.4GHz ISM(Industrial, Scientific and Medical) band and offers the potential for low-cost, broadband wireless access for various mobile and portable devices at range of about 10 meters. In this paper, we describe the structure and the test results of the bluetooth baseband module we have developed. This module was developed based on IP reuse. So Interface of each module such as link controller UART, and audio CODEC is designed based on ARM7 comfortable processor. We also considered various interfaces of related external chips. The fully synthesizable baseband module was fabricated in a $0.25{\mu}m$ CMOS technology occupying $2.79{\times}2.8mm^2$ area including the ARM TDMI processor. And a FPGA implementation of this module is tested for file and bit-stream transfers between PCs.

  • PDF

음절 별 발화속도 조절을 통한 노인 음석인식 개선 (Syllabic Speech Rate Control for Improving Elderly Speech Recognition of Smart Devices)

  • 경주원;손귀영;권순일
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.1711-1714
    • /
    • 2015
  • 스마트 디바이스가 사회와 소통할 수 있는 도구가 되었음에도 불구하고 아직까지 노인들이 사용하기에는 어려움이 있다. 여기에 음성인식 기술을 이용한 음성인터페이스를 활용함으로써 노인들의 스마트 디바이스에 대한 사용성을 높일 수 있다. 하지만 일반적인 음성인식 시스템은 청장년의 발성 스타일에 맞춰져 있기 때문에, 노화된 노인의 발성이 그대로 입력될 경우 음성인식률이 하락한다. 본 연구에서는 노인의 음절 별 발화속도가 일반적인 음성인식 시스템의 성능을 보증할 수 있는 범위를 벗어나는 경우가 많다는 분석 결과를 토대로 노인의 음절 별 발화속도를 조정한 결과 노인남녀 평균 음성인식률이 15.3% 상승하였다. 이처럼 노인의 음성인식 오류 원인들 중 하나인 발화속도의 재조정으로 음성 인식률을 높일 수 있는 토대를 마련하였다. 이는 노인들이 스마트 디바이스를 이용하여 쉽고 정확한 작업을 수행할 수 있게 됨으로써, 노인들의 사회 참여와 정보 획득이 용이해 지고 더 나아가 세대 간의 소통에도 이바지할 것으로 기대한다.

모바일 기기 기반 사용자 중심형 전시관 정보 안내 시스템의 설계 및 구현 (Design and Implementation of user centric pavilion information guide system based on commercial mobile device)

  • 윤현주;부소영;최유주
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권2호
    • /
    • pp.187-199
    • /
    • 2006
  • 본 논문에서는 PDA(Personal Digital Assistant: 이하 PDA라 약칭함)와 같은 모바일 기기를 기반으로 하여 사용자가 원하는 대로 시스템의 인터페이스가 구성되는 사용자 중심형 전시관 정보 안내 시스템을 제안한다. 이는 PDA나 휴대폰 등과 같은 모바일 기기를 기반으로 제작함으로써 이동하는 사용자에게 휴대성의 편리를 제공하며, 기존의 브라우저와는 다르게 작은 디바이스 화면에서도 모든 데이터들에 대한 정보가 한 화면에 디스플레이되며, 사용자와의 인터랙션을 통하여 사용자가 원하는 정보를 중심으로 시스템의 인터페이스와 정보 요소를 구성할 수 있게 하여 이용에 편리성을 더한다. 또한 안내 대상의 위치 정보와 상세 정보 등을 글, 이미지, 음성, 동영상 등의 다양한 형태로 사용자에게 제공하는 데 그 특징이 있다. 본 논문에서 시스템은 미디어 정보 데이터베이스를 갖추고 있는 미디어 데이터 서버와 데이터베이스와 휴대용 안내시스템을 실시간으로 동시에 제어하기 위한 휴대용 시스템 컨트롤 서버 그리고 사용자의 요구 사항을 입력받고 구성된 안내 정보를 디스플레이하는 휴대용 안내 시스템 등으로 구성된다. 각 시스템은 TCP/IP기반의 네트워크 연결과 여러 전시관 형태나 데이터의 종류에 따라 갱신 및 추가, 교환이 가능하도록 하기 위한 XML(extensible Markup Language)과 JAVA 2 Micro Edition 기반의 제작을 제시한다. 이는 어떤 모바일 기기에서도 사용할 수 있게 하는 시스템의 범용성을 높일 수 있다.

  • PDF