• 제목/요약/키워드: Audio User Interface

검색결과 54건 처리시간 0.032초

멀티미디어를 기반으로 하는 저작도구 툴북에서 객체 자동 변환을 이용한 자동 프리젠테이션 시스템 개발 (Development of Auto Presentation System of Toolbook Using Object Auto Transition on Multimedia Authoring Tool)

  • 양옥렬;정영식;이용주
    • 한국정보처리학회논문지
    • /
    • 제4권5호
    • /
    • pp.1182-1195
    • /
    • 1997
  • 멀티미디어 저작도구를 이용한 응용 프로그램 개발에 있어서, 기존의 저작도구를 멀티미디어 툴북의 경우 객체들이 사건을 기반으로 하는 상태 변환 방식을 사용하므로 프리젠테이션 을 자동으로 가능하게 할 수 있는 기능을 제공하지 못한다. 본 연구에서는 객체의 자동 변환 기법을 통하여 자동 프리젠테이션 기능을 멀티미디어 저작도구가 시스템 DLL(Dynamic Link Library) 형태로 제공하도록 하기 위한 객체 자동 변환기법을 개발하고자 이를 멀티미디어 툴복의 페이지 전환 및 미디어 제어 인터 페이스를 이용하여 오디오 자원의 상태 변환 기능을 추가하여 멀티미디어 저작도구의 기능 확정이 가능하게 하였다.

  • PDF

텔레메틱스 단말기 내의 오디오/비디오 명령처리를 위한 임베디드용 음성인식 시스템의 구현 (Implementation of Embedded Speech Recognition System for Supporting Voice Commander to Control an Audio and a Video on Telematics Terminals)

  • 권오일;이흥규
    • 대한전자공학회논문지TC
    • /
    • 제42권11호
    • /
    • pp.93-100
    • /
    • 2005
  • 본 논문에서는 차량 내에서 음성인식 인터페이스를 이용한 오비오, 비디오와 같은 응용서비스 처리를 위해 임베디드형 음성인식 시스템을 구현한다. 임베디드형 음성인식 시스템은 DSP 보드로 제작 포팅된다. 이는 음성 인식률이 마이크, 음성 코덱 등의 H/W의 영향을 받기 때문이다. 또한 차량 내 잡음을 효율적으로 제거하기 위한 최적의 환경을 구축하고, 이에 따른 테스트 환경을 최적화한다. 본 논문에서 제안된 시스템은 차량 내에서의 신뢰적인 음성인식을 위해 잡음제거 및 특징보상 기술을 적용하고 임베디드 환경에서의 속도 및 성능 향상을 위한 문맥 종속 믹스쳐 공유 음향 모델링을 적용한다. 성능평가는 일반 실험실 환경에서의 인식률과 실제 차량 내에서의 실차 테스트를 통해 검증되었다.

핸드제스처를 이용한 원격미팅 자료 인터페이스 (Hand Gesture based Manipulation of Meeting Data in Teleconference)

  • 송제훈;최기호;김종원;이용구
    • 한국CDE학회논문집
    • /
    • 제12권2호
    • /
    • pp.126-136
    • /
    • 2007
  • Teleconferences have been used in business sectors to reduce traveling costs. Traditionally, specialized telephones that enabled multiparty conversations were used. With the introduction of high speed networks, we now have high definition videos that add more realism in the presence of counterparts who could be thousands of miles away. This paper presents a new technology that adds even more realism by telecommunicating with hand gestures. This technology is part of a teleconference system named SMS (Smart Meeting Space). In SMS, a person can use hand gestures to manipulate meeting data that could be in the form of text, audio, video or 3D shapes. Fer detecting hand gestures, a machine learning algorithm called SVM (Support Vector Machine) has been used. For the prototype system, a 3D interaction environment has been implemented with $OpenGL^{TM}$, where a 3D human skull model can be grasped and moved in 6-DOF during a remote conversation between distant persons.

비 참조 QoE를 이용한 영상품질 측정 및 통합품질 관리 시스템의 설계 (Design of Video Quality Assurance and Integrated Quality Management System using No Reference QoE)

  • 김상수;박동수
    • 정보학연구
    • /
    • 제12권3호
    • /
    • pp.49-57
    • /
    • 2009
  • This Paper provides perceptual metrics for video quality based on properties of human visual system, and audio quality based on human audition. All metrics work without reference signals, allowing non-intrusive, in-service measurements. A simple and easy-to-learn user interface displays the metrics and saves them in popular file formats like CSV. In this paper, proposed method was able to various and corrective measurement for the multimedia service video quality. As that it was able to application to set up service guide line and the methode of measurement and system for the set up standardization of the high quality video service.

  • PDF

이동 멀티미디어 영상의 객관적인 품질측정 시스템 구현에 관한 연구 (A Study on Implementation of Objective Quality Assurance System for Mobile Multimedia Video)

  • 백승은;온진호;주해종;홍봉화;김은원;박영배
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2007년도 하계종합학술대회 논문집
    • /
    • pp.487-488
    • /
    • 2007
  • This Paper provides perceptual metrics for video quality based on properties of human visual system, and audio quality based on human audition. All metrics work without reference signals, allowing non-intrusive, in-service measurements. A simple and easy-to-learn user interface displays the metrics and saves them in popular file formats like CSV.

  • PDF

TVML (TV program Making Language) - Automatic TV Program Generation from Text-based Script -

  • Masaki-HAYASHI;Hirotada-UEDA;Tsuneya-KURIHARA;Michiaki-YASUMURA
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1999년도 KOBA 방송기술 워크샵 KOBA Broadcasting Technology Workshop
    • /
    • pp.151-158
    • /
    • 1999
  • This paper describes TVML (TV program Making Language) for automatically generating television programs from text-based script. This language describes the contents of a television program using expression with a high level of abstraction like“title #1”and“zoom-in”. The software used to read a script written in TVML and to automatically generate the program video and audio is called the TVML Player. The paper begins by describing TVML language specifications and the TVML Player. It then describes the“external control mode”of the TVML Player that can be used for applying TVML to interactive applications. Finally, it describes the TVML Editor, a user interface that we developed which enables users having no specialized knowledge of computer languages to make TVML scripts. In addition to its role as a television-program production tool. TVML is expected to have a wide range of applications in the network and multimedia fields.

Speech Interactive Agent on Car Navigation System Using Embedded ASR/DSR/TTS

  • Lee, Heung-Kyu;Kwon, Oh-Il;Ko, Han-Seok
    • 음성과학
    • /
    • 제11권2호
    • /
    • pp.181-192
    • /
    • 2004
  • This paper presents an efficient speech interactive agent rendering smooth car navigation and Telematics services, by employing embedded automatic speech recognition (ASR), distributed speech recognition (DSR) and text-to-speech (ITS) modules, all while enabling safe driving. A speech interactive agent is essentially a conversational tool providing command and control functions to drivers such' as enabling navigation task, audio/video manipulation, and E-commerce services through natural voice/response interactions between user and interface. While the benefits of automatic speech recognition and speech synthesizer have become well known, involved hardware resources are often limited and internal communication protocols are complex to achieve real time responses. As a result, performance degradation always exists in the embedded H/W system. To implement the speech interactive agent to accommodate the demands of user commands in real time, we propose to optimize the hardware dependent architectural codes for speed-up. In particular, we propose to provide a composite solution through memory reconfiguration and efficient arithmetic operation conversion, as well as invoking an effective out-of-vocabulary rejection algorithm, all made suitable for system operation under limited resources.

  • PDF

MOST 인터페이스를 위한 I2C 통신 드라이버의 구현에 관한 연구 (A Study on I2C Communication Driver Implementation for MOST Interface)

  • 성현용;장시웅
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2010년도 춘계학술대회
    • /
    • pp.739-742
    • /
    • 2010
  • 차량용 멀티미디어 네트워크 시스템의 증가로 인해 MOST 인터페이스 모듈의 수요가 증가하고 있다. MOST 장치는 네트워크 컨트롤러인 INIC 부분과 마이크로 컨트롤러의 EHC 부분으로 구성된다. MOST 장치를 개발함에 있어서 EHC에서 INIC을 통하여 MOST 네트워크로의 효율적인 데이터 송수신을 하기 위해서는 적절한 장치 드라이버의 구현이 요구된다. 본 논문에서는 MOST 네트워크 컨트롤러가 지원하는 I2C, MediaLB, I2S 통신방식 중 MOST 네트워크상의 각 노드간 상태 및 제어 메시지를 전달하는데 이용하는 I2C 통신 드라이버 구현 방안을 제시한다. INIC을 통한 MOST 네트워크와의 효과적인 통신을 위해서 NetService API와 연계하여 I2C 통신 드라이버를 구현한다. 본 연구에서는 I2C 통신의 low level driver의 구현을 위해 MOST 오디오 인터페이스 장치에 통신드라이버 소스를 포팅함으로써 테스트 하였으며, 향후 이에 대한 연구를 확장하여 OS 기반의 MOST 장치에 대한 다양한 드라이버를 개발할 예정이다.

  • PDF

관람자 내러티브를 활용한 인터랙티브 텍스트 콜라주 창작 연구 (A Study on the Creation of Interactive Text Collage using Viewer Narratives)

  • 임수연
    • 문화기술의 융합
    • /
    • 제8권4호
    • /
    • pp.297-302
    • /
    • 2022
  • 디지털 공간에 익숙한 동시대 관람자들은 자기표현 욕구를 드러내며 의사표현 도구로 음성, 텍스트와 제스처를 많이 이용한다. 본 연구의 목적은 발화한 관람자의 내러티브를 관람자의 모습을 이용하여 콜라주 형식으로 표현하고, 관람자의 움직임에 의한 스토리를 재생산하고 확장하는 인터랙티브 아트의 창작이다. 제안된 인터랙티브 아트는 관람자로부터 획득한 음성, 영상 정보를 텍스트 콜라주로 시각화하고, 제스처 정보와 자연스러운 사용자 인터페이스(Natural User Interface)를 이용하여 쉽고 간편하게 실시간으로 상호작용하며 개인화된 감정을 표현할 수 있도록 한다. 관람자로부터 획득한 세 가지 정보는 서로 연결되어 관람자의 현재 일시적 감정을 표출한다. 텍스트의 경직된 내러티브는 관람자의 초상 이미지와 제스처를 통하여 약간의 자유도를 가지게 되고, 동시에 현실과 밀착된 스토리의 구조를 생산하고 확장해간다. 이렇게 창조된 작품 공간은 실시간으로 관람자의 내러티브를 반영하고 갱신되며 창작되는 체험 공간이며, 자신의 반영이다. 또한 관람자의 능동적인 개입과 행위를 통해 적극적인 감상 행위를 유도해낸다.

철도 차량용 이벤트 레코더를 위한 분석 소프트웨어 개발 (Development of Analysis Software for Railway Vehicle Event Recorder)

  • 한광록;장동욱;김광열;손석원
    • 한국산학기술학회논문지
    • /
    • 제10권6호
    • /
    • pp.1245-1255
    • /
    • 2009
  • 최근 철도차량에도 객관적이고 신속 정확하게 사고 원인을 분석하고, 사고를 미리 예방하기 위하여 여러 나라에서 철도 차량의 운행정보가 기록되는 블랙박스 즉, 이벤트 레코더의 설치를 법제화하고 있고, 이에 대한 연구를 진행하고 있다. 또한 사고에 대한 정확한 판단을 위하여 저장된 데이터를 분석하고 표현할 수 있는 분석 소프트웨어가 요구된다. 따라서 본 논문에서는 이벤트 레코더에 기록된 데이터를 분석하고 음성과 영상을 재생하는 분석 소프트웨어를 개발하였다. 본 논문의 이벤트 레코더 분석 소프트웨어는 신속하고 정확하게 사고 원인을 규명할 수 있고, 구간별 운행 패턴과 기관사의 습관 등을 파악할 수 있다. 또한 이미 발생한 사고 상황에 대해 영상과 음성을 함께 분석함으로써, 차후 발생할 수 있는 사고를 미연에 방지할 수 있을 것으로 기대한다.