• Title/Summary/Keyword: 음성 검색

Search Result 355, Processing Time 0.025 seconds

Stocks information Implementation System based on the SAIP at CTI module (SAPI 기반 CPI 모듈을 이용한 주식정보 시스템 구현)

  • 오세일;고진한;박원배
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04a
    • /
    • pp.439-441
    • /
    • 2001
  • 보이스 포탈(Voice Portal) 서비스란 알고자 하는 정보를 음성으로 전화를 통해 명령하면 원하는 정보를 음성으로 서비스이다. 본 논문에서 구현된 시스템은 원하는 주식 정보를 음성으로 명령하면 Voice XML 서버가 찾고자 하는 주식 종목을 검색하여 다시 음성으로 알려주는 시스템이다. 인증의 절차를 수행하는 SMS(Short Message Service) 서버 모듈, PSTN 망과 Database 서버사이의 인터페이스를 제공하는 CTI(Computer Telephony Integration) 모듈, CTI 서버와 WWW(World Wide Web) 사이의 Voice XML 모듈, 정보를 검색하기 위한 Searching 모듈들이 필요하다. 음성 인식 기술을 기반으로 한 CTI 모듈 설계를 구현하였다. 또한 인정 방식으로 Random한 일회용 패스워드를 기반으로 한 SML 인증을 택하므로 더욱 더 안정된 서비스 제공을 목적으로 하였다.

On a Waveform Coding Technique Using Pitch Searching and 3-Level Clipping (피치검색기법과 3-Level Clipping을 이용한 음성 파형부호화법에 관한 연구)

  • 김규홍
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.08a
    • /
    • pp.127-130
    • /
    • 1998
  • 피치검색과 3-level clipping을 이용한 새로운 파형부호화법을 제안하고자 한다. 제안한 방법에서는 우선 피치를 검출하여 기준피치파형과 인근피치파형을 검색한다. 그 후 유사도 측정시 기준피치파형과 인근 피치파형에 대해 3-level clippng을 수행한다. 클리핑된 기준피치파형가 인근피치파형간의 유사도를 측정하여 유사성이 크다면 피치정보와 에너지 정보만을 전송하거나 저장하여 압축을 하고, 유사성이 적다면 인근피치파형을 압축을 하지 않고 저장한다. 그 후에 저장된 ?ㅇ을 기준 피치파형으로 재정의 하여 다시 반복적으로 압축을 수행한다. 압축된 음성신호를 다시 복원할 때에는 수신 또는 저장된 음성신호를 이용하여 PSOLA 방식으로 합성을 수행한다. 평균압축율이 약 65%일 경우에도, MOS 값이 4이상을 유지하였다.

  • PDF

A Voice Annotation Browsing Technique in Digital Talking Book for Reading-disabled People (독서장애인을 위한 음성 도서 어노테이션 검색 기법)

  • Park, Joo Hyun;Lim, Soon-Bum;Lee, Jongwoo
    • Journal of Korea Multimedia Society
    • /
    • v.16 no.4
    • /
    • pp.510-519
    • /
    • 2013
  • In this paper, we propose a voice-annotation browsing system that make the reading-disabled people to be able to find and play the existing voice-annotations. The proposed system consists of 4 steps: input, ranking & recommendation, search, and output. For the reading-disabled people depending only on the auditory sense, all steps can accept voice commands. To evaluate the effectiveness of our system, we design and implement an android-based mobile e-book application supporting the voice-annotation browsing ability. The implemented system is tested by a number of blind-folded users. As a result, we can see almost all the reading-disabled people can successfully and easily reach the existing voice-annotations they want to find.

A Generalized Subspace Approach for Enhancing Speech Corrupted by Colored Noise Using Voice Activity Detector(VAD) (음성활동영역검색을 사용하는 유색잡음에 오염된 음성의 향상을 위한 일반화 부공간 접근)

  • Son, Kyung-Sik;Kim, Hyun-Tae
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.17 no.8
    • /
    • pp.1769-1776
    • /
    • 2013
  • In this paper, we proposed the modified YL(Yi and Loizou) algorithm, using a VAD(voice activity detector) for enhancing speech corrupted by colored noise. The performance of the proposed algorithm has been compared to the YL algorithm and LS(Lee and Son, etc.) algorithm by computer simulation. The colored noises used in the experiment were a car noise and multi-talker babble from the AURORA data base and the used voices from the TIMIT data base. It is confirmed that the proposed algorithm shows better performance from SNR(signal to noise ratio) and SSD(speech spectral distortion) viewpoint over the previous two approach.

음성처리시스템의 전망

  • Korean Associaton of Information & Telecommunication
    • 정보화사회
    • /
    • s.101
    • /
    • pp.25-34
    • /
    • 1996
  • 음성처리(Voice Processing) 시장은 원격통신 산업에서 지속적으로 가장 빠르게 성장하고 있는 분야중 하나로, 지금까지는 전화망에 기초한 통신 관련 음성응용 기술이었다. 그러나 이제는 데이타 네트워크와 PC터미날까지를 포함한 기술로 그 범위가 확대되고 있으며 그 정의도 재정립되어야 한다. 음성프로세싱 기술은 음성 메시지와 자동전화 프로세싱, 디지탈음성 데이타의 기억장치와 검색을 위해 기본 기술을 사용하는 정보엑세스 응용프로그램, 인지와 통합, 전화화된 신호체계, 컴퓨터와 전화의 통합(CTI)등을 포함한다.

  • PDF

A Multi-Channel Speech Surveillance System (다채널 음성 감시 시스템 개발)

  • 김성수
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.08a
    • /
    • pp.442-445
    • /
    • 1998
  • TMS320C31 DSP를 사용하여 다채널 음성신호를 실시간으로 압축/저장 및 재생 시스템을 구현하였다. 각각의 전화선으로부터 입력되는 DAM성신호는 실시간으로 VSELP 음성 부호화 알고리즘을 이용하여 8Kbps 의 전송률로 압축된다 압축 음성 데이터는 host computer 로 전송되어 각각의 채널별로 HDD 나 MOD 같은 저장 장치에 저장되어진다. PC microsoft windows95 환경에서 동작하는 호스트프로그램은 압축 음성 데이터를 하드 디스크나 광자기 디스크에 저장하고, 저장된 압축 음성 데이터는쉽게 검색하여 재생이 가능하다.

  • PDF

Design and Implementation of the Speech Recognition-based Dynamic EPG Control System in Digital Broadcasting environment (디지털 TV 환경에서 음성인식을 통한 동적 EPG 제어 시스템 설계 및 구현)

  • Kim, Seong-Won;Na, Hee-Joo;Si, Jang-Hyun;Kim, Jung-Hwan;Jung, Moon-Ryul
    • 한국HCI학회:학술대회논문집
    • /
    • 2007.02a
    • /
    • pp.216-221
    • /
    • 2007
  • 디지털 방송은 수많은 프로그램과 기존의 아날로그 방송에서 볼 수 없었던 다양한 서비스를 제공하며 발전하고 있다. 하지만 시청자들에게는 방송 서비스 채널과 기능이 많아질수록 원하는 채널을 검색하고 전환하는 과정이 어렵고 복잡한 일이 되어 버릴 수 밖에 없을 것이다. 이에 본 논문에서는 이러한 정보 획득과정의 축소를 위해 전통적인 리모콘으로 채널을 검색하고 이동하는 절차를 벗어나 음성인식을 통한 동적 EPG(Electronic Program Guide) 제어 시스템을 설계하고 구현하고자 한다. 이는 EPG정보와 시청자의 TV시청 성향 및 History를 기반으로 구동되는 시스템으로 음성대화의 구조적 정의가 가능한 VXML(VoiceXML) 인터프리터를 활용한다. 본 논문에서 제안하는 대화형 인터페이스는 다양한 디지털방송 서비스에 접목이 가능 할 것이며, 새로운 형태의 디지털 가전기기 파일럿 인터페이스 개발에 도움이 될 것이라 기대한다.

  • PDF

A Design and Implementation of Electronic Dictionary for support bidirectional searching (양방향 검색을 지원하는 전자사전 구조의 설계 및 구현)

  • Kim, Cheol-Su;Park, In-Chul
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2000.10a
    • /
    • pp.367-370
    • /
    • 2000
  • 본 논문에서는 빠른 검색 시간을 가지면서 단어의 역문자열도 검색할 수 있는 사전 구조를 설계하고 구현한다. 빠른 검색 시간을 지원하고, 역문자열 검색을 효율적으로 하기 위해 트라이 구조를 이용하였으며 트라이 성질 잘 표현하는 배열을 이용한 구현 방법을 사용하였다. 이 사전 구조는 형태소분석, 정보검색, 음성인식 및 문자 인식 과정 등 다양한 분야에서 유용하게 이용할 수 있다.

  • PDF

A Study on Speech Recognition System Development for CD-ROM contents searching & manipulation (CD-ROM Title 컨텐츠의 검색과 제어를 위한 음성인식 시스템 개발에 관한 연구)

  • 이정숙;양진우;원종문;김순협
    • Proceedings of the IEEK Conference
    • /
    • 2000.09a
    • /
    • pp.163-166
    • /
    • 2000
  • 본 논문은 CD-ROM Title 컨텐츠의 검색과 제어를 위한 음성인식 시스템 개발을 목적으로 한다. 인식명령어는 학교 졸업앨범 또는 회사홍보용 CD-ROM Title컨텐츠의 타이틀(상품안내, 회사소개, 업무실적 등)로 구성된다. 모델은 지속시간을 고려한 DMS 모델, 인식은 OSDP를 사용하였다.

  • PDF

Study on the song title query by humming melody information (허밍 운율정보를 이용한 곡목 검색 기술)

  • Lee Ji-Yeoun;Hahn Min-Soo
    • MALSORI
    • /
    • no.44
    • /
    • pp.131-143
    • /
    • 2002
  • Music query by humming is a challenging problem since the humming signal inevitably contains much variation and inaccuracy. In this paper, we suggest an algorithm for querying a wanted song from music database by humming its melody. In order to suit or adapt the inaccurate peoples humming, a new melody representation technique is proposed. Our algorithm is basically a pitch and duration information-based one and performs fairly well. 85% of correct query rate of the song is achieved for the top 3 matches when tested with 20 songs.

  • PDF