• Title/Summary/Keyword: 모의 음성

Search Result 918, Processing Time 0.028 seconds

A VoIP Traffic Generator for Simulating Call Processing in IP Contact Center Systems (IP 컨택센터에서 통화 처리 모의 실험을 위한 VoIP 트래픽 생성기)

  • Kim Soo-Hee;Jung In-Hwan
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.05a
    • /
    • pp.1239-1242
    • /
    • 2006
  • 본 논문에서는 IP 컨택센터에서 통화 처리 모의실험을 위한 VoIP 트래픽 발생기를 설계하고 구현한다. 구현된 트래픽 발생기(VoIPTG)는 H.323과 SIP 기반의 VoIP 콜 생성과 음성코덱(G.711, G.723.1등)을 사용하는 RTP 트래픽을 발생시킴으로써 다수의 대화자들이 음성 통화하는 상황을 모의실험을 할 수 있도록 해준다. VoIPTG를 이용하면 H.323 또는 SIP 세션 제어 프로토콜 선택, 사용자(call)수 변화, 시간 변화, 음성코덱의 선택 등 여러 가지 조합을 통해 다양한 모의실험 환경을 연출 할 수 있다. 이러한 트래픽 발생기는 IP 기반 컨택센터의 전반적인 기능 검사 및 성능평가를 위해 유용하게 사용될 수 있으며, 특히 IP 기반 녹취 시스템의 성능 평가를 위해서 필수적이다.

  • PDF

Construction of the Standard Telephone Speec Database in Korean (한국어 표준 전화 음성 데이터 베이스 구축)

  • 김종교
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06a
    • /
    • pp.5-9
    • /
    • 1998
  • 음성처리 연구자들이 연구 수행을 하기 이해서 최초로 해야 할 일은 음성학적 범주가 풍부한 많은 사람이 발성한 음성 데이터의 확보이다. 그러나 음성 데이터를 확보하는 데는 많은 시간과 노력이 소요되므로 음성 DB의 구축이 필요하다. 따라서 본 연구에서는 한국어 전화 음성 인식 기술 연구시 시스템의 객관적 성능평가와 알고리즘 개발등에 모든 연구 개발자들이 공통으로 사용할 수 있는 표준 음성 데이터 베이스를 구축하여 국내 음성처리 연구의 활성화를 꾀할 수 있도록 하였다.

  • PDF

SFSWin을 이용한 음성분석 방법

  • 양병곤
    • Proceedings of the KSLP Conference
    • /
    • 2003.11a
    • /
    • pp.159-161
    • /
    • 2003
  • 일상생활 중에 많은 사람들이 과도한 음성을 사용하게 되어 자신도 모르는 사이에 발성기관의 이상이 생기는 경우를 본다. 이러한 병적인 음성을 분석하기 위해서는 정상적인 음성의 특징을 먼저 객관적으로 분석하고 이들의 기준치를 잡은 다음 병적인 음성의 특징이 그 기준에서 얼마나 벗어났는지를 밝히는 과정이 필요하다. 사람의 음성을 지문과 같이 나타내는 음성분석 소프트웨어가 다양하게 개발되어 왔다. 시중에는 너무 간단하여 사용하기는 편하나 학술 논문을 작성할 때 사용할 만큼 정확한 데이터를 제공하지 못하는 프로그램이 있고, 반면에 매우 복잡한 기능들이 들어가 있어서 단순한 분석을 위해 그 모든 기능들을 익혀야 하는 불편한 프로그램도 나와 있다. 특히, 비싼 하드웨어를 동반한 소프트웨어들은 가격에 비해 사용자의 편의를 고려하지 않는 프로그램들도 있다. (중략)

  • PDF

Complexity Reduction of G.729 Vocoder (G.729 음성 압축기의 계산량 감소)

  • Choi Younchang;Park Hochong
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.15-18
    • /
    • 2000
  • ACELP는 우수한 음질을 제공하지만 최적의 코드 벡터를 찾기 위한 계산량이 상당히 많은 단점이 있고, 이로 인하여 모든 시스템과 단말기에서는 고성능 DSP칩을 사용하여 동작시킨다. 본 논문에서는 고속 ACELP 코드북 검색 방법인 펄스 교환 검색 방법을 G.729 음성 압축기에 적용시켜 G.729 음성 압축기의 계산량을 감소시키는 방법을 연구하였다. 적용된 방법은 두 단계 과정을 가지며, 첫 단계에서는 완전 순차적 검색 방법을 통하여 매우 빠르게 대략적인 코드 벡터를 찾는다. 두 번째 단계에서는 앞에서 선택된 코드 벡터의 각 펄스의 중요도를 계산하여 역할이 적은 펄스를 제거하고 새로운 펄스로 교환하는 펄스 교환 과정을 통하여 코드 벡터의 성능을 향상시킨다. 적용된 방법은 표준에서 사용하는 코드북 검색 방법보다 적은 계산량을 가진다. 적용된 방법의 성능은 표준보다 0.3-0.5dB 정도의 SNRseg 감소를 보이지만 Fast Algorithm인 G.729A보다는 우수한 음질의 코드 벡터를 찾으며, 다양한 음성신호를 이용한 모의 실험을 통하여 이 결과를 확인하였다.

  • PDF

"한글음성문자(The Korean Phonetic Alphabet)"의 연원에 대한 고찰

  • 심소희
    • Proceedings of the KSPS conference
    • /
    • 1996.10a
    • /
    • pp.300-307
    • /
    • 1996
  • 한글은 세계 여느 문자처럼 자연 발생적으로 생긴 문자체계가 아니라 수천년간 인류의 어음에 대한 사유와 고도의 어음기술이 집약된 문자관에 의해 연역적 방법으로 창제된 문자체계이므로 다른 문자와는 차별적인 연구방법이 요구된다. 세종조에 편찬되었던 ${\ll}훈민정음{\gg}{;\}.{\;}{\ll}홍무정운역훈{\gg}{;\}.{\;}{\ll}동국정운{\gg}$는 제작 동기와 목적이 달라서 각각 상이한 어음체계를 가지고 있는데, 각 어음체계가 필요로 하는 글자꼴을 한글은 27개(자음16개, 모음11개)의 기본글자꼴에 발음부위 및 발음방법을 상형한 새로운 글자꼴을 제공하여 각각의 문자체계를 구성하였다. 유교적 언어관의 토양에서 세상 모든 음의 생성원리에 의해 창제된 한글은 바로 세상의 모든 음을 표기할 수 있는 문자체계인 것이다. 이러한 한글음성문자는 오늘날 이질어음체계의 외국어를 표음하는 데에도 예외 없이 적용될 수 있을 뿐만 아니라 글자꼴의 유연성.응용면에서 국제음성문자(I.P.A)보다 월등히 과학적이고 완정한 음성문자로서 기능할 수 있다.

  • PDF

Multi-Speaker Speech Recognition in Noisy Environments (잡음 환경에서의 복수 화자 음성인식)

  • Oh Yoon Hark;Hur Ho Young;Song Myung Gyu;Kim Hyung Soon
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.41-44
    • /
    • 2000
  • 본 논문에서는 잡음 환경에서 복수 화자 음성인식 시스템의 인식 성능 향상에 관한 실험을 하였다. 복수화자 음성인식 방식은 훈련에 참여한 복수의 사용자에 대한 등록 단어 모델을 가지므로, 인식 단계에서 등록화자의 모든 단어 모델들을 테스트 음성과 비교하여 인식 단어를 결정한다 그러나, 이 경우 훈련 환경과 테스트 환경의 불일치에 기인한 인식 성능 저하가 등록 화자수가 많아짐에 따라 더욱 심해지는 문제가 발생한다. 본 논문에서는 이 문제의 해결을 위해 등록 화자들의 모든 단어 모델들을 테스트 음성과 비교하는 대신 화자인식 시스템을 사용해서 발성 화자와 유사한 후보 화자들의 단어 모델들에 대해서만 테스트 음성과 비교하는 방식을 적용함으로써 기존의 방법보다 높은 단어 인식 율을 얻을 수 있었다

  • PDF

Adaptive echo canceller combined with speech coder for mobile communication systems (이동통신 시스템을 위한 음성 부호화기와 결합된 적응 반향제거기에 관한 연구)

  • 이인성;박영남
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.23 no.7
    • /
    • pp.1650-1658
    • /
    • 1998
  • This paper describes how to remove echoes effectively using speech parameter information provided form speech coder. More specially, the proposed adaptive echo canceller utilizes the excitation signal or linearly predicted error signal instead of output speech signal of vocoder as the input signal for adaptation algorithm. The normalized least mean ssquare(NLMS) algorithm is used for the adaptive echo canceller. The proposed algorithm showed a fast convergece charactersitcis in the sinulatio compared to the conventional method. Specially, the proposed echo canceller utilizing the excitation signal of speech coder showed about four times fast convergence speed over the echo canceller utilizing the output speech signal of the speech coder for the adaptation input.

  • PDF

An Experimental Field Trial of Stock Information Retrieval System Based on Speech Recognition (음성인식기술을 이용한 증권정보 안내 시스템의 실험적 실용시험)

  • 도삼주
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1994.06c
    • /
    • pp.241-244
    • /
    • 1994
  • 이 논문은 대어휘, 화자독립 음성인식 시스템인 KT-STOCK과 이 시스템에 대한 전화망을 통한 실험적 실용시험에 대해 기술하였다. KT-STOCK은 현재 주식시장에 상장된 712개 회사의 현재주가를 음성을 이용하여 검색할 수 있는 시스템이다. 이 시스템은 hidden markov model 기술에 기반을 둔 고립단어 인식 시스템이며 유사음소를 기본 인식단위로 사용한다. KT-STOCK은 1994년 6월 24일부터 실험적 실용시험 중에 있다. 중간 결과에 따르면 모의 실험 결과는 실제 환경에서의 시험과 차이가 있는 거승로 나타났다. 실제 환경에서 이 시스템의 인식률은 현재 61.9%이다.

  • PDF

A voice conversion based on probabilistic modeling (확률 모델링에 기초한 음성변환 시스템)

  • Lee, Eun;Kong, Eun-Bae
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.169-171
    • /
    • 2001
  • 이 논문에서 논해지는 음성변환이라는 것은 어떤 화자의 음성(소스)을 다른 화자의 음성(타겟)으로 바꾸는 것이다. 이 때, 모든 음소들을 녹음해서 데이터베이스화한 음성끼리 매칭시키는 것이 아니라, 몇 번의 학습을 통하여 음색의 특징을 파악한 후 나온 변환함수를 이용하여 원래 화자의 음성을 타겟 음성으로 변환하는 시스템을 제안하고자 한다. 여기서, 음색의 특징들을 추출한 후, 변환함수를 만들기 위한 트레이닝을 위한 방법으로 Gaussian Mixture Modeling을 이용할 것이다.

  • PDF

Efficient Codebook Search Method for AMR Speech Codec (AMR 음성 압축기를 위한 효율적인 코드북 검색 방법)

  • Lee Doyoon;Park Hochong
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.93-96
    • /
    • 2001
  • ACELP 구조의 음성 압축기는 우수한 음질을 제공하지만 최적의 코드 벡터를 구하기 위한 계산량이 상당히 많은 단점이 있다. 이를 해결하기 위해서 본 논문에서는 AMR 음성 압축기의 코드북을 매우 효율적으로 검색하는 새로운 방법을 제안한다. 제안하는 코드북 검색 방법은 완전 순차적인 검색 방법을 사용하여 대략적인 코드 벡터를 구하고, 코드 벡터의 각 펄스들의 중요도를 계산하여 중요도가 낮은 펄스를 새로운 펄스로 교환하는 펄스 교환 과정을 수행하여 코드 벡터의 성능을 향상시키는 방법을 사용한다. 또한, AMR 음성 압축기의 구조에 맞도록 트랙별로 이동하면서 순차적으로 코드북을 검색하여 다수의 대략적인 코드벡터를 찾은 후, 각 코드 벡터에 대하여 펄스 교환 과정을 수행하여 최적의 코드 벡터를 구한다. 제안한 코드북 검색 방법을 AMR 음성 압축기의 모든 모드에 적용하여 코드북 검색을 위한 계산량과 성능을 측정하였으며, 모든 모드에 대하여 매우 적은 계산량으로 동등한 성능을 가지는 것을 확인하였다

  • PDF