• Title/Summary/Keyword: 음질 인식

Search Result 41, Processing Time 0.022 seconds

Performance Analysis of Speech Recognition in Communication Systems using Speech Coder (음성 압축기를 사용한 통신 시스템에서의 음성 인식 성능 분석)

  • Han Sang-Wook;Jung Heui Suck;Park Hochong
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.179-182
    • /
    • 2002
  • 본 논문에서는 음성 압축기를 사용하는 디지털 이동통신 환경에서 한글 음성 인식기의 성능을 분석하기 위하여 다양한 표준 음성 압축기를 이용하여 음성 압축기의 구조, 전송률, 전송 채널의 에러율에 대한 성능을 측정하여 비교하였다. 동일한 구조의 음성 압축기에 대하여 전송률의 증가에 따라 음성 인식률이 증가하지만, 음성 압축기의 구조에 따라 동일 전송률에서도 많은 성능 차이가 발생하는 것을 확인하였다. 특히 IS-127 EVRC의 인식 성능이 매우 떨어지는 것을 알 수 있고, EVRC의 잡음 제거기와 가변 전송률에 의하여 음성 인식 성능이 저하되는 것을 확인하였다. 이를 통하여 청취 음질과 음성 인식 성능 사이의 상관 관계가 높지 않는 것을 알 수 있다. 모든 음성 압축기에 대하여 채널 에러율과 음성 인식기의 성능은 매우 밀접한 관계가 있음을 확인하였고, 평균적으로 채널 에러율 $1.0\%$에서 인식률이 $0.6\%$ 감소하고, 에러 $5.0\%$에서 인식률이 $1.8\%$ 감소한다.

  • PDF

The Voice Characteristics of Children with Palatine Tonsil and Adenoid Hypertrophy (구개편도와 아데노이드 비대 아동의 음성 특성)

  • Song, Yun-Kyung
    • The Journal of the Acoustical Society of Korea
    • /
    • v.28 no.8
    • /
    • pp.790-795
    • /
    • 2009
  • This study evaluated the voice of 68 normal children and 50 children with palatine tonsil and adenoid hypertrophy with MDVP to examine the hypothesis that their mouth breathing makes the vocal folds dry and this condition contributes to lower the level of voice quality. The results showed that children with palatine tonsil and adenoid hypertrophy had statistically significant elevations in Jitt, RAP, PPQ, Shim and APQ parameters, and had the lower level of voice quality. Therefore, the children with palatine tonsil and adenoid hypertrophy need vocal hygiene education.

Performance Comparison of Speech Recognition Using Body-conducted Signals in Noisy Environment (소음 환경에서 body-conducted 신호를 이용한 음성인식 성능 비교)

  • Choi Dae-Lim;Lee Kwang-Hyun;Lee Yong-Ju;Kim Chong-Kyo
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.57-60
    • /
    • 2004
  • 본 논문에서는 음성정보기술산업지원센터(SiTEC)에서 현재 배포중인 고소음 환경 음성 DB를 이용하여 air-conducted 음성과 body-conducted 음성의 인식 성능을 비교 실험하였다. 소음 환경에서 일반적인 마이크로폰으로부터 수집된 air-conducted 음성은 잡음의 영향을 받기 쉬우며 이는 인식률을 저하시킨다. 반면에 진동 픽업 마이크로폰에서 수집된 body-conducted 음성은 소음에 보다 강인한 특성을 보인다. 이러한 특성에 근거하여 소음 환경에서 일반 다이나믹 마이크로폰 음성에 음질 개선 방법과 채널 보상 방법을 적용한 인식 결과와 3종류의 진동 픽업 마이크로폰에서 수집된 음성과의 인식 성능을 비교 분석하여 body-conducted 음성 인식 시스템의 환용 가능성을 살펴보았다.

  • PDF

A Study on the Correlation between Frequency Components and Sound Quality of a Vacuum Cleaner using the Orthogonal Array (직교배열표를 이용한 진공 청소기의 음질과 주파수 특성의 상관 관계에 관한 연구)

  • Lim Do-Hyeong;Jeong Hyuk;Ih Jeong-Guon
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.295-298
    • /
    • 2000
  • 제품의 음질 특성과 관련된 주요 주파수 대역을 파악하기 위해 본 연구에서는 청소기 소리의 주파수 대역을 음성인식에 중요한 주파수 대역인 4개의 대역으로 나누고, 각 대역 성분을 직교배열표에 따라 가감한 16개의 소리를 만들었다 만들어진 소리에 대해 10명을 대상으로 4가지의 표현어로 Semantic Differential Method(SDM)로 주관적 평가를 하여, 청소기음의 주파수 특성과의 상관관계를 살펴보았다. 불쾌한 느낌과 관련이 깊은 주파수 대역은 고주파수 대역이었으며, 성능이 좋은 느낌을 주기 위해서는 저주파수 대역을 증가시키는 것 이 효과적이었다.

  • PDF

A Study on a comparison and analysis of Speaking rate estimation for adaptive bit rate on CELP vocoder (가변전송률 CELP 부호화기 설계를 위한 발성률 비교 분석에 관한 연구)

  • Jang KyungA;Min SoYeon;Bae MyungJin
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.105-108
    • /
    • 2004
  • 음성 부호화 기술은 전송률과 복잡도를 줄이고 음질을 향상시키는 방향으로 진행되고 있다. 현재 상용화되고 있는 CELP형 보코더는 낮은 전송률에 비해 우수한 음질을 제공한다. 본 논문에서는 기존의 방식과 다르게 보코더 단에 입력 음성이 들어가기 앞서 전처리 기법을 수행하는 전처리단을 부가하여 전송률을 낮추는 방법을 소개하고, 소개된 방법들을 각기 비교하고 분석하고자 한다. 전처리기법들을 음성 인식이나 합성에서 사용되는 파라미터들을 적용시켰으며, 처리시간이나 계산시간에 있어 기존의 방식에서 많은 영향을 미치지 않은 간단한 알고리즘으로 구현하였다. 소개하는 전처리단에서는 기존의 코딩방식에서 사용하지 않은 파라미터들, 발성율, 지속시간, PSOLA 방식들을 이용하였다.

  • PDF

Text-to-Speech Synthesizer with the Process of Minimizing Concatenation Distortion (접합 왜곡의 최소화 과정이 포함된 음성합성기)

  • 박훈재;김상훈;정재호
    • The Journal of the Acoustical Society of Korea
    • /
    • v.17 no.4
    • /
    • pp.38-44
    • /
    • 1998
  • 대용량의 음성합성용 데이터베이스를 용이하게 구축하기 위해 음성인식 시스템을 이용한 음소 경계 분할이 이루어지고 있다. 그러나 자동 분할 결과를 직접 이용하여 합성음 을 생성할 경우 음소 경계 에러로 인하여 접합 왜곡이 많이 발생하게 된다. 이러한 문제를 해결하기 위해서, 본 연구에서는 단위 접합시 경계 에러를 고려하여 적합한 접합 위치를 찾 고자 하였다. 여기서 적합한 접합 위치는 스펙트럼의 불연속이 최소화된 접합점을 의미한다. 합성음에 대한 MOS(Mean Opinion Score) 테스트와 스펙트로그램(spectrogram)의 모양을 비교하므로써 제안된 방법의 성능을 평가하였다. 제안된 방법은 두 단계로 이루어져 있다. 첫째, 레퍼런스 패턴(reference pattern)과 두 개의 테스트 패턴(test pattern)을 선택하는 단 계와, 둘째, 앞과 뒤 테스트 패턴 사이의 적합한 접합위치를 찾는 단계이다. 본 연구에서는 패턴 사이의 스펙트로그램 비교를 위해 켑스트럼(cepstrum) 피라미터와 패턴 분류기 (pattern classifier)인 DTW(Dynamic Time Warping) 알고리즘을 사용하였다. 제안된 알고 리즘을 평가한 청취 테스트의 결과에서 제안된 알고리즘을 적용하여 합성된 합성음의 음질 이 자동 분절로 생성된 단위를 그대로 이용한 경우의 음질보다 우수함을 보였다.

  • PDF

Speech Recognition Method under Noisy Environments using Time-Delay Neural Network (시간지연신경회로망을 사용한 잡음 중의 음성인식 수법)

  • Choi, Jae Seung
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2009.05a
    • /
    • pp.711-714
    • /
    • 2009
  • 잡음환경 하의 회화에서 잡음량을 줄이고 신호처리 시스템의 성능을 향상시키기 위해서는 잡음량에 따라서 적응적으로 처리되는 신호처리 시스템이 필요하다. 또한 잡음이 중첩된 음성으로부터 잡음을 제거하기 위해서는 잡음의 크기에 따라서 음성 처리 시스템의 파라미터를 변경하는 것이 양호한 음질의 음성을 재생하는데 바람직하다. 따라서 본 논문에서는 음성 속에 포함되는 잡음량을 인식하는 방법으로 선형예측계수를 구하여 시간지연신경회로망(Time-delay neural network: TDNN)의 입력으로 사용하여 학습시키는 잡음량을 인식하는 방법을 제안한다. 본 잡음량 인식은 다양한 배경잡음에 의하여 열화된 3종류의 음성이 TDNN에 의하여 학습되어진다. 본 실험에서는 Aurora2 데이터베이스를 사용하여 여러 잡음에 대하여 양호한 인식결과를 확인할 수 있었다.

  • PDF

Robust Speaker Recognition using Independent Component Analysis (독립성분분석을 이용한 강인한 화자인식)

  • 장길진
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06e
    • /
    • pp.327-330
    • /
    • 1998
  • 독립성분분석(ICA: Independent Component Analysis)이란 특징이 상이한 둘 이상의 신호들이 선형적으로 결합되어 있을 때 이를 효과적으로 분리하는 방법들을 통칭하며 잡음제거, 음질개선 및 신호처리 분야에서 많이 활용되고 있다. 본 논문에서는 전화음성 화자인식 시스템의 성능향상을 위해 독립성분분석을 이용하는 방법을 제안한다. 먼저 화자가 발성한 음성신호의 켑스트럼 계수를 여러 채널 함수들의 선형적인 합으로 가정하고, 독립성분분석을 이용하여 얻은 새로운 켑스트럼 벡터를 학습과 인식에 사용하였다. 실험자료는 잔화음성 화자식별기의 성능평가에 널리 쓰이고 있는 SPIDRE를 사용하였고 regodic 은닉 마코프 모델을 이용하여 문장 독립 화자식별 시스템을 구성하였다. 학습음성의 특징과 실험음성의 특징이 다른 조건에서 기존의 채널 정규화 방법들에 비해 10~15%이상 인식률이 향상되었다.

  • PDF

A Study on the Improvement of Speech Recognition System using Noise Filtering. (잡음 필터를 이용한 음성 인식 시스템의 성능향상에 관한 연구)

  • Lee Yang-Gyo;Kim Hack-Jin;Kim Soon-Hyob
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.77-80
    • /
    • 2001
  • 본 논문에서는 HMM알고리즘을 이용한 중규모급, 화자독립, 연결음성시스템에서의 인식성능 향상을 위해, 단어 인식기가 가지고 있는 고려사항들 중에 잡음(Noise)에 강한 모델을 위해 동작환경에 따른 적절한 필터를 구성하고 이차적으로 특징 파라미터를 개선하여 Noise를 보상하는 방법을 적용하였다. 인식기의 성능에 큰 영향을 미치는 요인중 하나인 전처리 기능의 평가로 성능향상의 요인을 찾아 음질개선을 위한 보다나은 잡음보상 방법을 제시하고자 하였다.

  • PDF

Multi-channel input-based non-stationary noise cenceller for mobile devices (이동형 단말기를 위한 다채널 입력 기반 비정상성 잡음 제거기)

  • Jeong, Sang-Bae;Lee, Sung-Doke
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.17 no.7
    • /
    • pp.945-951
    • /
    • 2007
  • Noise cancellation is essential for the devices which use speech as an interface. In real environments, speech quality and recognition rates are degraded by the auditive noises coming near the microphone. In this paper, we propose a noise cancellation algorithm using stereo microphones basically. The advantage of the use of multiple microphones is that the direction information of the target source could be applied. The proposed noise canceller is based on the Wiener filter. To estimate the filter, noise and target speech frequency responses should be known and they are estimated by the spectral classification in the frequency domain. The performance of the proposed algorithm is compared with that of the well-known Frost algorithm and the generalized sidelobe canceller (GSC) with an adaptation mode controller (AMC). As performance measures, the perceptual evaluation of speech quality (PESQ), which is the most widely used among various objective speech quality methods, and speech recognition rates are adopted.