Search | Korea Science

Speech Recognition in Noisy Environments Using Modified Gain Function (변형된 이득함수를 이용한 잡음 환경에서의 음성인식)

Jin, Ho-Sung;Lee, Sang-Ho;Hong, Jae-Keun
- Proceedings of the KAIS Fall Conference
- /
- 2010.05a
- /
- pp.119-123
- /
- 2010
본 논문에서는 2단계 잡음제거 방법의 이득함수를 이용한 고조파 복원 잡음제거 방법의 이득함수를 조정하여 기존의 방법보다 음성개선을 향상시켰고, 제안한 방법으로 개선된 음성을 음성인식 기술에 적용하였다. 본 논문에서는 기존 방법으로 음성개선 결과 묵음구간에서 음성구간으로 변화는 구간에서 이전 프레임의 추정된 음성신호로 스펙트럼의 이득함수가 구해져서 음성이 발생하는 구간에서 왜곡이 발생한다. 따라서 본 논문에서는 이러한 현상을 개선시키기 위해 2단계 잡음제거 방법의 이득함수를 추정된 a priori SNR과 비교하여 이득함수를 조정하고, 2단계 잡음제거 방법의 이득함수를 고조파 복원 방법의 이득함수와 비교하여 이득함수를 조정하여 음성을 개선하는 방법을 제안하였다. 그리고 음성인식을 위한 특징벡터 추출을 위해 제안한 방법으로 개선된 음성의 대수 에너지를 정규화 하는 대수 에너지 정규화 방법(Log Energy Normalization)을 음성인식 방법에 적용하였다.
PDF

Speech Enhancement for DMB Voice commander in Car environment (차량환경에서 DMB용 음성명령어기 사용을 위한 음성개선방법)

Beack Seung Kwon;Hahn Minsoo;Nam Seung Hyon;Kang Kyung Ook
- Proceedings of the Korean Society of Broadcast Engineers Conference
- /
- 2003.11a
- /
- pp.233-236
- /
- 2003
본 논문에서는 차량용 음성명령어기의 사용을 위한 전처리 과정으로 음성개선 방법을 다룬다. 특히 DMB 사용환경에서 보다 주위 소음에 자유롭고 단말 조작에 있어 안정성을 보장하기 위하여 일반적 단인 마이크로폰으로 처리되는 잡음뿐만 아니라 음성명령어를 제외한 오디오 신호 등 비정적 통계적 특성을 갖는 소음들도 제거 될 수 있도록 음성개선 방법을 제안한다. 우리는 2개의 마이크로폰을 가지고 BSS 알고리즘을 적용하여 비정적 신호들을 분리하고, 분리된 신호에 대하여 Kalman Filter를 이용하여 시간상 단구간 정적 잡음을 제거한다. 본 논문의 인식 실험 결과를 통하여 공간적, 시간적 음성개선 방법이 순차적으로 적용될 때, 실제 차량 환경에서 음성 개선 알고리즘으로 적용될 수 있음을 보였다
PDF

경피적 근전도 유도하 교원질 주입술을 통한 성대구증의 치료성적

김형태;조승호;김민식;선동일;유우정
- Proceedings of the KSLP Conference
- /
- 1999.11a
- /
- pp.177-177
- /
- 1999
배경 : 성문폐쇄부전을 나타내는 질환 중 성대구증은 음성개선을 위한 치료면에서 가장 어려운 질환중에 하나다. 성대구증의 음성개선을 위해서 현재 다양한 수술적 방법과 보형물의 주입술이 이용되고는 있으나 만족할 만한 음성개선을 얻기는 힘들었다. 목적 : 진행된 성대구증 환자의 성문폐쇄부전을 치료하기 위한 새로운 방법으로 본 교실에서 시도하고 있는 경피적 근전도유도하 교원질주입술의 치료성적 및 음성 및 음향학적 추적결과와 술기의 유용성에 관하여 알아보고자 하였다. (중략)
PDF

Speech Enhancement for Voice commander in Car environment (차량환경에서 음성명령어기 사용을 위한 음성개선방법)

백승권;한민수;남승현;이봉호;함영권
- Journal of Broadcast Engineering
- /
- v.9 no.1
- /
- pp.9-16
- /
- 2004
In this paper, we present a speech enhancement method as a pre-processor for voice commander under car environment. For the friendly and safe use of voice commander in a running car, non-stationary audio signals such as music and non-candidate speech should be reduced. Ow technique is a two microphone-based one. It consists of two parts Blind Source Separation (BSS) and Kalman filtering. Firstly, BSS is operated as a spatial filter to deal with non-stationary signals and then car noise is reduced by kalman filtering as a temporal filter. Algorithm Performance is tested for speech recognition. And the results show that our two microphone-based technique can be a good candidate to a voice commander.
PDF KSCI

Telephone Speech Recognition Using Laboratory Environment Speech Data (실험실 환경 음성을 이용한 전화음성 인식에 관한 연구)

윤상호
- Proceedings of the Acoustical Society of Korea Conference
- /
- 1994.06c
- /
- pp.391-394
- /
- 1994
본 연구에서는 전화선을 통한 음성인식을 위해 저잡음의 실험실 환경에서 수집된 음성 자료를 이용하는 접근을 하였다. 전화 음성과 실험실 음성 간의 특성 차이를 보정하기 위해 선형 회귀 분석법을 이용한 SDCN을 제안하였다. 두 자료간의 보정은 동시 녹음된 실험실 환경의 음성과 전화음성의 SNRDP 따른 두 자료간의 차이를 최소화하는 변환행렬을 구해, 이를 학습자료의 변환에 이용한다. 제안된 방법의 타당성을 확인하기 위해 두가지 인식 알고리즘인 DTW와 이산 HMM 에 대해 실험하였다. DTW를 통한 인식에서개선된 SDCN 에 의한 특징벡터의 변환은 기존의 SDCNDP 따른 특징변환보다 8~17%의 인식률이 향상되었다. 이산 HMM으로 인식할 때는 개선된 SDCNDP 의한 전화음성과 실험실 음성과의 유사도를 보다 잘 나타내기 위해 개선된 SDCN을 적용하고, VQ 코드열 상에서이 코드 사상법을 사용하여 인식률의 향상시켰다.
PDF

Comparison of Recognition Per formance of Noisy Speech Depend ing on Preprocessing Methods (전처리 기법에 따른 잡음음성의 인식성능 비교)

Son Jong Mok;Lee Yong Ju;Bae Keun Sung
- Proceedings of the Acoustical Society of Korea Conference
- /
- spring
- /
- pp.31-34
- /
- 2000
본 연구에서는 부가잡음에 의한 음성신호의 왜곡에 대해 다양한 음성개선 기법을 전처리기로 도입하여 HMM(Hidden Markov Model)에 기반 한 음성인식 시스템의 인식성능을 평가하였다. 음성개선 기법으로는 MMSE(Minimun Mean Square Error) STSA(Short-Time Spectral Amplitude Estimator) 기법과 웨이브렛 영역에서의 UWD(Undecimated Wavelet Denoising), CWD(Conventional Wavelet Denoising) 기법을 적용하였다. 잡음이 없는 데이터로 훈련한 음성인식시스템에 잡음음성을 입력할 때 각 음성개선기법을 전처리기로 사용하여 신호대잡음비(Signal to Noise Ratio)에 따른 인식 성능을 비교하였다.
PDF

N-Best Reranking for Improving Automatic Speech Recognition of Korean (N-Best Re-ranking에 기반한 한국어 음성 인식 성능 개선)

Joung Lee;Mintaek Seo;Seung-Hoon Na;Minsoo Na;Maengsik Choi;Chunghee Lee
- Annual Conference on Human and Language Technology
- /
- 2022.10a
- /
- pp.442-446
- /
- 2022
자동 음성 인식(Automatic Speech Recognition) 혹은 Speech-to-Text(STT)는 컴퓨터가 사람이 말하는 음성 언어를 텍스트 데이터로 전환하는 일련의 처리나 기술 등을 일컫는다. 음성 인식 기술이 다양한 산업 전반에 걸쳐 적용됨에 따라 높은 수준의 정확도와 더불어 다양한 분야에 적용할 수 있는 음성 인식 기술에 대한 필요성이 점차 증대되고 있다. 다만 한국어 음성 인식의 경우 기존 선행 연구에 비해 예사말/높임말의 구분이나 어미, 조사 등의 인식에 어려움이 있어 음성 인식 결과 후처리를 통한 성능 개선이 중요하다. 따라서 본 논문에서는 N-Best 음성 인식 결과가 구성되었을 때 Re-ranking을 통해 한국어 음성 인식의 성능을 개선하는 모델을 제안한다.
PDF

Voice Packet Processing Scheme for Voice Quality and Bandwidth Efficiency in VoIP (VoIP의 음성품질/대역효율 개선을 위한 음성패킷 처리)

Kim, Jae-Won;Sohn, Dong-Chul
- Journal of Korea Multimedia Society
- /
- v.7 no.7
- /
- pp.896-904
- /
- 2004
In this paper, We present an efficient variable rate speech coder for spectral efficiency and packet processing technique for packet loss compensation of a voice codec with 10msec frame in VoIP service. Through disconnecting the users from the spectral resource during silence interval of about 60% period, a variable rate voice coder based on a voice activity detection(VAD) can increase spectral gain by two times. The performance of the method was analyzed by variation of detected voice activity factor and degraded speech frame ratio under various background noise level, and compared those of G.729B of ITU-T 8kbps standard speech codec. A method to compensate lost packets utilized addition of recovery data to a main stream and error concealment scheme for speech quality enhancement, the performance is verified by reconstructed speech quality. The proposed scheme can achieve spectral gain by two times or enhance speech quality by 3dB through reserved bandwidth of VAD. Therefore, the proposed method can enhance a spectral efficiency or speech quality of VoIP.
PDF

On the Use of a KAK Filter for Enhancement of Noisy Speech (KAK 필터를 이용한 잡음이 섞인 음성의 음질향상)

조동호;유득수;은종관
- The Journal of the Acoustical Society of Korea
- /
- v.5 no.2
- /
- pp.48-57
- /
- 1986
광대역 또는 협대역잡음이 섞인 음성의 음질을 개선하기 위해 KAK 필터를 사용하는 방법을 제 안한다. KAK 필터는 그 구조가 간단하지만, 잡음이 섞인 음성의 음질을 개선하는데 있어서 객관적인 음질척도로 볼 때 spectral subtraction 방법과 성능이 비슷하다. 또한 귀로 들어봐도 kak 필터를 사용한 경우와 spectral subtraction 방법을 이용한 경우의 개선된 음질이 거의 비슷하다. 그런데 이 kak 필터는 구조가 다른 기존방법보다 훨씬 간단하며, 다른 음질개선 알고리즘과는 달리 음성과 묵음의 판별이 필 요하지 않다. 또한 kak 필터는 ADPCM과 같은 파형 부호화기와 결합하는 것이 용이하다. 따라서 깨끗 한 음성뿐만 아니라 잡음이 섞인 음성을 부호화하는데 있어서 제안한 kak 필터를 ADPCM과 같은 파형 부호화기에 결합하여 사용하는 것이 적합하다.
PDF

A Voice/Unvoice Decomposition in Noisy Background (이중 여진 음성모델을 이용한 음질개선)

유창동
- Proceedings of the Acoustical Society of Korea Conference
- /
- 1998.06c
- /
- pp.175-178
- /
- 1998
음질개선에 이줄 여진(Double Excitation) 음성모델을 적용하는 방법이 있다. 유성음과 무성음 성분들로 분리하는 이 방법은 각 성분들의 고유한 성질을 이용하여 음질을 저하시키는 wideband 잡음을 제거할 수 있다. 이중 여진 음성모델을 이용한 음질개선 시스팀과 기존의 스펙트랄 제거(spectal subtraction) 알고리즘을 비공식적으로 비교한 결과 이중 여진 모델을 이용한 방법이 더 나은 성능을 보였다.
PDF

Search Result 1,025, Processing Time 0.025 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)