통합 검색 | Korea Science

DSR 환경에서의 다 모델 음성 인식시스템의 성능 향상 방법에 관한 연구 (A Study on Performance Improvement Method for the Multi-Model Speech Recognition System in the DSR Environment)

장현백;정용주
- 융합신호처리학회논문지
- /
- 제11권2호
- /
- pp.137-142
- /
- 2010
다 모델 음성인식기는 잡음환경에서 매우 우수한 성능을 보이는 것으로 평가되고 있다. 그러나 지금까지 다 모델 기반인식기의 성능시험에는 잡음에 대한 적응을 고려하지 않은 일반적인 전처리 방식이 주로 활용하였다. 본 논문에서는 보다 정확한 다 모델 기반인식기에 대한 성능 평가를 위해서 잡음에 대한 강인성이 충분히 고려된 전처리 방식을 채택하였다. 채택된 전처리 알고리듬은 ETSI (European Telecommunications Standards Institute)에서 DSR (Distributed Speech Recognition) 잡음환경을 위해서 제안된 AFE (Advanced Front-End) 방식이며 성능비교를 위해서 DSR 환경에서 좋은 성능을 나타낸 것으로 알려진 MTR (Multi-Style Training)을 사용하였다. 또한, 본 논문에서는 다 모델 기반인식기의 구조를 개선하여 인식성능의 향상을 이루고자 하였다. 기존의 방식과 달리 잡음음성과 가장 가까운 N개의 기준 HMM을 사용하여 기준 HMM의 선택시에 발생할 수 있는 오류 및 잡음신호의 변이에 대한 대비를 하도록 하였으며 각각의 기준 HMM을 훈련을 위해서 다수의 SNR 값을 이용함으로서 구축된 음향모델의 강인성을 높일 수 있도록 하였다. Aurora 2 데이터베이스에 대한 인식실험결과 개선된 다 모델기반인식기는 기존의 방식에 비해서 보다 향상된 인식성능을 보임을 알 수 있었다.
PDF KSCI

개량된 음성매개변수를 사용한 지속시간이 짧은 잡음음성 중의 배경잡음 분류 (Background Noise Classification in Noisy Speech of Short Time Duration Using Improved Speech Parameter)

최재승
- 한국정보통신학회논문지
- /
- 제20권9호
- /
- pp.1673-1678
- /
- 2016
음성인식처리 분야에서 배경잡음으로 인하여 음성입력이 배경잡음으로 잘못 판단되는 원인이 되어 음성인식율의 저하를 초래한다. 이러한 종류의 잡음대책은 단순하지 않으므로 보다 고도한 잡음처리기술이 필요하게 된다. 따라서 본 논문에서는 잡음환경 중에서 정상적인 배경잡음 혹은 비정상적인 배경잡음과 지속 시간이 짧은 음성을 구별하는 알고리즘에 대하여 기술한다. 본 알고리즘은 다른 종류의 잡음과 음성을 구별하는 중요한 수단으로서 개량된 음성의 특징파리미터를 사용한다. 다음으로 다층퍼셉트론 네트워크에 의하여 잡음의 종류를 추정하는 알고리즘에 대해서 기술한다. 본 실험에서는 잡음과 음성이 구별이 가능하도록 실험적으로 확인하였다.
https://doi.org/10.6109/jkiice.2016.20.9.1673 인용 PDF KSCI

차량 잡음 환경에서 엔트로피 기반의 음성 구간 검출 (Voice Activity Detection Based on Entropy in Noisy Car Environment)

노용완;이규범;이우석;홍광석
- 융합신호처리학회논문지
- /
- 제9권2호
- /
- pp.121-128
- /
- 2008
정확한 음성 구간 검출은 음성 인식 및 음성 코딩 그리고 음성 통신 시스템 등과 같은 음성 어플리케이션의 성능에 큰 영향을 미친다. 본 논문에서는 실제 운전하고 있는 상태에서 다양한 차량 노이즈 환경의 음성 구간 검출 방법을 제안한다. 기존의 음성 구간 검출은 시간 에너지, 주파수 에너지, 영 교차율, spectral entropy 등 다양한 방법을 사용하였으며 잡음 환경에서 급격하게 성능이 저하되는 단점이 있었다. 본 논문에서는 기존의 spectral entropy를 기반으로 하여 MFB(Mel-frequency Filter Banks) spectral entropy, 기울기 FFT(Fast Fourier Transform) spectral entropy, 기울기 MFB spectral entropy를 이용한 음성 구간 검출 방법을 제안한다. MFB는 멜 스케일과 FFT를 곱한 것으로 멜 스케일은 인간이 소리를 인지할 때 주파수에 대해 비선형적인 스케일이며 음성의 특징을 잘 반영한다. 제안한 MFB spectral entropy 방법은 다양한 차량 잡음 환경에서 음성 및 비음성 분별 능력을 향상시킬 수 있으며 실험 결과 93.21%의 음성 구간 검출율을 나타내었다. 이는 기존의 spectral entropy 방법과 비교할 때 MFB를 이용한 음성 구간 검출 방법이 3.2%의 검출율이 향상되었다.
PDF

평균 포인케어맵을 이용한 Noisy Field에서의 chaos거동의 검출방법 (Detecting Chaotic Motions of a Piecewise-Linear System in the Noisy Fields by Mean Poincare Maps)

마호성
- 전산구조공학
- /
- 제10권4호
- /
- pp.239-249
- /
- 1997
랜덤하중 하에서의 구분적선형시스템이 갖는 노이즈의 영향으로 인해 그 특성이 많이 감소되거나 소멸된 응답거동으로부터 chaos거동을 검출하는 방법을 개발, 분석하였다. 해양에서 구조물이 받는 파력은 결정론적이 아닌 추계론적이다. 바람, 파도 그리고 조류 등에 의한 파력은 유한도의 랜던성을 갖으며, 이러한 파력은 지배적인 조화가진하중과 정규 백색노이즈를 더함으로써 표현할 수 있다. 외적 동요를 받는 시스템의 응답거동은 그 거동이 방해를 받으며, 이로 인해 chaos응답거동을 확인하기가 어려우며, 그 거동의 특성이 일반적인 랜덤거동과 다를 바가 없다. 이러한 경우, 평균 포인케어맵을 이용하여 랜덤노이즈에 의해 발견되지 않는 chaos응답거동을 식별할 수 있다. 본 연구에서는 직접수치시뮬레이션상에서 이러한 평균 포인케어맵을 만드는 방법을 개발하였으며, 얻어진 평균 포인케어맵의 적용범위에 대하여 분석하였다. 평균 포인케어맵은 노이즈가 포함된 조화가진하중을 받는 시스템의 chaos응답거동을 확인하는데 있어서 노이즈의 강도가 높을 때 일반적인 포인케어맵만으로는 놓칠 수 있는 chaos응답거동을 성공적으로 확인할 수 있음을 알아내었다. 또한 시스템의 응답거동에서 chaos의 특성이 완전히 사라지는 노이즈의 강도를 얻을 수 있음도 알아내었다.
PDF

SNR 매핑을 이용한 환경적응 기반 음성인식 (Speech Recognition based on Environment Adaptation using SNR Mapping)

정용주
- 한국전자통신학회논문지
- /
- 제9권5호
- /
- pp.543-548
- /
- 2014
다 모델 기반의 음성인식기는 음성인식에서 매우 성공적임이 알려져 있다. 그것은 다양한 신호-대-잡음비(SNR)와 잡음종류에 해당하는 다수의 HMM을 사용함으로서 선택된 음향모델이 인식잡음음성에 매우 근접한 일치성을 가질 수 있기 때문이다. 그러나 실제 사용시에 HMM의 개수가 제한됨에 따라서 음향모델의 불일치는 여전히 문제로 남아 있다. 본 논문에서는 인식잡음음성과 HMM 간의 SNR 불일치를 줄이고자 이들 간의 최적의 SNR 매핑 (mapping)을 실험적으로 결정하였다. 인식잡음음성으로 부터 추정된 SNR 값을 사용하는 대신 제안된 SNR 매핑을 사용함으로서 향상된 인식결과를 얻을 수 있었다. 다 모델 기반인식기에 제안된 방법을 적용하여 Aurora 2 데이터베이스에 대해서 인식 실험한 결과 기존의 MTR 이나 다 모델 기반 음성인식기에 비해서 6.3%와 9.4%의 상대적 단어 오인식율 감소를 이룰 수 있었다.
https://doi.org/10.13067/JKIECS.201.9.5.543 인용 PDF KSCI

잡음 환경에 효과적인 음성인식을 위한 특징 보상 이득 기반의 음성 향상 기법 (Speech enhancement method based on feature compensation gain for effective speech recognition in noisy environments)

배아라;김우일
- 한국음향학회지
- /
- 제38권1호
- /
- pp.51-55
- /
- 2019
본 논문에서는 잡음 환경에 강인한 음성 인식 성능을 위해 특징 보상 이득을 이용한 음성 향상 기법을 제안한다. 본 논문에서는 변분모델 생성 기법을 채용한 병렬 결합된 가우스 혼합 모델(Parallel Combined Gaussian Mixture Model, PCGMM) 기반의 특징 보상 기법으로부터 계산할 수 있는 특징 보상 이득을 이용하는 음성 향상 기술을 제안한다. 불일치 환경 음성 인식 시스템 적용 환경에서 본 논문에서 제안하는 기법이 실험 결과에서 기존의 전처리 기법 및 이전 연구에서 제안된 특징 보상 기반의 음성 향상 기법에 비해 다양한 잡음 및 SNR(Signal to Noise Ratio) 조건에서 월등한 인식 성능을 나타내는 것을 확인한다. 또한 잡음 모델 선택 기법을 적용함으로써 음성 인식 성능을 유사한 수준으로 유지하면서 계산량을 대폭적으로 감축할 수 있다.
https://doi.org/10.7776/ASK.2019.38.1.051 인용 PDF KSCI HTML

PNCC와 robust Mel-log filter bank 특징을 결합한 조류 울음소리 분류 (Bird sounds classification by combining PNCC and robust Mel-log filter bank features)

알자흐라 바디;고경득;고한석
- 한국음향학회지
- /
- 제38권1호
- /
- pp.39-46
- /
- 2019
본 논문에서는 합성곱 신경망(Convolutional Neural Network, CNN) 구조를 이용하여 잡음 환경에서 음향신호를 분류할 때, 인식률을 높이는 결합 특징을 제안한다. 반면, Wiener filter를 이용한 강인한 log Mel-filter bank와 PNCCs(Power Normalized Cepstral Coefficients)는 CNN 구조의 입력으로 사용되는 2차원 특징을 형성하기 위해 추출됐다. 자연환경에서 43종의 조류 울음소리를 포함한 ebird 데이터베이스는 분류 실험을 위해 사용됐다. 잡음 환경에서 결합 특징의 성능을 평가하기 위해 ebird 데이터베이스를 3종류의 잡음을 이용하여 4개의 다른 SNR (Signal to Noise Ratio)(20 dB, 10 dB, 5 dB, 0 dB)로 합성했다. 결합 특징은 Wiener filter를 적용한 log-Mel filter bank, 적용하지 않은 log-Mel filter bank, 그리고 PNCC와 성능을 비교했다. 결합 특징은 잡음이 없는 환경에서 1.34 % 인식률 향상으로 다른 특징에 비해 높은 성능을 보였다. 추가적으로, 4단계 SNR의 잡음 환경에서 인식률은 shop 잡음 환경과 schoolyard 잡음 환경에서 각각 1.06 %, 0.65 % 향상했다.
https://doi.org/10.7776/ASK.2019.38.1.039 인용 PDF KSCI HTML

레이더 신호 탐지를 위한 잡음제거 임계레벨 자동제어 기법 (Noise Cancelling Automatic Threshold Control Method for Radar Signal Detection)

이치헌
- 한국군사과학기술학회지
- /
- 제16권2호
- /
- pp.214-217
- /
- 2013
In this paper, we proposed an automatic threshold control method for radar warning receiver. Considering the noise level of the environment, this technique can effectively adjust sensitivity level of radar warning receiver and can offer more accurate radar information for aircraft pilot in noisy circumstances.
https://doi.org/10.9766/KIMST.2013.16.2.214 인용 PDF KSCI

한국어 입술 독해에 적합한 시공간적 특징 추출 (Experiments on Various Spatial-Temporal Features for Korean Lipreading)

오현화;김인철;김동수;진성일
- 대한전자공학회:학술대회논문집
- /
- 대한전자공학회 2001년도 하계종합학술대회 논문집(4)
- /
- pp.29-32
- /
- 2001
Visual speech information improves the performance of speech recognition, especially in noisy environment. We have tested the various spatial-temporal features for the Korean lipreading and evaluated the performance by using a hidden Markov model based classifier. The results have shown that the direction as well as the magnitude of the movement of the lip contour over time is useful features for the lipreading.
PDF

Application of FFT to orientation determination

Woo, Dong-Min;Park, Mignon
- 제어로봇시스템학회:학술대회논문집
- /
- 제어로봇시스템학회 1991년도 한국자동제어학술회의논문집(국제학술편); KOEX, Seoul; 22-24 Oct. 1991
- /
- pp.1730-1733
- /
- 1991
In this paper, we two dimensional processing method is presented, which can accurately determine the orientation of an part. Matching bewteen the object and the object contour is decomposed to estimate the orientation of the object and to evaluate the similarity new approach is very robust with respect to noise and no preprocessing of the contour is required. Also, this method has many advantages over the converntional correlation technique. With only a few uniformly sampled points, this method can estimate the accurate orientation in an efficient manner even in a noisy environment.
PDF

검색결과 389건 처리시간 0.023초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)