• 제목/요약/키워드: Noise robust feature

검색결과 155건 처리시간 0.028초

화자 확인을 위한 다중대역에 기반한 주성분 분석 공분산 모델 (PCA Covariance Model Based on Multiband for Speaker Verification)

  • 최민정;이윤정;서창우
    • 음성과학
    • /
    • 제14권2호
    • /
    • pp.127-135
    • /
    • 2007
  • Feature vectors of speech are generally extracted from whole frequency domain. The inherent character of a speaker is located in the low band or high band frequency. However, if the speech is corrupted by narrowband noise with concentrated energy, speaker verification performance is reduced as the individual characteristic is removed. In this paper, we propose a PCA Covariance Model based on the multiband to extract the robust feature vectors against the narrowband noise. First, we divide the overall frequency band into several subbands. Second, the correlation of feature vectors extracted independently from each subband is removed by PCA. The distance obtained from each subband has different distribution. To normalize against the different distribution, we moved the value into the normalized distribution through the mapping function. Finally, the represented value applying the weighting function is used for speaker verification. In the experiments, the proposed method shows better performance of the speaker verification and reduces the computation.

  • PDF

Eigen - Environment 잡음 보상 방법을 이용한 강인한 음성인식 (Robust Speech Recognition using Noise Compensation Method Based on Eigen - Environment)

  • 송화전;김형순
    • 대한음성학회지:말소리
    • /
    • 제52호
    • /
    • pp.145-160
    • /
    • 2004
  • In this paper, a new noise compensation method based on the eigenvoice framework in feature space is proposed to reduce the mismatch between training and testing environments. The difference between clean and noisy environments is represented by the linear combination of K eigenvectors that represent the variation among environments. In the proposed method, the performance improvement of speech recognition systems is largely affected by how to construct the noisy models and the bias vector set. In this paper, two methods, the one based on MAP adaptation method and the other using stereo DB, are proposed to construct the noisy models. In experiments using Aurora 2 DB, we obtained 44.86% relative improvement with eigen-environment method in comparison with baseline system. Especially, in clean condition training mode, our proposed method yielded 66.74% relative improvement, which is better performance than several methods previously proposed in Aurora project.

  • PDF

$La^*b^*$ 칼라 특징과 무게 중심 모델을 이용한 객체 추출 (Object segmentation using CoM Model and $La^*b^*$ color feature)

  • 박태곤;김경환
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2008년도 하계종합학술대회
    • /
    • pp.1021-1022
    • /
    • 2008
  • This paper proposes an object segmentation method using centre of mass model and $CIELa^*b^*$ color feature. The proposed method detects moving objects using geometric and colorimetic information. The method is robust to illumination changes and it reduces noise by block-wise computation.

  • PDF

잡음 민감성이 향상된 주성분 분석 기법의 비선형 변형 (A Non-linear Variant of Improved Robust Fuzzy PCA)

  • 허경용;서진석;이임건
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권4호
    • /
    • pp.15-22
    • /
    • 2011
  • 주성분 분석(PCA)은 데이터의 차원을 줄이면서 최대의 데이터 변이를 보존하는 기법으로 차원 축소나 특징 추출을 위해 널리 사용되고 있다. 하지만 PCA는 잡음에 민감하며 가우스 분포에 대하여만 유효하다는 단점이 있다. 잡음 민감성의 개선을 위해 다양한 방법이 제시되었고 그 중 퍼지 소속도를 이용한 반복적 최적화 기법인 RF-PCA2가 다른 방법에 비해 우수한 성능을 보였다. 하지만 RF-PCA2는 가우스 분포에만 사용할 수 있는 선형 알고리듬이라는 한계가 있다. 이 논문에서는 RF-PCA2와 커널 주성분 분석(kernel PCA, K-PCA)을 결합하여 가우스 분포 이외의 분포들도 다룰 수 있는 비선형 알고리듬인 improved robust kernel fuzzy PCA (RKF-PCA2)를 제안한다. RKF-PCA2는 RF-PCA2 알고리듬의 잡음 강건성과K-PCA의비선형성을 통해 기존알고리듬에 비해 잡음민감성이 적으며 가우스분포 한계를 효과적으로 극복할 수 있다. 이러한 사실은 실험 결과를 통해 확인할 수 있다.

음성 인식을 위한 개선된 평균 예측 LMS 필터를 이용한 DNN 기반의 강인한 음성 특징 추출 및 신호 잡음 제거 기법 (DNN based Robust Speech Feature Extraction and Signal Noise Removal Method Using Improved Average Prediction LMS Filter for Speech Recognition)

  • 오상엽
    • 융합정보논문지
    • /
    • 제11권6호
    • /
    • pp.1-6
    • /
    • 2021
  • 음성 인식 분야에서 DNN이 적용됨에 따라 음성 인식의 이용이 증대되고 있으나 기존의 GMM 보다 병렬 훈련에 대한 계산의 양이 많아야 되며, 데이터의 양이 적으면 오버피팅이 발생한다. 이를 해결하기 위해 데이터의 양이 작은 경우에도 강인한 음성 특징 추출과 음성 신호 잡음 제거에 효율적인 방안을 제시한다. 음성 특징 추출은 음성에 대한 프레임 에너지의 차이와 음성 신호에 영향을 받는 영 교차율과 레벨 교차율을 적용하여 음성 에너지의 효율적 추출을 한다. 또한, 잡음 제거를 위해 음성 신호에 대한 검출에서 음성의 고유 특성을 유지하면서 음성 정보 손상이 적은 평균 예측 LMS 필터를 개선하여 음성 신호의 잡음을 제거하여 데이터양이 적은 경우의 문제를 해결한다. 개선된 LMS 필터는 입력 신호에 대한 활성 파라미터 임계치를 조정하여 입력된 음성 신호에 대한 잡음을 처리하는 방법을 사용한다. 본 논문에서 제안한 방법을 사용하여 기존의 프레임 에너지를 이용한 방법과 비교한 결과 음성의 시작점의 오차율은 7%, 끝나는 점 오차율에서 11% 향상된 성능을 확인하였다.

DSP를 이용한 자동차 소음에 강인한 음성인식기 구현 (Implementation of a Robust Speech Recognizer in Noisy Car Environment Using a DSP)

  • 정익주
    • 음성과학
    • /
    • 제15권2호
    • /
    • pp.67-77
    • /
    • 2008
  • In this paper, we implemented a robust speech recognizer using the TMS320VC33 DSP. For this implementation, we had built speech and noise database suitable for the recognizer using spectral subtraction method for noise removal. The recognizer has an explicit structure in aspect that a speech signal is enhanced through spectral subtraction before endpoints detection and feature extraction. This helps make the operation of the recognizer clear and build HMM models which give minimum model-mismatch. Since the recognizer was developed for the purpose of controlling car facilities and voice dialing, it has two recognition engines, speaker independent one for controlling car facilities and speaker dependent one for voice dialing. We adopted a conventional DTW algorithm for the latter and a continuous HMM for the former. Though various off-line recognition test, we made a selection of optimal conditions of several recognition parameters for a resource-limited embedded recognizer, which led to HMM models of the three mixtures per state. The car noise added speech database is enhanced using spectral subtraction before HMM parameter estimation for reducing model-mismatch caused by nonlinear distortion from spectral subtraction. The hardware module developed includes a microcontroller for host interface which processes the protocol between the DSP and a host.

  • PDF

Object Feature Extraction Using Double Rearrangement of the Corner Region

  • Lee, Ji-Min;An, Young-Eun
    • 통합자연과학논문집
    • /
    • 제12권4호
    • /
    • pp.122-126
    • /
    • 2019
  • In this paper, we propose a simple and efficient retrieval technique using the feature value of the corner region, which is one of the shape information attributes of images. The proposed algorithm extracts the edges and corner points of the image and rearranges the feature values of the corner regions doubly, and then measures the similarity with the image in the database using the correlation of these feature values as the feature vector. The proposed algorithm is confirmed to be more robust to rotation and size change than the conventional image retrieval method using the corner point.

Energy Feature Normalization for Robust Speech Recognition in Noisy Environments

  • Lee, Yoon-Jae;Ko, Han-Seok
    • 음성과학
    • /
    • 제13권1호
    • /
    • pp.129-139
    • /
    • 2006
  • In this paper, we propose two effective energy feature normalization methods for robust speech recognition in noisy environments. In the first method, we estimate the noise energy and remove it from the noisy speech energy. In the second method, we propose a modified algorithm for the Log-energy Dynamic Range Normalization (ERN) method. In the ERN method, the log energy of the training data in a clean environment is transformed into the log energy in noisy environments. If the minimum log energy of the test data is outside of a pre-defined range, the log energy of the test data is also transformed. Since the ERN method has several weaknesses, we propose a modified transform scheme designed to reduce the residual mismatch that it produces. In the evaluation conducted on the Aurora2.0 database, we obtained a significant performance improvement.

  • PDF

열화상 이미지 히스토그램의 가우시안 혼합 모델 근사를 통한 열화상-관성 센서 오도메트리 (Infrared Visual Inertial Odometry via Gaussian Mixture Model Approximation of Thermal Image Histogram)

  • 신재호;전명환;김아영
    • 로봇학회논문지
    • /
    • 제18권3호
    • /
    • pp.260-270
    • /
    • 2023
  • We introduce a novel Visual Inertial Odometry (VIO) algorithm designed to improve the performance of thermal-inertial odometry. Thermal infrared image, though advantageous for feature extraction in low-light conditions, typically suffers from a high noise level and significant information loss during the 8-bit conversion. Our algorithm overcomes these limitations by approximating a 14-bit raw pixel histogram into a Gaussian mixture model. The conversion method effectively emphasizes image regions where texture for visual tracking is abundant while reduces unnecessary background information. We incorporate the robust learning-based feature extraction and matching methods, SuperPoint and SuperGlue, and zero velocity detection module to further reduce the uncertainty of visual odometry. Tested across various datasets, the proposed algorithm shows improved performance compared to other state-of-the-art VIO algorithms, paving the way for robust thermal-inertial odometry.

음성의 특징 단계에 독립 요소 해석 기법의 효율적 적용을 통한 잡음 음성 인식 (Independent Component Analysis on a Subband Domain for Robust Speech Recognition)

  • 박형민;정호영;이태원;이수영
    • 전자공학회논문지CI
    • /
    • 제37권6호
    • /
    • pp.22-31
    • /
    • 2000
  • 본 논문에서는 잡음이 섞인 음성 신호로부터 특징을 추출하는 과정에서 잡음의 영향이 배제된 음성의 특징을 추출하는 방법을 제안한다. 이 방법은 여러 개의 마이크로폰으로 녹음된 잡음 음성 신호에 독립 요소해석 (Independent Component Analysis) 기법을 사용한 암묵 신호 분리를 적용하여 잡음 성분을 제거하게 된다. 또한, 새로운 스펙트럼 분석법을 제안하여 음성 인식을 위한 특징에 가까운 단계에서 독립 요소 해석 기법을 효율적으로 적용할 수 있도록 한다. 이 스펙트럼 분석법은 기존의 대역 에너지 계산 방법을 수정하여 하나의 대역을 몇 개의 영역으로 구분하고 그 영역내의 Fast Fourier Transform (FFT) 포인트 값들의 평균을 먼저 구한 후 대역 에너지를 계산하게 된다. 음성과 잡음에 대한 대역 에너지의 표본 분산을 사용한 해석과 인식 실험을 통해 이 스펙트럼 분석법이 잡음에 둔감한 방법임을 보였다. 또, 실세계에서 녹음된 잡음 음성 신호에 대해 새로운 스펙트럼 분석법에 독립 요소 해석 기법을 적용한 방법은 인식 성능을 크게 향상시켰으며, 특히 낮은 신호 대 잡음비에 대하여 효과적이었다. 이 방법은 음성 인식을 위한 특징 단계에 독립 요소 해석 기법을 효율적으로 적용 가능할 수 있도록 하는 방안을 제시한다.

  • PDF