• 제목/요약/키워드: 잡음에 강인한 특징

검색결과 121건 처리시간 0.035초

다중 레벨 양자화 기법을 적용한 오디오 핑거프린트 추출 방법 (Audio Fingerprint Extraction Method Using Multi-Level Quantization Scheme)

  • 송원식;박만수;김회린
    • 한국음향학회지
    • /
    • 제25권4호
    • /
    • pp.151-158
    • /
    • 2006
  • 본 논문은 필립스의 음악 검색 기법을 기반으로 필터 뱅크 에너지 변화량과 음악의 통계적인 특성을 이용한 오디오 핑거프린트 추출 방법을 제안하였다. 기존의 필립스 방식은 제한된 주파수 영역을 너무 많은 필터 뱅크로 분할하여 분석함으로써 밴드들 사이에 연계성 및 왜곡에 대한 민감도가 증가하는 특징을 보일 수 있다. 제안된 방법은 필터 뱅크의 밴드 수를 줄여 왜곡에 대한 강인성을 증진시키고, 필터 뱅크 에너지의 변화량의 부호와 크기 정보를 통계적 특성을 고려한 양자화 기법을 이용해 2비트로 할당함으로써 오디오 핑거프린트의 고유성을 확보하였다. 추출된 2비트는 4개의 레벨로 정보를 표현함으로 각 레벨 사이에 연계성이 존재하게 된다. 이 같은 레벨 사이의 연계성은 유사도 측정 시 이용될 뿐만 아니라 오디오 핑거프린트를 기준으로 검색 영역을 확장하는 제안된 방식에서는 효율적인 검색 영역을 선택할 수 있는 정보로 활용 되었다. 제안된 방식은 다양한 주변 잡음환경 (거리, 백화점, 자동차, 사무실, 식당)에서의 실험을 통하여 주변 잡음에 강인한 특성을 보일 뿐만 아니라 검색 속도 또한 향상되는 특징을 보였다.

Wavelet 기반의 Watershed를 이용한 효율적인 영상 분할 기법 (Efficient Image Segmentation using Wavelet-based Watershed)

  • 김종배;김항준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.472-474
    • /
    • 2001
  • 본 논문은 wavelet 기반의 watershed를 이용한 효율적인 영상 분할을 기법을 제안한다. 영상 분할을 위해 입력 영상을 wavelet transform을 사용하여 low-resolution 영상을 생성한 후 watershed 알고리즘을 이용해 분할하고, 이를 Inverse wavelet transform함으로써 원 영상으로 복원한다. 복원된 영상을 의미 있는 영역들로 분할하기 위해 wavelet 특징값의 유사성을 두 인접한 영역에 비교하여 병합한다. 실험 결과 제안한 방법은 영상의 잡음에 대한 강인함과 영상의 과분할 문제를 해결할 수 있다.

  • PDF

독립성분분석을 이용한 강인한 화자인식 (Robust Speaker Recognition using Independent Component Analysis)

  • 장길진
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 2호
    • /
    • pp.327-330
    • /
    • 1998
  • 독립성분분석(ICA: Independent Component Analysis)이란 특징이 상이한 둘 이상의 신호들이 선형적으로 결합되어 있을 때 이를 효과적으로 분리하는 방법들을 통칭하며 잡음제거, 음질개선 및 신호처리 분야에서 많이 활용되고 있다. 본 논문에서는 전화음성 화자인식 시스템의 성능향상을 위해 독립성분분석을 이용하는 방법을 제안한다. 먼저 화자가 발성한 음성신호의 켑스트럼 계수를 여러 채널 함수들의 선형적인 합으로 가정하고, 독립성분분석을 이용하여 얻은 새로운 켑스트럼 벡터를 학습과 인식에 사용하였다. 실험자료는 잔화음성 화자식별기의 성능평가에 널리 쓰이고 있는 SPIDRE를 사용하였고 regodic 은닉 마코프 모델을 이용하여 문장 독립 화자식별 시스템을 구성하였다. 학습음성의 특징과 실험음성의 특징이 다른 조건에서 기존의 채널 정규화 방법들에 비해 10~15%이상 인식률이 향상되었다.

  • PDF

EIV와 MLP를 이용한 뇌파 기반 운전자의 졸음 감지 시스템 (Electroencephalogram-Based Driver Drowsiness Detection System Using Errors-In-Variables(EIV) and Multilayer Perceptron(MLP))

  • 한형섭;송경영
    • 한국통신학회논문지
    • /
    • 제39C권10호
    • /
    • pp.887-895
    • /
    • 2014
  • 졸음운전은 전체 교통사고 원인 중 큰 비중을 차지하며 그 위험성이 음주운전보다도 크다고 알려져 있다. 따라서 운전자의 졸음을 판단하고 경고하는 시스템 개발에 대한 관심이 높아지고 있으며, 뇌파를 분석하는 것이 운전자의 피로와 졸음을 감지하는데 효과적이라는 연구결과들이 발표되었다. 본 논문은 짧은 시간에 높은 해상도를 가지는 auto-regressive 모델 기법 중 잡음에 강인한 errors-in-variables(EIV) 방법을 이용하여 특징벡터를 추출하고, 다층신경망(multilayer perceptron; MLP)에 적용하여 운전자의 상태를 각성, 천이, 졸음의 세 가지 상태로 분류하는 졸음 감지 시스템을 제안한다. 생체신호의 측정 환경에 따른 성능을 평가하기 위해 높은 진단률을 갖도록 하는 EIV차수를 결정하고, 잡음에 대한 강인성을 확인하기 위해 신호대 잡음비(signal-to-noise ratio; SNR)에 따른 성능을 선형 예측 부호화(linear predictive coding; LPC) 방법과 비교하였다. 이 결과로부터 제안한 EIV와 MLP를 결합한 졸음 감지 시스템은 기존의 LPC와 MLP를 이용한 시스템에 대해 우수한 성능을 얻을 수 있음을 확인하였다.

잡음에 강한 특징 벡터 및 스펙트럼 차감법을 이용한 음성 인식 (Speech Recognition Using Noise Robust Features and Spectral Subtraction)

  • 신원호;양태영;김원구;윤대희;서영주
    • 한국음향학회지
    • /
    • 제15권5호
    • /
    • pp.38-43
    • /
    • 1996
  • 본 논문에서는 잡음 및 주변 환경에 강인한 것으로 알려져 있는 특징 벡터들을 이용한 인식 성능을 비교하였다. 아울러 스펙트럼 차감법을 적용하여 높은 인식 성능을 얻도록 하였다. 본 논문에서는 환경 변화에 강인한 인식 성능을 얻기 위하여 SMC(Short time Modified Coherence) 분석, 루트(root) 켑스트럼 분석, LDA(Linear Discriminant Analysis), PLP(Perceptual Linear Prediction), RASTA(RelAtive SpecTrAl) 처리 등을 이용하여 인식 실험을 수행하였다. 실험을 위하여 반연속 HMM을 이용한 단독음 인식 시스템을 구현하였고 전시장 및 컴퓨터실의 잡음을 첨가하여 0, 10 및 20dB의 SNR에 대한 인식 실험을 수행하였다. 실험 결과, LPCC(Linear Prediction Cepstral Coefficient)를 이용한 경우에 비하여 SMC나 루트처리를 이용한 멜 켑스트럼(루트_멜 켑스트럼)을 이용한 경우 10dB의 SNR에서 각각 9.86%, 12.68% 향상된 가장 좋은 인식률을 얻었다. 또한 멜 켑스트럼과 루트_멜 켑스트럼을 스펙트럼 차감법과 결합하여 잡음을 제거한 경우 10dB에서 각각 16.7%, 8.4% 향상된 94.91%, 94.28%의 인식률을 얻을 수 있었다.

  • PDF

음성구간검출을 위한 비정상성 잡음에 강인한 특징 추출 (Robust Feature Extraction for Voice Activity Detection in Nonstationary Noisy Environments)

  • 홍정표;박상준;정상배;한민수
    • 말소리와 음성과학
    • /
    • 제5권1호
    • /
    • pp.11-16
    • /
    • 2013
  • This paper proposes robust feature extraction for accurate voice activity detection (VAD). VAD is one of the principal modules for speech signal processing such as speech codec, speech enhancement, and speech recognition. Noisy environments contain nonstationary noises causing the accuracy of the VAD to drastically decline because the fluctuation of features in the noise intervals results in increased false alarm rates. In this paper, in order to improve the VAD performance, harmonic-weighted energy is proposed. This feature extraction method focuses on voiced speech intervals and weighted harmonic-to-noise ratios to determine the amount of the harmonicity to frame energy. For performance evaluation, the receiver operating characteristic curves and equal error rate are measured.

주행중인 자동차 환경에서의 음성인식 연구 (A Study on Speech Recognition in a running automobile)

  • 유봉근
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
    • /
    • pp.47-50
    • /
    • 1998
  • 본 논문은 자동차의 편의성 및 안전성의 동시 확보를 위하여, 보조적 스위치의 조작없이 상시 음성의 입,출력이 가능하도록 하며, band pass filter를 이용하여 잡음환경에서 자동으로 정확하게 음성구간 검출(End Point Detection)을 하게 하였다. Reference Pattern은 Dynamic Multi-Section(DMS)[1] 모델을 사용하였고 차량의 속도에 따라 자동으로 잡음환경에 강인한 모델을 선택하도록 하였으며, 음성의 특징 파라미터와 인식 알고리즘은 Perceptual Linear Predictive(PLP) 13차와 One Stage Dynamic Programming(OSDP)를 사용하였다. 주행중인 자동차 환경(30~70km/h)에서 자주 사용되는 차량제어 명령 33개에 대하여 화자독립 92.98%, 화자종속 94.44% 인식율을 구하였다. 또한 주행중인 차량에서 카폰, 핸드폰 사용으로 인한 사고를 줄이기 위하여 음성으로 전화를 걸 수 있도록 하는 Voice Dialing 기능도 구현하였다.

  • PDF

저 분해능 엔코더가 장착된 전동기의 적응 상태추정기를 이용한 고성능 속도제어 (High-Performance Speed Control Using Adaptive State Estimator for Electric Machine with Low-Precision Shaft Encoder)

  • 권택준;현동석
    • 전력전자학회:학술대회논문집
    • /
    • 전력전자학회 1998년도 전력전자학술대회 논문집
    • /
    • pp.309-313
    • /
    • 1998
  • 고성능 서보 전동기 시스템을 구축하기 위해서는 저속영역과 고속영역을 포함하는 넓은 속도영역에서의 정확한 속도검출을 통한 정밀한 속도제어기 필수적이며, 관성모멘트와 같은 전동기의 파라메터 변동에 대해 강인한 속도제어와 외란 억제능력도 중요한 요소로서 고려되어야 한다. 변동하는 부하의 관성모멘트을 식별하여 PI 속도제어기를 실시간으로 적응 동정하고, 플랜트 잡음과 측정잡음을 고려하는 상태 관측기인 칼만필터의 부하관성에 대한 민감성을 제거하기 위해 이를 적응 동정하여 적응 상태 추정기를 구현함으로써 우수한 속도 추정 성능을 얻었다. 또한 외란과 불확실한 모델링은 등가 외란으로 추정되어 전향적으로 보상된다. 본 논문에서는 이러한 특징을 이용하여 전동기의 고성능 속도제어를 구현하고 유도전동기를 이용한 실험을 통하여 연구결과의 유효성을 확인한다.

  • PDF

잡음 환경에서 음성인식을 위한 스펙트럼 기울기의 효과적인 보상 방법 (Efficient Compensation of Spectral Tilt for Speech Recognition in Noisy Environment)

  • 조정호
    • 한국인터넷방송통신학회논문지
    • /
    • 제17권1호
    • /
    • pp.199-206
    • /
    • 2017
  • 환경 잡음은 음성인식 시스템의 성능을 떨어뜨릴 수 있다. 이 논문은 인식 시스템이 잡음에 강인하도록 만들기 위하여, 켑스트럼에 기초한 특징 보상을 수행하는 과정을 제시한다. 이 방법은 부가적인 잡음의 영향을 제거하기 위한 직접적인 스펙트럼 기울기 보상에 기초를 둔다. 잡음 보상 방법은 로그 전력 스펙트럼의 스펙트럼 기울기 계산에 의하여 캡스트럼 영역에서 동작한다. 스펙트럼 보상은 SNR에 의존하는 켑스트럼 평균 보상 방법과 함께 사용된다. 백색 가우스 잡음, 지하철 잡음 및 자동차 잡음에 있는 조건에서, 실험 결과는 제안한 보상 방법이 여러 SNR에서 인식률을 상당히 개선한다는 것을 보여준다.

가우시안 잡음과 계산량을 고려한 하이브리드 센서스 변환 (Hybrid census transform considering gaussian noise and computational complexity)

  • 정성환;강성진
    • 한국산학기술학회논문지
    • /
    • 제14권8호
    • /
    • pp.3983-3991
    • /
    • 2013
  • 스테레오 매칭 중 센서스 변환은 방사 왜곡과 밝기 변화에 강한 특징이 있다. 본 논문은 미니 센서스 변환과 일반화된 센서스 변환을 동시에 이용한 하이브리드 센서스 변환을 제안하였다. 제안한 하이브리드 센서스 변환 방법은 미니 센서스 변환의 적은 계산량과 일반화된 센서스 변환의 잡음에 강인한 특성을 반영하여 설계되었다. 성능을 평가하기 위하여 후처리 과정까지 포함하여 스테레오 매칭을 수행하였다. 그 결과 하이브리드 센서스 변환은 일반화된 센서스 변환과 성능이 비슷하였고, 계산량은 미니 센서스 변환과 일반화된 센서스의 중간값을 갖는다.