• 제목/요약/키워드: 잡음에 강인한 특징

검색결과 121건 처리시간 0.023초

강인한 오디오 핑거프린팅 시스템을 위한 에너지와 통계적 필터링 (Energy and Statistical Filtering for a Robust Audio Fingerprinting System)

  • 정병준;김대진
    • 한국콘텐츠학회논문지
    • /
    • 제12권5호
    • /
    • pp.1-9
    • /
    • 2012
  • 디지털 음악과 스마트 폰이 대중화되면서 잡음에 강인한 실시간 음악 핑거프린트 시스템이 다양하게 개발되고 있다. 특히 핑거프린트 알고리즘 중 Multiple Hashing(MLH)은 잡음에 강인하고 정교한 구조로 되어 있다. 본 논문에서는 음악 데이터베이스로부터 질의 및 응답의 정확도를 개선하기 위해 에너지 집중필터를 사용하고 연속성과 중복성을 제거하는 통계적 필터를 제안한다. 에너지 집중 필터는 하위 비트에 에너지가 집중되는 Discrite Cosine Transform(DCT)의 특징을 이용하고, 통계적 필터는 검색된 핑거프린트 정보들 사이의 상관관계 특성을 이용한다. 실험 결과로 잡음 환경에서 에너지와 통계적 필터링으로 구성된 제안 알고리즘은 우수성을 보인다. 이는 제안된 필터 엔진으로 Philips Robust Hash(PRH)보다 잡음에 강인하고 Multiple Hashing(MLH)보다 간결한 핑거프린트 시스템을 구성할 수 있다.

병렬 결합된 혼합 모델 기반의 특징 보상 기술 (Feature Compensation Method Based on Parallel Combined Mixture Model)

  • 김우일;이흥규;권오일;고한석
    • 한국음향학회지
    • /
    • 제22권7호
    • /
    • pp.603-611
    • /
    • 2003
  • 본 논문에서는 잡음 환경에서 보다 강인한 성능을 얻기 위하여 음성 모델 기반의 효과적인 특징 보상 기법을 제안한다. 일반적인 모델 기반의 특징 보상 기법은 오열 음성 데이터베이스를 이용한 훈련 과정을 필요로 하므로 온라인 상에서의 적응 과정에 적합하지 않다. 제안한 방법에서는 보정 인자 추정 과정에서 병렬 모델 결합 기법을 도입함으로써 훈련 과정을 필요하지 않게 하였다. 모델의 결합 과정이 HMM 전체가 아닌 가우시안 혼합 (Mixture) 모델에만 적용이 되므로, 계산이 비교적 간단하게 되어 온라인 상에서의 모델 결합을 가능하게 하였다. 병렬적 모델 결합의 도입은 잡음 모델의 독립적인 이용을 가능하게 하였고, 본 논문에서는 MAP (Maximum A Posteriori) 적응을 통해 잡음 모델 갱신을 실시하였다 또한 잡음 오열 과정에 대한 근사화를 통해 연속적 형태의 채널 정규화 기법을 유도하여 적용하였다. 보다 효율적인 구현을 위하여 선택적인 모델 결합 방식을 도입함으로써 연산량을 줄일 수 있는 방법을 제시하였다. 제안한 특징 보상 기법이 부가적인 배경 잡음과 채널 왜곡이 존재하는 잡음 환경에서 음성 인식 시스템의 성능을 향상시키는데 효과적임을 실험을 통해 확인할 수 있었다.

잡음 환경에 효과적인 음성인식을 위한 특징 보상 이득 기반의 음성 향상 기법 (Speech enhancement method based on feature compensation gain for effective speech recognition in noisy environments)

  • 배아라;김우일
    • 한국음향학회지
    • /
    • 제38권1호
    • /
    • pp.51-55
    • /
    • 2019
  • 본 논문에서는 잡음 환경에 강인한 음성 인식 성능을 위해 특징 보상 이득을 이용한 음성 향상 기법을 제안한다. 본 논문에서는 변분모델 생성 기법을 채용한 병렬 결합된 가우스 혼합 모델(Parallel Combined Gaussian Mixture Model, PCGMM) 기반의 특징 보상 기법으로부터 계산할 수 있는 특징 보상 이득을 이용하는 음성 향상 기술을 제안한다. 불일치 환경 음성 인식 시스템 적용 환경에서 본 논문에서 제안하는 기법이 실험 결과에서 기존의 전처리 기법 및 이전 연구에서 제안된 특징 보상 기반의 음성 향상 기법에 비해 다양한 잡음 및 SNR(Signal to Noise Ratio) 조건에서 월등한 인식 성능을 나타내는 것을 확인한다. 또한 잡음 모델 선택 기법을 적용함으로써 음성 인식 성능을 유사한 수준으로 유지하면서 계산량을 대폭적으로 감축할 수 있다.

한글의 구조적 특징을 이용한 인쇄체 한글인식을 위한 신경망 설계 (Neural Network design for Printed Hangul recognition using structural characteristic of Hangul)

  • 서원택;조범준
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 춘계학술발표대회논문집
    • /
    • pp.588-591
    • /
    • 2003
  • 본 논문에서는 한글의 구조적인 특징을 이용하여 이를 효과적으로 인식할 수 있는 신경망을 설계해보았고, 이를 이용하여 주민등록증에 있는 이름을 인식하는 시스템을 구성해 보았다. 본 시스템은 한글의 6형식에 따른 구조적인 특징을 효과적으로 구분하기 위해 형식을 구분하는 신경망을 먼저 구성하여 형식별로 분류한 뒤, 형식에 따라 자모음을 분리하여 각 형식에 따라 구성된 2차 신경망으로 입력을 하여 인식하는 구조로 설계되었다. 훈련용 데이터는 각 형식 별로 자소를 분리해서 얻은 영상들을 자소별 평균이미지로 만들어서 이를 조합하여 만든 글자로 사용하였다. 그래서 같은 형식의 같은 자음이라도 글자의 모양과 위치가 조금 다른 것에 대해서 강인한 훈련을 할 수 있었다. 또한 히스토그램의 국부 평균을 적용함으로써 잡음에 효과적으로 대응하였다. 100명의 주민등록증을 컴퓨터 카메라를 이용하여 입력 받아서 테스트한 결과 98.1%의 높은 인식률을 얻을 수 있었다.

  • PDF

정사투영된 2차원 영상과 복원된 3차원 형상의 기하학적 관계 분석 (Analysis of Geometrical Relations of 2D Affine-Projection Images and Its 3D Shape Reconstruction)

  • 고성식;티티진;히로미츠 하마
    • 대한전자공학회논문지SP
    • /
    • 제44권4호통권316호
    • /
    • pp.1-7
    • /
    • 2007
  • 본 논문은 정사투영 카메라로부터 얻어진 2차원 영상으로부터 복원된 3차원 형상과의 기하학적 관계를 분석한다 본 연구의 목적은 2차원과 3차원 관계를 기하학적으로 분석함으로서 잡음에 강인한 3차원 형상 복원에 기여하기 위함이다. 만약 3차원 형상 복원 시 특징점이 손실되지 않고 잡음이 존재하지 않는다면 3차원 형상복원은 고유치 행렬인수분해로 정확하게 얻을 수 있다. 그렇지만 실제 촬영된 피사체의 일부가 보이지 않는 오클루션 또는 낮은 해상도 등의 영향으로 인해, 피사체의 특징점 일부가 손실된 경우는 고유치 행렬인수분해의 계산적 문제가 발생되어 정확한 3차원 복원을 할 수 없게 된다. 더욱이 추출된 특징 점에 잡음이 포함될 경우는 복원된 3차원 형상 역시 그 섭동 영향을 받게 된다. 본 연구는 이러한 잡음환경에서도 손실된 특징 점을 정확히 유추하기 위해 2차원과 3차원 사이의 기하학적 특성을 분석하는데 포커스 한다.

신경망 기반 음성, 영상 및 문맥 통합 음성인식 (Speech Recognition by Integrating Audio, Visual and Contextual Features Based on Neural Networks)

  • 김명원;한문성;이순신;류정우
    • 전자공학회논문지CI
    • /
    • 제41권3호
    • /
    • pp.67-77
    • /
    • 2004
  • 최근 잡음환경에서 신뢰도 높은 음성인식을 위해 음성정보와 영상정보를 융합하는 방법이 활발히 연구되고 있다. 본 논문에서는 이절적인 정보의 융합에 적합한 신경망 모델을 기반으로 음성, 영상 및 문맥 정보 등 다양한 정보를 융합하여 잡음 환경에서 고려단어를 인식하는 음성인식 기법에 대하여 기술한다. 음성과 영상 특징을 이용한 이중 모드 신경망 BMNN(BiModal Neural Network)을 제안한다. BMM은 4개 층으로 이루어진 다층퍼셉트론의 구조를 가지며 각 층은 입력 특징의 추상화 기능을 수행한다. BMNN에서는 제 3층이 잡음에 의한 음성 정보의 손실을 보상하기 위하여 음성과 영상 특징을 통합하는 기능을 수행한다. 또한, 잡음환경에서 음성 인식률을 향상시키기 위해 사용자가 말한 단어들의 순차 패턴을 나타내는 문맥정보를 이용한 후처리 방법을 제안한다. 잡음환경에서 BMNN은 단순히 음성만을 사용한 것 보다 높은 성능을 보임으로써 그 타당성을 확인할 수 있을 뿐 아니라, 특히 문맥을 이용한 후처리를 하였을 경우 잡음 환경에서 90%이상의 인식률을 달성하였다 본 연구는 잡음환경에서 강인한 음성인식을 위해 다양한 추가 정보를 사용함으로써 성능을 향상시킬 수 있음을 제시한다.

차량 항법용 음성 인식 시스템 구현 (Implementation of Speech Recognition System for Car Navigation)

  • 김지성
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
    • /
    • pp.51-54
    • /
    • 1998
  • 본 논문에서는 자동차 잡음 환경에서 녹음된 데이터 베이스를 이용하여 인식 시스템의 성능을 향상시키기 위한 효율적인 잡음 제거 방법을 연구하였다. 먼저, 잡음 및 주변 환경 변화에 강인한 것으로 알려져 있는 특징 벡터들의 인식 성능을 비교하교, 가중 켑스트랄 거리 측정 방법을 이용한 인식 실험을 통하여 시스템의 성능 향상을 확인하였다. 실험 결과, 본 논문에서 기준 시스템으로 사용한 LPC 켑스트럼의 경우에 비하여 MFCC나 root-cepstrum을 사용한 경우 인식률이 향상되었다. 켑스트럼간의 거리 측정에 있어서는 RPS와 BPL과 같은 가중 켑스트랄 거리 측정 함수들이 인식 성능 향상에 도움을 주었다. 또한 켑스트럼 평균 차감법이라는 간단한 잡음 제거기술을 적용하여 자동차 잡음 환경에서 인식 성능 향상을 보였다. 마지막으로, 차량 항법용 음성 인식 시스템의 실시간구현을 위하여 여러 경우의 인식 성능을 비교하고, 메모리 량과 실행 시간 등을 고려하여 최적 시스템을 제시하였다.

  • PDF

음성 인식을 위한 개선된 평균 예측 LMS 필터를 이용한 DNN 기반의 강인한 음성 특징 추출 및 신호 잡음 제거 기법 (DNN based Robust Speech Feature Extraction and Signal Noise Removal Method Using Improved Average Prediction LMS Filter for Speech Recognition)

  • 오상엽
    • 융합정보논문지
    • /
    • 제11권6호
    • /
    • pp.1-6
    • /
    • 2021
  • 음성 인식 분야에서 DNN이 적용됨에 따라 음성 인식의 이용이 증대되고 있으나 기존의 GMM 보다 병렬 훈련에 대한 계산의 양이 많아야 되며, 데이터의 양이 적으면 오버피팅이 발생한다. 이를 해결하기 위해 데이터의 양이 작은 경우에도 강인한 음성 특징 추출과 음성 신호 잡음 제거에 효율적인 방안을 제시한다. 음성 특징 추출은 음성에 대한 프레임 에너지의 차이와 음성 신호에 영향을 받는 영 교차율과 레벨 교차율을 적용하여 음성 에너지의 효율적 추출을 한다. 또한, 잡음 제거를 위해 음성 신호에 대한 검출에서 음성의 고유 특성을 유지하면서 음성 정보 손상이 적은 평균 예측 LMS 필터를 개선하여 음성 신호의 잡음을 제거하여 데이터양이 적은 경우의 문제를 해결한다. 개선된 LMS 필터는 입력 신호에 대한 활성 파라미터 임계치를 조정하여 입력된 음성 신호에 대한 잡음을 처리하는 방법을 사용한다. 본 논문에서 제안한 방법을 사용하여 기존의 프레임 에너지를 이용한 방법과 비교한 결과 음성의 시작점의 오차율은 7%, 끝나는 점 오차율에서 11% 향상된 성능을 확인하였다.

천해 배경잡음 환경에 적합한 과도신호의 특징 및 변별력 분석 (Analysis of Features and Discriminability of Transient Signals for a Shallow Water Ambient Noise Environment)

  • 이재일;강윤정;이종현;이승우;배진호
    • 전자공학회논문지
    • /
    • 제51권7호
    • /
    • pp.209-220
    • /
    • 2014
  • 본 논문에서는 천해 배경잡음 환경에서 과도신호 분류에 적합한 특징 선택을 위해 특징의 변별력을 분석하였다. 과도신호 분류는 해양환경 특성상 낮은 신호대잡음비(SNR)를 가지므로 잡음변화에 강인한 특징이 요구된다. 천해 배경잡음을 모델링하기 위해 이론적인 잡음 모델과 Wenz의 천해 관측 자료 그리고 Yule walker 필터를 이용하였다. 과도신호의 SNR에 따른 각 특징의 변별력은 Fisher score를 이용하여 분석하였다. 변별력이 높은 특징을 선택하여 24 클래스의 과도신호원에 대한 분류정확도를 분석한 결과 잡음이 없는 환경에서 선택된 특징에서 상대적으로 높은 분류정확도를 보였다. 이러한 결과를 토대로 최종적으로 선택된 특징은 전체 28가지 특징 중 16가지 특징이 선택되었다. 다중 클래스 SVM분류기를 이용하여 선택된 특징의 인식률 분석결과 과도신호의 SNR 20dB 환경에서 약92%의 분류정확도를 보였다.

모듈레이션 기법을 이용한 잡음에 강인한 선로 전환기의 이상 상황 탐지 (Noise-Robust Anomaly Detection of Railway Point Machine using Modulation Technique)

  • 이종욱;김아용;박대희;정용화
    • 스마트미디어저널
    • /
    • 제6권4호
    • /
    • pp.9-16
    • /
    • 2017
  • 열차의 방향을 기존 방향에서 다른 방향으로 이동시키기 위한 변환 장치인 선로 전환기의 고장은 열차의 탈선 등을 유발시킬 수 있다. 따라서 열차운행의 안전 측면에서 해당 장비에 대한 모니터링은 필수 요소이다. 본 논문에서는 선로 전환기의 구동시 발생하는 소리 정보를 기반으로 잡음에도 강인한 선로 전환기의 이상 상황 탐지시스템을 제안한다. 먼저 제안한 시스템은 소리 센서에서 실시간으로 취득하는 소리 신호에 STFT(Short-Time Fourier Transform)를 적용하여 스펙트로그램을 취득한다. 실제 환경에서 발생하는 잡음의 영향에도 강인한 성능을 보장하기 위하여, 해당 스펙트로그램에 대한 전처리 과정을 수행 후 모듈화 한다. 각각의 모듈에서 평균값과 표준편차를 계산 및 조합하여 특징 벡터로 생성한 후 이진 분류에 뛰어난 성능이 확인된 SVM(Support Vector Machine)에 적용하여 이상 상황을 탐지한다. 실제 선로 전환기의 전환 시 발생하는 소리 데이터를 이용하여 모의실험을 수행한 결과, 제안한 시스템은 잡음이 발생하는 상황에서도 효과적으로 이상 상황을 탐지함을 확인하였다.