• 제목/요약/키워드: 음향 식별

검색결과 177건 처리시간 0.029초

LPC에 의한 화자 식별 (On using the LPC parameter for Speaker Identification)

  • 조병모
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1987년도 학술발표회 논문집
    • /
    • pp.82-85
    • /
    • 1987
  • Preliminary results of using the LPC parameter for text-independent speaker identification problem are presented. The idetification process includes log likelihood ratio for distance measure and dynamic programming for time normalization. To generate the data base for experiments, ten times. Experimental results show 99.4% of identification accuracy, incorrect identification were made when the speaker uses a dialect.

  • PDF

커널 주성분 분석의 앙상블을 이용한 다양한 환경에서의 화자 식별 (Speaker Identification on Various Environments Using an Ensemble of Kernel Principal Component Analysis)

  • 양일호;김민석;소병민;김명재;유하진
    • 한국음향학회지
    • /
    • 제31권3호
    • /
    • pp.188-196
    • /
    • 2012
  • 본 논문에서는 커널 주성분 분석 (KPCA, kernel principal component analysis)으로 강화한 화자 특징을 이용하여 복수의 분류기를 학습하고 이를 앙상블 결합하는 화자 식별 방법을 제안한다. 이 때, 계산량과 메모리 요구량을 줄이기 위해 전체 화자 특징 벡터 중 일부를 랜덤 선택하여 커널 주성분 분석의 기저를 추정한다. 실험 결과, 제안한 방법이 그리디 커널 주성분 분석 (GKPCA, greedy kernel principal component analysis)보다 높은 화자 식별률을 보였다.

특징 강화 기법과 학습 데이터 길이 조절에 의한 Supervector Linear Kernel SVM 화자식별 개선 (Improvement in Supervector Linear Kernel SVM for Speaker Identification Using Feature Enhancement and Training Length Adjustment)

  • 소병민;김경화;김민석;양일호;김명재;유하진
    • 한국음향학회지
    • /
    • 제30권6호
    • /
    • pp.330-336
    • /
    • 2011
  • 본 논문에서는 supervector linear kernel SVM을 사용한 화자식별 시스템의 성능을 개선하는 방법을 제안하였다. 제안한 방법은 긴 학습 데이터를 여러 개의 짧은 학습 데이터로 분할하는 것을 기본 아이디어로 하고 있다. 제안한 방법의 성능을 평가하기 위해 서로 다른 4가지 데이터베이스에 PCA, GKPCA, KMDA를 사용하여 특징 강화를 하고 실험한 뒤 결과를 분석하였다. 실험 결과 제안한 방법이 supervector linear kernel SVM을 사용한 화자 식별 성능을 향상 시키는 것을 확인하였다.

음소인식기와 음소결합확률모델을 이용한 언어식별시스템 (Language Identification System using phoneme recognizer and phonotactic language model)

  • 이대성;김세현;오영환
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2001년도 추계학술발표대회 논문집 제20권 2호
    • /
    • pp.73-76
    • /
    • 2001
  • 본 논문에서는 음소인식기와 음소결합확률모델을 이용하여 전화음성을 대상으로 입력음성이 어느 나라 말 인지를 식별할 수 있는 언어식별시스템을 구현하였고 성능을 실험하였다. 시스템은 음소인식기로 입력음성에 대한 음소열을 인식하는 과정, 인식된 음소열을 이용하여 인식대상 언어별 음소결합확률모델을 생성하는 훈련과정, 훈련과정에서 생성된 음소결합확률모델로부터 확률 값을 계산하여 인식결과를 출력하는 식별과정으로 구성된다. 본 논문에서는 음소결합확률모델로부터 우도를 계산할 때 정보이론(Information Theory, Shannon and Weaver, 1949)을 이용하여 가중치를 적용하는 방법을 제안하였다. 시스템의 훈련 및 실험에는 OGI 11개국어 전화음성 corpus (OGI-TS)를 사용하였으며, 음소인식기는 HTK를 이용하여 구현하였고 음소인식기 훈련에는 NTIMIT 전화음성 DB를 이용하였다. 실험결과 11개국어를 대상으로 45초 길이의 음성에 대해서 평균 $74.1\%$, 10초 길이의 음성에 대해서는 평균 $57.1\%$의 인식률을 얻을 수 있었다.

  • PDF

TV 광고 식별을 위한 Constant-Q 변환 기반의 오디오 핑거프린팅 방식 (Audio Fingerprinting Based on Constant Q Transform for TV Commercial Advertisement Identification)

  • 류상현;김형국
    • 한국음향학회지
    • /
    • 제33권3호
    • /
    • pp.210-215
    • /
    • 2014
  • 오디오 핑거프린팅 기술은 잡음과 에코 등으로 인한 왜곡에도 성공적으로 음원을 식별해야한다. 이러한 오디오 핑거프린팅 기술을 TV광고식별에 적용하고자 한다. 본 논문은 TV 광고 식별을 위한 강인한 오디오 핑거프린팅 방식을 제안한다. 제안된 방법에서 사용되는 Constant Q 변환 기반에서 추출된 현저한 오디오 피크 쌍 핑거프린트는 실제 다양한 잡음환경에서 오디오 핑거프린팅 시스템의 정확도를 향상시키고, 낮은 복잡도를 가진다. 실험결과는 제안된 방식이 기존의 오디오 핑거프린팅 방식에 비해 다양한 잡음환경에서도 안정적이며 신뢰할 수 있는 검색 정확도를 제공함을 보여준다.

위그너-빌 분포 함수 기반의 고유치 분해를 이용한 수중 천이 신호 식별 (Underwater Transient Signal Classification Using Eigen Decomposition Based on Wigner-Ville Distribution Function)

  • 배건성;황찬식;이형욱;임태균
    • 한국음향학회지
    • /
    • 제26권3호
    • /
    • pp.123-128
    • /
    • 2007
  • 본 논문에서는 수중 천이 신호에 대한 식별 알고리즘을 제안한다. 일반적으로 해양의 배경잡음은 스펙트럼 특성 및 에너지 변화가 적은 정재성을 갖는 반면에 천이 신호는 스펙트럼 및 에너지 변화가 큰 비정재성을 가진다. 따라서 수중 천이 신호 식별을 위하여 선행되어져야 하는 수중 천이 신호 탐지에서는 프레임 단위로 스펙트럼 변이와 에너지 변화를 이용한다. 제안한 수중 천이 신호 식별 알고리즘에서는 특징 벡터를 추출하기 위하여 위그너-빌 분포 함수를 기반으로 고유치 분해를 이용한다. 추출된 특징 벡터를 기반으로 탐지된 수중 천이 신호의 특징 벡터와 식별하고자 하는 데이터베이스에 있는 기준 신호의 특징 벡터와의 상관 값을 프레임 단위로 계산하고, 각 클래스별로 프레임 사상도를 산출하여 최대 값을 갖는 기준 신호로 탐지된 수중 천이 신호를 식별한다.

바이스펙트럼을 이용한 차량의 음향식별 (Identification of Acoustic Signals of Vehicles Using Bispectrum)

  • 안종구;이동민;이태호
    • 한국음향학회지
    • /
    • 제11권1호
    • /
    • pp.5-13
    • /
    • 1992
  • 어느 신호의 특성을 주파수 영역에서 해석할 때, 파워스펙트럼은 해석하고자 하는 신호의 위상에 관한 정보를 모두 잃어 버리는 단점이 있어서, 위상에 관한 정보를 필요로 하는 경우에는 파워스펙트럼 해석법은 그 이용에 제한을 받는다. 고차스펙트럼(특히 본 논문에서는 3차 스펙트럼인 바이스펙트럼)은 그 계산에 시간이 많이 걸리는 단점은 있으나 반면에 위상에 관한 정보를 잃지 않는다는 장점이 있다. 본 논문에서는 몇가지 이상적인 경우에 대한 바이스펙트럼의 예를 보이고, 실제로 노상에서 녹음된 자동차들의 엔진 소음에 대한 바이스펙트럼을 구한후, 이를 이용하여 음향 식별을 할 수 있음을 보였다.

  • PDF

수중음향식별시스템에서의 잡음감소기법의 성능평가 (Evaluation of Noise Normalization Methods in Underwater Acoustic Target Identifiction System)

  • 김진영;김의석;성굉모
    • 한국음향학회지
    • /
    • 제12권4호
    • /
    • pp.14-20
    • /
    • 1993
  • 본 논문에서는 주변 소음을 감소시키고 표적원의 방사음으로부터 tonal 성분을 추출하기 위한 방법으로서 잡음 정규화 기법에 대하여 연구하였다. 지금까지 알려진 기법들을 정리하였으며, ATW, 최빈치 필터등의 새로운 기법을 도입, 적용하여 그 성능을 평가하였다. 그리고 tonal 성분을 검출하기 위한 임계값 결정을 위해 오경보확률과 검출확률을 시뮬레이션을 통해 구하였다.

  • PDF

Wavelet 이론과 신경회로망을 이용한 천이 수중 신호의 특징벡타 추출 및 자동 식별 (Feature Vector Extraction and Automatic Classification for Transient SONAR Signals using Wavelet Theory and Neural Networks)

  • 양성철;남상원;정용민;조용수;오원천
    • 한국음향학회지
    • /
    • 제14권3호
    • /
    • pp.71-81
    • /
    • 1995
  • 본 논문에서는 수중에서 발생되는 전이 신호의 자동 식별을 위하여 특징벡타를 추출하는 기법과 식별 알고리즘에 대하여 논한다. 특징벡타 추출기법으로 적은 계수로도 우수한 성능을 보이는 wavelet 변환을 사용한 방법을 제안하고 기종의 고전적인 방법들과 비교한다. 자동식별을 위해서는 MLP (Multilayer Perceptron), RBF (radial Basis Function), MLP-클래스 등 세 종류의 신경회로망을 사용하고, 성능 및 신뢰성을 높이기 위해서 두가지 특징벡타 및 세 식별기를 결합하는 방법을 사용한다. Traco의 표준 천이 데이터 집합 (standard transient data set) I과 모의 실험 데이터를 사용하여, 주어진 천이신호가 배경잡음에 비하여 충분히 에너지가 크고, 유한개의 소음원이 존재하며, 동시에 둘 이상의 소음원이 존재하지 않는다는 가정하에서 제안된 특징벡타 추출기법과 식별 알고리즘의 우수성을 확인한다.

  • PDF