• Title/Summary/Keyword: 음향 식별

Search Result 177, Processing Time 0.027 seconds

Frame Selection, Hybrid, Modified Weighting Model Rank Method for Robust Text-independent Speaker Identification (강건한 문맥독립 화자식별을 위한 프레임 선택방법, 복합방법, 수정된 가중모델순위 방법)

  • 김민정;오세진;정호열;정현열
    • The Journal of the Acoustical Society of Korea
    • /
    • v.21 no.8
    • /
    • pp.735-743
    • /
    • 2002
  • In this paper, we propose three new text-independent speaker identification methods. At first, to exclude the frames not having enough features of speaker's vocal from calculation of the maximum likelihood, we propose the FS(Frame Selection) method. This approach selects the important frames by evaluating the difference between the biggest likelihood and the second in each frame, and uses only the frames in calculating the score of likelihood. Our secondly proposed, called the Hybrid, is a combined version of the FS and WMR(Weighting Model Rank). This method determines the claimed speaker using exponential function weights, instead of likelihood itself, only on the selected frames obtained from the FS method. The last proposed, called MWMR (Modified WMR), considers both original likelihood itself and its relative position, when the claimed speaker is determined. It is different from the WMR that take into account only the relative position of likelihood. Through the experiments of the speaker identification, we show that the all the proposed have higher identification rates than the ML. In addition, the Hybrid and MWMR have higher identification rate about 2% and about 3% than WMR, respectively.

Fast Speaker Identification Using a Universal Background Model Clustering Method (Universal Background Model 클러스터링 방법을 이용한 고속 화자식별)

  • Park, Jumin;Suh, Youngjoo;Kim, Hoirin
    • The Journal of the Acoustical Society of Korea
    • /
    • v.33 no.3
    • /
    • pp.216-224
    • /
    • 2014
  • In this paper, we propose a new method to drastically reduce computational complexity in Gaussian Mixture Model (GMM)-based Speaker Identification (SI). Generally, GMM-based SI systems have very high computational complexity proportional to the length of the test utterance, the number of enrolled speakers, and the GMM size. These make the SI systems difficult to be used in various real applications in spite of their broad applicability. Thus, a trade-off between computational complexity and identification accuracy is considered as a primary issue for practical applications. In order to reduce computational complexity sharply with a little loss of accuracy, we introduce a method based on the Universal Background Model (UBM) clustering approach and then we show that it can be used successfully in real-time applications. In experiments with the proposed algorithm, we obtained a speed-up factor of 6 with a negligible loss of accuracy.

Ship-class Classification by Nonlinear Mapping Analysis for Underwater Radiated Noise (수중방사소음의 비선형매핑 해석에 의한 선박 클래스 식별)

  • Lee Phil-Ho;Heo Bo-Hyeon;Park Hyung-Wuk;Yoon Jong-Rak
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.349-352
    • /
    • 2001
  • 본 논문은 수중방사소음을 이용한 선박 클래스 식별을 위하여 비선형매핑법을 제안한다. 수중방사소음으로부터의 특성벡터 추출과정은 신호의 주파수영역 변환, 규준화, 및 특성추출 과정들을 포함하며, 비선형매핑법은 이러한 과정을 통하여 추출된 특성벡터를 입력으로 선박의 클래스를 분류한다. 제안된 비선형매핑법은 인공적으로 생성한 데이터들을 이용한 시뮬레이션을 통해 검증되고, 실제 데이터를 이용한 테스트 결과들은 본 논문에서 제시한 방법이 식별을 위해 사용될 수 있음을 보여준다.

  • PDF

Analysis and Recognition of Korean Fricatives and Affricates (한국어 마찰음 및 파찰음의 분석과 인식)

  • 정석재;정현열;이무영
    • The Journal of the Acoustical Society of Korea
    • /
    • v.10 no.5
    • /
    • pp.27-35
    • /
    • 1991
  • 음소를 인식의 기본 단위로 하는 소규모 음성 인식 시스템을 구현하기 위한 기초 연구로서 마 찰음(/ㅅ, ㅆ, ㅎ/) 과 파찰음(/ㅈ, ㅉ, ㅊ/) 에 대하여 지속시간, 평균패턴, 분산비를 이용하여 각 음소 의 특징을 분석하고 각 음소군 내에서의 식별에 유효한 parameter들을 추출하여 인식 실험을 실시하 였다. 지속시간의 분포, 평균패턴의 분포, 분산비의 분포를 이용하여 분석한 결과 6차원 정도의 cepstrum 계수만으로 마찰음 및 파찰음의 식별이 가능하고, 시간 방향의 정보는 음성의 시단으로부터 14 frame 정도의 특징을 인식 파라미터로 할 경우가 최적임을 알 수 있었다. 이를 이용한 인식실험 결과에서는 조음방법별로 분류된 음소군내의 각 음소에 대한 인식실험의 인식률 보다는 발음방법별 인식실험시의 인식률이 높게 나타나 동일 음소군 내에서의 각 음소에 대한 식별이 더 어려움을 알 수 있었고, 특징 파라미터의 길이를 음성의 시단으로부터 14 frame 정도로 했을 때 조음방법별 인식률은 평균 81.1%, 발음방법별 인식률은 평균 97.9%로 최고의 인식률을 나타내었다. 특징 파라미터의 길이 를 14 frame 이상으로 증가시켜도 인식률은 큰 변화가 없어 분석 결과를 잘 설명하고 있음을 알 수 있었다.

  • PDF

Maximum Likelihood Classifier Using Detection of Amplitude Modulation Frequency due to Propulsion of Underwater Vehicle (수중 프로펠러 추진체에 의한 진폭변조 신호의 주파수 탐지에 의한 Maximum Likelihood Classifier)

  • 강성현;김의준;윤원식
    • The Journal of the Acoustical Society of Korea
    • /
    • v.19 no.8
    • /
    • pp.47-53
    • /
    • 2000
  • In order to classify the underwater vehicles due to propeller propulsion, maximum likelihood classifier was developed. Propeller produces the cavitation and noise during its work. Cavitation-bubble makes the nonlinear medium in the water. The nonlinearity of cavitation leads to the generation of a complete spectrum of combination harmonics of the tonals of noise, and modulation of cavitation noise with propeller shaft-rates and blade-rates. The optimal estimator was derived mathematically and its capabilities were proven by simulation and real test.

  • PDF

Analysis of Characteristics of Athmatic Cough Sound (천식 기침소리의 음향적 특정 분석)

  • Jo Cheol-Woo;Han Man-Yong
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.177-180
    • /
    • 1999
  • 본 논문에서는 천식기침소리의 음향적 특성을 신호처리 방법을 이용하여 분석하고 통계처리한 결과를 보고한다. 정상인과 천식 환자의 기침소리 신호의 특징을 비교 분석함으로써 신호의 특징에 의해 자동식별할 수 있는 가능성을 제시하였다.

  • PDF

Trends in Acoustic Data Hiding and Tagging Technologies for Enhancement of Media Accessibility (미디어 접근편의성 향상을 위한 음향 데이터 삽입 및 색인 기술 동향)

  • Sung, J.;Beack, S.;Lee, M.;Lee, T.
    • Electronics and Telecommunications Trends
    • /
    • v.32 no.3
    • /
    • pp.36-45
    • /
    • 2017
  • 오디오 워터마크, 음향 데이터 전송 및 오디오 핑거프린트 등으로 대표되는 음향 데이터 삽입 및 색인 기술은 최근 다양한 미디어 활용 인프라의 보급과 새로운 형태의 미디어 생태계가 등장함에 따라 중요성이 더욱 커지고 있으며, 콘텐츠 제어 및 식별을 비롯한 다양한 응용 서비스의 기반 기술로 활용될 수 있다. 본고에서는 음향 신호 기반 데이터 삽입 및 색인 기술 개발 현황과 관련 서비스 동향에 대해서 소개한다.

Tonal Signal Detection for Acoustic Targets using ASM Neural Network (ASM 신경망을 이용한 음향 표적의 토날 신호 탐지)

  • 이성은
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1996.06a
    • /
    • pp.22-28
    • /
    • 1996
  • 수동 소나 시스템에서 표적을 탐지, 식별하는데 가장 중요한 인자는 표적에서 발생되는 토날 신호 성분이다. 수중의 주변잡음과 표적소음이 복합된 환경하에서 표적의 토날 신호성분을 정확히 추출하는데는 신호 탐지 준위 설정이나 주변 잡음의 변화에 의해 어려움이 있다. 본 논문에서는 ASM 신경망을 이용하여 신호 탐지 준위 설정이나 주변잡음의 변화에 강인한 음향 표적의 토날 신호 탐지 방식을 제안한다. 모의 시뮬레이션 및 실제 표적 신호에 적용하여 우수한 토날 신호 탐지 성능을 보인다.

  • PDF

A Study on the Voiced, Unvoiced and Silence Classification (유.무성음 및 묵음 식별에 관한 연구)

  • 김명환
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1984.12a
    • /
    • pp.73-77
    • /
    • 1984
  • This paper reports on a Voiced-Unvoiced-Silence Classification of speech for Korean Speech Recognition. In this paper, it is describe a method which uses a Pattern Recognition Technique for classifying a given speech segment into the three classes. Best result is obtained with the combination using ZCR, P1, Ep and classification error rate is less than 1%.

  • PDF