A Study on Utterance Verification Using Accumulation of Negative Log-likelihood Ratio

음의 유사도 비율 누적 방법을 이용한 발화검증 연구

  • 한명희 (광운대학교 컴퓨터공학과) ;
  • 이호준 (광운대학교 컴퓨터공학과) ;
  • 김순협 (광운대학교 컴퓨터공학과)
  • Published : 2003.04.01

Abstract

In speech recognition, confidence measuring is to decide whether it can be accepted as the recognized results or not. The confidence is measured by integrating frames into phone and word level. In case of word recognition, the confidence measuring verifies the results of recognition and Out-Of-Vocabulary (OOV). Therefore, the post-processing could improve the performance of recognizer without accepting it as a recognition error. In this paper, we measure the confidence modifying log likelihood ratio (LLR) which was the previous confidence measuring. It accumulates only those which the log likelihood ratio is negative when integrating the confidence to phone level from frame level. When comparing the verification performance for the results of word recognizer with the previous method, the FAR (False Acceptance Ratio) is decreased about 3.49% for the OOV and 15.25% for the recognition error when CAR (Correct Acceptance Ratio) is about 90%.

음성인식에서 신뢰도 측정이란 인식된 결과에 대한 신뢰 여부를 결정하는 것이다. 신뢰도는 프레임을 음소 및 단어 수준으로 통합하여 측정된다. 단어 인식의 경우, 신뢰도를 이용하여 인식 결과와 미등록 어휘를 검증한다. 따라서 이러한 후처리를 통해 이를 인식 결과로 승인하지 않음으로써 성능을 높일 수 있다. 본 논문에서는 기존의 신뢰도 측정 방법인 로그 유사도 비를 수정하여 신뢰도를 측정하였다. 제안된 방법은 프레임 수준에서 음소 수준으로 신뢰도를 통합할 때 로그 유사도 비가 음수인 것만을 누적하는 것이다. 단어 인식기의 인식 결과에 대한 검증 성능을 기존의 방법과 비교한 결과, CAR (Correct Acceptance Ratio)이 90%인 지점에서 FAR (False Acceptance Ratio)을 미등록 어휘에 대해서는 약 3.49%, 오인식에 대해서는 15.25% 감소시킬 수 있었다

Keywords

References

  1. 한국음향학회지 v.18 no.3 반음소 모델링을 이용한 거절기능에 대한 연구 김우성;구영완
  2. IEEE ICASSP A Hidden Markov Model based keyword recognition system R.Rose;D.Paul
  3. 한국음향학회지 v.20 no.2 가변어휘 단어 인식에서의 미등록어 거절 알고리즘 성능 비교 김기태;문광식;김회린;이영직;정재호
  4. Speech and Audio Processing, IEEE Transactions on v.9 no.Issue 8 Speech recognition and utterance verification based on a generalized confidence score Myoung-Wan Koo.;Chin-Hui Lee;Biing-Hwang Juang
  5. Master's thesis, MIT Word and phone level accoustic confidence scoring for speech understanding systems Kampari