• 제목/요약/키워드: 음소 인식

검색결과 302건 처리시간 0.022초

음소를 이용한 한국어 음성 신호의 분석과 인식에 관한 연구 (A Study on the Analysis and Recognition of Korean Speech Signal using the Phoneme)

  • 김영일;황영수;윤대희;차일환
    • 한국음향학회지
    • /
    • 제8권5호
    • /
    • pp.70-77
    • /
    • 1989
  • 본 연구는 한국어를 음소변로 분리하여 인식하는 실험에 관한 연구이다. 한국어 단음 545개를 자음 음소, 모음 음소, 받침 음소로 분리하여 선형 예측 계수로 인식한 결과, 각각 $87.3(\%), 91.0(\%), 91.7(\%)$의 인식률을 얻었고, 이 음소들을 결합한 단음에서는 $71.4(\%)$의 인식률을 얻었다. 음소 분리 및 음소 인식은 Itakura-Saito 거리 측정을 이용하였다.

  • PDF

음소경계검출과 신경망을 이용한 음소인식 연구 (Phoneme-Boundary-Detection and Phoneme Recognition Research using Neural Network)

  • 임유두;강민구;최영호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 1999년도 추계종합학술대회
    • /
    • pp.224-229
    • /
    • 1999
  • 음성 인식 연구는 유사음소 단위의 인식시스템을 구축하는 방향과 단어 단위의 인식시스템에서의 효율을 최대화하는 방향으로 이루어지고 있다. 이중 유용한 유사음소 단위의 인식시스템 구현을 위해서는 음소의 경계 검출 문제와 검출된 음소에 대한 인식률 향상 문제가 해결되어야 한다. 기존의 LPC(Linear Predictive Coefficient) 방법들은 기준 음소데이터의 LPC와 입력 음성프레임의 LPC 사이의 거리를 Itakura-Saito 방법으로 구하여 음소의 경계를 검출하였으며, 근래에는 MFCC(Mel-Frequency-Cepstrum Coefficient)를 이용하여 스펙트럼의 천이부분을 음소의 경계로 검출하는 방법들이 제안되어왔으나 이러한 방법들은 공통적으로 적응성이 미비하다는 단점이 있다. 본 논문에서는 이러한 단점을 극복하기 위해 음소경계검출을 위해서는 auto-correlation을 이용하고 음소인식을 위해서는 적응성이 뛰어난 다층 Feed-Forward 신경망을 사용하는 새로운 인식시스템을 제안하였다 제안하는 시스템은 기존의 방법들보다 적응성이 뛰어나고 특징추출부분과 인식 부분의 알고리듬이 독립적이라는 장점을 가지며 프레임단위의 음소인식시스템의 구현 가능성을 확인해 주었다.

  • PDF

수정된 LVQ2 알고리즘을 이용한 음소분류 (Phoneme Classification using the Modified LVQ2 Algorithm)

  • 김홍국;이황수
    • The Journal of the Acoustical Society of Korea
    • /
    • 제12권1E호
    • /
    • pp.71-77
    • /
    • 1993
  • 패턴매칭 기법에 근거한 음성 인식 시스템은 크게 clustering 과정과 labeling 과정으로 구성된다. 본 논문에서는 Kohonen의 featrue map 알고리즘과 LVQ2 알고리즘을 각각 clusterer와 labeler로 하는 음소인식 시스템을 구성한다. 구성된 인식시스템의 성능을 향상시키기 위해서 수정된 LVQ2알고리즘(MLVQ2)을 제안한다. MLVQ2는 selective learning, LVQ2, perturbed LVQ2 그리고 기존의 LVQ2의 4단계 학습과정으로 구성된다. 제안된 음소 인식 알고리즘의 성능을 평가하기 위하여 LVQ2와 MLVQ2를 각각 사용하여 6가지의 한국어 음소군에 대한 feature map을 만든다. 음소인식 실험결과, LVQ2와 MLVQ2를 사용하는 경우 각각 60.5%와 65.4%의 인식률을 얻을 수 있었다.

  • PDF

강건한 한국어 연속음성인식을 위한 유사음소단일에 대한 연구 (A Study on PLU (Phone-Likely Unit) for Korean Continuous Speech Recognition)

  • 서준배;김주곤;김민정;정호열;정현열
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 춘계학술발표대회 논문집 제23권 1호
    • /
    • pp.37-40
    • /
    • 2004
  • 본 논문은 한국어 연속음성인식에 효율적인 문맥의존 음향모델 수에 대한 연구로써 유사음소단위 수에 따른 인식 성능을 비교, 평가하였다. 기존에 본연구실에서는 48음소를 기본인식단위로 이용하고 있으나 연속음성인식의 경우 문맥종속모델이 사용되고 문맥종속모델은 변이 음을 고려한 음소가 이미 포함되어 있어 이를 고려하면 기본 음소를 줄이므로서 계산량의 감소와 인식 성능 향상을 기대할 수 있을 것으로 생각된다. 따라서 , 본 논문에서는 기존의 48음소와 이를 39음소로 줄여 인식실험에 사용하여 그 성능을 비교 평가하기로 하였다. 이를 위하여 다양한 태스크의 데이터베이스를 통합하여 부족한 문맥요소들을 확장한 후 인식실험을 수행하였다. 실험결과 변이음의 개수를 줄이면서도 인식 성능저하가 없음을 확인할 수 있었으며 연속 음성의 경우 39음소를 이용한 경우가 $10\%$정도의 향상된 인식성능을 얻을 수 있음을 확인할 수 있었다.

  • PDF

한국어 음소인식을 위한 기준 프레임 추출 (Typical Frame Etraction for Korean Phoneme Recognition)

  • 김범국
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.121-124
    • /
    • 1994
  • 음소를 인식의 기본으로 하는 한국어 음성인식 시스템을 구현하기 위한 기초 연구의 일환으로서 각 음소의 특징 가장 잘 표현하는 기준프레임 추출을 위한 연구를 수행하였다. 이를 위하여 먼저 선행 실험과 분산비 분석을 통해서 인식에 필요로한 시간 패턴의 길이를 추출한 후 이를 바탕으로 통계적 인식방법인 베이즈 결정법칙을 이용하여 시단 프레임으로부터 3프레임씩 시점을 1프레임씩 옮기면서 인식 실험을 해?여, 각 음소별 특징이 가장 풍부한 기준 프레임을 추출하였다. 그리고 이 기준 프레임을 중심으로 각 음소군별 인식 실험을 수행하여 그 결과를 시단을 기준으로 한 경우와 비교 검토하고 한국어 전 음소별로 확장하여 인식 실험을 실시하였다. 이 실험 결과 모음의 경우 시단으로부터 5프레임, 파열음은 시단에서부터 5프레임사이, 마찰음은 3프레임에서부터 10프레임까지, 파찰음은 5프레임까지, 비음과 유음의 경우 초성은 시단 프레임에서 6프레임, 종성은 종단으로부터 전 4프레임 구간이 인식률이 높게 나타나 이 부분의 특징이 인식에 가장 유효함을 알 수 있었다.

  • PDF

음소 인식을 위한 수정된 LVQ2 알고리즘의 고찰 (A Modified LVQ2 Algorithm for Phonemes Recognition)

  • 황철준
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1996년도 영남지부 학술발표회 논문집 Acoustic Society of Korean Youngnam Chapter Symposium Proceedings
    • /
    • pp.76-79
    • /
    • 1996
  • 본 논무에서는 한국어 음소를 대상으로 Kohonen 이 제안한 LVQ2 방법의 결저을 보완한 MLVQ2 방법으로 인식실험을 행하고 MLVQ2 알고리즘의 유효성을 검토하고자 한다. 인식실험을 위한 음성자료는 ETRI 611단어로부터 추출한 49음소를 사용하였다. 그리고 인식실험에 있어서는 먼저 파열음을 대상으로 학습회수, 표준패턴의 수, 샘플수에 따른 인식률의 변화를 조사하였으며, 이 결과 표준패턴의 수 15개, 학습회수 10회 이하, 샘플 수 3000 개일 경우가 가장 좋은 인식률을 보였다. 이 결과를 참고로 음소군별 인식실험 결과 모음 69.11%, 파열음 74.69%, 마찰음 및 파찰음 86.31%비음 및 유음 74.51%의 평균 인식률을 얻었다. 또한 , 한국어 49음소 전음소에 대한 인식실험 결과 71.2%의 인식률 얻어 MLVQ2의 유효성을 확인하였다.

  • PDF

음소인식 기반의 립싱크 구현을 위한 한국어 음운학적 Viseme의 제안 (Korean Phonological Viseme for Lip Synch Based on Phoneme Recognition)

  • 주희열;강선미;고한석
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 1호
    • /
    • pp.70-73
    • /
    • 1999
  • 본 논문에서는 한국어에 대한 실시간 음소 인식을 통한 Lip Synch 구현에 필수요소인 Viseme(Visual Phoneme)을 한국어의 음운학적 접근 방법을 통해 제시하고, Lip Synch에서 입술의 모양에 결정적인 영향을 미치는 모음에 대한 모음 인식 실험 및 결과 분석을 한다.모음인식 실험에서는 한국어 음소 51개 각각에 대해 3개의 State로 이루어진 CHMM (Continilous Hidden Makov Model)으로 모델링하고, 각각의 음소가 병렬로 연결되어진 음소네트워크를 사용한다. 입력된 음성은 12차 MFCC로 특징을 추출하고, Viterbi 알고리즘을 인식 알고리즘으로 사용했으며, 인식과정에서 Bigrim 문법과 유사한 구조의 음소배열 규칙을 사용해서 인식률과 인식 속도를 향상시켰다.

  • PDF

기능어용 음소 모델을 적용한 한국어 연속음성 인식 (Korean Continuous Speech Recognition using Phone Models for Function words)

  • 명주현;정민화
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.354-356
    • /
    • 2000
  • 의사형태소를 디코딩 단위로 한국어 연속 음성 인식에서의 조사, 어미, 접사 및 짧은 용언의 어간등의 단어가 상당수의 인식 오류를 발생시킨다. 이러한 단어들은 발화 지속시간이 매우 짧고 생략이 빈번하며 결합되는 다른 형태소의 형태에 따라서 매우 심한 발음상의 변이를 보인다. 본 논문에서는 이러한 단어들은 한국어 기능어라 정의하고 실제 의사형태소 단위의 인식 실험을 통하여 기능어 집합 1, 2를 규정하였다. 그리고 한국어 기능어에 기능어용 음소를 독립적으로 적용하는 방법을 제안했다. 또한 기능어용 음소가 분리되어 생기는 음향학적 변이들을 처리하기 위해 Gaussian Mixture 수를 증가시켜 보다 견고한 학습을 수행했고, 기능어들의 음향 모델 스코어가 높아짐에 따른 인식에서의 삽입 오류 증가를 낮추기 위해 언어 모델에 fixed penalty를 부여하였다. 기능어 집합1에 대한 음소 모델을 적용한 경우 전체 문장 인식률은 0.8% 향상되었고 기능어 집합2에 대한 기능어 음소 모델을 적용하였을 때 전체 문장 인식률은 1.4% 증가하였다. 위의 실험 결과를 통하여 한국어 기능어에 대해 새로운 음소를 적용하여 독립적으로 학습하여 인식을 수행하는 것이 효과적임을 확인하였다.

  • PDF

잡음환경하의 연속 음성인식을 위한 유사음소단위 분석 (An Analysis on Phone-Like Units for Korean Continuous Speech Recognition in Noisy Environments)

  • 신광호;임수호;서준배;김주곤;정호열;정현열
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 추계학술발표대회논문집 제23권 2호
    • /
    • pp.123-126
    • /
    • 2004
  • 본 논문은 잡음환경 하에서의 효율적인 문맥의존 음향 모델 구성에 대한 기초연구로서 잡음환경 하에서의 유사 음소단위 수에 따른 연속 음성인식 성능을 비교, 평가한 결과에 대한 보고이다. 기존의 연구[1,2]로부터 연속음성 인식의 경우 문맥종속모델은 변이음을 고려한 39유사음소를 이용한 경우가 48유사음소를 이용하는 것보다 더 좋은 인식성능을 나타냄을 알 수 있었다. 이 연구 결과를 바탕으로 본 연구에서는 잡음환경에서도 효율적인 문맥 의존 음향모델을 구성하기 위한 기초 연구를 수행하였다. 다양한 잡음환경을 고려하기 위해 White, Pink, LAB 잡음을 신호 대 잡음비(Signal to Noise Ratio) 5dB, 10dB, 15dB 레벨로 음성에 부가한 후 각 유사음소단위 수에 따른 연속음성인식 실험을 수행하였다. 그 결과, 39유사음소를 이용한 경우가 48유사음소를 이용한 경우보다 clear 환경인 경우에 약 $7\%$$17\%$ 향상된 단어인식률과 문장 인식률을 얻을 수 있었으며, 각 잡음환경에서도 39유사음소를 이용한 경우가 48유사음소를 이용한 경우보다 평균 적으로 $17\%$$28\%$ 향상된 단어인식률과 문장인식률을 얻을 수 있어 39유사음소 단위가 한국어 연속음성인식에 더 적합하고 잡음환경에서도 유효함을 확인할 수 있었다.

  • PDF

미등록어 거절 알고리즘에서 음소 특성 추출의 신뢰도 측정 개선 (Reliability measure improvement of Phoneme character extract In Out-of-Vocabulary Rejection Algorithm)

  • 오상엽
    • 디지털융복합연구
    • /
    • 제10권6호
    • /
    • pp.219-224
    • /
    • 2012
  • 통신 모바일 단말기에서 어휘 인식 시스템은 부정확한 어휘로부터 음소 특징을 추출하기 때문에 음소를 인식하지 못하거나 유사한 음소 오인식 오류로 인한 낮은 인식률의 문제점을 가진다. 이러한 문제를 해결하기 위해서, 본 논문에서는 입력 음소는 음소 유사율 처리를 통해 음소 사이의 거리를 측정하여 수치로 나타내고, 신뢰도 측정을 통하여 인식되어진 결과를 확인하는 시스템을 제안하였다. 이로 인해 부정확한 어휘 제공으로 인한 오인식 오류를 최소화하였으며 음소 유사율과 신뢰도를 이용하여 오류 보정율을 구하였다. 기존 방법인 에러 패턴 학습을 이용한 시스템과 의미기반을 이용한 시스템의 성능 평가 결과 2.7%의 인식 향상율을 보였다.