• 제목/요약/키워드: 단모음

검색결과 72건 처리시간 0.022초

음성 스펙트럼 분석에 의한 한국어 단모음 실시간 인식 (Real-Time Recognition of the Korean Spingle Vowels Using the Speech Spectrum Anaysis)

  • 김엄준;성미영
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 1998년도 추계학술발표논문집
    • /
    • pp.226-231
    • /
    • 1998
  • 본 연구에서는 짧은 시간에 계산이 가능하며, 음성을 특징 지울 수 있는 파라미터로서 영 교차율(zero crossing rate), 단 구간 에너지(short-term, energy) 그리고 포만트(formant)를 사용하였다. 특정 화자의 음성을 입력 받아서 단모음인 'ㅏ, ㅐ, ㅓ, ㅔ, ㅗ, ㅜ, ㅡ. ㅣ'에 대한 인식을 위해 위의 세가지 파라미터를 측정하였다. 영 교차율과 단 구간 에너지 파라미터는 유성음과 무성음의 구별과 음성인지 아닌지를 판별하는데 사용하였다. 포만트 파라미터는 10차 켑스트럼(cepstrum)을 이용하여 구하였으며, 각 단모음을 판별하기 위해서 사용하였다. 하나의 단모음을 입력받아 처리하여 텍스트로 출력하는데 평균 0.065sec에 처리하며, 각각의 단모음에 대해 93%, 10개의 테스트 문장에 대해 72%의 인식률을 보이고 있다.

  • PDF

발화속도에 따른 한국어 모음의 음향적 특성 (Effects of Speaking Rate on Korean Vowels)

  • 이숙향;고현주;한양구;김종진
    • 한국음향학회지
    • /
    • 제22권1호
    • /
    • pp.14-22
    • /
    • 2003
  • 본 연구는 발화속도에 따른 한국어 모음의 음향적 특성에 관한 것으로 보통, 느림. 빠름의 발화속도 변화에 따라 단모음과 이중모음의 반모음 성분과 단모음성분의 지속시간적 특성과 포만트 특성을 살펴보았다. 지속시간은 전체적으로 발화속도가 빨라짐에 따라 짧아지는 경향을 보였으나 포만트는 단모음과 이중모음의 단모음 성분의 경우 큰 차이가 없었고 이중모음의 반모음 성분의 경우는 반모음의 종류에 따라 서로 다른 결과를 보여주었다.

VQ와 Multi-layer perceptron을 이용한 단모음 인식에 관한 연구 (A Study on Single Vowels Recognition using VQ and Multi-layer Perceptron)

  • 안태옥;이상훈;김순협
    • 한국음향학회지
    • /
    • 제12권1호
    • /
    • pp.55-60
    • /
    • 1993
  • 본 논문은 불특정 화자의 단모음 인식에 관한 연구로써, VQ(Vectro Quantization)와 MLP(multi-layer perceptron)에 의한 음성 인식 방법을 제안한다. 이 방법은 VQ codebook을 구하고 이를 이용해서 관측열(observation sequence)을 구해각 codeword가 데이터로부터 가질 수 있는 확률값을 계산하여 이 값을 신경 회로망의 입력으로 사용하는 방법이다. 인식 대상으로는 한국어 단모음을 선정하였으며 10명의 남성 화자가 8개의 단모음을 10번씩 발음한 것으로 시스템의 효율성을 알아보기 위해 VQ/HMM(hidden markov model)에 의한 인식과 비교 실험한다. 실험 결과에 의하면, 시스템의 단순성에도 불구하고 학습능력애 뛰어난 관계로 VQ/HMM보다 VQ와 MLP에 의한 음성 인식률이 향상됨을 보여준다.

  • PDF

안면근육 표면근전도 신호기반 근육 조합 최적화를 통한 단모음인식 (Monophthong Recognition Optimizing Muscle Mixing Based on Facial Surface EMG Signals)

  • 이병현;류재환;이미란;김덕환
    • 전자공학회논문지
    • /
    • 제53권3호
    • /
    • pp.143-150
    • /
    • 2016
  • 본 논문에서는 안면근육 표면근전도를 기반으로 근육 조합 최적화를 통한 한국어 단모음 인식 방법을 제안한다. 표면근전도 신호는 한국어 단모음 발음에 따라 서로 다른 패턴과 근육 활성도를 보였다. 이전 연구에서 높은 인식 정확도를 보였던 RMS, VAR, MMAV1, MMAV2와 Cepstral Coefficients를 특징 추출 알고리즘으로 사용하였으며, QDA(Quadratic Discriminant Analysis)와 HMM(Hidden Markov Model)으로 한국어 단모음을 분류하였다. 트레이닝 단계에서 입력 받은 데이터로 근육조합을 최적화하고, 최적화 결과를 인식단계에 적용한다. 이때, 새로운 근전도 신호를 입력받고 한국어 단모음을 최종 인식한다. 실험결과 제안한 방법의 인식 정확도가 QDA에서 평균 85.7%, HMM에서 평균 75.1%를 보였다.

한국어 연속음인식에 관한 연구(유성음 분류 및 단모음 인식 ) (On the Classification of Voice Sound and the Recognition of Vowels for Korean Continuous Speech)

  • 하판봉;이철희;방승찬;안수길
    • 한국음향학회지
    • /
    • 제5권3호
    • /
    • pp.28-35
    • /
    • 1986
  • 우리나라 음성의 유성음을 모음, 비음 및 유성화 자음으로 분류하는 알고리즘을 기술하였다. 먼 저 기존의 PITCH 검출 알고리즘에 의하여 음성을 유성음과 무성음으로 나눈 뒤, 단지 정규화된 1차 상 관계수, 영교차율, LOG 에너지 및 LPG 에너지의 골짜기 검출만을 이용하여, 유성음은 모음, 비음 및 유 성화자음으로 분류하고 무성음은 실제의 무성음과 묵음으로 분류하였다. 그리고 이렇게 분류된 모음에 대하여 단모음 인식을 행하였다. 단지 한 FRAME으로 모음을 대표하였기 때문에 메모리 크기와 인식 시간을 줄였다. 여기서 UP & DOWN 및 수정된 영교차율을 새로이 정의하여 적용한 결과 만족한 결과 를 얻을 수 있었다. LPC 매개변수 및 전력 스펙트럼도 단모음 인식의 FEATURE로 사용하였다. 그리고 각 FEATURE 의 성능을 비교하였다. 이들 FEATURE을 잘 조합하여 2단계 인식을 행한 결과 92%의 높은 인식율을 얻을 수 있었다.

  • PDF

한국어 단모음의 분석 및 인식에 관한 고찰

  • 이용주
    • ETRI Journal
    • /
    • 제8권1호
    • /
    • pp.6-15
    • /
    • 1986
  • 본고는 보상훈련 기간 중 일본 동북대학 응용정보학 연구센타에서 수행한 연구 결과를 기술한 것이다. 음소 단위에 의한 한국어의 대용량 단어인식을 위한 기초연구로서, 그 기본이 되는 단모음을 대상으로 포먼트 주파수에 의한 음운간의 특징 및 발성자간의 개인성의 분산을 살펴보고 Battacharyya 거리를 구하여 음운간의 식별의 곤란성을 도출하였다. 또한, Karbunen-Loeve변환 및 Bayes결정에 의한 인식 그리고 spectral local peak에 의한 인식등의 실험에 의해 효과적인 인식 방법에 관하여 고찰하였다 .

  • PDF

Optical Flow를 이용한 단모음(아,에,이,오,우) 분석 (Vowels(a,e,i,o,u) Analysis Using Optical Flow)

  • 이미애;박기수
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 춘계학술발표논문집(상)
    • /
    • pp.299-302
    • /
    • 2002
  • 컴퓨터를 이용한 독순 연구는 Man Machine Interface, 지적부호화에 있어서의 송신측 기술, 청각 장애인의 독순 훈련 시스템 등 다방면에서 그 응용이 기대된다. 본 논문은, 움직임 정보는 입술의 에지영역에 집중하고 있음에 주목하여, 입술 에지영역의 Optical Flow 추정값을 독순정보로 이용하는 방법을 제안한다. 휘도값을 갖지 않는 에지에, 선형 가상 휘도값를 정해주어 Optical Flow를 추정하는 VGM을 도입해 특징 파라미터를 계산하고, 마할라노비스 평방거리(Mahalanobis's square distance)에 기초한 최대우도판별함수를 이용하여 단모음을 분석하는 알고리즘을 제안한다.

  • PDF

통합 사용자 인터페이스에 관한 연구 : 인공 신경망 모델을 이용한 한국어 단모음 인식 및 음성 인지 실험 (A Study on the Intelligent Man-Machine Interface System: The Experiments of the Recognition of Korean Monotongs and Cognitive Phenomena of Korean Speech Recognition Using Artificial Neural Net Models)

  • 이봉규;김인범;김기석;황희융
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1989년도 한글날기념 학술대회 발표논문집
    • /
    • pp.101-106
    • /
    • 1989
  • 음성 및 문자를 통한 컴퓨터와의 정보 교환을 위한 통합 사용자 인터페이스 (Intelligent Man- Machine interface) 시스템의 일환으로 한국어 단모음의 인식을 위한 시스템을 인공 신경망 모델을 사용하여 구현하였으며 인식시스템의 상위 접속부에 필요한 단어 인식 모듈에 있어서의 인지 실험도 행하였다. 모음인식의 입력으로는 제1, 제2, 제3 포르만트가 사용되었으며 실험대상은 한국어의 [아, 어, 오, 우, 으, 이, 애, 에]의 8 개의 단모음으로 하였다. 사용한 인공 신경망 모델은 Multilayer Perceptron 이며, 학습 규칙은 Generalized Delta Rule 이다. 1 인의 남성 화자에 대하여 약 94%의 인식율을 나타내었다. 그리고 음성 인식시의 인지 현상 실험을 위하여 약 20개의 단어를 인공신경망의 어휘레벨에 저장하여 음성의 왜곡, 인지시의 lexical 영향, categorical percetion등을 실험하였다. 이때의 인공 신경망 모델은 Interactive Activation and Competition Model을 사용하였으며, 음성 입력으로는 가상의 음성 피쳐 데이타를 사용하였다.

  • PDF

한글 단모음의 포만트 분석과 성도내의 공명효과에 관한 연구 (A Study on the Formant Analysis of Korean Monophthongs and their Resonance Effect in Vocal Tract)

  • 신현재;윤석왕
    • 한국음향학회지
    • /
    • 제6권2호
    • /
    • pp.30-37
    • /
    • 1987
  • 한글 단모음의 음향특성을 기본진동수와 배진동수를 고러하여 포만트 분석하였으며, 성도내의 공명현상과 포만트진동수와의 상관관계를 고찰하였다. 성악을 전공하는 남성으로 하여금 한글 단모음 12개를 5개의 기본진동수에 맞추어 3초 동안 발음하게 하여 FFT스펙트럼 분석기를 통해 진동수 스펙트럼을 얻었다. 포만트 분석에 의해 제 1포만트는 인두강, 그리고 제 2포만트는 구강의 공명효과에 의함을 밝혔고, 원순화가 일어나므로서 제 2포만트 진동수가 낮아짐을 발견하였다. 제 1포만트와 제 2포만트 진동수로는 "어"의 $[\partial]와[\Lambda], "아"의[a]와 [\alpha]$, 그리고"에"와 "애"의 음향학적 차이를 뚜렷이 구분짓기는 어러웠다

  • PDF