• 제목/요약/키워드: 한국어 모음

검색결과 217건 처리시간 0.023초

구개열 환자 발음 판별을 위한 특징 추출 방법 분석 (Analysis of Feature Extraction Methods for Distinguishing the Speech of Cleft Palate Patients)

  • 김성민;김우일;권택균;성명훈;성미영
    • 정보과학회 논문지
    • /
    • 제42권11호
    • /
    • pp.1372-1379
    • /
    • 2015
  • 본 논문에서는 구개열 환자의 장애 발음과 정상인의 발음을 자동으로 구분하여 판별하는데 사용될 수 있는 특징 추출 방법들의 성능을 분석하는 실험에 대하여 소개한다. 이 연구는 발성 장애인의 복지 향상을 추구하며 수행하고 있는 장애 음성 자동 인식 및 복원 소프트웨어 시스템 개발의 기초과정이다. 실험에 사용된 음성 데이터는 정상인의 발음, 구개열 환자의 발음, 그리고 모의 환자의 발음의 세 그룹으로부터 수집된 한국어 단음절로서 14개의 기본 자음과 5개의 복합 자음, 7개 모음이다. 발음의 특징 추출은 LPCC, MFCC, PLP의 세 가지 방법으로 각각 수행하였고, GMM 음향 모델로 인식 훈련을 한 후, 수집된 단음절 데이터를 대상으로 하여 인식 실험을 실시하였다. 실험 결과, 정상인과 구개열 환자의 장애 발음을 구별하기 위하여 특징을 추출함에 있어서 MFCC 방법이 전반적으로 가장 우수하였다. 본 연구의 결과는 구개열 환자의 부정확한 발음을 자동으로 인식하고 복원하는 연구와 구개열 장애 발음의 정도를 측정할 수 있는 도구에 대한 연구에 도움이 될 것으로 기대된다.

III급 부정교합 환자의 한국어 모음 발음에 관한 음향학적 분석 (AN ACOUSTIC ANALYSIS ON THE PRONUNCIATION OF KOREAN VOWELS IN PATIENT WITH CLASS III MALOCCLUSION)

  • 김영호;유현지;김휘영;홍종락
    • Journal of the Korean Association of Oral and Maxillofacial Surgeons
    • /
    • 제35권4호
    • /
    • pp.221-228
    • /
    • 2009
  • The purpose of the study was to investigate the characteristics of the pronunciation of Korean vowels in patients with class III malocclusion. 11 adult male patients with class III malocclusion(mean ages 22.3 years) and four adult males with normal occlusion(mean ages 26.5 years) were selected for the analysis of eight Korean monophthongs /ㅣ, ㅔ, ㅐ, ㅏ, ㅓ, ㅗ, ㅡ, ㅜ/. The values and relationships of F1, F2 and F3 were derived from the stable section of target vowel in each sentence, and the analysis using formant plots and vowel triangles' distance and area was conducted to find the features of two groups' vowel distributions. Consequently, it was identified that the pronunciation of males patients with class III malocclusion showed high values of F1 in the low vowels, high values of F2 in the back vowels, and remarkably low position of /ㅏ/. The vowel triangle suggested that the triangle areas of male patients with class III malocclusion were shown wider vertically and narrower horizontally than those of males with normal occlusion. These characteristics could reflect the structural features of class III malocclusion such as the prognathic mandible, low tongue position, and advancement of back position of the tongue.

『해린척소(海隣尺素)』 발신자(發信者) 61인(人) 인물(人物) 탐색(探索) (An Examination into the 61 Senders of Letters Contained in 『Haerincheokso(海隣尺素)』)

  • 정후수
    • 동양고전연구
    • /
    • 제35호
    • /
    • pp.447-470
    • /
    • 2009
  • "해린척소(海隣尺素)"는 1830년부터 1865년 공헌경(孔憲庚)이 이상적(李尙迪)에게 보내온 마지막 편지(便紙)까지 모두 61명 279통의 편지를 모은 편지 모음첩이다. 본고는 "해린척소(海隣尺素)" 발신자 61명에 대한 인적사항을 중심으로 그들 개개인의 이력과 활동모습을 정리하였다. 첫째, 이상적과 특별한 교유 관계를 가진 사실이 발견되었다. 예컨대 이상적의 시문집인 "은송당집(恩誦堂集)" 출판을 대행해준 인물도 있었다. 둘째, 그들은 강소성(江蘇省), 산서성(山西省), 절강성(浙江省) 출신이 가장 많았다. 그리고 강소성(江蘇省) 중에서도 특히 소주(蘇州)와 양호(陽湖) 지역(地域) 인사(人士)가 가장 많았음을 알 수 있었다. 셋째, 밝혀진 인물만 대상으로 삼았을 때, 이상적이 교유한 인물들의 50% 이상은 당대 최고의 지식인인 진사(進士)와 거인(擧人)이었다. 넷째, 그들 중 승려(僧侶) 1인과 인삼(人蔘)가게로 추측되는 1인을 제외하면, 모두가 당대 연경 지역에서 상당한 문화 활동을 하고 있었던 문화인이었음을 알 수 있다. 이런 정보를 토대로 "해린척소"를 읽는다면 다소 오독(誤讀)의 실수를 감소시키는데 효과가 있을 것이다. 나아가 19세기 한중(韓中) 문명(文明) 교류(交流)의 실태(實態)를 확인하는데 필요한 약간의 자료를 제공해준다고 하겠다.

SOFM 신경회로망을 이용한 한국어 음소 인식 (Korean Phoneme Recognition Using Self-Organizing Feature Map)

  • 전용구;양진우;김순협
    • 한국음향학회지
    • /
    • 제14권2호
    • /
    • pp.101-112
    • /
    • 1995
  • 본 논문에서는 패턴 매칭 방법에 근거하여 인식 단위가 음소인 음소 기반 인식 시스템을 구성하였다. 선택한 신경망 구조는 생물학적 신경망인 코호넨(T. Kohonen)의 SOFM(Self-Organizing Feature Map)으로 패턴 매칭 과정 중 클러스터러(clusterer)로 사용하였다. SOFM 신경망은 신호 공간에 대해서 최적의 국소(局所) 해부적 사상(local topographical mapping)에 의한 자기 조직화 과정을 수행하며, 그 결과 인식 문제에 있어서 상당히 높은 정확도를 나타낸다. 따라서 SOFM 신경망은 음소 인식에도 효과적으로 응용될 수 있다. 또한 음소 인식 시스템의 성능 향상을 위해 K-means클러스터링 알고리즘이 결합된 학습 알고리즘을 제안하였다. 제안된 음소 인식 시스템의 성능을 평가하기 위해 먼저, 인식 대상음소는 모음군 17개, 자음의 경우 파열음9개, 마찰음 3개, 파찰음 3개, 유음 및 비음 4개, 음소의 성질이 다른 종성 7개의 음소군으로 모두 43개의 음소를 대상으로 실험하였으며, 각 음소군에 대한 특징 지도를 구성하여 레이블러(labeler)의 기능을 수행하게 하였다. 화자 종속 인식 실험 결과 $87.2\%$의 인식률을 보였으며 제안한 학습법의 빠른 수렴성과 인식률 향상을 확인하였다.

  • PDF

3차원 모델을 이용한 입모양 인식 알고리즘에 관한 연구 (A study on the lip shape recognition algorithm using 3-D Model)

  • 배철수
    • 한국정보통신학회논문지
    • /
    • 제3권1호
    • /
    • pp.59-68
    • /
    • 1999
  • 최근 통신 시스템의 연구와 발전 방향은 목소리의 음성 정보와 말하는 얼굴 영상의 화상 정보를 함께 적용하므로서 음성 정보만을 제공하는 경우보다 높은 인식율을 제공한다. 따라서 본 연구는 청각장애자들의 언어 대체수단 중 하나인 구화(speechreading)에서 가장 시각적 변별력이 높은 입모양 인식을 일반 퍼스널 컴퓨터상에서 구현하고자 한다. 본 논문은 기존의 방법과 달리 말하는 영상 시퀀스에서 입모양 인식을 행하기 위해 3차원 모델을 사용하여 입의 벌어진 정도, 턱의 움직임, 입술의 돌출과 같은 3차원 특징 정보를 제공하였다. 이와 같은 특징 정보를 얻기 위해 3차원 형상 모델을 입력 동영상에 정합시키고 정합된 3차원 형상 모델에서 각 특징점의 변화량을 인식파라미터로 사용하였다. 그리고, 인식단위로 동영상을 분리하는 방법은 3차원 특징점 변화량에서 얻어지는 강도의 기울기에 의하여 이루어지고, 인식은 각각의 3차원 특징벡터를 이산 HMM 인식기의 인식 파라메타로 사용하였다. 본 논문에서는 한국어 10개 모음에 대하여 인식실험하여 비교적 높은 인식율을 얻을 수 있는 것으로 보아 본 연구에서 사용한 특징 벡터를 시간적 변별 요소로서 사용할 수 있음을 제시하였다.

  • PDF

한국어 서울 방언의 평음과 격음 변별 지각에서 연령과 성별에 따른 차이 (Perception of lenis and aspirated stops in Seoul Korean by younger and older male and female listeners)

  • 김제홍;김소안;안주희;남기춘;최지연
    • 말소리와 음성과학
    • /
    • 제12권4호
    • /
    • pp.1-8
    • /
    • 2020
  • 전통적으로 서울 방언의 어두 평음과 격음은 voice onset time(VOT)에 의해 일차적으로 변별된다고 알려져 있다. 그러나 최근 발화 연구에서는 평음과 격음 간 존재하던 VOT값의 차이가 줄어들고 이차적 변별자질이었던 후행 모음의 fundamental frequency(F0)가 평음과 격음을 변별하는 데 일차적 역할을 수행하게 되는 변화가 관찰되고 있다. 본 연구는 산출 영역에서 관찰되는 이와 같은 변화가 지각 영역에서도 관찰되는 지 알아보고자 하였다. 구체적으로, 평음과 격음을 지각할 때 VOT와 F0 변별력을 알아보기 위해 VOT값과 F0값을 10단계로 조작한 음성 자극을 이용하여 식별 과제를 실시하였다. 청년과 노년 남녀를 대상으로 실험을 실시한 결과, 네 집단 모두에서 VOT와 F0가 평음과 격음을 변별하는 데 사용되지만 VOT에 비해 F0의 변별력이 더 큰 것을 확인하였다. 또한, F0 변별력에서는 성별과 연령에 따른 차이가 없었으나 VOT 변별력은 청년여성 집단이 가장 낮고 노년남성 집단이 가장 큰 양상으로 성별 및 연령에 따른 차이를 관찰할 수 있었다. 본 연구는 그동안 주로 발화 연구에서 보고돼오던 평음과 격음 대립의 VOT 및 F0 사용에서의 변화를 지각 영역으로 확대하여 그 양상을 살펴보았다는 점에서 의의가 있다.

한국어 음소 단위 LSTM 언어모델을 이용한 문장 생성 (Korean Sentence Generation Using Phoneme-Level LSTM Language Model)

  • 안성만;정여진;이재준;양지헌
    • 지능정보연구
    • /
    • 제23권2호
    • /
    • pp.71-88
    • /
    • 2017
  • 언어모델은 순차적으로 입력된 자료를 바탕으로 다음에 나올 단어나 문자를 예측하는 모델로 언어처리나 음성인식 분야에 활용된다. 최근 딥러닝 알고리즘이 발전되면서 입력 개체 간의 의존성을 효과적으로 반영할 수 있는 순환신경망 모델과 이를 발전시킨 Long short-term memory(LSTM) 모델이 언어모델에 사용되고 있다. 이러한 모형에 자료를 입력하기 위해서는 문장을 단어 혹은 형태소로 분해하는 과정을 거친 후 단어 레벨 혹은 형태소 레벨의 모형을 사용하는 것이 일반적이다. 하지만 이러한 모형은 텍스트가 포함하는 단어나 형태소의 수가 일반적으로 매우 많기 때문에 사전 크기가 커지게 되고 이에 따라 모형의 복잡도가 증가하는 문제가 있고 사전에 포함된 어휘 외에는 생성이 불가능하다는 등의 단점이 있다. 특히 한국어와 같이 형태소 활용이 다양한 언어의 경우 형태소 분석기를 통한 분해과정에서 오류가 더해질 수 있다. 이를 보완하기 위해 본 논문에서는 문장을 자음과 모음으로 이루어진 음소 단위로 분해한 뒤 입력 데이터로 사용하는 음소 레벨의 LSTM 언어모델을 제안한다. 본 논문에서는 LSTM layer를 3개 또는 4개 포함하는 모형을 사용한다. 모형의 최적화를 위해 Stochastic Gradient 알고리즘과 이를 개선시킨 다양한 알고리즘을 사용하고 그 성능을 비교한다. 구약성경 텍스트를 사용하여 실험을 진행하였고 모든 실험은 Theano를 기반으로 하는 Keras 패키지를 사용하여 수행되었다. 모형의 정량적 비교를 위해 validation loss와 test set에 대한 perplexity를 계산하였다. 그 결과 Stochastic Gradient 알고리즘이 상대적으로 큰 validation loss와 perplexity를 나타냈고 나머지 최적화 알고리즘들은 유사한 값들을 보이며 비슷한 수준의 모형 복잡도를 나타냈다. Layer 4개인 모형이 3개인 모형에 비해 학습시간이 평균적으로 69% 정도 길게 소요되었으나 정량지표는 크게 개선되지 않거나 특정 조건에서는 오히려 악화되는 것으로 나타났다. 하지만 layer 4개를 사용한 모형이 3개를 사용한 모형에 비해 완성도가 높은 문장을 생성했다. 본 논문에서 고려한 어떤 시뮬레이션 조건에서도 한글에서 사용되지 않는 문자조합이 생성되지 않았고 명사와 조사의 조합이나 동사의 활용, 주어 동사의 결합 면에서 상당히 완성도 높은 문장이 발생되었다. 본 연구결과는 현재 대두되고 있는 인공지능 시스템의 기초가 되는 언어처리나 음성인식 분야에서 한국어 처리를 위해 다양하게 활용될 수 있을 것으로 기대된다.