• 제목/요약/키워드: Pronunciation modeling

검색결과 25건 처리시간 0.019초

운율 정보를 이용한 한국어 위치 정보 데이터의 발음 모델링 (Pronunciation Variation Modeling for Korean Point-of-Interest Data Usins Prosodic Information)

  • 김선희;박전규;전재훈;나민수;정민화
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2006년도 제18회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.51-56
    • /
    • 2006
  • 일반적으로 운율 정보를 음성인식에 이용한 연구들에 있어서는 대부분 운율의 음향적 정보를 이용하는데 반하여, 본 연구에서는 운율어나 음절수와 같은 운율의 구조적 정보가 인식률 향상에 기여함을 보인다. 본 논문은 두 가지 운율 정보, 즉 운율어와 음절수를 이용하여 발음모델링을 할 경우에 음성인식기의 성능을 평가하는 것을 목표로 하는 것으로, 먼저, 운율어를 이용하여 위치 정보데이터의 가능한 모든 발음을 생성하고, 다시 음절 수를 기준으로 발음변이 수를 조절하는 방법을 제시한 다음, 제안한 방법에 의하여 생성한 발음사전을 이용하여 음성인식의 성능을 평가하였다. 실험결과 운율어를 이용하여 발음 사전을 제작한 모든 경우에 베이스라인과 비교하여 성능이 향상됨을 보였는데, 베이스라인의 WER 4.63% 에서 최대 8.4%의 WER 가 감소하였다. 위치 정보 데이터의 음절수에 따라서 발음 변이의 수를 조절한 결과도 전체적으로는 3 음절로 그 수를 제한한 경우, 6 음절이상 단어에서는 4음절로 제한한 경우에 가장 좋은 인식 성능을 얻을 수 있어서, 음절수에 따른 발음변이 수의 조절이 효과적임을 알 수 있었다.

  • PDF

중증 장애우용 음성구동 휠체어를 위한 강인한 음성인식 알고리즘 (Robust Speech Recognition Algorithm of Voice Activated Powered Wheelchair for Severely Disabled Person)

  • 석수영;정현열
    • 한국음향학회지
    • /
    • 제26권6호
    • /
    • pp.250-258
    • /
    • 2007
  • 현재의 음성인식 기술은 하드웨어 기술의 발전과 더불어 여러 분야에 응용되고 있지만 음성구동 휠체어와 같은 고신뢰성이 요구되는 응용분야에서는 아직도 그 성능이 불충분하다. 실 환경에서 음성을 통해 안전하게 휠체어를 제어하기 위해서는 도로의 소음 등과 같은 주변잡음의 영향에 의한 음성인식 성능의 저하, 사용자의 기침소리나 숨소리 등과 같은 비음성 입력시의 오동작, 명령어의 불명확한 발성과 일반인과는 다른 발성 속도 및 발성 주파수 등을 고려한 인식시스템이 필요하다. 이를 위하여 본 논문에서는 비음성 입력시의 오동작을 방지하기 위해 인식기의 전처리 단에서 YIN 기본주파수 추출방법을 적용한 후 프레임 별 신뢰도에 기반한 고정도로 음성/비음성을 판별할 수 있는 방법을 제안하고, 불명확한발성에 대한 인식 성능 향상을 위해 화자 적응화 방법 및 개인적인 발성 변이를 표현할 수 있는 다중 후보 단어사전을 구성하여 인식성능 제고를 도모하였다. 잡음이 포함된 실 환경하에서 수집한 데이터를 대상으로 인식실험을 수행한 결과 기존의 켑스트럼 방법에서는 오류 없이 비음성을 찾아내는 재현율은 62%로 나타났으나 본 논문에서 제안한 YIN방법에 기반을 둔 신뢰도 측정방법에서는 95.1%를 나타나 우수한 성능을 나타내었다. 실 환경에서 수집된 2211개의 불명확한 발성을 대상으로 인식실험을 수행한 결과 2000상태 16 혼합수 HMnet 모델을 이용한 경우 인식률이 78.6%로 나타났으나 MAP적응화 방법 및 다중 후보 인식사전을 적용한 결과 99.5%의 인식 성능을 나타내어 제안한 방법의 유효성을 확인할 수 있었다.

대화구문기반 교육용 콘텐츠 저작 시스템을 위한 3D 캐릭터 제작 (3D Character Production for Dialog Syntax-based Educational Contents Authoring System)

  • 김남재;유석호;경병표;이동열;이완복
    • 한국융합학회논문지
    • /
    • 제1권1호
    • /
    • pp.69-75
    • /
    • 2010
  • 영상매체를 이용한 영어 교육은 단순히 청각만을 이용한 방법보다 피교육생에게 사실적인 발음표현과 콘텐츠 몰입감 증대등의 측면에서 중요성이 높아지고 있다. 영어교육 콘텐츠에 등장하는 캐릭터들은 음성에 영어 발음에 맞추어진 사실적인 입모양을 표현키 위하여 많은 노력을 들이 있다. 이 논문에서는 교사가 손쉽게 영상 콘텐츠를 제작할 수 있도록 도와줄, 대화구문기반 교육용 콘텐츠 저작시스템을 이용하는 사용자에게 사실적인 lip-sync 애니메이션을 제작할 수 있도록 하여 교육의 능률을 높일 수 있도록 3D 캐릭터를 사례로 제작하였다. 폼 노아 마우스 차트를 활용한 입모양과 발음의 연관구조를 분석하고, 캐릭터의 컨셉 디자인에서 모델링, 맵핑, 애니메이팅 과정을 거쳐 익스포트로 최적화된 캐릭터데이터를 추출해 보았다. 입모양과 연계되는 손동작, 몸동작도 추후 연구에서 다루어질 때 보다 효율적인 교육용콘텐츠를 위한 3D캐릭터 제작이 될 것으로 사료된다.

심장(心臟) 질환(疾患) 진단(診斷)을 위한 한의학적 청진(聽診) 기반의 설음(舌音) 분석 (A Lingual Sound Analysis based on Oriental Medicine Auscultation for Heart Diseases Diagnosis)

  • 김봉현;조동욱;허성호
    • 한국통신학회논문지
    • /
    • 제34권8B호
    • /
    • pp.830-838
    • /
    • 2009
  • 다양한 진단 기기들의 개발로 인해 발전을 거듭하고 있는 서양의학에 비해, 한의학은 임상의의 직관에 의존하여 환자들에게 시각적이며 객관적으로 질환 상태를 표현해줄 수 있는 정량화된 진단 데이터들이 부족한 실정이다. 이를 위해 본 논문에서는 한의학적 진단 방법의 시각화를 통한 객관화를 구현하기 위해 먼저, 한의학에서 몸을 다스리는 중심기관이며 생명과 정신의 근원처로 간주하고 있는 심장과 음성 신호와의 관계를 한방에 기초하여 규명하고 분석하였다. 따라서 심장은 오관 중 혀와 관련이 되어 있어 음성과 연계하여 생각하면 심장 질환자는 설음(舌音), 즉 혓소리의 발음이 불명확하다는 것에 초점을 맞추어 심장 질환의 유무를 판단하는 방법을 설계하였다. 이를 위해 심장 질환자와 정상인으로 피실험자 집단을 구성하고 이들의 음성에서 헛소리에 해당하는 부분에 대한 제2포먼트 주파수의 통계적 대역폭 분석과 형태적 모델링 분석을 수행하여 상호간의 비교, 분석을 수행하였다. 최종적으로 설계한 방법에 대해 실험 결과를 통한 상관성을 분석하였다.

경복궁 아미산의 조영과 조산설(造山說)에 관한 고찰 (Studies on the Construction and the Artificial Mountain Theory of Amisan in the Gyeongbok Palace)

  • 정우진;심우경
    • 한국전통조경학회지
    • /
    • 제30권2호
    • /
    • pp.72-89
    • /
    • 2012
  • 본 연구는 사료 및 도상자료의 분석을 통하여 경복궁 교태전 북쪽의 아미산 화계가 인공산이라는 기존의 주장을 재검토하고 반론을 제기하기 위한 목적으로 수행되었다. 경회지를 판 흙으로 아미산을 조산했다는 논리는 그간 정설로 여겨졌으며, 의심 없이 대부분의 경복궁 관련 논저와 단행본에서 반복되어 기술되고 있다. 본 연구에서는 사료에서 전혀 발견되지 않는 아미산 조산설에 대해 몇 가지 반론을 제기하였는데, 기존 주장에 내재된 논리적 모순, 경회지 축조시기와 교태전 건립 시점의 불일치, 영조와 고종 연간에 제작된 도형사료에서 나타난 백악산과 아미산을 잇는 산줄기의 존재, 아미산 북쪽에 있는 흥복전에서 동쪽 담장을 경계로 높은 위차를 보이고 통행기능이 없다는 점, 중건 당대에 아미산을 풍수적인 아미사(蛾眉砂)로 인식하고 있는 것과 세종 연간에 경복궁 주산논쟁 결과 조치된 경복궁 내맥의 보존에 관한 주장이 그것이다. 아울러 본 연구에서는 교태전 북쪽의 언덕이 아미산으로 불러지게 된 기원과 잘못된 조산설이 등장하게 된 원인을 규명하였는데, 풍수용어 아미사가 음변되어 아미산이 되었다는 것을 밝히고, 중국 사천에 있는 도불(道佛)성지인 아미산을 모방한 의경의 조성과 천연두신을 퇴치하기 위한 벽사적 의미의 아미산 조영관에 의한 것이라고 판단하였다. 또한 아미산 조산설은 천지조산(穿池造山)식 조경법식을 경회지와 아미산에 소급시킨 것으로 보이며, 1980년대를 전후로 주장이 등장하게 된 것으로 조사 되었다. 백악산과 아미산을 잇는 용맥은 일제가 1915년 경복궁에 개최한 대규모 박람회를 기점으로 상당부분 절토되었으나, 교태전 동북쪽에 위치한 탐방로를 따라 낮은 둔덕이 약 70m 가량 이어져 있어 일제 강점기에 이 지맥이 아주 없어진 것은 아니었던 것으로 판단된다. 또한 표고분석 결과 녹산에서 아미산까지 불연속적인 언덕이 일정한 축을 이루는 것이 발견되어 아미산의 용맥을 대략적으로 가늠해 볼 수 있으며, 이러한 아미산 용맥에 관한 기초연구를 통해 향후 경복궁 지형복원의 주요한 단서를 제공하려 하였다.