• 제목/요약/키워드: 음운 정보

검색결과 124건 처리시간 0.021초

한국어 연속음성인식을 위한 발음사전 구축 (Pronunciation Dictionary For Continuous Speech Recognition)

  • 이경님;정민화
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.197-199
    • /
    • 2000
  • 연속음성인식을 수행하기 위해서는 발음사전과 언어모델이 필요하다. 이 둘 사이에는 디코딩 단위가 일치하여야 하므로 발음사전 구축시 디코딩 단위로 표제어 단위를 선정하며 표제어 사이의 음운변화 현상을 반영한 발음사전을 구축하여야 한다. 한국어에 부합하는 음운변화현상을 분석하여 학습용 자동 발음열을 생성하고, 이를 통하여 발음사전을 구축한다. 전처리 단계로 기호, 단위, 숫자 등 전처리 과정 및 형태소 분석 과정을 수행하며, 디코딩 단위인 의사 형태소 단위를 생성하기 위해 규칙을 이용한 태깅 과정을 거친다. 이를 통해 나온 결과를 발음열 생성기 입력으로 하며, 결과는 학습용 발음열 또는 발음사전 구성을 위한 형태로 출력한다. 표제어간 음운변화 현상이 반영된 상태의 표제어 단위이므로 실제 음운변화가 반영되지 않은 상태의 표제어와는 그 형태가 상이하다. 이는 연속 발음시 생기는 현상으로 실제 인식에는 이 음운변화 현상이 반영된 사전이 필요하게 된다. 생성된 발음사전의 효용성을 확인하기 위해 다음과 같은 실험을 통해 성능을 평가하였다. 음향학습을 위하여 PBS(Phonetically Balanced Sentence) 낭독체 17200문장을 녹음하고 그 전사파일을 사용하여 학습을 수행하였고, 발음사전의 평가를 위하여 이 중 각각 3100문장을 사용하여 다음과 같은 실험을 수행하였다. 형태소 태그정보를 이용하여 표제어간 음운변화 현상을 반영한 최적의 발음사전과 다중 발음사전, 언어학적 기준에 의한 수작업으로 생성한 표준 발음사전, 그리고 표제어간의 음운변화 현상을 고려하지 않고 독립된 단어로 생성한 발음사전과의 비교 실험을 수행하였다. 실험결과 표제어간 음운변화 현상을 반영하지 않은 경우 단어 인식률이 43.21%인 반면 표제어간 음운변화 현상을 반영한 1-Best 사전의 경우 48.99%, Multi 사전의 경우 50.19%로 인식률이 5~6%정도 향상되었음을 볼 수 있었고, 수작업에 의한 표준발음사전의 단어 인식률 45.90% 보다도 약 3~4% 좋은 성능을 보였다.

  • PDF

한국어 시각단어재인 과정에서의 음운정보 역할 규명을 위한 계산주의적 모델 (Computational Model for Proving Phonological Information a Role in Visual Korean Word Recognition)

  • 박기남;임희석;한군희
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2007년도 춘계학술발표논문집
    • /
    • pp.178-180
    • /
    • 2007
  • 본 논문은 인간의 언어정보처리 과정 중 시각단어재인(visual word recognition) 과정에서 음운정보와 철자정보의 역할 및 심성어휘집의 표상 형태를 알아보기 위해, 계산주의적 모델을 제안하고, 제안된 모델을 이용하여 실험하였다. 실험결과 계산주의적 모텔은 한국어에 대한 시각 단어재인 시 보이는 언어현상 중 음운, 철자 이웃 크기효과(phonological and orthographic neighborhood effect)를 나타냈으며, 이를 통해 한국어 시각단어재인 과정에서 심성어휘집이 음운정보로 표상되어 있다는 것을 시사하는 증거를 보였다.

  • PDF

정규화 지속시간 회귀트리를 기반으로 한 음운지속시가 모델화 (A Modelling of segmental Duration based on Regression Tree of the Normalized Duration)

  • 정지혜
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 2호
    • /
    • pp.278-281
    • /
    • 1998
  • 본 논문에서는 자연음성으로부터 통계적인 방법으로 일반적인 음성합성 규칙을 생성하기 위해, 남녀 각각 1명이 200문장에 대해 발성한 문음성 데이터를 음운 세그먼트, 음운 라벨링, 음운별 품사 태깅, 문법 정보 태깅하여 음성 데이터베이스를 구축하였다. 이 음성 데이터베이스로부터 휴지지속시간을 분석하여 긴 휴지와 짧은 휴지로 분류하였고, 이러한 휴지가 어느 경우에 나타나는가를 조사하였다. 음운지속시간을 보다 정교하게 예측하기 위하여, 각 음운의 고유 지속시간의 영향을 배제시킨 정규화 지속시간에 대해 2가지 class(장, 단)의 휴지시간을 고려한 회귀트리로 음운지속시간을 모델화하였다. 제안된 모델의 평가 결과 예측치와 관측치 간의 다중 상관 계수는 남성은 0.82, 여성은 0.84 정도로 평가되었다.

  • PDF

한국인의 영어처리의 기제: 모국어처리와의 상호작용을 중심으로 (The Processing System of English for Korean: Focused on the Interaction with Native Language Processing)

  • 이창환;강봉경
    • 인지과학
    • /
    • 제15권2호
    • /
    • pp.43-53
    • /
    • 2004
  • 영어를 제2언어로 사용하는 한국인을 대상으로 이중언어의 어휘접근이 음운 정보와 관련하여 어떻게 일어나는지를 알아보았다. 이중언어를 처리할 매에 양 언어의 음운적 지식이 동시에 활성화된다는 비선택적 가설과 한 언어의 음운적 지식만이 활성화된다는 선택적 가설을 검증하고자하는 목적으로 2개의 실험을 실시하였다. 실험결과 한글 표적자극의 수행이(실험2) 점화자극으로 제시된 영어 단어의 음운적 조작에 따라 유의미한 영향을 받았고, 영어 표적자극을 처리할 때에는 (실험1) 점화자극으로 제시된 한글 단어의 음운적 조작에 따라 영향을 받는 경향을 발견하였다. 이는 이중언어 중 한 언어를 처리할 때에 다른 언어의 음운적 지식이 자동적으로 활성화됨을 의미하며 한국인에게 있어서 제2언어인 영어의 처리에서 음운정보가 중요한 역할을 함을 의미한다.

  • PDF

코퍼스 확률에 기반한 한국어 표준발음 생성 (The Corpus-probability Based Generation of Korean Standard Pronunciation)

  • 김동성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2007년도 제19회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.210-215
    • /
    • 2007
  • 본 연구에서는 코퍼스 확률에 기반하여 한국어 표준 발음 생성에 대한 연구를 한다. 기존의 이은영 외 (2005)에서 연구된 규칙기반의 한국어 IPA 발음 변환방식과는 달리 본 연구에서는 음운변환 코퍼스를 바탕으로 표준발음을 변환한다. 이 방식을 위해서 Brill(1995)에서 제안한 변형기반 학습방식이 활용되었으며, 단계적인 처리방식이 아닌 입-출력 대응 방식의 확률적 처리 방식이 제안되었다. 음운변환 방식은 음운규칙에 근거한 처리가 아닌 언어자원인 코퍼스를 활용해서 처리하였다는 점에서 기존의 연구방식과 차이가 있다. 또한, 기존 연구에서는 음운규칙을 단계적으로 적용하여서 입력형이 출력형으로 도출되기 위해서 여러 단계를 거쳤지만, 본 연구에서는 입력형과 출력형의 일대일 대응이라는 점에서 차이점을 보인다.

  • PDF

음운 변동 실현 오류의 예측 인자 분석 (Analysis of Predictors of Phonological Variation Realization)

  • 안성민
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.498-500
    • /
    • 2021
  • 본 연구에서는 음운 변동에서 나타나는 오류가 어떤 변수에 영향을 받는지 확인하여 음운 변동 연구 및 교육의 기초 자료를 제공하고자 하는 데에 목적이다. 이를 위해 유음화 발음 데이터를 이용하여 성별, 유음화의 방향, 품사, 단어의 빈도, 단어의 음절수와 유음화의 발음 적격 유무를 변수로 설정하였다. 유음화 적격률에 영향을 줄 수 있는 독립변수를 찾기 위해 카이제곱 검정과 다중공선성의 팽창계수를 먼저 확인하였다. 이후 다중 로지스틱 회귀분석과 오즈비를 통해 유의한 예측인자를 검토하였다. 그 결과 5개의 독립 변수 중 성별과 유음화의 방향, 품사가 결과를 오류에 영향을 주는 주요한 인자가 되는 것을 확인할 수 있었다.

  • PDF

한국어 음운 변동 처리 규칙의 설계 및 구현 (Design and Implementation of Vocal Sound Variation Rules for Korean Language)

  • 이계영
    • 한국정보처리학회논문지
    • /
    • 제5권3호
    • /
    • pp.851-861
    • /
    • 1998
  • 한국어는 음운 변동 현상이 매우 발달되어 있다는 특징을 갖고 있다. 따라서, 음성 인식율의 제고와 음성 합성음의 자연스러움을 향상시키기 위해서는 음운 변동 현상을 비롯한 한국어의 모든 특징에 대한 체계적인 연구가 있어야 한다. 본 논문은 한국어의 제 특징 중에서 음운 변동 현상을 효율적으로 처리할 수 있는 규칙을 설계하고 구현함으로써, 한국어 음성 인식과 합성에 효율적으로 이용될 수 있음을 보인다. 음운 변동 규칙의 설계를 위하여 사용된 규정은 한글 맞춤법 통일안의 표준 발음법(7장 30항)이며, 일차적으로 각 규정별로 설계된 규칙을 최종적으로 27개 그룹으로 정리된 종성별 규칙을 제시하였다. 본 연구에서 제안된 음운 변동 처리 시스템은 한번의 규칙 적용으로 음운 변도 dgus상이 신속히 처리되는 잇점이 있으며, 단어 및 용언의 어간에 접속되는 정보에 대한 처리 내용까지도 제안된 규칙내에 수용하였기 때문에 문장 단위의 음성 인식과 합성 시스템의 연구에 도움을 줄 수 있다.

  • PDF

다차원 구어 단기기억에 따른 전도 실어증 환자의 언어수행력 분석 (Language performance analysis based on multi-dimensional verbal short-term memories in patients with conduction aphasia)

  • 하지완;황유미;편성범
    • 인지과학
    • /
    • 제23권4호
    • /
    • pp.425-455
    • /
    • 2012
  • 다차원 구어 단기기억 기제는 크게 음운적 통로와 어휘-의미적 통로로 구분된다. 전자를 음운단기기억, 후자를 의미단기기억이라고 할 수 있는데, 단기기억 과제를 정상적으로 수행하기 위해서는 두 통로 모두의 정보를 활발히 활용하여야 한다. 그리고 음운단기기억은 다시 음운입력완충기와 음운출력완충기로 나누어지며, 음운입력완충기는 음운자극의 입력 시, 음운출력완충기는 음운 산출 시에 작동한다. 본 연구에서는 유사한 수준의 전도 실어증 증상을 보이는 세 명의 환자에 대해, 각각의 언어 수행력을 구어 단기기억의 다차원적 측면에서 분석하였다. 그러기 위하여 세 명의 전도 실어증 환자들에게 단어 수준과 문장 수준에서 스스로 말하기, 따라말하기, 스스로 쓰기, 받아쓰기의 네 가지 양태의 언어과제를 실시하여 수행력을 비교 분석하였고, 숫자폭검사와 언어학습검사를 이용하여 음운단기기억력과 의미단기기억력을 평가하였다. 그 결과 세 대상자들은 네 양태의 언어 검사에서 다양한 수행력과 오반응 유형을 보였고, 단기기억력 검사 결과도 동일하게 나타나지 않았다. 즉 전도 실어증 환자들의 언어 수행력은 의미단기기억 또는 음운단기기억의 결함으로 설명될 수 있으며, 음운단기기억 가운데에서도 음운입력완충기, 음운출력완충기 혹은 둘 다의 결함 여부에 따라 언어특성이 상이하게 나타날 가능성을 제시하고 있다. 본 연구에서는 전도 실어증 환자들의 언어 검사와 단기기억력 검사 결과를 바탕으로, 언어와 다차원 구어 단기기억력과의 관계에 대하여 논의하고 있다.

  • PDF

현대국어 음변화 규칙의 기능 부담량

  • 이상억
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1990년도 제2회 한글 및 한국어정보처리 학술대회
    • /
    • pp.131-138
    • /
    • 1990
  • 이 연구는 현대 국어에 나타나는 음성규칙, 음운규칙, 형태음운규칙, 기타 등등의 발생빈도를 조사하여, 각 규칙이 차지하는 기능 부담량(Functional Load)을 알아 보려는 것이다.

  • PDF

한글 일음절 단어처리에서의 음운정보의 역할 (The Role of Phonological Information in Korean Monosyllabic Word Processing)

  • 김연희;이창환
    • 인지과학
    • /
    • 제15권1호
    • /
    • pp.35-41
    • /
    • 2004
  • 한글단어가 음운경로를 통해 처리되는지 아닌지를 알아보고 단어재인의 어느 단계에서 음운 정보의 영향을 주로 받는지 알아보기 위하여, 1음절 단어를 사용하고 철자를 지연시키는 실험올 하였다. 두 개의 초점조건은 옴가가 있는 철자를 지연시키거나 묵음을 지연시키는 조건이었다. 실험 1에서는 음운정보가 단어재인 초기에 영향을 미치는지 또는 후기 과정에서 영향을 미치는지 알아 보기 위하여, 점화자극을 l50ms와 250ms로 제시한 명명과제를 실시하였다, 그 결과 150ms로 점화자극 을 제시하였을 때에는 음가조건파 정화자극제시여부간의 유의한 상호작용이 나타나 묵음조건에서는 점화자극 제시에 따라 목표자극이 촉진된 반면 유음조건에서는 점화자극 제시에 따른 효과가 없었다. '반면, 250ms로 정화자극이 제시되었을 때에는 유의한 상호작용효파가 나타나지 않았다. 실험 2에서는 어휘 판단과제를 통해 실험 1의 결과가 일반화되는지를 살펴보았다 그 결과, 실험l과 마찬가지로 150ms로 정화자극을 제시하였을 때에는 음가조건과 점화자극제시여부 간의 유의한 상호작용이 나타났으나, 점화자극을 250ms로 제시한 경우에는 유의한 상호작용이 나타나지 않았다. 이상의 결과는 한글단어가 음운경로를 통해 처리되고, 주로 단어재인과정의 초기 단계에서 음운정보가 개입함을 시사한다.

  • PDF