• 제목/요약/키워드: 예외 발음

검색결과 16건 처리시간 0.027초

예외 단어 선별 작업을 이용한 자동 발음열 생성 시스템의 성능향상에 관한 연구

  • 안주은;김선희;김순협
    • 대한음성언어의학회:학술대회논문집
    • /
    • 대한음성언어의학회 2003년도 제19회 학술대회
    • /
    • pp.142-142
    • /
    • 2003
  • 본 연구는 텍스트 분석 기반 자동 발음열 생성 시스템의 성능을 향상시킬 수 있는 방법으로 예외 단어 선별 작업을 제안한다. 제안하는 자동 발음열 생성 시스템은 형태음운 규칙 적용, 예외 규칙 적용, 일반음운 규칙 적용의 순서로 이루어진다. 이 때 예외 규칙은 예외사전을 검색하여 해당 어휘가 있을 때에만 적용하게 되는데, 예외 단어는 일정한 예외 환경에서만 나타난다. 본 시스템의 예외 사전에 있는 예외 단어는 5만여 어휘 연세사전에서 예외 환경에 해당하는 28,486개의 어휘 중, 총 2,931개의 예외 단어를 선별하였다. 본 시스템의 성능 평가는 ETRI 2,385, PBS 1,637 어절을 사용하였는데 실험 결과 각각 99.8%, 99.9%의 정확도를 보였고, 0.1% 의 오류는 예외 규칙 중에 하나인 어휘적 경음화 현상에서 나타났다. 따라서 예외 사전을 보다 정확하게 만드는 방법인, 예외 단어 선별 작업을 통해 본 시스템의 성능을 향상시킬 수 있다. (중략)

  • PDF

예외 단어 선별 작업을 이용한 자동 발음열 생성 시스템 (Automatic Pronunciation Generator Using Selection Procedure for Exceptional Pronunciation Words)

  • 안주은;김순협;김선희
    • 한국음향학회지
    • /
    • 제23권3호
    • /
    • pp.248-252
    • /
    • 2004
  • 실제 언어생활에 있어서 여러 다양한 경제적 문화적 사회적 환경에 따라 다른 어휘가 사용되고, 각각의 다양한 환경에서 새롭게 신조어가 추가되는 등 어휘의 양적인 변화가 일어난다. 이러한 역동적인 언어 현실을 자동 발음열 생성기에 반영하기 위하여, 본 논문은 추가된 텍스트로부터 예외발음사전을 구축하는 방법을 제안하고, 이러한 방법으로 구축된 예외발음사전을 이용한 자동 발음열 생성 시스템의 성능을 실험하였다. 본 시스템에 대하여 ETRI에서 출시된 음성인식용 텍스트 코퍼스 가운데 한 달 동안의 신문기사를 모은 53,750문장 (740,497 어절)을 이용하여 실험한 결과 100%의 성능을 얻었다.

한글 TTS시스템에서 형태 음운론적 분석에 기반 한 발음열 생성 (Pronunciation Generation Based on Morphophonological Analysis in Korean TTS)

  • 정경석;박혁로
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.559-562
    • /
    • 2001
  • 한국어 TTS시스템에서 한 가지 모듈로써의 발음열 생성기는 한국어의 특성상 음운적 조건과 형태론적 조건 등에 의해 다양한 방법과 예외처리를 요구하고 한국어의 음운현상에 대한 체계적인 분석과 처리가 필요하다. 그래서 이 논문은 형태 음운론적 분석을 통한 발음열 자동 생성기법을 소개한다. 이 시스템은 형태소 분석을 선행한 후, 특수문자나 숫자 등을 정규화하고 복합명사 분해 사전을 이용한 복합명사 분해와 추가 조건을 통해 ㄴ-첨가 규칙을 전 처리한다. 그리고 음운 변화 현상을 분석하여 선택적으로 규칙을 적용하여 발음열을 생성한다. 제안된 시스템은 기존의 형태소 분석되지 않은 시스템에 비해 더욱 효과적인 음운, 형태소 변화를 가져옴과 함께, 특히 ㄴ-첨가가 적용되는 텍스트는 7$\sim$8%정도의 나은 발음열을 생성찬 수 있었다. 그 결과, 발음열 생성기는 한국어 TTS 시스템의 한국어 처리라는 고질적인 문제 해결에 좋은 방향과 결과를 기여할 수 있다.

  • PDF

최소 형태소 정보를 이용한 자동 발음열 생성 시스템 (Automatic Pronunciation Generation System Using Minimum Morpheme Information)

  • 김선희;안주은;김순협
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 추계학술발표대회(상)
    • /
    • pp.216-219
    • /
    • 2003
  • 본 논문은 최소한의 형태소 정보를 이용한 자동 발음열 생성 시스템을 제안한다 일반적으로 발음열 생성 시스템은 입력된 문장에 대하여 형태소 단위로 분석한 다음, 각 형태소와 형태소의 결함 관계를 고려한 음운 규칙을 적용함으로써 상응하는 발음열을 생성한다. 지금까지의 연구는 이러한 발음열 생성시의 형태소 분석에 관하여 그 범위에 관한 연구 없이, 가능한 최대한의 분석을 상정하고 있다. 본 논문은 한국어 음운현상을 체계적인 텍스트 분석을 통하여 모든 형태론적 음운론적인 환경에서 가능한 모든 음운현상을 분류하여 발음열 생성시에 실제로 필요한 형태소 분석의 범위를 규명하는 것을 그 목적으로 한다. 음운 현상을 분석하기 위해 사용한 텍스트 자료로는 어휘가 중복되지 않으면서도 많은 종류의 어휘가 수록된 5만 여 어휘의 연세한국어사전과 2200 여 개의 어미와 조사를 수록한 어미조사사전을 이용하였다. 이와 같이 텍스트를 분석한 결과, 음운현상은 규칙적인 음운 현상과 불규칙적인 음운현상으로 나뉘는데, 이 가운데 형태소 정보가 필요한 형태음운규칙으로는 두 가지가 있으며, 이러한 형태음운규칙을 위한 형태소 분석의 범위로는 세세한 분류를 필요로 하지 않는 최소한의 정보로 가능함을 보인다. 이러한 체계적인 분석을 기반으로 제안하는 자동 발음열 생성 시스템은 형태음운규칙과 예외규칙, 그리고 일반음운 규칙으로 구성된다. 본 시스템에 대한 성능 실험은 PBS 1637 어절과 ETRI 텍스트 DB 19만 여 어절을 이용하여 99.9%의 성능결과를 얻었다.

  • PDF

한국어 발음열 자동 생성을 위한 형태소 태그 정보 기반의 텍스트 전처리기 (Text Preprocessor for Generating Korean Automatic Pronunciation Variants Using Morpheme-trg Information)

  • 이경님;정민화
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.199-201
    • /
    • 2001
  • 일반적으로 발음열 자동 생성기는 음성 인식 및 음성 합성에 사용되며, 그 주된 역할은 입력된 한글 철자에 대해 발음 나는 데로 표기된 음소열로 출력하는 것이다. 그러나 실제 입력되는 문장에는 특수 기호 및 알파벳. 아라비아 숫자, 영어 단어, 알파벳과 숫자가 혼용된 약어, 기호 단위 명사 등이 포함되어 있다. 게다가 아라비아 숫자의 경우 단위 명사의 종류에 따라서 뿐만 아니라, 문맥에 따라 숫자를 읽는 방식이 달라지게 된다. 이러한 모든 현상들을 발음열 생성기 내부에서 처리하게 되면 선행작업이 상대적으로 크게 되어 과부하 문제 가 발생된다. 또한 어절 내의 문맥 정보만으로 정확한 변환 결과를 얻기 힘들기 때문에 형태소 분석 수행 결과 및 예외처리를 위 한 루틴을 포함하여 한글 자소 단위의 입력형식으로 변환하는 전처리 시스템을 구성하였다.

  • PDF

한글 TTS 시스템에서 문자열-발음열 변환기의 ㄴ-소리 첨가 전 처리기 (Ni-eun Addition Preprocessing of Grapheme to Phoneme Conversion for Koran TTS)

  • 정경석;박혁로
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.370-372
    • /
    • 2001
  • 본 논문은 ㄴ-첨가 규칙을 전 처리를 통한 문자열-발음열 변환 기법을 소개한다. 한국어 TTS 시스템에서의 고질적인 문제는 문자열-발음열 변환이라고 할 수 있는데, 그 이유는 한국어의 특징상 음운적 조건과 형태론적 조건등에 의해 다양한 방법과 예외처리를 요구하기 때문이다. 그 중 ㄴ-첨가 규칙은 위와 같은 대표적인 현상으로 많은 문제점과 그에 따른 연구를 필요로 하고 있다. 이 시스템은 형태소 분석을 선행한 후, 특수문자나 숫자를 정규화하고 ㄴ-첨가 규칙을 전 처리한 후, 음운변화 현상을 분석하여 선택적으로 규칙을 적용하여 발음열을 생성한다. 제안된 시스템은 기존의 시스템에 비해 더욱 효과적인 음운, 형태소 변화를 가져옴과 함께, 특히 ㄴ-첨가가 적용되는 문장을 효과적으로 해결할 수 있어 TTS시스템에 좋은 결과를 가져오게 될 것이다.

  • PDF

WWW에서의 한국어 표준 음가생성 시스템 구현 (An Implementation of A Korean Standard Ponetic Value Generating System)

  • 임재걸;이계영;남중구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.204-206
    • /
    • 1999
  • 본 시스템은 한글 발음 교육 사이트 개발 프로젝트의 일부인 음가 생성에 관한 컴포넌트로써 한국어 표준발음 테이블에서 음운 변동값을 추출하고 해당 음성과 입모양을 출력하는 WWW상의 자바 애플릿 프로그램 개발에 관한 연구이다. 본 논문에서는 형태소 분석에 선행되어야 할 전처리 과정, 예외처리, 음가 생성부에서 고려하여야할 점과, 시스템의 애플릿 구현 등에 대해 중점적으로 기술하였다.

  • PDF

무제한 음성합성 시스팀을 위한 전처리과정 (A Preprocessing for the Unlimited Korean Text to Speech System)

  • 강용범
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.334-337
    • /
    • 1994
  • 본 논문에서는 형식형태소 사전 및 1300여 단어의 발음예외 사전을 이용하여 무제한 dam성합성을 위한 전처리과정을 구현하였으며, 문자열 정형화부, 형식셩태소 중심의 문장분석 및 자소단위의 음운변동과정에 관하여 논한다.

  • PDF

한국어 자동 발음열 생성 시스템을 위한 예외 발음 연구 (A Study on Exceptional Pronunciations For Automatic Korean Pronunciation Generator)

  • 김선희
    • 대한음성학회지:말소리
    • /
    • 제48호
    • /
    • pp.57-67
    • /
    • 2003
  • This paper presents a systematic description of exceptional pronunciations for automatic Korean pronunciation generation. An automatic pronunciation generator in Korean is an essential part of a Korean speech recognition system and a TTS (Text-To-Speech) system. It is composed of a set of regular rules and an exceptional pronunciation dictionary. The exceptional pronunciation dictionary is created by extracting the words that have exceptional pronunciations, based on the characteristics of the words of exceptional pronunciation through phonological research and the systematic analysis of the entries of Korean dictionaries. Thus, the method contributes to improve performance of automatic pronunciation generator in Korean as well as the performance of speech recognition system and TTS system in Korean.

  • PDF

"한글음성문자(The Korean Phonetic Alphabet)"의 연원에 대한 고찰

  • 심소희
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 1996년도 10월 학술대회지
    • /
    • pp.300-307
    • /
    • 1996
  • 한글은 세계 여느 문자처럼 자연 발생적으로 생긴 문자체계가 아니라 수천년간 인류의 어음에 대한 사유와 고도의 어음기술이 집약된 문자관에 의해 연역적 방법으로 창제된 문자체계이므로 다른 문자와는 차별적인 연구방법이 요구된다. 세종조에 편찬되었던 ${\ll}훈민정음{\gg}{;\}.{\;}{\ll}홍무정운역훈{\gg}{;\}.{\;}{\ll}동국정운{\gg}$는 제작 동기와 목적이 달라서 각각 상이한 어음체계를 가지고 있는데, 각 어음체계가 필요로 하는 글자꼴을 한글은 27개(자음16개, 모음11개)의 기본글자꼴에 발음부위 및 발음방법을 상형한 새로운 글자꼴을 제공하여 각각의 문자체계를 구성하였다. 유교적 언어관의 토양에서 세상 모든 음의 생성원리에 의해 창제된 한글은 바로 세상의 모든 음을 표기할 수 있는 문자체계인 것이다. 이러한 한글음성문자는 오늘날 이질어음체계의 외국어를 표음하는 데에도 예외 없이 적용될 수 있을 뿐만 아니라 글자꼴의 유연성.응용면에서 국제음성문자(I.P.A)보다 월등히 과학적이고 완정한 음성문자로서 기능할 수 있다.

  • PDF