• Title/Summary/Keyword: 단어 데이터베이스

Search Result 208, Processing Time 0.026 seconds

A Study on the Artificial Neural Networks for the Sentence-level Prosody Generation (문장단위 운율발생용 인공신경망에 관한 연구)

  • 신동엽;민경중;강찬구;임운천
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.53-56
    • /
    • 2000
  • 무제한 어휘 음성합성 시스템의 문-음성 합성기는 합성음의 자연감을 높이기 위해 여러 가지 방법을 사용하게되는데 그중 하나가 자연음에 내재하는 운을 법칙을 정확히 구현하는 것이다. 합성에 필요한 운율법칙은 언어학적 정보를 이용해 구현하거나, 자연음을 분석해 구한 운을 정보로부터 운율 법칙을 추출하여 합성에 이용하고 있다. 이와 같이 구한 운을 법칙이 자연음에 존재하는 운율 법칙을 전부 반영하지 못했거나, 잘못 구현되는 경우에는 합성음의 자연성이 떨어지게 된다. 이런 점을 고려하여 우리는 자연음의 운율 정보를 이용해 인공 신경망을 훈련시켜, 문장단위 운율을 발생시킬 수 있는 방식을 제안하였다. 운율의 세 가지 요소는 피치, 지속시간, 크기 변화가 있는데, 인공 신경망은 문장이 입력되면, 각 해당 음소의 지속시간에 따른 피치 변화와 크기 변화를 학습할 수 있도록 설계하였다. 신경망을 훈련시키기 위해 고립 단어 군과 음소균형 문장 군을 화자로 하여금 발성하게 하여, 녹음하고, 분석하여 구한 운을 정보를 데이터베이스로 구축하였다. 문장 내의 각 음소에 대해 지속시간과 피치 변화 그리고 크기 변화를 구하고, 곡선적응 방법을 이용하여 각 변화 곡선에 대한 다항식 계수와 초기치를 구해 운을 데이터베이스를 구축한다. 이 운을 데이터베이스의 일부를 인공 신경망을 훈련시키는데 이용하고, 나머지를 이용해 인공 신경망의 성능을 평가한 결과 운을 데이터베이스를 계속 확장하면 좀더 자연스러운 운율을 발생시킬 수 있음을 관찰하였다.

  • PDF

Applicability of Two-Poisson Model to Korean Literature (2-포아송 모형의 한국어 문헌 적용성)

  • 최대식;정영미
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 1999.08a
    • /
    • pp.9-12
    • /
    • 1999
  • 통계적 확률이론에 근거한 포아송 모형을 색인어 선정 기반으로 활용하고자 하는 2-포아송 함수와 3-포아송 함수 및 다중 포아송 함수에 대한 단계적 발전 과정을 살펴보았다. 아울러, 2-포아송이 한국어 문헌의 색인어 선정에 유용한지 알아보기 위해 한국어 말뭉치 데이터베이스 내 문헌 50개를 실험 대상으로 단어의 장서빈도와 문헌빈도를 이용하여 z값을 산출해 보았다.

  • PDF

Shape Decomposition of Handwritten Hangul Characters (필기 한글 문자의 모양 분해)

  • Park, Jeong-Seon;Hong, Gi-Cheon;O, Il-Seok
    • Journal of KIISE:Software and Applications
    • /
    • v.28 no.7
    • /
    • pp.511-523
    • /
    • 2001
  • 필기 한글의 문자나 단어 인식에 있어 패턴을 구성하는 획 성분을 추출하는 작업은 매우 중요하다. 세선화와 직선근사에 기반한 고전적인 방법은 원래 패턴을 크게 왜곡한다는 단점을 가지고 있다. 우리는 이러한 문제점을 해결하기 위하여 한글 패턴에 적합한 모양 분해 알고리즘을 제안한다. 한글 패턴은 T-접점과 B-접점이라는 두가지 모양 특징을 중심으로 분할할 수 있다고 관찰에 근거하여 알고리즘을 설계하였다. 또한 세 개 이상의 획이 복잡한 형태로 만나는 결합 지점을 강전하게 처리하는 방법도 제시한다. 제안한 알고리즘을 PE92 데이터베이스에 적용한 결과를 제시한다.

  • PDF

The Design for Ancient Literature Retrival System Using XML (XML 기반의 고문헌 검색 시스템 설계)

  • 이근우;이근무
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2001.06a
    • /
    • pp.390-394
    • /
    • 2001
  • 논문에서는 최근 인터넷 상에서 표준 공통 포맷으로 대두되는 XML을 이용하여 웹 기반의 역사자료의 데이터베이스 검색 시스템을 설계 및 구현하였다. 원격 교육 시스템의 참조문헌 지원 시스템을 설계하였다. 컴퓨터 상에서 고문헌 자료 주로 한자를 입력하고 검색할 수 있는 환경이 점차 나아지고 있다고는 하지만, 여전히 원전사료의 한자를 일반적인 환경에서 자유롭게 구현하는 일은 결코 용이하지 않다. 종래의 연구자들은 텍스트 별로 수작업으로 작성한 색인류를 이용하여 연구를 해왔다. 그러나 이러한 색인 이용방법에는 문제가 있다. 색인어로 삼고자 하는 단어를 텍스트에서 추출하는 과정에서 누락되는 경우가 있기 때문이다. 전산화된 데이터는 이른바 '발견적 이용'이라는 관점에서 활용될 수 있다.

  • PDF

해외안테나 / E2A

  • ReSeu, Eo-Ni
    • Digital Contents
    • /
    • no.9 s.88
    • /
    • pp.50-51
    • /
    • 2000
  • 모두에게 가장 방심할 수 없는 위협인 끝없이 확장되어가는 두문자어에 대해 미군에게 감사해마지 않는다. 컴퓨터 Y2k문제는 생수 판매에 있어서는 호재였지만 두자리 숫자 연도 버그는 1973년 카호우렉 혜성이 출현하지 않음을 지나치게 강조하였던 것과 거의 동일한 효과를 가졌었다. 여러분은 단어를 축약시키는 두문자어에 대해 무엇을 기해했는가? 여러분이 기억하는 바와 같이 몇년전 이 문제에 대한 심각한 논의가 시작되었을 때 이는 2000년 버그라 칭해졌었고 그리곤 곧 Y2000으로 줄여지더니 다시 Y2K로 단축되었다. 마침내 이는 "체!"가 되었고 본질적으로 사라져버렸다.

  • PDF

Development of a Pseudomorpheme-Based Large Vocabulary Continuous Speech Recognizer (의사형태소 단위 대어휘 연속 음성 인식기 개발)

  • 권오욱
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.08a
    • /
    • pp.320-327
    • /
    • 1998
  • 대어휘 연속음성인식을 목표로 개발한 의사형태소 단위의 인식기를 기술하였다. 먼저 의상형태소를 정의하고, 의사형태소 태거를 간단히 기술하며, 의사형태소의 병합에 의한 인식단위 결정방법, 의사형태소 단위 인식기에서 특히 고려되어야 할 음향모델링, 품사 정보를 이용한 언어모델 및 어절규칙의 적용 방안, 의사형태소 단위 인식을 위한 새로운 탐색기 구조를 기술한다. 약 5,500 어절의 인식어휘를 갖는 여행계획 영역의 대화체 연속음성 데이터베이스를 이용하여 초벌 인식실험을 한 결과, 의사형태소 단위의 인식기의 단어인식률은 66.4%, 어절인식률은 60.0%를 나타내었다.

  • PDF

콘텐츠연재 / 이제 콘텐츠에 돈되는 색깔을 입히자

  • Im, Eun-Mo
    • Digital Contents
    • /
    • no.10 s.89
    • /
    • pp.86-91
    • /
    • 2000
  • 한국 방송은 새로운 역사를 거듭 쓰고 있다. '거듭'이라는 단어의 의미가 주는 무게는 남다르다. 남북화해 무드에 편승해 백두산과 한라산에서 남북동시 3원 생방송을 위시해 방송의 날(매년 9월 3일)을 기념해 KBS와 MBC가 디지털 방송을 시작한 것이 그것이다. 이들 양사보다 한발 앞선 SBS는 2000년 8월 31일부터 디지털 시험 방송을 시작함에 따라 지상파 3사는 모두 디지털 방송시대에 돌입하게 되었다. 이들 지상파 방송 3사는 디지털 방송을 위해 1999년 1월부터 장비도입 등 준비작업에 박차를 가한 결과라 시청자는 물론 방송 업계와 콘텐츠 관련 업계는 모두 새로운 디지털 콘텐츠 시대를 실감하고 그 준비에 하루 24시간이 늦가을 하루해 만큼 짧게 느끼고 있다.

  • PDF

A Survey on the Off-line of Handwritten Korean Characters (필기 한글 문자의 오프라인 인식에 관한 사례 연구)

  • 김수형;정선화;오일석
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10c
    • /
    • pp.396-398
    • /
    • 1998
  • 본 논문에서는 필기 한글 문자의 오프라인 인식 기술에 관련하여 최근 5년 동안 발표된 연구 사례를 종합하여 향후의 연구자들이 연구 방향을 설정하고 방법론을 개발하는데 도움이 되도록 함음 물론, 당 분야 연구의 발전 방향을 모색하고자 한다. 사례 조사의 범위는 필기 한글 문자 인식에 관련된 문자 데이터베이스, 낱자 인식, 단어 인식의 세 가지 핵심 요소 기술로만 국한하였으며 이들 각각에 대한 향후 연구의 방향을 제시하였다.

  • PDF

A post processing of continuous speech recognition using N-gram words and sentence patterns (문형정보와 N-gram 단어정보를 이용한 연속음성인식 후처리)

  • 엄한용;황도삼
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.324-326
    • /
    • 2000
  • 본 논문에서는 항공편 예약이라는 제한 영역에서의 연속음성인식 시스템을 위한 후처리 본 논문에서는 항공편 예약이라는 제한 영역에서의 연속음성인식 시스템을 위한 후처리 방안을 제시한다. 제안하는 후처리 방안은 200 문장의 항공편 예약 텍스트 데이터를 이용하여 문형 정보를 추출한 뒤 특정 문형별로 분류하였다. 분류된 문형과 음성인식 후의 문장을 비교하여 가장 유사한 문형을 추론한다. 추론한 특정 문형에서 나올 수 있는 형태소를 형태소들간의 N-gram 정보가 수록된 데이터베이스를 이용하여 형태소를 수정하고 보완한 결과를 최종 문장으로 출력한다.

  • PDF

전략 시나리오

  • Hwang, Bu-Yeong
    • Digital Contents
    • /
    • no.5 s.156
    • /
    • pp.102-105
    • /
    • 2006
  • 영어 표현에 "What…?" 라는 것이 있다. 만약 상황이 이렇게 된다면 어떻게 되는 거냐고 묻는 말이다. 어떤 상황을 전제로 하거나 기정사실로 상정했을 때, 만일 그렇지 않다면 어떻게 되는 거냐고 되묻는 말이다. 휴일에 다같이 피크닉 가자고 했을 떄 "만일 비가 오면 어떻게 되는 겁니까?'라고 묻는 식이다. 그럴 리 없다고 확신하는 경우, 이런 질무은 사람들의 짜증을 불러일으킬 수도 있다. 분명히 일기예보에 그 날 날씨가 맑다고 확인했다면 더 짜증이 날 것이다. 하지만 정작 당일에 비가오면 어떡할 것인가. 두 단어로 긴 우리말을 대체하는 영어표현이 멋있다는 것이 아니다. 그저 이 표현이 전략을 입안하고 실천하는 사람들이 잊지 말아야할 기본 태도를 잘 나타낸 것이라고 본다.

  • PDF