• Title/Summary/Keyword: 음성이해 시스템

Search Result 85, Processing Time 0.028 seconds

Statistical Korean Spoken Language Understanding System for Dialog Processing (대화처리를 위한 통계기반 한국어 음성언어이해 시스템)

  • Roh, Yoon-Hyung;Yang, Seong-II;Kim, Young-Gil
    • Annual Conference on Human and Language Technology
    • /
    • 2012.10a
    • /
    • pp.215-218
    • /
    • 2012
  • 본 논문에서는 한국어 대화 처리를 위한 통계기반 음성언어이해 시스템에 대해 기술한다. 음성언어이해시스템은 대화처리에서 음성 인식된 문장으로부터 사용자의 의도를 인식하여 의미표현으로 표현하는 기능을 담당한다. 한국어의 특성을 반영한 실용적인 음성언어이해 시스템을 위해서 강건성과 적용성, 확장성 등이 요구된다. 이를 위해 본 시스템은 음성언어의 특성상 구조분석을 하지 않고, 마이닝 기법을 이용하여 사용자 의도 표현을 생성하는 방식을 취하고 있다. 또한 한국어에서 나타나는 특징들에 대한 처리를 위해 자질 추가 및 점규화 처리 등을 수행하였다. 정보서비스용 대화처리 시스템을 대상으로 개발되고 있고, 차량 정보서비스용 학습 코퍼스를 대상으로 실험을 하여 문장단위 정확률로 약 89%의 성능을 보이고 있다.

  • PDF

FA의 새로운 전개(중)

  • 이봉진
    • Journal of the Korean Society for Precision Engineering
    • /
    • v.4 no.4
    • /
    • pp.6-12
    • /
    • 1987
  • 지능화(Intelligence) 전반적인 경향 : 생산분야에 있어서의 지능화는 인공지능(AI)기법이 활용되면서 부터 관심을 모으게 되었다. AI기법이라고 하여도 그에 관련된 기술은 Software기술, 지식표현과 같은 기초기술 에서 부터, 지식공학, 화상인식 이해, 자연언어 이해, 음성이해 등의 응용기술에 이르기까지 다양한 분야를 포함하고 있다. 여기서는, 최근 실용화 면에서 주목을 받고 있는 지식공학의 실용 또는 그 응용시스템인 expert system(전문가시스템)에 주목하면서, 설계와 공정설계 중에 최근의 AI활용과 동향을 요약해 보기로 한다.

  • PDF

A study on the Stochastic Model for Sentence Speech Understanding (문장음성 이해를 위한 확률모델에 관한 연구)

  • Roh, Yong-Wan;Hong, Kwang-Seok
    • The KIPS Transactions:PartB
    • /
    • v.10B no.7
    • /
    • pp.829-836
    • /
    • 2003
  • In this paper, we propose a stochastic model for sentence speech understanding using dictionary and thesaurus. The proposed model extracts words from an input speech or text into a sentence. A computer is sellected category of dictionary database compared the word extracting from the input sentence calculating a probability value to the compare results from stochastic model. At this time, computer read out upper dictionary information from the upper dictionary searching and extracting word compared input sentence caluclating value to the compare results from stochastic model. We compare adding the first and second probability value from the dictionary searching and the upper dictionary searching with threshold probability that we measure the sentence understanding rate. We evaluated the performance of the sentence speech understanding system by applying twenty questions game. As the experiment results, we got sentence speech understanding accuracy of 79.8%. In this case, probability ($\alpha$) of high level word is 0.9 and threshold probability ($\beta$) is 0.38.

A Study on the Word Selection for Intelligibility Assessment of Synthesized Speech by Rule (규칙 합성음성의 이해성 평가를 위한 단어표 구성에 관한 연구)

  • 홍진우;김순협;강성훈
    • The Journal of the Acoustical Society of Korea
    • /
    • v.9 no.6
    • /
    • pp.22-28
    • /
    • 1990
  • 최근에 음성합성 기술이 발전됨에 따라 이러한 기술을 이용한 새로운 통신 서비스가 등장하고 있으며 그 표준 설정에 있어서 음성 품질은 아주 중요한 요인이 된다. 따라서, 시스템 알고리즘의 진단 적 평가 및 평가치의 상호 비교를 위해 품질 평가방법을 개발하는 것은 매우 중요하다. 본 논문에서는 규칙 합성음성의 이해성 평가를 위한 기본적 사항들과 개념을 기술하고 ,이해성 평가에 사용되는 단어 표를 구성하는 방법과 단어표를 제안하였다.

  • PDF

Implementation of Voice Support Calendar Management System Using TTS (TTS를 이용한 음성지원 일정관리 시스템의 구현)

  • Lee Se-Hwan;Kim Bong-Hyun;Kim Seung-Youn
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.05a
    • /
    • pp.501-504
    • /
    • 2006
  • 본 논문에서는 텍스트로 구성된 문서에 대한 음성 변환 시스템의 각 분야에 대해 기술하고, 음성합성 기술인 TTS기반의 음성지원 일정관리 시스템 설계 및 구현 부분에 대하여 설계한다. 이를 위해서 음성합성 기술의 개념 및 원리와 구조 등을 이해하고, 시스템 설계 및 구현을 하고자 한다. 시스템 설계 구현부에는 Speech SDK 5.1(음성합성엔진)을 사용하여 음성합성 기술부분을 처리하고, 이를 바탕으로 C# 언어를 사용하여 구현한다. 기존 텍스트기반의 일정관리 시스템 설계 부분에다가 음성합성 기능을 추가하여 텍스트의 지루함을 탈피하고, 음성 기술을 접목시켰다. 본 논문에 사용되는 엔진은 영문위주의 음성합성이므로 시스템 설계 부분에 있어 음성처리 부분을 영문으로 하여 결과물을 산출하였다. 최종적으로 실험에 의해 제안한 방법의 유용성을 입증한다.

  • PDF

Acoustic Properties of the Jeonju World Cup Stadium (전주월드컵 경기장의 음향특성 평가)

  • Yeon Chul-Ho;Haan Chan-Hoon
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.495-500
    • /
    • 2002
  • 전주월드컵 경기장은 Fully Digital sidelobe-free array 방식의 음향시스템을 도입한 유일한 경기장으로서 대규모 경기장에 Line Array type의 스피커를 사용한 최초의 예가 된다. 현장음향실험을 통하여 경기장의 주요 음향 파라미터인 음압레벨(SPL), 잔향시간(RT), 음성명료도(D50), 음성이해도(RASTI) 등을 측정함으로 전주월드컵 경기장의 음향시스템의 특성과 종합적인 음향성능을 알아보고자 한다. 주음원(Messenger)만 사용하여 실험한 결과 음압레벨(SPL)은 관중석의 객석간 위치별 음압레벨 표준편차가 약 2.78dB로 나타났다. 이 값은 당초의 음압레벨분포편차의 목표치인 ${\pm}3dB$의 범위 이내로 나타났다. 또한 최대음압레벨은 평균 100.1dB로 목표치인 96dB을 초과하는 것으로 나타났다. 잔향시간(RT)은 공석시 전체 관중석 평균 2.94초로 나타났으며, 1000Hz에서의 평균 잔향시간은 2.58초로 나타났다. 잔향시간은 실제 경기장의 사용 시 약 0.3-0.4초의 감소가 발생되리라 판단된다. 음성명료도(D50)는 전체 관중석 평균 $56.2\%$로 매우 양호한 상태로 나타났고 음성이해도(RASTI)는 전체 관중석 평균 0.63으로 목표치인 0.5를 상회하는 것으로 나타났다. 이상의 현장음향실험 결과를 분석한 결과 전주월드컵 경기장의 음향성공은 음향설계 요건을 만족하는 것으로 나타났고 야외 경기장 같은 대형공간에서의 음향시스템에 있어서 Fully Digital sidelobe-free array 방식의 음향시스템의 적용가능성을 보여주고 있는 것으로 나타났다.

  • PDF

A Study on the Architecture and Learning of the Artificial Neural Networks for Prosody Generation of Korean Sentence (한국어 운율 발생용 인공신경망의 구조 및 학습에 관한 연구)

  • Min Kyung-Joong;Lim Un-Cheon
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.135-138
    • /
    • 2004
  • 음성처리기술은 정보화 시대를 위한 주요 기술의 하나이다. 이 중에서도 음성합성의 연구는 디지털 신호처리 기술과 컴퓨터의 발달로 활발히 진행되고 있다. 그러나 음성 합성기에 의해 발생된 합성음의 음질은 이해도 면에서는 상당한 진전이 있었지만, 자연감 면에서는 만족한 수준에 도달할 수 없었는데, 이러한 합성시스템의 문제점을 해결하는 방법은 다양하게 적용되는 언어정보와 합성음의 자연감을 결정하는 정확한 운율정보가 필요하다. 그러나 구한 운율 정보가 자연음에 존재하는 모든 운율 법칙을 포함할 수 없고, 또한 추출한 운율 법칙이 틀린 것이면 자연감이나 이해도가 떨어지는 합성음이 만들어지고 이것은 음성 합성 시스템의 실용화에 장애로 작용할 것이다. 본 논문은 한국어 음성 합성 시 문제가 되는 자연감을 높이기 위한 한 방법으로 자연음에 내재하는 운율 변화를 효율적으로 학습할 수 있는 인공 신경망을 제안하였다.

  • PDF

A Study of Speech Recognition Web Services Environment for Voice Browser (Voice Browser를 위한 음성 인식 웹서비스 환경에 관한 연구)

  • Hong, In-Suk;Kim, Yoon-Joong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2009.04a
    • /
    • pp.142-145
    • /
    • 2009
  • 음성인터페이스 관련 표준화는 음성 대화, 음성인식/합성, 전화망 등의 접속망을 상호 분리하여 음성정보시스템 구성요소들 각각의 상호 독립적인 개발을 보장해 주며, 각 요소의 이해가 없이도 음성정보시스템을 개발할 수 있도록 함으로써 음성정보기술의 보급 및 확산에 크게 기여하고 있다. 이에 W3C에서는 Voice Browser에 대한 표준화를 현재 진행 중에 있으며 Vocie Browser WG에서 Voice Browser를 위한 SIF(Speech Interface Framework)를 제안하였다. 제안된 SIF에서 Voice Browser가 음성인식을 실행하기 위해서는 많은 자원의 소요와 부하가 생길 수 있다. 이러한 문제점을 해결하기 위해 본 논문에서는 음성인식 웹 서비스를 기존의 SIF에 추가한 새로운 형태의 SIF를 제안하고자 한다. 음성인식은 원격 시스템에서 수행하고 그 결과를 Voice Browser가 사용할 수 있도록 음성인식 웹서비스 환경을 구축하였다. 그리고, XML-SRGS 포멧의 grammar를 음성인식기가 사용하는 EBNF 포멧의 grammar로 변환시키는 변환기를 구현하였다.

Design of an Automatic Speech translation system on the Telephone Line (전화망을 통한 자동음성번역 서비스 시스템 설계)

  • Lee Sung-Joo;Lee Yunggik;Yang Jea-Woo
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.57-60
    • /
    • 2002
  • 본 논문에서는 현재 ETRI에서 개발 중인 유/무선 전화망을 통한 다국어간 대화체 음성번역서비스 시스템에 대해서 소개한다. 전화망을 통한 자동음성번역서비스 시스템은 여행대화영역을 서비스 대상영역으로 하고 있고 자동음성번역서비스를 필요로 하는 사용자들은 동일한 장소에서 대면하고 있으며 서로 다른 언어를 사용하기 때문에 서로 의사 소통에 어려움을 겪고 있다고 가정한다. 따라서 여기서 말하는 자동음성번역 시스템의 특징은 인간과 기계간의 인터페이스를 그 대상으로 하는 것이 아니라 인간과 인간사이의 인터페이스를 그 대상으로 하고 있다는 정이다. 인간과 인간사이의 인터페이스 상황에서는 인간의 이해력이 시스템 오류를 정정할 수 있는 여지를 지니고 있다. 따라서 시스템이 사용자의 말하는 의도 혹은 개념만 잘 전달할 수 있다면 서로 다른 언어를 사용하는 사용자들 사이에서도 이러한 시스템을 통한 의사소통이 가능하다. 자동음성번역서비스 시스템은 크게 음성인식모듈 문장해석 및 번역 모듈, 음성합성모듈, 시스템통합 모듈 그리고 전화망 인터페이스 모듈로 나뉜다. 여기서는 자동음성번역 서비스 시스템의 각 모듈들의 주요 특징과 상호 인터페이스 방법에 대해서 소개한다.

  • PDF

Construction of the Standard Telephone Speec Database in Korean (한국어 표준 전화 음성 데이터 베이스 구축)

  • 김종교
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06a
    • /
    • pp.5-9
    • /
    • 1998
  • 음성처리 연구자들이 연구 수행을 하기 이해서 최초로 해야 할 일은 음성학적 범주가 풍부한 많은 사람이 발성한 음성 데이터의 확보이다. 그러나 음성 데이터를 확보하는 데는 많은 시간과 노력이 소요되므로 음성 DB의 구축이 필요하다. 따라서 본 연구에서는 한국어 전화 음성 인식 기술 연구시 시스템의 객관적 성능평가와 알고리즘 개발등에 모든 연구 개발자들이 공통으로 사용할 수 있는 표준 음성 데이터 베이스를 구축하여 국내 음성처리 연구의 활성화를 꾀할 수 있도록 하였다.

  • PDF