• Title/Summary/Keyword: 자동 음성인식

Search Result 247, Processing Time 0.029 seconds

음성인식을 위한 은닉마코프모형 연구

  • 손건태;정상화;박민욱
    • Communications for Statistical Applications and Methods
    • /
    • v.5 no.1
    • /
    • pp.155-165
    • /
    • 1998
  • 음성자동인식을 위한 통계적 방법으로 은닉마코프모형이 널리 사용되고 있다. 이산형 은닉마코프모형보다 인식률이 우수한 연속형 은닉마코프모형을 고려하였으며, 인식을 위한 비터비(Viterbi) 알고리즘을 병렬화시켜 인식속도를 빠르게 하는 인식 알고리즘을 제안하였다. 제안된 방법으로 실험을 통하여 인식률과 인식속도 개선률(speed-up)을 살펴보았다.

  • PDF

통신망 기반 음성연어 응용기술

  • 구명완;정영준
    • Korea Information Processing Society Review
    • /
    • v.11 no.2
    • /
    • pp.104-109
    • /
    • 2004
  • KT는 음성언어기술 연구를 10여년 이상 진행하여 왔다. 1990년 초에는 음성번역 연구를 중심으로 기초기술을 수행하여 왔으며 그 결과 1995년 5월 16일에 한-일 간 호텔예약을 위한 자동통역시험을 전자통신연구원, 일본 KDD(국제전신전화회사)와 성공적으로 수행하였다. 1995년 이후부터 유/무선통신망 응용연구 및 개발을 중심으로 수행하였다. 먼저 음성인식 증권정보 서비스를 1995년 가을부터 국내 최초로 시험서비스를 수행하였으며 1998년에는 음성인식 무인자동 교환서비스도 개발하였다(1). 2000년부터는 VoiceXML기 반 음성 언어 시스템을 개발하였으며 이를 지능망(Advanced Intelligent Network)에 수용하기 위해서 IP(Intelligent Peripheral) 에 음성인식, 음성합성기 및 VoiceXML 해석기를 통합하기 위한 연으로 다양한 음성언어서비스를 개발하여 출시하기 시작하였다[2][3][4].(중략)

  • PDF

Automatic Segmentation Using LPC Smoothed Log Amplitude Spectra (LPC Smoothed Log Amplitude Spectra를 이용한 자동 음성 분할)

  • 김도한;이상운;이기정;홍재근
    • Proceedings of the IEEK Conference
    • /
    • 2000.09a
    • /
    • pp.795-798
    • /
    • 2000
  • 연속음 인식과 음성 합성을 위해서는 정밀한 음성학적 모델과 연속 음성에 적용 가능한 언어 모델의 개발이 중요하다. 이를 위해서는 음성 데이터 베이스에 대한 인식 단위, 혹은 합성 단위의 분할이 필요한데, 수동음성 분할은 일관성의 유지가 어렵고 긴 시간이 소요되므로 최근에는 자동 분할 기술이 많이 연구되고 있다. 자동 음성 분할 기법으로는 시간 영역이나 주파수 영역특징 벡터의 천이를 분석하는 방법과 특징 벡터간의 상관도를 구하여 경계를 추출하는 방법이 있다. LPC smoothed log amplitude spectra는 음성의 주파수 영역의 특징을 잘 나타내며, 동일 음소 내의 상관도가 서로 다른 음소의 상관도보다 더 크고, 음소의 경계구간에서 급격한 상관도의 변화를 보인다. 이 특성을 이용하여 이웃 프레임에 대한 상관도의 방향성이 특정조건을 만족하는가를 검사하여 음소의 경계를 구하는 방법을 찾았다. 또한 LPC. 이득 인자만으로 묵음 구간을 검출하는 방법을 제시한다. 이렇게 하면 묵음 구간검출과 음소 경계 검출의 일관성을 향상시키고 수행 시간을 단축시킬 수 있다. 제안한 기법으로 허용 오차 20ms 이내에서 연속음성에 대한 음소 경계 검출 실험을 수행한 결과, 수작업으로 행한 경계 검출 지점의 약 88%를 정확히 검출하였다.

  • PDF

A Study on the Development of Automatic Schedule Management System through Speech Recognition Text Analysis (음성인식 텍스트 분석을 통한 자동 일정 관리 시스템 개발에 관한 연구)

  • Lee, Hae-Mi;Cho, We-Duke
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2022.05a
    • /
    • pp.279-282
    • /
    • 2022
  • 컴퓨터가 마이크 등의 소리 센서를 통해 얻은 음향학적 신호를 단어나 문장으로 변환시키는 기술인 음성 인식 기술과 인공지능 기술을 결합한 음성 대화 시스템에 대한 연구 진행 및 제품 출시가 활발하게 이루어지고 있다. 기존의 시스템을 사용하면서 날짜와 시간 외의 정보 추출 정도가 빈약하거나 자동 등록이 되지 않는 문제점을 확인하였다. 음성 인식 기술을 통해 얻은 텍스트에서 보다 많은 정보를 추출하고, 자동 등록 및 알림과 맛집 등 추가 정보 제공 시스템을 구축하는 것을 목표로 하였다.

Fuzzy Model for Speech Emotion Recognition (음성으로부터의 감정 인식을 위한 퍼지모델 제안)

  • Moon, Byung-Hyun;Jang, In-Hoon;Sim, Kwee-Bo
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2008.04a
    • /
    • pp.115-118
    • /
    • 2008
  • 본 논문에서는 음성으로부터 감정을 인식하고 감성적인 운율로 음성 출력을 산출해 내는 시스템을 제안 한다. 음성적인 운율로부터 감정을 인식하기 위해서 퍼지룰(rule)을 이용한다. 본 논문에서 감정 인식 시스템은 음성 샘플들로 학습 데이터를 구축하고 이를 기반으로 하여 추출된 20개의 특징 집합으로부터 가장 중요한 특징들을 자동적으로 선택한다. 화남, 놀람, 행복, 슬픔, 보통의 5가지 감정 상태를 구분하기 위하여 접근법에 기반한 퍼지를 이용하였다.

  • PDF

A Korean Speech Database for Use in Automatic Translation (자동통역용 한국어 음성 데이터베이스)

  • 최인정
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1994.06c
    • /
    • pp.287-290
    • /
    • 1994
  • 음성 인식 시스템의 개발을 위해서는 음성 데이터베이스구축이 중요한 과제의 하나로서, 많은 시간과 노력이 요구된다. 개별적인 음성데이타베이스 구축에 따른 중복 투자를 줄이고 다양한 인식 알고리듬의 성능 비교와 국내 음성 인식 기술의 발전을 위해서는 벤치마크 시험을 위한 공통의 음성 데이터베이스가 필수적이다. 본 논문에서는 한국과학기술원 통신연구실에서 제작한 한국어 음성 데이터베이스에 관하여 기술한다. KAIST 음성데이타베이스는 자동통ㅇ역을 N이한 무역 상담과 관련되 3,000 단어 규모의 연속어를 비롯하여, 가변 길이 연결 숫자음, phoneme-balanced 75 고립단어, 지역명 관련 500 고립단어, 한국어 아-세트로 구성되어 있다. 이 음성 데이터베이스의 구축을 위하여 사용된 태스크선정 절차, 녹음 방법, 규격, 및 기대효과 등 세부사항을 기술한다.

  • PDF

Performance Comparison and Verification of Lip Parameter Selection Methods in the Bimodal Speech ]Recognition System (입술 파라미터 선정에 따른 바이모달 음성인식 성능 비교 및 검증)

  • 박병구;김진영;임재열
    • The Journal of the Acoustical Society of Korea
    • /
    • v.18 no.3
    • /
    • pp.68-72
    • /
    • 1999
  • The choice of parameters from various lip information and the robustness of extracting lip parameters play important roles in the performance of bimodal speech recognition system. In this paper, lip parameters are extracted by using an automatic extraction algorithm and inner lip parameters effect on the recognition rate more than outer lip parameters. Compared with a manual extraction algorithm, the automatic extraction method is evaluated about its robustness.

  • PDF

A Study on The Automatic Caption System for Hearing Impaired Person (청각장애인을 위한 자동 자막 시스템)

  • Park, Hyon-Gun;Lee, Hee-Suk;Lee, Sang-Moon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2010.07a
    • /
    • pp.335-336
    • /
    • 2010
  • 장애인도 비장애인과 정보접근 기회를 동일하게 가질 권리가 있다. 하지만 청각장애인은 의사소통 수단이나 정보획득의 수단으로부터 소외됨으로써 다양한 사회적 참여에서 배제되기 일쑤였다. 따라서 이 논문에서는 청각장애인을 위한 음성인식을 이용한 자동 자막 시스템을 제안한다. 이 논문에서 제안하는 시스템은 음성 특징 파라미터 추출과 DTW에 의한 음성인식을 통해 음성을 추출하여 화면에 자막으로 나타나게 하는 시스템이다.

  • PDF

Automatic Speech Recognition Research at Fujitsu (후지쯔에 있어서의 음성 자동인식의 현상과 장래)

  • Nara, Yasuhiro;Kimura, Shinta;Loken-Kim, K.H.
    • The Journal of the Acoustical Society of Korea
    • /
    • v.10 no.1
    • /
    • pp.82-91
    • /
    • 1991
  • The history of automatic speech recognition research, and current and future speech products at Fujitsu are introduced here. The speech recognition research at Fujitsu started in 1970. Our research efforts have results in the production of a speaker dependent 12,000 word discrete / connected word recognizer(F2360), and a speaker independent 17 word discrete word recognizer(F2355L/S). Currently, we are working on a larger vocabulary speech recognizer, in which an input utterance will be matched with networks representing possible phonemic variations. Its application to text input is also discussed.

  • PDF

Automatic Recognition of Sentence-final Intonatio Patterns for Korean Predicates (한국어 서술어의 문장만 위치에서의 억양패턴에 대한 자동인식)

  • 이기영
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1995.06a
    • /
    • pp.131-134
    • /
    • 1995
  • 최근, 문장단위의 음성을 인식할 수 있는 시스템을 개발하는 단계에 접어들면서 자발적인 발성음성의 인식 또는 음성언어 이해의 차원을 위한 시스템의 개발을 위해 운율특징을 이용하는 연구가 요구되고 있으나, 지금까지 개발되어온 음성이식시스템은 주로 독립단어의 인식수준에 머물고있기 때문에 운율을 이용하고자 하는 연구가 상대적으로 미흡한 수준에 있다. 본 연구에서? 나국어의 중의성 문장에서 서술어 부분을 세그멘트하고 이 부분의 억양패턴을 자동인식하여 중의성 문장이 서술형, 의문형, 명령형, 권유형인지를 파악하므로써 인식시스템에서 억양패턴을 이용할 수 있는 가능성을 제시하였으며, 서술형 문장음서으이 서술어 부분의 억양변황에 의해 의문형, 명령형, 권유형 무장으로 변환시키므로써 서술어 부분의 억양패턴에 따라 문장의 형태가 구분될 수 있음을 확인하였다.

  • PDF