Search | Korea Science

A study on the recognition of continuous speech using CHMM word spotting (CHMM Word Spotting 기법을 이용한 연속음성 인식에 관한 연구)

김수훈
- Proceedings of the Acoustical Society of Korea Conference
- /
- 1994.06c
- /
- pp.373-377
- /
- 1994
연속음성 인식 시스템 구성을 위한 HMM WORD SPOTTING 기법을 검토하였다. 실험에 사용한 HMM WORD SPOTTING 기법은 O(n)DP 기법와 OPDP 법이다. 인식시스템은 파라메터로 멜켑스트럼 만을 사용한 경우와 동적 파라메터인 희귀계수를 결합한 경우의 2종류이며, 인식 알고리즘은 O(n)DP 법과 유한상태 오토마타에 의해 구문제어를 실？나 ONE PASS DP 법으로 나눌 수 있다. 또한 인식 단위는 음절과 단어가 혼합된 형태이고 학습은 모두 음절단위로 실시하였으며 연속음성 25문장에 대하여 O(n)DP법과 OPDP법의 인식결과를 비교하여 연속음성 인식에 구문제어 효과를 검증하였다. 실험 결과 평균 인식률이 O(n)DP 의 경우 각각 90.6%, 90.9%, OPDP 의 경우 각각 98.4%, 98.6%로 유한 상태 오토마타에 의한 구문제어를 이용한 평균 7.5%의 인식률이 향상되었다.
PDF

A Korean Continuous Speech Recognition System for finding N-best Sentence Hypotheses (N개의최적문장을 찾을 수 있는 한국어 연속음성인식 시스템)

구명완
- Proceedings of the Acoustical Society of Korea Conference
- /
- 1994.06c
- /
- pp.48-51
- /
- 1994
본 논문은 N개의 최적문장을 찾을 수 있는 한국어 연속 음성인식시스템 개발과 성능실험에 관한 것이다. 개발된 연속 음성인식시스템은 462개의 단어로 이루어지며 언어 복잡도가 30인 연속문장을 인식할 수 있으며 언어처리, 기계번역 등과 같이 쉽게 정합되어 문장 인식률을 향상시킬 수 있도록 N개의 최적문장도 찾을 수 있다. 또한 인식의 기본단위로 triphone을 사용하였으며 단어간, 단어내의 조음현상도 모델링하였다. 남성화자 3인에 대한 화자독립 실험 결과 단어 인식율은 95.7%을 얻었으며 문장 인식율은 하개의 최적문장인 경우 88.5%, 5개의 최적문장을 고려하면 98.6% 문장 인식률을 얻었다.
PDF

SPOT Continuous Strip Image Modelling (SPOT 위성영상의 연속화상 모델링)

Lee, Yong-Ung;Sin, Dae-Sik;Jo, Bong-Hwan;Yu, Bok-Mo
- 한국지형공간정보학회:학술대회논문집
- /
- 1997.12a
- /
- pp.17-25
- /
- 1997
스트립 방식으로 촬영된 위성영상의 기하학적 모델링시에는 일반적으로 단위모델별로 위성영상에서 식별이 용이한 지점을 지상기준점으로 선정하여 영상에서의 좌표를 해석도화기나 컴퓨터 화면상에서 획득하고, 그에 대응하는 지상좌표는 현지측량이나 기본지도로부터 얻는다. 현지측량방법의 경우에는 정확하고 신뢰성있는 좌표를 제공해 줄 수 있는 반면에 현지로의 접근이 용이해야 하고 비용과 시간이 많이 소요되며, 소축척의 기본지도상에서 직접 독취하는 경우에는 지도자체에 내재된 오차의 정도가 불명확하고 지상기준점으로 선정한 지점이 명확히 표기되어 있지 않은 경우가 있으므로 영상좌표 측정시에 오차의 유발 가능성이 크다. 특히 영상 해상도 $5{\sim}10m$의 연속된 화상을 3차원 기하학적 모델링을 수행하기 위하여 현지측량에 의해 지상기준점을 획득하는 방법은 경제성 및 효율성 측면에서 불리하다. 따라서 본 연구에서는 삼각점 조서를 이용하여 연속촬영된 SPOT 위성영상을 스트립 단위로 모델링하여 영상해상도 수준의 위치정확도를 얻을 수 있는 연속화상 모델링기법을 제시하였다.
PDF

Morpheme Graph Generation with HMM based Continuous Speech Recognition (HMM에 기반한 연속음성인식에서의 형태소 그래프 생성)

Choi, Joon-Ki;Lee, Geun-Bae;Lee, Jong-Hyeok
- Annual Conference on Human and Language Technology
- /
- 1997.10a
- /
- pp.500-504
- /
- 1997
본 논문에서는 형태소 그래프를 정의하고 이를 한국어 연속 음성 인식의 결과로서 사용함과 동시에 한국어의 자연어 처리를 위한 지식 표현 방법으로 사용한다. 또한 형태소 그래프를 연속 음성 인식과정에서 효율적으로 생성하는 알고리즘으로서 Tree-Trellis 탐색 알고리즘을 소개한다. 한국어 연속 음성 인식기는 HMM 인식기를 사용하며 탐색 알고리즘 또한 HMM 음소 인식기의 사용을 전제로 한다. 실험 DB로는 한국과학기술원 통신연구실에서 제작한 3000 단어급의 무역상담관련 DB를 사용하였다.
PDF

Performance Evaluation of Acoustic Models According to Differences between Vocabularies in Training and Test Phases of Speech Recognition (음성 인식에서 훈련 및 인식 과정에 사용되는 대상 어휘의 차이에 대한 음향 모델의 성능 평가)

김회린;이항섭;권오욱
- The Journal of the Acoustical Society of Korea
- /
- v.17 no.7
- /
- pp.22-27
- /
- 1998
본 논문에서는 ETRI에서 개발한 가변 어휘 음성 인식기의 어휘 독립 음향 모델링 방법을 기술하고, 이 모델의 어휘 종속, 어휘 독립 및 어휘적응 성능을 평가하기 위하여 다 양한 고립단어 및 연속음성 DB에 대하여 실험한 결과를 분석하였다. 평가를 위하여 사용한 음성 DB로는 고립단어 음성으로 POW(Phonetically Optimized Words) 3848, PBW(Phonetically Balanced Words) 445, PBW 452, 호텔예약 244 단어, 게임 제어용 단어 등이며, 연속음성으로 일반 문장 음성 및 연속 숫자음을 이용하였다. 성능 분석 결과 40개 음소 모델만으로도 비교적 높은 인식률을 보여 주었지만, 어휘독립의 경우는 어휘종속에 비 하여 성능이 크게 낮았고, 특히 대상 어휘가 숫자음, 알파벳, 연속음 등의 경우에는 POW 데이터나 PBW 데이터만 가지고는 우수한 가변 어휘 음성 인식기를 구현하기에 한계가 있 음을 알 수 있다. 또한, 훈련 데이터의 어휘와 평가데이터의 어휘가 비슷할 경우에는 변이음 모델을 사용하면 음소 모델만을 사용할 경우에 비하여 그 성능이 우수하였지만, 일반적인 어휘독립의 상황에서는 효과가 별로 없음을 알 수 있었다.
PDF

Development of Continuous Speech Recognition System for Multimedia Mobile Terminal Applications (휴대 멀티미디어 단말용 음성인식 시스템 개발)

김승희
- Proceedings of the Acoustical Society of Korea Conference
- /
- 1998.06c
- /
- pp.59-62
- /
- 1998
본 논문에서는 한국전자통신연구원의 Handy Combi 응용 도메인을 대상으로 한 화자독립 연속음성인식 시스템 개발에 관하여 기술한다. 불특정화자가 자연스럽게 발음한 연속음성을 인식하는 기술은 펜인식 등과 더불어 멀티모달 인터페이스의 핵심 요소로서, 이동 환경에서 사용자의 다양한 요구사항을 처리하는 지능형 에이전트에 구현을 위해 필수적으로 개발되어야 하는 기술이다. 본 논문에서는 연속확률분포를 가지는 Hidden Markov Model(HMM) 기반의 연속음성인식 시스템을 구현하였다. 개발된 시스템은 음성특징벡터로 MFCC를 사용하였으며, 음소 모델의 강인한 훈련을 위해 음성학적 지식에 기반을 둔 tree-based clustering 방식을 도입하였다. 인식단계에서는 인식속도를 개선시키기 위해 beam-search 기법을 적용하였다. 인식 실험 결과, 99.7%의 어절 인식률과 98.8%의 문장 인식률을 얻었으며, 최종적인 문장의 이해도는 99% 이상이었다.
PDF

The Implementation of Continuous Digit Recognition Using DSP (DSP를 이용한 연속숫자 음성 인식기 구현)

Lee Seong-Kwon;Lim Young-chun;Seo Jun-Bae;Jung Hyun-youl
- Proceedings of the Acoustical Society of Korea Conference
- /
- autumn
- /
- pp.93-96
- /
- 2004
본 논문은 TMS320C5501 16bit DSP를 적용한 실시간 화자독립 연속 숫자인식기의 구현에 관해 서술한다. 하드웨어 모듈의 구성은 TMS320C5501 300MHz DSP, 코덱으로는 TLV320AIC1103, SDRAM, 외부장치와의 인터페이스를 위한 HPI, Uart, MIC, SPK Out 단자로 구성되었다. 음성인식 알고리즘은 HM-Net 방식을 사용하였고 고정소수점 연산처리 방식으로 C를 이용한 최적화 작업을 수행하였으며 스트리밍 방식의 인식 방법으로 실시간 처리가 가능하도록 구현하였다. 숫자 인식에 사용한 모델은 41음소에 기반한 트라이폰을 학습하였으며, 특징 파라미터로는 LPCMEL 20차를 사용하였다. 임베디드 시스템의 실시간 음성인식 시스템 구성에 중점을 두었으며 PC상에서의 성능과 비교해 볼때 본 DSP 상에서 500단어, 50문장의 인식을 평균 1.5초 전후로 인식하도록 하였으며 간단한 연결 단어 인식을 수행하는데 무리 없음을 보여준다. 특별히 한국어 연속숫자 부분에 중점을 두었고, 본 연구에서 구현된 연속 음성인식 시스템에 사용된 숫자 인식에서 음절 바이폰 모델에 대하여 $92.92\%$의 인식율을 얻을 수 있었다.
PDF

Run-time Evaluation of Selection Predicates in Multiple Continuous Queries over Data Streams (데이터 스트림에서 다중 연속질의의 선택 조건에 대한 실행 순서 결정)

Yoon, Eun-Won;Lee, Won-Suk
- Proceedings of the Korean Information Science Society Conference
- /
- 2007.06c
- /
- pp.25-28
- /
- 2007
무한히 연속적으로 발생하는 데이터 스트림에서의 연속 질의 처리는 빠른 처리 시간과 적은 메모리 사용량을 요구한다. 이런 제약 사항을 만족하기 위해 연속 질의의 선택 조건절에 사용된 같은 속성들로 그룹화하여 해당 속성들을 처리함으로써 빠르게 질의를 처리할 수 있다. 그리고 더 효율적으로 질의를 처리하기 위해 초기에 일정 기간 동안 데이터 스트림에 대한 통계 정보를 수집한다. 실행 시 통계 정보를 수집하는 이유는 데이터 스트림의 특성을 예측할 수 없기 때문에 데이터 특성에 대한 정보를 수집하고 수집된 정보를 가지고 가장 좋은 질의 처리 순서를 결정함으로 써 전체적인 질의 처리 성능을 향상 시킬 수 있고 실험을 통해 이를 검증한다.
PDF

A Study on Speech Period and Pitch Detection for Continuous Speech Recognition (연속음성인식을 위한 음성구간과 피치검출에 관한 연구)

Kim Tai Suk;Chang jong chil
- Journal of Korea Multimedia Society
- /
- v.8 no.1
- /
- pp.56-61
- /
- 2005
In this thesis, propose speech period and pitch detection for continuous speech recognition. This mathod is distinguishes between vowel and consonant to frame unit in continuous speech, for distinguishable voice. Powerful extraction of speech period could threshold energy make use of input signal to real noise environment. Also algorithm of this method distinguish between vowel and consonant at the same time in voice make use of zero crossing rate and short time energy to extractible speech period.
PDF

A Study on the Speech Recognition For the Voice Dialing System (Voice Dialing System을 위한 음성인식)

이성권
- Proceedings of the Acoustical Society of Korea Conference
- /
- 1998.06e
- /
- pp.365-368
- /
- 1998
본 연구는 음소 단위의 CHMM(Continuous Hidden Markov Model)을 이용한 Voice Dialing System을 위한 연속 음성인식에 관한 내용이다. 연구실 환경에서 음성으로 전화를 걸기 위하여 전국 지역명과 연속 숫자음 인식을 수행하였다. ETRI 445 데이터를 사용하여 초기의 모델은 ML(Maximum Likelihood) 추정법을 이용하여 작성하였고 적응화를 위해 최대 사후 확률 추정법을 사용하였다. 음성으로 다이얼링을 수행하기 위하여 문맥자유문법을 이용하여 제한적이나마 대화체문장으로 수행할 수 있도록 하였다. 그리하여 숫자음에 대하여 5인의 화자에 대하여 4연속 숫자음에 대하여 96%의 인식률을 보이고 있으며 7연속 숫자음에 대하여도 약 91%의 결과를 보여주고 있다. 문장으로도 음성 다이얼링을 수행하였을 경우 문장내에 단어와 숫자음에 대하여 약 80%의 인식률을 보였다.
PDF

Search Result 13,560, Processing Time 0.039 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)