통합 검색 | Korea Science

대어휘 연속음성 인식 시스템의 성능평가 (Performance Evaluation of Large Vocabulary Continuous Speech Recognition System)

김주곤;정현열
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 2002년도 하계학술발표대회 논문집 제21권 1호
- /
- pp.99-102
- /
- 2002
본 논문에서는 한국어 대어휘 연속음성 인식 시스템의 성능향상을 위하여 Multi-Pass 탐색 방법을 도입하고, 그 유효성을 확인하고자 한다. 연속음성 인식실험을 위하여, 최근 실험용으로 널리 사용되고 있는 HTK와 Multi-Pass 탐색 방법을 이용한 음성인식 시스템의 비교 실험을 수행한다. 대어휘 연속음성 인식 시스템에 사용한 언어 모델은 ARPA 표준 형식의 단어 N-gram 언어모델로, 1-pass에서는 2-gram 언어모델을, 2-pass 에서는 역방향 3-gram 언어모델을 이용하여 Multi-Pass 탐색 방법으로 인식을 수행한다. 본 논문에서는 Multi-Pass 탐색 방법을 한국어 연속음성인식에 적합하게 구성한 후, 다양한 한국어 음성 데이터 베이스를 이용하여 인식실험을 수행하였다. 그 결과, 전화망을 통하여 수집된 잡음이 포함된 증권거래용 연속음성 데이터 베이스를 이용한 연속음성 인식실험에서 HTK가 $59.50\%$, Multi-Pass 탐색 방법을 이용한 시스템은 $73.31\%$의 인식성능을 나타내어 HTK를 이용한 연속음성 인식률 보다 약 $13\%$의 인식률 향상을 나타내었다.
PDF

HMM(Hidden Markov Model) 음성인식 알고리즘을 이용한 효율적인 음성인식 모듈 개발 설계에 관한 연구 (A Study on the Speech Recognition Moduleas Design Using HMM Speech Recognition Algorithm)

김정훈;류홍석;강재명;강성인;이상배
- 한국지능시스템학회:학술대회논문집
- /
- 한국퍼지및지능시스템학회 2002년도 추계학술대회 및 정기총회
- /
- pp.337-340
- /
- 2002
본 논문에서는 휠체어 시스템에 화자 독립 고립단어 인식을 위한 임베디드 시스템 설계에 관한 내용을 서술한다. 실제 환경에서는 잡음이 포함되어 있어 인식률을 저하시키므로, 잡음을 제거하는 방식 중 가장 간단한 방식인 스펙트럼 차감법(Spectral subtraction method)을 사용하여 잡음을 제거했다 전처리 단계에서는 12차 LPC&Cepstrum 방식을 사용했고, 인식 알고리즘은 DHMM (Discrete Hidden Markov Model)을 전반부 인식기로 사용했다. 이 알고리즘을 적용하기 위해서는 데이터 간소화를 위해 벡터양자화(Vector Quantization) 처리가 전제되어야한다 또한 인식알고리즘은 인식률을 향상을 위해 후처리 인식기로 신경망(MLP:Multi-layer Perceptron)을 통해서 인식률을 향상시켰다 화자 독립 시스템에 맞는 인식 단어의 구성은 총 7개단어로 남녀 총 25명 목소리로 구성하였다. 그리고 하드웨어 구성은 32-bits floating point 방식인 TMS320C32를 적용했고, 메모리 부분은 4Mbyte로 설계를 했으며, 메인보드의 설계는 현재 완성 단계에 있다.

연속숫자 음성인식에서 화자 적응에 관한 연구 (A Study on Speaker Adaptation in Continuous Digits Speech Recognition)

최광표
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 1998년도 학술발표대회 논문집 제17권 2호
- /
- pp.319.2-322
- /
- 1998
본 논문에서는 반음절 단위 HMM을 이용한 연속 숫자 음성인식 시스템의 2단계로 이루어지는 화자 적응 알고리즘을 수행하였다. 음성인식 시스템에서 사용되는 훈련데이터의 양이 많더라도 발성속도, 발성크기 등의 화자 발성 습관에 따라 화자독립 음성인식 시스템에서는 많은 문제점들이 발생하게 된다. 불특정 화자를 대상으로 한 음성 인식에 있어서 개인차에 의한 변동을 대처하는 방법으로 유효한 음향적 특성을 추출하기 위해 스펙트럼의 동적인(Dynamic) 특성을 주로 이용하고 있다. 따라서 본 논문에서는 화자 적을 기법의 하나인 frequency warped spectral matching 방법을 연속숫자 음성 인식시스템에 적용하였으며, 이때 인식에 의한 적절한 화자별 스케일링 계수 선정 방법을 수행하여 오인식률이 감소함을 확인하였다.
PDF

얼굴 인식 Open API를 활용한 출입자 인식 시스템 개발 (Development of a Visitor Recognition System Using Open APIs for Face Recognition)

옥기수;권동우;김현우;안동혁;주홍택
- 정보처리학회논문지:컴퓨터 및 통신 시스템
- /
- 제6권4호
- /
- pp.169-178
- /
- 2017
최근 보안에 대한 관심과 필요성이 증가하면서 출입자 인식 시스템의 수요가 증대되고 있다. 출입자 인식 시스템은 출입자를 인식하기 위해서 다양한 생체인식 방법을 사용하고 있다. 본 논문에서는 다양한 특성과 강점을 가진 다수의 얼굴인식 Open API 서비스를 통합하고, 그 인식결과를 앙상블 함으로써 인식 성능을 개선하는 얼굴인식 기반 출입자 인식 시스템을 제안한다. 또한 다양한 얼굴 인식 Open API 서비스를 앙상블 하는 출입자 인식 시스템의 구조를 제안한다. 성능 측정은 약 5개월 간 수집한 얼굴 데이터를 이용하여 수행하였으며, 측정결과로 본 논문에서 제안하는 출입자 인식 시스템이 단일 얼굴인식 Open API 서비스를 사용했을 때보다 더 높은 얼굴인식률을 보임을 확인하였다.
https://doi.org/10.3745/KTCCS.2017.6.4.169 인용 PDF KSCI

다중 인식기 및 검증기를 갖는 거버문자 인식 시스템 (A Gerber-Character Recognition System with Multiple Recognizers and a Verifier)

오혜원;박태형
- 한국지능시스템학회논문지
- /
- 제14권1호
- /
- pp.20-27
- /
- 2004
인쇄회로기판 제작에 사용되는 국제표준규격의 거버 파일로부터 부품 위치 이름을 자동으로 추출하기 위한 문자인식 시스템을 제안한다. 거버 파일은 벡터형식의 그림파일로서, 각종도형 및 기호가 문자와 혼합되어 있으며, 가로쓰기와 세로쓰기 및 역 세로쓰기가 병용된다. 거버문자인식 시스템은 거버 파일에서 문자패턴을 추출하여 분리하는 전 처리 단계와 추출된 패턴을 인식하는 인식단계 및 인식된 문자와 숫자를 조합하여 부품위치이름을 구성하는 후 처리단계로 구성된다. 특히 인식률 향상을 위하여 신경회로망에 의한 다중인식기 및 구조적 특징을 이용한 검증기를 개발한다. 본 논문에서 개발된 거버문자 인식시스템은 인쇄회로기판 조립 및 검사 장비를 위한 자동 프로그래밍 시스템에 사용되어, 전자제품 제조시스템의 생산성 향상에 기여할 수 있다.
https://doi.org/10.5391/JKIIS.2004.14.1.020 인용 PDF KSCI

입 모양 인식 기술이 비교 연구 (A study on lip-motion recognition algorithms)

박한무;정진우
- 한국지능시스템학회:학술대회논문집
- /
- 한국지능시스템학회 2008년도 춘계학술대회 학술발표회 논문집
- /
- pp.268-270
- /
- 2008
얼굴 인식은 영상 처리 분야 중 대표적인 분야의 하나로, 지금까지 다양한 응용시스템이 개발됐다. 얼굴 인식은 눈, 코, 입 같은 얼굴의 특징들을 값으로 변환하고 각 특징 값들의 상관관계를 분석하는 방식으로 이루어지는데, 이 중에서 입은 형태 변화가 심하기 때문에 얼굴 인식에서는 특징 값으로 잘 이용되지 않는다. 반면, 표정 인식이나 화자 인식과 같은 특정 응용 시스템에서는 중요한 특징의 하나로 사용되고 있다. 입 모양을 인식한다는 것은 입술의 형태와 그 변화를 인식한다는 것을 의미하며, 이에 대한 연구가 많이 이루어지기는 했지만 음성 인식의 보조 수단으로 사용된 것이 대부분이다. 본 논문에서는 현재까지 제안된 입 움직임 인식 기술에 대해서 정리하고, 새로이 적용 가능한 응용 시스템에 대해 고찰해보고자 한다.
PDF

빌렛영상에 포함된 문자인식을 위한 비전시스템 개발 (Development of vision system for the character recognition of the billet image)

박상국
- 한국산업정보학회논문지
- /
- 제13권1호
- /
- pp.22-29
- /
- 2008
본 논문은 철강공장의 연주공정에서 만들어진 빌렛 소재의 관리를 위해 사용되는 소재 관리문자를 실시간으로 인식하기 위한 비전시스템 개발 결과에 대해 기술한다. 빌렛 재질의 단면에 마킹된 소재 관리문자는 소재가 다음 공정으로 이동하기 전에 공정상에서 실시간으로 인식된다. 문자인식용 비전시스템은 영상획득을 위한 카메라 시스템, 영상을 장거리로 고속 전송하기위한 영상전송 시스템, 기존 시스템과의 인터페이스를 위한 입 출력 장치 및 문자인식용 소프트웨어로 구성된다. 개발된 비전시스템을 실제 철강 선제공정에 설치하여 운용테스트를 실시했다. 테스트를 통해 시스템의 내구성과 신뢰성을 검증하고 최종적으로 문자 인식률을 검증했다. 개발된 시스템에 대해 문자인식 테스트 결과 약 98.6%의 높은 인식률을 가졌다.
PDF

음성인식기술을 이용한 증권정보 안내 시스템의 실험적 실용시험 (An Experimental Field Trial of Stock Information Retrieval System Based on Speech Recognition)

도삼주
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
- /
- pp.241-244
- /
- 1994
이 논문은 대어휘, 화자독립 음성인식 시스템인 KT-STOCK과 이 시스템에 대한 전화망을 통한 실험적 실용시험에 대해 기술하였다. KT-STOCK은 현재 주식시장에 상장된 712개 회사의 현재주가를 음성을 이용하여 검색할 수 있는 시스템이다. 이 시스템은 hidden markov model 기술에 기반을 둔 고립단어 인식 시스템이며 유사음소를 기본 인식단위로 사용한다. KT-STOCK은 1994년 6월 24일부터 실험적 실용시험 중에 있다. 중간 결과에 따르면 모의 실험 결과는 실제 환경에서의 시험과 차이가 있는 거승로 나타났다. 실제 환경에서 이 시스템의 인식률은 현재 61.9%이다.
PDF

얼굴 인식 기술의 연구 현황 및 구현 사례

유명현;박정선;양희덕;이상웅
- 한국통계학회:학술대회논문집
- /
- 한국통계학회 2002년도 춘계 학술발표회 논문집
- /
- pp.105-112
- /
- 2002
얼굴인식 기술은 접촉에 대한 거부감이나 불편함이 없이 친숙하고 편리하게 사용자를 식별하고 인식할 수 있으며, 부가적인 센서 장비가 필요없다는 측면에서 개인 인증 및 보안 시스템으로서의 활용성이 매우 높다. 본 논문에서는 여러 가지 장점들을 지닌 얼굴 인식 시스템의 구현 사례를 실시간 얼굴 검출 기술과 특징 추출 기술, 인식 기술로 구분하여 소개한다. 개발된 시스템은 얼굴 검출을 위해서 색상과 에지 성분을 이용하는 복합 알고리즘을 적응하여 실시간 얼굴 탐지를 가능하게 하였고, 추출된 사용자의 고유 얼굴 정보는 최신 인식 기법의 하나인 Support Vector Machine으로 분류, 인식된다. 또한 시스템의 성능을 테스트하고, 실용화 가능성을 모색하기 위하여 하드웨어 임베디드 시스템의 설계 및 구현과정과 조명 및 환경 변화에 따른 시스템의 성능 변화를 객관적으로 검증하기 위하여 다양한 변화 조건을 고려한 한국인 표준 얼굴 데이터베이스를 구축 과정을 소개한다.
PDF

대용량 음성인식 전화정보시스템 개발 및 시험운용 (The Development of a Speech Recognition System with Large Channel over the PSTN and it's Field Trial)

장경애
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
- /
- pp.43-47
- /
- 1998
대용량, 대어휘, 화자독립 음성인식시스템의 개발과 1998년 3월 16일부터 일반인들을 대상으로 시험운용하고 있는 음성인식 증권서비스에 대한 것이다. 이 시스템은 상용서비스를 위하여 한 대당 120명이 동시에 사용할 수 있는 대용량 시스템으로 HMM 기술에 기반을 둔 고립단어 인식 시스템이다. 이 시스템은 음소를 기본 인식단위로 사용하여 인식단어의 추가 및 변경이 자유로우며, 추가 또는 변경된 회사명칭을 운용자의 개입 없이 자동적으로 시스템에 반영될 수 있다. 본 서비스의 개발과정에서 인식대상단어를 결정하는데 발생된 문제점과 인식단어의 변경방법 및 적용후의 효과 등을 살펴보았다.
PDF

검색결과 10,249건 처리시간 0.028초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)