통합 검색 | Korea Science

멀티모달 인터페이스를 위한 음성 및 문자 공용 인식시스템의 구현 (An On-line Speech and Character Combined Recognition System for Multimodal Interfaces)

석수영;김민정;김광수;정호열;정현열
- 한국멀티미디어학회논문지
- /
- 제6권2호
- /
- pp.216-223
- /
- 2003
본 논문에서는 음성과 온라인 문자를 단일시스템으로 인식할 수 있는 음성 문자 공용인식 시스템을 제안한다. 일반적으로 CHMM(Continuous Hidden Markov Model)은 음성인식과 온라인 문자인식을 위해 매우 유용한 도구로 잘 알려져 있으나, 인식을 위해서는 각각을 독립 시스템으로 구현하고 있어 추가적인 메모리와 계산량을 요구한다. 제안한 공용인식 시스템은 음성인식과 문자인식을 결합하기 위하여 이들을 동일한 CHMM모델로 구성한 후 상태단위로 지속정보를 제어하는 OPDP(One Pass Dynamic Programming) 알고리즘을 통하여 음성과 문자를 인식할 수 있는 확률 통계적 시스템을 구현하였다. 음성은 MFCC(Mel Frequency Cepstrum Coefficient) 파라미터, 문자는 위치 변화량 파라미터와 비트맵 파라미터를 사용하였으며, MLE(Maximum Likelihood Estimation) 추정법을 이용하여 음소와 자소를 결합한 115개의 3상태 9천이 CHMM모델을 구성하였다. 공용인식기의 실험결과 음소 인식률 51.65%, 음성 단어 인식률 88.6%, 자소 인식률 85.3%, 필기체 단어인식률 85.6%를 나타내어 공용인식의 유효함을 확인할 수 있었다.
PDF

얼굴인식해석의 Small Sample Size 문제 해결을 위한 Resampling 방법 (A Resampling Method for Small Sample Size Problems in Face Recondition)

오재현;곽노준;최태영
- 대한전기학회:학술대회논문집
- /
- 대한전기학회 2008년도 심포지엄 논문집 정보 및 제어부문
- /
- pp.172-173
- /
- 2008
LDA를 이용한 얼굴 인식에서 발생하는 small sample sire 문제를 해결하기 위해서 regularization method를 주로 사용한다. 이 방법을 사용하게 되면 클래스 내 분산행렬의 특이성을 없앨 수 있지만, 클래스 내 분산행렬과 단위행렬 $\alpha$를 곱한 값을 더하는 과정에서 $\alpha$의 값을 임의적으로 정해주어야 되고 이 값에 따라 인식률이 개선되지 않을 수 있다는 문제점이 있다. Resampling 개념을 이용하여 학습 데이터의 수를 늘리게 되면 regularization method보다 개선된 인식률을 얻을 수 있다. 또한 경험적으로 $\alpha$값을 정해 주어야 하고, $\alpha$값에 따라 인식률의 변통이 생길 수 있는 단점이 개선되는 효과를 얻을 수 있다.
PDF

업샘플링을 통한 바코드 이미지 인식 성능 개선 (An Improved Recognition Technique for Bar Code Images Using Upsampling)

안희준;도딴뚜안
- 한국통신학회논문지
- /
- 제41권8호
- /
- pp.911-913
- /
- 2016
최근 이미지기반 바코드 인식 시스템의 활용도가 커지고 있으나, 촬영된 바코드영역의 유효해상도가 낮은 경우 인식률이 현저하게 저하된다. 본 논문에서는 낮은 유효해상도에서도 인식률을 향상시킬 수 있는 업샘플링을 통한 부화소-레벨 동기화 방법을 제안한다. 표준 ITF-18 포맷에 대한 실험결과 VGA ($640{\times}480$)급, CIF ($320{\times}240$)인 영상에서 기존방식과 비교하여 각각 66%, 100%의 인식률 증가를 확인 하였다.
https://doi.org/10.7840/kics.2016.41.8.911 인용 PDF KSCI

음성인식을 위한 환경잡음의 전처리기법에 관한 검토 (A Study on Front-End Processing Methods of Environmental Noise for Speech Recognition)

김광수
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 1997년도 영남지회 학술발표회 논문집 Acoustic Society of Korean Youngnam Chapter Symposium Proceedings
- /
- pp.17-22
- /
- 1997
본 논문에서는 음성 인식기의 성능을 저하시키는 요인중 부가 잡음과 마이크의 변동에 의한 채널 왜곡을 동시에 감소시키는 방법으로 기존의 전처리에 의한 환경덥음처리기법의 단점을 개선한 Histogram 처리기법을 잡음처리에 도입하고 그 유효성을 확인하였다. 도입한 잡음처리기법의 유효성을 확인하기 위하여 기존의 잡음처리기법으로 잘 알려진 여러 가지 방법과 비교하기 위하여 단어 인식실험을 실시하였다. 실험결과, 부가잡음만이 첨가된 경우에 있어서는 일반적으로 알려진 SS, CMN, RASTA등을 이용한 결과 전처리방법을 이용하지 않은 경우의 기본인식률에 비해 SN비에 따라 25% 이상이 인식률 향상을 볼 수 있었다. 특히 CDCN 처리와 H-RASTA를 사용한 경우, 채널왜곡과 부가잡음이 함께 포함된 음성에 대해 SN비에 관계없이 약 15~30%정도의 인식률의 향상을 볼 수 있어 기존 방법으로서는 이글 방법이 우수함을 확인할 수 있었다. 이 위에 Histogram 에 의한 추정법을 적용한 경우 전처리의 성능을 10~15% 정도 성능향상을 가져와 도입한 방법의 유효성을 확인할 수 있었다.
PDF

잡음환경의 ASR 성능개선을 위한 음성강조 파라미터 (Using speech enhancement parameter for ASR)

차영동;김영섭;허강인
- 융합신호처리학회 학술대회논문집
- /
- 한국신호처리시스템학회 2006년도 하계 학술대회 논문집
- /
- pp.63-66
- /
- 2006
음성인식시스템은 사람이 별도의 장비 없이 음성만으로 시스템의 사용이 가능한 편리한 장점을 지니고 있으나 여러 가지 기술적인 어려움과 실제 환경의 낮은 인식률로 폭넓게 사용되지 못한 상황이다. 그 중 배경잡음은 음성인식의 인식률을 저하시키는 원인으로 지적 받고 있다. 이러한 잡음환경에 있는 ASR(Automatic Speech Recognition)의 성능 향상을 위해 외측억제 기능 이 추가된 파라미터를 제안한다. ASR 에서 널리 사용되는 파라미터인 MFCC을 본 논문에서 제안한 파라미터와 HMM를 이용하여 인식률을 비교하여 성능을 비교하였다. 실험결과를 통해 제안된 파라미터의 사용을 통해 잡음환경에 있는 ASR의 성능 향상을 확인할 수 있었다.
PDF

한글 주소의 오인식 수정을 위한 효율적인 후처리 알고리즘 (An Efficient Postprocessing Algorithm for Error Correction in Hangul Address Recognition)

이성환;김은순
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 1992년도 제4회 한글 및 한국어정보처리 학술대회
- /
- pp.555-566
- /
- 1992
본 논문은 한글 주소의 오인식 수정에 관한 연구로서, 필기자의 다양한 필기 형태와 입력 장치의 특성으로 인하여 문자 인식 단계에서 발생할 수 있는 혼동을 줄이고 오류를 효율적으로 수정하는 후처리 알고리즘을 소개한다. 특히, 주소의 행정 구역부에 대해서는 정합해야 할 문자 모델의 범위를 줄여줌으로써 높은 인식률과 처리 속도를 기록하였으며, 문자 인식의 결과에 임계값과 백트랙킹 방법을 도입한 후처리 알고리즘을 적용하여 더욱더 높은 인식률을 나타낼 수 있었다. 번지부와 건물부에 대한 오인식도 제안된 각각의 알고리즘을 적용함으로써 효과적으로 수정할 수 있었다. 우리나라의 25,000여 행정 구역을 바탕으로 작성 가능한 주소들 중에서 임의의 150개 주소 데이타에 대하여 제안된 후처리 방법을 포함한 다양한 후처리 방법으로 실험한 결과, 행정 구역부에 대하여 98%이상의 높은 인식률을 보임으로써, 제안된 후처리 알고리즘이 효과적임을 알 수 있었다.
PDF

인공지능 인식률을 높이기 위한 명암비 적용 전처리 방법 (The Contrast Ratio Applied Preprocessing Method for Enhancing Recognition Rate of Artificial Intelligence)

김성중;유재천
- 한국컴퓨터정보학회:학술대회논문집
- /
- 한국컴퓨터정보학회 2019년도 제59차 동계학술대회논문집 27권1호
- /
- pp.19-21
- /
- 2019
본 논문에서는 인공지능의 인식률을 높이기 위해 명암비를 적용한 전처리 방법에 대해 제안한다. 이 방법은 인공지능이 기존의 방법보다 특징점을 쉽게 얻어내기 위해서 명암비를 적용한 전처리를 진행하여 인식률을 높이기 위함에 목적을 두고 있다. 제안한 방법으로 인하여 문자인식이 얼마나 향상되었고, 기존의 성능과 비교하여 정확도가 얼마나 향상되었는지를 알아보고 있다.
PDF

(2D)$^2$PCA 의 차원축소를 통한 Curvelet 기반 얼굴인식 (Curvelet Based Face Recognition using (2D)$^2$PCA)

이보현;이성주;이일병
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2011년도 춘계학술발표대회
- /
- pp.479-482
- /
- 2011
얼굴인식의 인식률 향상과 계산량을 줄이기 위한 방법으로 Curvelet 변환과 (2D)$^2$PCA(Two directional two-dimensional PCA) 를 통한 특징추출 및 차원축소 방법을 제안한다. 기존의 Wavelet 변환과 PCA 를 통한 기법들이 소개되어 인식률 향상을 이끌어 냈다. 그런데 Curvelet Transform 은 곡선의 정보를 효과적으로 표현할 수 있는 장점이 있고, (2D)$^2$PCA 는 PCA 에 비해 계산량이 적은 장점이 있기 때문에 이를 이용하여 인식률과 처리성능 측면에서 개선된 결과를 얻고자 한다.
https://doi.org/10.3745/PKIPS.y2011m04a.479 인용 PDF

MLHF 모델을 적용한 어휘 인식 탐색 최적화 시스템 (Vocabulary Recognition Retrieval Optimized System using MLHF Model)

안찬식;오상엽
- 한국컴퓨터정보학회논문지
- /
- 제14권10호
- /
- pp.217-223
- /
- 2009
모바일 단말기의 어휘 인식 시스템에서는 통계적 방법에 의한 어휘인식을 수행하고 N-gram을 이용한 통계적 문법 인식 시스템을 사용한다. 인식 대상이 되는 어휘의 수가 증가하면 어휘 인식 알고리즘이 복잡해지고 대규모의 탐색공간을 필요로 하게 되며 처리시간이 길어지므로 제한된 연산처리 능력과 메모리로는 처리하기가 불가능하다. 따라서 본 논문에서는 이러한 단점을 개선하고 어휘 인식을 최적화하기 위하여 MLHF 시스템을 제안한다. MLHF는 FLaVoR의 구조를 이용하여 음향학적 탐색과 언어적 탐색을 분리하여 음향학적 탐색에서는 HMM을 사용하고 언어적 탐색 단계에서는 Levenshtein distance 알고리즘을 사용한다. 시스템 성능 평가 결과 어휘 종속 인식률은 98.63%, 어휘 독립 인식률은 97.91%의 인식률을 나타냈으며 인식속도는 1.61초로 나타내었다.
https://doi.org/10.9708/jksci.2009.14.10.217 인용 PDF

증강현실 콘텐츠의 이미지 인식 기법 효과성 연구 (A Study on the Effectiveness of the Image Recognition Technique of Augmented Reality Contents)

서동희
- 만화애니메이션 연구
- /
- 통권41호
- /
- pp.337-356
- /
- 2015
최근 증강현실 콘텐츠는 광고나 전시 등에서 많이 사용되고 있으며, 어린이들의 동화책으로도 출판되어 판매될 만큼, 대중화되었다. 증강현실 콘텐츠는 현실과 가상을 혼합하여 새로운 예술 공간을 창조하여, 경험자의 몰입도를 높이기 때문에 전시와 광고용 콘텐츠에서 어린이 체험, 교육용 콘텐츠로 다양하게 제작되고 있다. 제작 방법이 복잡하지 않기 때문에, 대학생 과정에서도 간단한 콘텐츠를 개발할 수 있어, 무한한 개발 가능성을 짐작할 수 있다. 증강현실은 카메라로 등록해 놓은 마커를 인식하게 하여 컴퓨터 그래픽 콘텐츠를 그 카메라에 비췬 현실세계에 불러온다. 이때, 증강현실의 제작과정에서는 이미지 인식 기법을 사용하는데, 이는 매우 일반적이며 쉬운 방법이다. 자신이 만든 이미지를 사용할 수도 있기 때문에, 동화책이나 광고에 전반적으로 사용되고 있다. 제작자들이 가장 많이 사용하는 증강현실 마커등록 플랫폼은 퀄컴에서 제공하는 Vuforia이다. 남서울 대학교 가상증강현실 연계전공 학부생들이 제작하여 세종문화회관에 전시된 세 개의 AR콘텐츠는 이미지 인식기법을 사용하였다. 본 연구는 퀄컴에서 제공하는 마커 등록 방법을 학생들이 증강현실 콘텐츠 제작과정에서 사용하면서 시작되었다. 세 개의 각각 다른 이미지를 제작하면서, 마커로 사용하기 위해 Vuforia에서 제공하는 Image Target Manager에 이미지를 등록시키고, 인식률을 조사하여, 인식률을 조금 더 높이기 위해 다양한 방법으로 이미지 제작법을 변경해보았다. 인식률이 높다는 것은 증강현실 콘텐츠를 안정적으로 사용할 수 있음을 의미하기 때문에, 높은 인식률을 가지기 위해, 다양한 시도들을 적용해보았다. 기획의도에 적합한 이미지를 제작하고, 보다 높은 인식률을 위해 몇 가지 방법을 적용하여, 인식률을 비교하였다. 색의 대비, 패턴 등의 요소를 통해 비교하였으며, 그 결과 효율적인 이미지 제작 방안을 제시하였다. 본 연구는 증강현실 콘텐츠의 안정적인 콘텐츠 제작 사례를 제시하고자 한다. 연구의 목적은 이미지 인식 기법을 기반으로 하는 증강현실 콘텐츠의 활용방안과 인식기법의 효과성을 제시하여 증강현실 콘텐츠 개발자들에게 실질적인 도움을 주는 것에 있다.
https://doi.org/10.7230/KOSCAS.2015.41.337 인용 PDF KSCI

검색결과 3,096건 처리시간 0.03초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)