• Title/Summary/Keyword: 인식비교

Search Result 6,304, Processing Time 0.048 seconds

Posture Recognition for Physical Training System with Adjusted Edge Template (에지 템플릿 조절을 통한 체조 동작 인식)

  • Lee, Chang-Mug;Kwon, Oh-Young
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2009.04a
    • /
    • pp.110-113
    • /
    • 2009
  • 로봇을 이용한 체조 학습 시스템을 위해서는 영상을 통한 사람의 자세 인식기법이 필요하다. 본 논문에서는 Chamfer Matching을 이용한 두 영상간의 에지 윤곽 비교를 통해 자세를 인식한다. 또한, 비교대상이 되는 에지의 크기를 조절함으로서 여러 사람에 대한 신뢰성 있는 인식 결과를 얻는다. 실험결과를 통해 알 수 있듯 에지의 크기 조절에 의해 서로 다른 사람간의 비교값 편차를 줄임으로써 인식률을 향상시키고 인식 오류를 최소화 하였다.

Face Recognition using Haralick Facet Function Model (Haralick의 면함수 모델을 이용한 얼굴인식)

  • 이민규;김희승
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.380-382
    • /
    • 2000
  • 본 논문은 얼굴인식을 위한 특징으로 Haralick의 면함수 모델을 이용한 방법을 제시한다. 얼굴인식 시스템에서의 큰 제약조건 중 하나인 조명에 대해 향상된 인식을 수행하기 위해 일반영상의 에지추출에 주로 사용되었던 면함수를 적합시켜 얼굴인식을 위한 입력으로 사용하였다. 제안된 방법을 기존의 얼굴인식 기법과 비교 분석해 본 결과, 전체적인 인식률과 수행 시간이 향상되었고, 특히 조명 변화에 대해 조명 변화 보정을 위한 별도의 전처리 없이도 좋은 인식 결과를 나타내었다. 또한 제안된 방법에 신경망을 적용하여 성능을 비교하였다.

  • PDF

Comparison of Adult and Child's Speech Recognition of Korean (한국어에서의 성인과 유아의 음성 인식 비교)

  • Yoo, Jae-Kwon;Lee, Kyoung-Mi
    • The Journal of the Korea Contents Association
    • /
    • v.11 no.5
    • /
    • pp.138-147
    • /
    • 2011
  • While most Korean speech databases are developed for adults' speech, not for children's speech, there are various children's speech databases based on other languages. Because there are wide differences between children's and adults' speech in acoustic and linguistic characteristics, the children's speech database needs to be developed. In this paper, to find the differences between them in Korean, we built speech recognizers using HMM and tested them according to gender, age, and the presence of VTLN(Vocal Tract Length Normalization). This paper shows the speech recognizer made by children's speech has a much higher recognition rate than that made by adults' speech and using VTLN helps to improve the recognition rate in Korean.

Improved Pattern Recoginition Coding System of a Handwriting Character with 3D (3D Magnetic Ball을 이용한 필기체 인식 향상 Coding System)

  • Sim, Kyu Seung;Lee, Jae Hong;Lee, Byoung Yup
    • The Journal of the Korea Contents Association
    • /
    • v.13 no.9
    • /
    • pp.10-19
    • /
    • 2013
  • This Paper proposed the development of new magnetic sensor and recognition system to expendite pattern recognition of a handwriting character. Received character graphics should be performed the session and balancing and no extraction of end points, bend points and juntions separately. The Artifical intelligence algorithm is adapted to structure snalysis and recognition process by individual basic letter dictionary except for the handwriing character graphic dictionaryimproving error of recognition algorithm and enomous dictionary for generalization. In this Paper, recognition rate of the received character are compared with pre registered character at letter dictionary for performance test of magnetic ball sensor. As a result of unicode conversion and eomparison, the artificial intelligence study have recognition rate more than 95% at initial recognition rate of 70%.

Multi-Speaker Speech Recognition in Noisy Environments (잡음 환경에서의 복수 화자 음성인식)

  • Oh Yoon Hark;Hur Ho Young;Song Myung Gyu;Kim Hyung Soon
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.41-44
    • /
    • 2000
  • 본 논문에서는 잡음 환경에서 복수 화자 음성인식 시스템의 인식 성능 향상에 관한 실험을 하였다. 복수화자 음성인식 방식은 훈련에 참여한 복수의 사용자에 대한 등록 단어 모델을 가지므로, 인식 단계에서 등록화자의 모든 단어 모델들을 테스트 음성과 비교하여 인식 단어를 결정한다 그러나, 이 경우 훈련 환경과 테스트 환경의 불일치에 기인한 인식 성능 저하가 등록 화자수가 많아짐에 따라 더욱 심해지는 문제가 발생한다. 본 논문에서는 이 문제의 해결을 위해 등록 화자들의 모든 단어 모델들을 테스트 음성과 비교하는 대신 화자인식 시스템을 사용해서 발성 화자와 유사한 후보 화자들의 단어 모델들에 대해서만 테스트 음성과 비교하는 방식을 적용함으로써 기존의 방법보다 높은 단어 인식 율을 얻을 수 있었다

  • PDF

A Comparison of Discrete and Continuous Hidden Markov Models for Korean Digit Recognition (한국어 숫자음 인식을 위한 이산분포 HMM과 연속분포 HMM의 성능 비교 연구)

  • 홍형진
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1994.06c
    • /
    • pp.157-160
    • /
    • 1994
  • 본 논문에서는 한국어 숫자음 인식에 대한 이산분포 HMM과 연속분포 HMM의 인식 성능을 비교하였다. 일반적으로 연속분포 HMM은 많은 계산량이 필요하고, 학습시 초기값이 매우 민감하다는 단점이 있지만, 이산분포 HMM의 VQ로 인한 왜곡을 제거함으로써 인식률을 향상시킬 수 있다. 여기서는 성능비교를 위해서 mel-cepstrum의 분석차수, 이산분포 HMM의 codebook 크기, 연속분포 HMM의 miture 개수등에 따른 인식성능을 비교하였다. 실험 결과 이산분포 HMM에서는 mel-cepstrum 벡터가 14차이고, codebook 크기가 64일 때 가장 좋은 성능을 나타냈으며, 연속부포 HMM에서는 mel-cepstrum 벡터가 16차이고 miture가 3개일 때 가장 좋은 결과를 얻을 수 있었다. 특히 학습 데이터의 양이 적은 경우에는 연속분포 HMM이 이산분포 HMM보다 더 좋은 인식률을 나타내었다.

  • PDF

A Study on Speaker Normalization using VTN (VTN을 이용한 화자 정규화에 관한 연구)

  • 손창희;손종목;배건성
    • Proceedings of the IEEK Conference
    • /
    • 2001.09a
    • /
    • pp.499-502
    • /
    • 2001
  • 본 연구에서는 화자에 따라 서로 다른 성도의 길이에 의해 발생하는 음성인식 시스템의 성능 저하를 줄이기 위하여, VTN(Vocal Tract Normalization)을 음성인식 시스템에 적용하고, 주소 인식 실험을 통하여 인식 성능을 평가하였다. 또, VTN을 CMN과 동시에 적용하여 인식 실험을 하였다. 실험에서는 화자간 성도길이의 차이를 반영하기 위하여 13개의 Warping 계수에 대해 필터 뱅크를 이용한 선형 Warping 방법을 적용하였다. 실험결과, Baseline 인식 시스템에 비하여 VTN을 적용하면, WER(Word Error Rate)이 1.24% 감소하였고, CMN과 VTN을 동시에 적용한 실험에서는 Baseline 인식 시스템과 비교하여 WER이 0.33% 감소 하였지만 VTN을 적용한 실험결과와 비교하면 오히려 0.91% 증가하였다.

  • PDF

Comparisons of MPEG-7 Texture Descriptors for Iris recognition (MPEG-7 텍스쳐 서술자의 홍채 인식에 대한 성능 비교)

  • Choo, Hyon-Gon;Kim, Whoi-Yul
    • The KIPS Transactions:PartB
    • /
    • v.11B no.4
    • /
    • pp.421-428
    • /
    • 2004
  • There are three texture descriptors in MPEG-7 : Homogeneous Texture, Edge Histogram and Texture Browsing. In this paper, a comparative analysis is presented on the capability of MPEG-7 texture descriptors for iris recognition as part of an MPEG-7 application using descriptors. Through the experiments of comparing the clustering efficiency and error distribution of the descriptors using 560 iris images, their discriminating capabilities for different iris groups are analyzed. The results show that Homogenous Texture descriptor is the best discriminator among three descriptors to recognize the iris pattern. However, compared with the conventional iris recognition methods, it needs more efforts to enhance the results.

Object Categorization Using PLSA Based on Weighting Distinctions (특이점 가중치 기반 PLSA를 이용한 객체 범주화)

  • Song, Hyun-Chul;Choi, Kwang-Nam
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.06c
    • /
    • pp.460-465
    • /
    • 2007
  • 영상 내 사물들의 카테고리를 인식하는 연구는 시각적 영상처리와 연관된 다양한 분야에서 활발히 진행되고 있다. 객체 범주화(Object Categorization)는 가정과 같은 실내에서 책상, 의자, 컵, 주전자 등의 다양한 사물들을 구분하여 인식하는데 중요한 역할을 할 수 있다. 본 논문에서는 최근 영상 내 객체들의 카테고리 분석을 위해 연구된 PLSA를 기반으로 특이점에 가중치를 부여하여, 보다 유사한 카테고리 간에 인식 성능을 향상시키는 접근법에 대하여 연구하였다. PLSA는 문서기반의 정보검색 분야로부터 소개된 기법으로, 약한 수준의 비감독 방법임에도 불구하고 인상적인 인식성능을 보여준다. 그러나 비슷한 특징점 분포를 보이는 유사한 카테고리 간의 객체 카테고리 인식에 대해서는 비교적 낮은 성능을 보인다. 본 연구에서는 카테고리간의 비교실험을 통해 각 특징점에 대하여 가중치를 부여한 PLSA를 적용하여 유사한 객체 간의 카테고리 인식 가능성을 살펴보았다. 실험에서는 기존의 PLSA 기법과 제안한 가중치를 부여 PLSA 기법을 각각 적용하여 그 성능을 비교하였다. 본 연구에서는 기존 PLSA 기법에서는 비교적 낮은 인식률을 보인 유사한 카테고리 인식에 대하여 실험 결과를 통해 가중치를 부여한 PLSA 기법이 보다 향상된 성능을 보임을 확인하였다.

  • PDF

A Study on the Rejection Capability based on Utterance Verification for Speech Recognition (발화 검증에 의한 음성인식 거절기능 연구)

  • 김우성
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06c
    • /
    • pp.67-70
    • /
    • 1998
  • 본 논문에서는 단어독립 음성인식 시스템을 위한 음성인식 거절(rejection)기능에 대해 기술한다. 음성인식 거절 기능은 음성인식기를 제작할 때 정해놓은 인식대상 단어 이외의 단어가 입력되었을 때 그 단어가 인식할 수 없는 단어임을 알려주는 기능이다. 본 연구에서는 단어독립 음성인식 시스템에 적용될 수 있는 발화 검증 방식에 의해 음성인식 거절 기능을 구현하였다. 특히 유사도를 결정함에 있어서 산술평균, 기하평균, 조화평균을 사용하고 각각을 비교하여, 기하 평균을 사용하는 방식이 우수한 성능을 보임을 알 수 있었다. 음성의 신뢰도(confidence score)를 정규화하기 위해서 Sigmoid 함수를 사용하는데 이 함수의 가중치(weight) 상수의 변화에 대해 인식률을 비교함으로써 가장 적절한 가중치 상수값을 결정하였다. 음성인식 테스트 결과에서는 신뢰도 임계치 값을 구하고 이 값을 사용하여 인식률을 계산하였으며, 거절의 오류까지 포함된 음성인식률은 약 76%였다. 이 연구결과는 현재 한국통신에서 시험 서비스 중인 음성인식 증권정보 안내 시스템에 적용될 예정이다.

  • PDF