통합 검색 | Korea Science

에지 템플릿 조절을 통한 체조 동작 인식 (Posture Recognition for Physical Training System with Adjusted Edge Template)

이창묵;권오영
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2009년도 춘계학술발표대회
- /
- pp.110-113
- /
- 2009
로봇을 이용한 체조 학습 시스템을 위해서는 영상을 통한 사람의 자세 인식기법이 필요하다. 본 논문에서는 Chamfer Matching을 이용한 두 영상간의 에지 윤곽 비교를 통해 자세를 인식한다. 또한, 비교대상이 되는 에지의 크기를 조절함으로서 여러 사람에 대한 신뢰성 있는 인식 결과를 얻는다. 실험결과를 통해 알 수 있듯 에지의 크기 조절에 의해 서로 다른 사람간의 비교값 편차를 줄임으로써 인식률을 향상시키고 인식 오류를 최소화 하였다.
https://doi.org/10.3745/PKIPS.y2009m04a.110 인용 PDF

Haralick의 면함수 모델을 이용한 얼굴인식 (Face Recognition using Haralick Facet Function Model)

이민규;김희승
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
- /
- pp.380-382
- /
- 2000
본 논문은 얼굴인식을 위한 특징으로 Haralick의 면함수 모델을 이용한 방법을 제시한다. 얼굴인식 시스템에서의 큰 제약조건 중 하나인 조명에 대해 향상된 인식을 수행하기 위해 일반영상의 에지추출에 주로 사용되었던 면함수를 적합시켜 얼굴인식을 위한 입력으로 사용하였다. 제안된 방법을 기존의 얼굴인식 기법과 비교 분석해 본 결과, 전체적인 인식률과 수행 시간이 향상되었고, 특히 조명 변화에 대해 조명 변화 보정을 위한 별도의 전처리 없이도 좋은 인식 결과를 나타내었다. 또한 제안된 방법에 신경망을 적용하여 성능을 비교하였다.
PDF

한국어에서의 성인과 유아의 음성 인식 비교 (Comparison of Adult and Child's Speech Recognition of Korean)

유재권;이경미
- 한국콘텐츠학회논문지
- /
- 제11권5호
- /
- pp.138-147
- /
- 2011
현재 한국의 음성 데이터베이스 구축 현황을 살펴보면 유아에 맞춰진 음성 데이터베이스는 구축이 되지 않은 실정이다. 국외 연구를 분석한 결과, 다양한 언어를 기반으로 유아 대상의 음성 데이터베이스가 구축되어 있다. 이는 성인의 음성과 유아의 음성은 언어학적으로 차이가 있기 때문에 유아는 유아에 맞는 음성 데이터베이스가 필요하다. 한국어에서 성인과 유아의 음성 차이를 알아보기 위해, HMM을 이용하여 유아와 성인의 음성인식을 비교하였다. 유아와 성인의 음성인식 비교는 성별, 나이별, 성도 길이 정규화의 적용 유무에 따라 실험한다. 본 논문에서는 한국어에서 유아의 음성을 유아의 음성인식기로 인식했을 때가 성인의 음성인식기로 인식했을 때 보다 월등히 인식률이 높았으며, 성도 길이 정규화의 적용이 인식률 향상에 도움이 되고 있음을 보여준다.
https://doi.org/10.5392/JKCA.2011.11.5.138 인용 PDF KSCI

3D Magnetic Ball을 이용한 필기체 인식 향상 Coding System (Improved Pattern Recoginition Coding System of a Handwriting Character with 3D)

심규승;이재홍;이병엽
- 한국콘텐츠학회논문지
- /
- 제13권9호
- /
- pp.10-19
- /
- 2013
본 논문에서는 그래프 패턴 인식을 신속히 처리하기 위한 새로운 자성 센서의 개발과 인식 시스템을 제안하고자 하였다. 그래픽을 입력받아 세션화와 균형화를 수행하는데 있어서 특징점의 사전 처리를 선결 수행함으로써 인식 속도를 증강하고 선처리된 특징점을 이용하여 끝점, 굴곡점, 분기점의 특징점을 별도로 추출하지 않는 방법으로 조사하여 모음이나 자음의 부분패턴의 그래프 사전을 비교하는 간단한 구조해석과 인식을 도모하였다. 본 논문의 성능 비교를 위하여 사용자의 필기체를 사전에 등록 인식하고 입력 필기체를 비교 인식하여 Unicode로 변환시켜 비교한 결과 70%의 초기 인식률에서 누적 인공학습 지능 처리 결과 95%의 이상의 인식률을 보여주고 있다.
https://doi.org/10.5392/JKCA.2013.13.09.010 인용 PDF KSCI

잡음 환경에서의 복수 화자 음성인식 (Multi-Speaker Speech Recognition in Noisy Environments)

오윤학;허호영;송명규;김형순
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 2000년도 학술발표대회 논문집 제19권 2호
- /
- pp.41-44
- /
- 2000
본 논문에서는 잡음 환경에서 복수 화자 음성인식 시스템의 인식 성능 향상에 관한 실험을 하였다. 복수화자 음성인식 방식은 훈련에 참여한 복수의 사용자에 대한 등록 단어 모델을 가지므로, 인식 단계에서 등록화자의 모든 단어 모델들을 테스트 음성과 비교하여 인식 단어를 결정한다 그러나, 이 경우 훈련 환경과 테스트 환경의 불일치에 기인한 인식 성능 저하가 등록 화자수가 많아짐에 따라 더욱 심해지는 문제가 발생한다. 본 논문에서는 이 문제의 해결을 위해 등록 화자들의 모든 단어 모델들을 테스트 음성과 비교하는 대신 화자인식 시스템을 사용해서 발성 화자와 유사한 후보 화자들의 단어 모델들에 대해서만 테스트 음성과 비교하는 방식을 적용함으로써 기존의 방법보다 높은 단어 인식 율을 얻을 수 있었다
PDF

한국어 숫자음 인식을 위한 이산분포 HMM과 연속분포 HMM의 성능 비교 연구 (A Comparison of Discrete and Continuous Hidden Markov Models for Korean Digit Recognition)

홍형진
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
- /
- pp.157-160
- /
- 1994
본 논문에서는 한국어 숫자음 인식에 대한 이산분포 HMM과 연속분포 HMM의 인식 성능을 비교하였다. 일반적으로 연속분포 HMM은 많은 계산량이 필요하고, 학습시 초기값이 매우 민감하다는 단점이 있지만, 이산분포 HMM의 VQ로 인한 왜곡을 제거함으로써 인식률을 향상시킬 수 있다. 여기서는 성능비교를 위해서 mel-cepstrum의 분석차수, 이산분포 HMM의 codebook 크기, 연속분포 HMM의 miture 개수등에 따른 인식성능을 비교하였다. 실험 결과 이산분포 HMM에서는 mel-cepstrum 벡터가 14차이고, codebook 크기가 64일 때 가장 좋은 성능을 나타냈으며, 연속부포 HMM에서는 mel-cepstrum 벡터가 16차이고 miture가 3개일 때 가장 좋은 결과를 얻을 수 있었다. 특히 학습 데이터의 양이 적은 경우에는 연속분포 HMM이 이산분포 HMM보다 더 좋은 인식률을 나타내었다.
PDF

VTN을 이용한 화자 정규화에 관한 연구 (A Study on Speaker Normalization using VTN)

손창희;손종목;배건성
- 대한전자공학회:학술대회논문집
- /
- 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
- /
- pp.499-502
- /
- 2001
본 연구에서는 화자에 따라 서로 다른 성도의 길이에 의해 발생하는 음성인식 시스템의 성능 저하를 줄이기 위하여, VTN(Vocal Tract Normalization)을 음성인식 시스템에 적용하고, 주소 인식 실험을 통하여 인식 성능을 평가하였다. 또, VTN을 CMN과 동시에 적용하여 인식 실험을 하였다. 실험에서는 화자간 성도길이의 차이를 반영하기 위하여 13개의 Warping 계수에 대해 필터 뱅크를 이용한 선형 Warping 방법을 적용하였다. 실험결과, Baseline 인식 시스템에 비하여 VTN을 적용하면, WER(Word Error Rate)이 1.24% 감소하였고, CMN과 VTN을 동시에 적용한 실험에서는 Baseline 인식 시스템과 비교하여 WER이 0.33% 감소 하였지만 VTN을 적용한 실험결과와 비교하면 오히려 0.91% 증가하였다.
PDF

MPEG-7 텍스쳐 서술자의 홍채 인식에 대한 성능 비교 (Comparisons of MPEG-7 Texture Descriptors for Iris recognition)

추현곤;김회율
- 정보처리학회논문지B
- /
- 제11B권4호
- /
- pp.421-428
- /
- 2004
MPEG극 텍스쳐 서술자에는 균등 질감(Homogeneous Texture), 경계 히스토그램(Edge Histogram), 텍스쳐 브라우징(Texture Browsing) 서술자가 있다. 본 논문에서는 이들 텍스쳐 서술자를 이용하여 홍채 인식에 대한 성능을 비교 분석한다. 전처리 과정을 통해 추출된 560장의 흥채 영상을 이용하여, 세 서술자에 대한 각 계수에 대한 군집화 효율성 비교와 에러 분포 비교를 통해 서로 다른 홍채 그룹에 대한 변별 능력을 비교한다. 실험 결과를 통해 세 서술자 중 균등 질감 서술자가 홍채 패턴을 인식하는 데 있어서 가장 효율적인 서술자로 나타났다. 그러나, 실험결과는 기존의 홍채 인식 방법에 비해, MPEG-7 텍스쳐 서술자를 이용한 홍채 인식에 인식 성능 향상을 위한 노력이 필요함을 알 수 있다.
https://doi.org/10.3745/KIPSTB.2004.11B.4.421 인용 PDF KSCI

특이점 가중치 기반 PLSA를 이용한 객체 범주화 (Object Categorization Using PLSA Based on Weighting Distinctions)

송현철;최광남
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (C)
- /
- pp.460-465
- /
- 2007
영상 내 사물들의 카테고리를 인식하는 연구는 시각적 영상처리와 연관된 다양한 분야에서 활발히 진행되고 있다. 객체 범주화(Object Categorization)는 가정과 같은 실내에서 책상, 의자, 컵, 주전자 등의 다양한 사물들을 구분하여 인식하는데 중요한 역할을 할 수 있다. 본 논문에서는 최근 영상 내 객체들의 카테고리 분석을 위해 연구된 PLSA를 기반으로 특이점에 가중치를 부여하여, 보다 유사한 카테고리 간에 인식 성능을 향상시키는 접근법에 대하여 연구하였다. PLSA는 문서기반의 정보검색 분야로부터 소개된 기법으로, 약한 수준의 비감독 방법임에도 불구하고 인상적인 인식성능을 보여준다. 그러나 비슷한 특징점 분포를 보이는 유사한 카테고리 간의 객체 카테고리 인식에 대해서는 비교적 낮은 성능을 보인다. 본 연구에서는 카테고리간의 비교실험을 통해 각 특징점에 대하여 가중치를 부여한 PLSA를 적용하여 유사한 객체 간의 카테고리 인식 가능성을 살펴보았다. 실험에서는 기존의 PLSA 기법과 제안한 가중치를 부여 PLSA 기법을 각각 적용하여 그 성능을 비교하였다. 본 연구에서는 기존 PLSA 기법에서는 비교적 낮은 인식률을 보인 유사한 카테고리 인식에 대하여 실험 결과를 통해 가중치를 부여한 PLSA 기법이 보다 향상된 성능을 보임을 확인하였다.
PDF

발화 검증에 의한 음성인식 거절기능 연구 (A Study on the Rejection Capability based on Utterance Verification for Speech Recognition)

김우성
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
- /
- pp.67-70
- /
- 1998
본 논문에서는 단어독립 음성인식 시스템을 위한 음성인식 거절(rejection)기능에 대해 기술한다. 음성인식 거절 기능은 음성인식기를 제작할 때 정해놓은 인식대상 단어 이외의 단어가 입력되었을 때 그 단어가 인식할 수 없는 단어임을 알려주는 기능이다. 본 연구에서는 단어독립 음성인식 시스템에 적용될 수 있는 발화 검증 방식에 의해 음성인식 거절 기능을 구현하였다. 특히 유사도를 결정함에 있어서 산술평균, 기하평균, 조화평균을 사용하고 각각을 비교하여, 기하 평균을 사용하는 방식이 우수한 성능을 보임을 알 수 있었다. 음성의 신뢰도(confidence score)를 정규화하기 위해서 Sigmoid 함수를 사용하는데 이 함수의 가중치(weight) 상수의 변화에 대해 인식률을 비교함으로써 가장 적절한 가중치 상수값을 결정하였다. 음성인식 테스트 결과에서는 신뢰도 임계치 값을 구하고 이 값을 사용하여 인식률을 계산하였으며, 거절의 오류까지 포함된 음성인식률은 약 76%였다. 이 연구결과는 현재 한국통신에서 시험 서비스 중인 음성인식 증권정보 안내 시스템에 적용될 예정이다.
PDF

검색결과 6,315건 처리시간 0.033초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)