• 제목/요약/키워드: 인식비교

검색결과 6,317건 처리시간 0.033초

대역폭 변화에 따른 음성 인식률 비교연구 (A Comparative Study of Recognition Rate According to the Variance of Speech Bandwidth)

  • 손일현;도삼주;구명완
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1992년도 제4회 한글 및 한국어정보처리 학술대회
    • /
    • pp.193-199
    • /
    • 1992
  • 이 논문에서는 123개 단어의 한국어 음성에 대하여 음성의 대역폭 변화에 따른 인식률을 비교하였다. 인식률 비교실험을 위해 hidden Markov model과 음소와 유사한 131개의 한국어 subword 유니트를 사용한 화자독립 격리단어 인식 시스팀을 사용하였다. 이 실험은 대역폭이 각각 0 - 4.5kHz 및 0.3 - 3.3kHz인 두가지 종류의 음성 데이타베이스를 사용하였다. 훈련과정에서 corrective training의 반복회수를 2로 하고 state transition duration 정보를 사용하였을 때, 0 - 4.5kHz 와 0.3 - 3.3kHz 대역폭에 대해 각각 98.8 % 및 98.2 % 의 최고 인식률을 얻었다. 이로부터 전화대역폭에서도 음성인식률은 크게 저하되지 않음을 알 수 있다.

  • PDF

신경회로망을 이용한 화자식별 시스템의 특징 파라미터에 따른 성능비교 (Performance Comparison by Characteristic Parameter of Speaker Identification System using Neural Networks)

  • 정재룡;유재훈;배현;전병희;김성신
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2002년도 추계학술대회 및 정기총회
    • /
    • pp.345-348
    • /
    • 2002
  • 음성인식 기술은 크게 음성인식과 화자인식 기술의 두 가지로 분류된다. 현재는 음성인식 기술이 널리 연구되고 있지만 점차 화자인식 기술의 중요성이 대두되고 있다. 본 논문에서는 화자인식 기술의 한 가지 분류로 임의 화자를 식별하기 위한 화자식별 기술을 연구 대상으로 하고 있으며, 신경회로망을 이용한 화자식별 시스템의 특징 추출 방법을 제시하고 그에 따른 성능을 비교하고 있다. 식별 단계에서 26명의 78개의 음성 샘플을 신경회로망의 역전파 알고리듬을 이용하여 학습하고, 테스트용으로 한 화자의 음성샘플이 사용되어 식별된다. 신경회로망의 입력 변수는 특징 파라미터로 선형예측계수, Mel-주파수 켑스트럼계수와 웨이블릿을 이용한 켑스트럼 계수를 사용하였다. 그 결과로써 화자식별 시스템의 신경회로망 모델2의 입력으로 혼합된 특징 파라미터를 사용한 경우가 다른 파라미터들을 사용한 경우와 비교하여 8.46~21.53%의 차를 가지고 가장 좋은 성능을 나타내었다.

ZigBee를 이용한 실내 위치 인식의 정확성 향상에 관한 연구 (A Study on Accuracy Enhancement of Indoor Local Positioning System for Zigbee)

  • 김인겸;이기영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2009년도 춘계학술대회
    • /
    • pp.745-748
    • /
    • 2009
  • 본 논문은 ZigBee 기술을 이용하여 실내 위치 인식 알고리즘을 설계하고 구현하였다. ZigBee의 가장 큰 장점은 RFID, 적외선, 초음파 기술 등과 비교하여 저전력으로 오랜 시간 동안 사용할 수 있으면서도 가격이 저렴하다는 것이다. 본 논문은 ZigBee를 이용한 위치 인식 기술에 RSSI와 삼각 측량법, 그리고 다수의 데이터에서 정확한 RSSI값을 선택하는 알고리즘을 설계하였고, 위치 인식의 정확도를 높이는데 초점을 두었다. RSSI값을 미리 실측하여 Curve Fitting을 이용하여 각각의 고정 AP마다 RSSI와 거리의 관계식을 산출하여 위치 계산에 사용하였다. 또한 실제 위치 인식 시스템을 기존의 삼각 측량법만을 사용하는 방법과 본 논문에서 제안하는 방법을 각각 구현하였다. 또한 모의실험을 통해 실제 모바일 노드의 위치와 측정된 위치의 오차율을 비교하여 성능을 측정하였다. 모의실험을 통해 성능을 비교하여 모바일 노드의 위치 인식 오차율을 줄이고, 정확도를 향상하였다.

  • PDF

KT 변환과 템플릿매칭을 이용한 얼굴 인식 방법 (Comparative Study on the Recognition of Face Image Using the KL transform and the Template Matching)

  • 강환일;송영기;이세영;정요원
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1999년도 춘계공동학술대회: 지식경영과 지식공학
    • /
    • pp.301-305
    • /
    • 1999
  • 얼굴인식의 방법 중 하나인 전체얼굴에 대한 인식 방법으로, 고유벡터를 이용한 인식 방법과 템플릿 매칭을 이용한 방법의 차이점을 비교 연구한다. 고유벡터를 이용한 방법은 얼굴 영상에 대한 벡터공간을 얻은 후 각 얼굴 영상을 구별할 수 있는 공간에 대한 투영을 통하여 인식에 이용한다. 템플릿 매칭에 기반한 방법은 몇가지 유사도 정의를 이용한 것이다. 또한 얼굴 영상에 대한 전처리 과정이 인식에 끼치는 영향도 분석한다. 본 논문은 두가지의 얼굴 영상 인식기술의 비교를 통하여 얼굴 영상의 인식에 대한 유용한 도구로서 에지영상을 이용한 KL변환 방법이 더 우수함을 보인다.

  • PDF

KL 변환과 템플릿매칭을 이용한 얼굴 인식 방법 (Comparative Study on the Recognition of Face Image Using the KL transform and the Template Matching)

  • 강환일;송영기;이세영;정요원
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 1999년도 춘계공동학술대회-지식경영과 지식공학
    • /
    • pp.301-305
    • /
    • 1999
  • 얼굴인식의 방법 중 하나인 전체얼굴에 대한 인식 방법으로, 고유벡터를 이용한 인식 방법과 템플릿 매칭을 이용한 방법의 차이점을 비교 연구한다. 고유벡터를 이용한 방법은 얼굴 영상에 대한 벡터공간을 얻은 후 각 얼굴 영상을 구별할 수 있는 공간에 대한 투영을 통하여 인식에 이용한다. 템플릿 매칭에 기반한 방법은 몇가지 유사도 정의를 이용한 것이다. 또한 얼굴 영상에 대한 전처리 과정이 인식에 끼치는 영향도 분석한다. 본 논문은 두가지의 얼굴 영상 인식기술의 비교를 통하여 얼굴 영상의 인식에 대한 유용한 도구로서 에지영상을 이용한 KL변환 방법이 더 우수함을 보인다.

  • PDF

고속 필기 한글 주소 인식을 위한 낱자 인식 (Character Recognition for Fast Handwritten Korean Address Reading)

  • 정선화;임길택;송재관;남윤석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.589-592
    • /
    • 2001
  • 본 논문에서는 고속 필기 한글 주소 인식을 위한 낱자 인식기를 제안한다. 인식 대상은 우편번호 여섯 자리에 할당된 주소에 출현 빈도가 높은 필기 한글 469 자이다. 제안된 방법은 낱자 인식 기법을 채택하고 있으며, 인식률과 처리속도를 향상시키기 위하여 2 단계 인식 전략을 채택하였다. 인식기로는 다층퍼셉트론, 최소거리분류기, Subspace 방법을 고려한다. 다층퍼셉트론은 비교적 높은 인식률과 처리속도를 보유하지만 출력값이 확률이 아님으로써 후처리를 필요로 하는 시스템에서 사용하기 어렵다. 최소거리분류기는 간단한 알고리즘으로 처리속도가 높고 확률을 출력하는 장점을 갖지만 인식률이 낮아 활용되기 어렵다. 또한 Subspace 방법은 인식률이 높고 확률을 출력하지만 처리속도가 매우 느리다는 단점이 있다. 따라서 제안방법에서는 처리속도가 높은 인식기 - 다층퍼셉트론, 최소거리분류기 - 를 사용하여 선인식을 수행한 후, 이 결과를 활용하여 인식 대상을 제한한 후 Subspace 방법을 사용하여 정확하게 인식하는 전략을 도입함으로써, 높은 인식결과를 유지하면서 처리속도를 높이고 후처리에 적합하도록 하였다. PE92 데이터베이스를 사용하여 실험한 결과 제안방법이 한글 469 자에 대하여 비교적 높은 인식률과 처리속도를 갖음을 알 수 있었다.

  • PDF

차량 항법용 음성 인식 시스템 구현 (Implementation of Speech Recognition System for Car Navigation)

  • 김지성
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
    • /
    • pp.51-54
    • /
    • 1998
  • 본 논문에서는 자동차 잡음 환경에서 녹음된 데이터 베이스를 이용하여 인식 시스템의 성능을 향상시키기 위한 효율적인 잡음 제거 방법을 연구하였다. 먼저, 잡음 및 주변 환경 변화에 강인한 것으로 알려져 있는 특징 벡터들의 인식 성능을 비교하교, 가중 켑스트랄 거리 측정 방법을 이용한 인식 실험을 통하여 시스템의 성능 향상을 확인하였다. 실험 결과, 본 논문에서 기준 시스템으로 사용한 LPC 켑스트럼의 경우에 비하여 MFCC나 root-cepstrum을 사용한 경우 인식률이 향상되었다. 켑스트럼간의 거리 측정에 있어서는 RPS와 BPL과 같은 가중 켑스트랄 거리 측정 함수들이 인식 성능 향상에 도움을 주었다. 또한 켑스트럼 평균 차감법이라는 간단한 잡음 제거기술을 적용하여 자동차 잡음 환경에서 인식 성능 향상을 보였다. 마지막으로, 차량 항법용 음성 인식 시스템의 실시간구현을 위하여 여러 경우의 인식 성능을 비교하고, 메모리 량과 실행 시간 등을 고려하여 최적 시스템을 제시하였다.

  • PDF

PSOLA 방식을 이용한 화자인식 시스템의 처리시간 단축에 관한 연구 (A Study on Reduction of the Processing time of Speaker Recognition using the PSOLA Method)

  • 박현영;서지호;배명진
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅳ
    • /
    • pp.2447-2450
    • /
    • 2003
  • 화자인식은 음성의 특성을 이용해서 화자의 신원을 확인하는 기술이다. 이러한 기술은 등록된 화자집단 중 화자를 식별하는 화자식별(speaker Identification)과 지금 발성한 화자만을 비교하여 확인하는 화자확인(speaker verification)이 있다. 이러한 화자인식은 음성에 내재되어 있는 화자정보를 추출하여 개인을 확인하는 기술로 전화망을 통한 서비스가 확산되어 가고 있는 현대사회에 가장 효과적인 기술 중 하나이다. 또한 PDA를 이용한 증건거래 시스템 등 현대사회에서는 실시간으로 화자인식이 이루어져야 한다. 본 논문에서는 이와 같이 실시간 화자인식을 위한 처리시간 단축에 관하여 연구하였다. 처리시간 단축을 위하여 우선 피치주기 단위로 음성 파형을 분해한 다음 분해된 피치 단위에 윈도우 함수를 곱해서 단구간 신호의 열로 만들고 분해된 단위를 조절하는 PSOLA 합성방식을 이용하여 인식 시스템의 전처리단을 재구성하였다. 이와 같은 방식으로 제안한 인식시스템의 처리시간, 인식률을 기존의 화자인식 시스템과 비교하였다.

  • PDF

한국어 고립단어인식을 위한 고속 알고리즘 (Fast Algorithm for Recognition of Korean Isolated Words)

  • 남명우;박규홍;정상국;노승용
    • 한국음향학회지
    • /
    • 제20권1호
    • /
    • pp.50-55
    • /
    • 2001
  • 본 논문에서는 청각모델을 이용하여 음성신호로부터 추출한 특징벡터를 2차원 DCT (discrete cosine transform)방법을 사용하여 가공한 후, 새로운 거리측정 방법에 적용하여 한국어 고립단어 인식 실험을 행하였다. 고립단어 인식은 기존에 많은 방법들이 제안되어졌으나, 본 논문에서 제안한 방법은 고립단어 인식을 위한 특징 파라미터로 2차원 DCT 계수를 사용한 것으로 구현이 간단하며, 간단한 계산식으로 인하여 빠른 인식 시간을 가지는 장점이 있다. 제안한 방식의 타당성 검토를 위하여, 고립단어 인식에서 좋은 인식결과를 나타내는 DTW (Dynamic Time Warping)방법을 사용하여 인식률을 비교하였다[5][6]. 실험결과 제안한 방식은 DTW를 사용한 인식방법에 비하여 화자종속 고립단어 인식에서는 거의 유사한 인식결과를, 화자독립 고립단어 인식에서는 더 높은 인식결과를 얻을 수 있었다. 또한, DTW에 비해 패턴비교를 위한 계산시간에 있어서는 200배 이상의 감소효과를 볼 수 있었다. 제안된 방법은 비교 방법에 비하여 잡음환경에서도 강한 특성을 보였다.

  • PDF

특이점 가중치 기반 PLSA를 이용한 객체 범주화 (Object Categorization Using PLSA Based on Weighting)

  • 송현철;황인택;최광남
    • 인터넷정보학회논문지
    • /
    • 제10권4호
    • /
    • pp.45-54
    • /
    • 2009
  • 본 논문에서는 영상 내 객체들의 카테고리 분석을 위해 연구된 PLSA를 기반으로 특이점에 가중치를 부여하여 보다 유사한 카테고리 간에 인식 성능을 향상시키는 접근법에 대하여 연구하였다. PLSA는 문서기반의 정보검색 분야로부터 소개된 기법으로, 약한 수준의 비감독 방법임에도 불구하고 인상적인 인식성능을 보여준다. 그러나 비슷한 특징점 분포를 보이는 유사한 카테고리 간의 객체 카테고리 인식에 대해서는 비교적 낮은 성능을 보인다. 본 연구에서는 카테고리간의 비교실험을 통해 각 특징점에 대하여 가중치를 부여한 PLSA를 적용하여 유사한 객체 간의 카테고리 인식 가능성을 살펴보았다. 실험에서는 기존의 PLSA 기법과 제안한 가중치를 부여 PLSA 기법을 각각 적용하여 그 성능을 비교하였다. 본 연구에서는 기존 PLSA 기법에서는 비교적 낮은 인식률을 보인 유사한 카테고리 인식에 대하여 실험 결과를 통해 가중치를 부여한 PLSA 기법이 보다 향상된 성능을 보임을 확인하였다.

  • PDF