• 제목/요약/키워드: 인식율

검색결과 1,691건 처리시간 0.036초

상태의존 소스 양자화에 기반한 음성인식을 위한 은닉 마르코프 모델 파라미터의 견고한 추정 (Robust estimation of HMM parameters Based on the State-Dependent Source-Quantization for Speech Recognition)

  • 최환진;박재득
    • 한국음향학회지
    • /
    • 제17권1호
    • /
    • pp.66-75
    • /
    • 1998
  • 최근 음성인식을 위한 대표적인 방법으로써 은닉 마르코프 모델이 사용되고 있으며, 이러한 방법은 음성의 특성을 잘 표현하도록 하는 음향적인 모델링 방법에 따라서 성능이 좌우된다. 본 논문에서는 상태에서의 출력확률은 견고히 추정하기 위한 방법으로 상태에서 의 출력활률을 소스들의 분포와 그들의 빈도로 가중한 출력분포로 표시하는 상태 의존 소스 양자화 모델링 방법을 제안한다. 이 방법은 한 상태 내에서 특징 파라미터들이 유사한 특성 을 가지며, 그들의 변이가 다른 상태에 있는 특징 파라미터들에 비해서 작다는 사실에 기반 한다. 실험결과에 의하면, 제안된 방법이 기존의 baseline시스템보다 단어 인식율의 경우는 2.7%, 문장 인식율의 경우 3.6%의 향상을 보였다. 이러한 결과로부터 제안된 SDSQ-DHMM이 인식율 향상면에서 유효하며, HMM에 있어서 상태별 출력확률의 견고한 추정을 위한 대안으로 사용될 수 있을 것으로 판단된다.

  • PDF

MFCC 특징 파라미터를 이용한 인식 알고리즘 (Recognition Algorithm using MFCC Feature Parameter)

  • 최재승
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2016년도 추계학술대회
    • /
    • pp.773-774
    • /
    • 2016
  • 배경잡음은 음성신호의 특징을 왜곡하기 때문에 음성인식 시스템의 인식율 향상의 방해요소가 된다. 따라서 본 논문에서는 배경잡음이 존재하는 환경에서의 음성인식을 실시하기 위해서, 신경회로망과 Mel 주파수 켑스트럼 계수를 사용하여 연속음성 식별 알고리즘을 제안한다. 본 논문의 실험에서는 본 알고리즘을 사용하여 배경잡음이 섞인 음성신호에 대하여 음성인식의 식별율 개선을 실현할 수 있도록 연구를 진행하며, 본 알고리즘이 유효하다는 것을 실험을 통하여 명백히 한다.

  • PDF

화자인식을 위한 음성 요소들의 성능분석 및 새로운 판단 논리 (Performance Analysis of Speech Parameters and a New Decision Logic for Speaker Recognition)

  • 이혁재;이병기
    • 대한전자공학회논문지
    • /
    • 제26권7호
    • /
    • pp.146-156
    • /
    • 1989
  • 본 논문에서는 화자인식 시스템의 인식율 향상을 도모하기 위하여 요소의 선택 및 판단 논리의 문제를 고찰하였다. 또한 화자인식 실험을 수행하는 과정에서 기준패턴의 작성이 인식율에 어떠한 영향을 미치는 가를 아울러 검토해 보았다. LPC, PARCOR 계수, LPC-cepstrum 계수등을 인식 요소로 사용하여 화자확인 오차율을 측정한 결과, 기준 패턴의 작성방법에 관계 없이 LPC-cepstrum계수의 성능이 LPC나 PARCOR 계수의 성능에 비해 우수한 것으로 나타났다. 또 화자인식율을 향상시키기 위하여 일반화된 거리 개념을 도입한 새로운 판단 논리를 제안하였다. 제안된 판단 논리는 기준화자 및 외부화자의 통계적 성질을 동시에 고려하여 각 요소들에 서로 다른 가중치를 둔다는 점이 기존의 방법들에 비해 다르다. 화자적인 실험결과 제안된 판단 논리를 적용한 경우가 기존의 방법들에 비해서 인식율이 향상된 것을 관찰할 수 있었다.

  • PDF

주행중인 자동차 환경에서의 고립단어 음성인식 연구 (A Study on Isolated Words Speech Recognition in a Running Automobile)

  • 유봉근
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 2호
    • /
    • pp.381-384
    • /
    • 1998
  • 본 논문은 주행중인 자동차 환경에서 운전자의 안전성 및 편의성의 동시 확보를 위하여, 보조적인 스위치 조작없이 상시 음성의 입, 출력이 가능하도록 한다. 이때 잡음에 강인한 threshold 값을 구하기 위하여, 일정한 시간마다 기준 에너지와 영교차율(Zero Crossing Rate)을 변경하며, 밴드패스 필터(bandpass filter)를 이용하여 1차, 2차로 나누어 실시간 상태에서 자동으로, 정확하게 끝점검출(End Point Detection)을 처리한다. 기준패턴(reference pattern)은 DMS(Dynamic Multi-Section)을 사용하며, 화자의 변별력을 높이기 위하여 2개의 모델사용을 제안한다. 또한 주행중인 차량의 잡음환경에 강인하기 위하여 일반주행(80km/h 이내), 고속주행(80km/h 이상)등으로 나누며 차량의 가변잡음 크기에 따라 자동으로 선택하도록 한다. 음성의 특징 벡터와 인식 알고리즘은 PLP 13차와 One-Stage Dynamic Programming (OSDP)를 이용한다. 실험결과, 자주 사용되는 차량 편의장치 제어명령 33개에 대하여 중부, 영동 고속도로(시속 80Km/h 이상)에서 화자독립 89.75%, 화자종속 90.08%의 인식율을 구하였으며, 경부 고속도로에서는 화자독립 92.29%, 화자종속 92.42%의 인식율을 구하였다. 그리고 저속 주행중인 자동차 환경(80km/h 이내, 시멘트, 아스팔트 등의 서울시내 및 시외독립)에서는 화자독립 92.89%, 화자종속 94.44% 인식율을 구하였다.

  • PDF

얼굴피부색, 얼굴특징벡터 및 안면각 정보를 이용한 실시간 자동얼굴검출 및 인식시스템 (Real-Time Automatic Human Face Detection and Recognition System Using Skin Colors of Face, Face Feature Vectors and Facial Angle Informations)

  • 김영일;이응주
    • 정보처리학회논문지B
    • /
    • 제9B권4호
    • /
    • pp.491-500
    • /
    • 2002
  • 본 논문에서는 칼라 얼굴 영상으로부터 피부색 정보, 얼굴의 기하학적 특징벡터 및 안면각 정보를 이용한 실시간 얼굴검출 및 인식 알고리즘을 제안하였다. 제안한 알고리즘에서는 HSI 칼라좌표계상의 얼굴 피부색 정보와 얼굴 에지 정보를 함께 이용함으로써 얼굴 영역 검출 효율을 개선하였다. 또한 추출된 얼굴 영역으로부터 얼굴인식율 개선을 위해 얼굴 특징자들을 추출하고 추출된 얼굴 특징자들의 기하학적 관계로 구성된 얼굴 특징벡터와 얼굴 안면각 정보를 사용하여 얼굴 인식율을 개선하였다. 실험에서는 제안한 방법이 기존의 방법에 비해 얼굴 영역 검출율 뿐만 아니라 얼굴 인식율도 개선되었음을 알 수 있다.

바타챠랴 거리 측정법을 이용한 음소 유사율 오류 보정 개선 시스템 (Phoneme Similarity Error Correction System using Bhattacharyya Distance Measurement Method)

  • 안찬식;오상엽
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권6호
    • /
    • pp.73-80
    • /
    • 2010
  • 어휘 인식 시스템은 부정확한 어휘 제공과 유사한 음소 인식으로 인식률이 저하되며 이는 유사한 음소인식 오인식과 효율적 특징 추출 처리를 위한 방법을 필요로 한다. 따라서 본 논문에서는 음소가 갖는 특징을 기반으로 바타챠랴 거리 측정법을 이용한 음소 유사율 오류 보정 개선 시스템을 제안하였다. 음소 유사율은 모노폰으로 훈련시킨 훈련 데이터의 음소에 HMM 특징 추출 방법을 이용하였으며 유사한 음소는 바타챠랴 거리 측정법을 이용하여 정확한 음소로 인식할 수 있도록 유도하여 인식률 향상 효과를 얻을 수 있었다. 이를 유클리디안 거리 측정법과 동적타임 워핑 시스템에 비교한 시스템 성능 평가 결과 1.2%의 향상된 97.91% 인식률을 보였다.

H.264/AVC에서 비트율 제어와 시각 인지도를 고려한 영상화질 개선 기법 (Improving Video Quality with Bitrate Control and Visual Recognition in H.264/AVC)

  • 안수민;김강석;김재훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.971-974
    • /
    • 2014
  • H.264/AVC 영상 부호화기의 비트율(Bitrate) 제어에 사람의 눈에 잘 인식되는 부분의 화질을 향상하고 인식률이 낮은 부분의 화질을 낮추어 상대적으로 향상된 화질을 얻기 위한 방법을 연구하였다. 먼저 H.264/AVC 영상 부호화기에서, 장면 변화로 인한 참조 프레임의 비트 낭비를 막기 위해 GOP(Group of Pictures) 단위로 장면 변화를 검출한 후, 검출된 장면 변화에 대해 GOP를 적용 시킨다. 해당 GOP 내에서 시각 인지도에 기초하여 물체의 움직임으로 인한 인식률이 높은 부분을 검출하고, 인식률이 높은 부분에 대해 QP(Quantization Parameter)의 재분배로 비트율을 높임으로써 화질을 향상시키고, 인식률이 낮은 부분에 대해서는 비트율을 적게 분배한다. 그 결과 한정된 대역폭을 갖는 전송 환경에서 영상을 향상된 화질로 이용할 수 있는 방법을 제안한다.

학습 기반의 자동차 번호판 인식 시스템 (Learing-based approach for License Plate Recognition)

  • 김종배;김갑기;김항준
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2000년도 하계종합학술대회논문집
    • /
    • pp.273-276
    • /
    • 2000
  • 자동차 번호판은 조명과 카메라에 따라 영상에서 다양한 형태로 나타나고 영상내의 잡음으로 인해 알고리즘 방식으로 자동차 번호판을 인식하기가 쉽지 않다. 이러한 문제에 적합한 해결 방법으로 본 논문에서는 학습 기반의 자동차 번호판 인식 시스템을 제안한다. 제안한 시스템은 자동차 검출 모듈, 번호판 추출 모듈, 번호판 문자인식 모듈로 구성된다. 본 논문에서는 자동차 번호판 추출을 위해서 시간-지연 신경망(Time-Delay Neural Networks : TDNN)과 번호판 인식을 위해서 일반적인 신경망보다 일반화 성능이 뛰어난 서포트 벡터 머신(Support Vector Machines : SVMs)을 시스템에 적용한다. 주차장과 톨케이트에서 여러 시간대의 움직이는 자동차 영상들을 실험한 결과, 자동차 검출율은 100%, 번호판 추출율은 97.5%, 번호판 문자 인식율은 97.2%의 성능을 내었고, 전체 시스템 성능은 94.7%이며 처리 시간은 약 1초 미만이다. 따라서 본 논문에서 제안한 시스템은 실세계에서 유용하게 적용될 수 있다.

  • PDF

시퀀스-피이드백 신경회로망을 이용한 한국어 숫자음 인식 (Korean Digits Recognition using Sequence-feedback Neural Network (SFNN))

  • 최정철;이기영;최종환;최갑석
    • 한국음향학회지
    • /
    • 제12권5호
    • /
    • pp.5-13
    • /
    • 1993
  • 본 논문에서는 음성신호의 시간정보와 상관성을 포함할 수 있는 방법으로 시퀀스-피이드백 신경회로망을 제안하였으며, 그에 의한 단어인식을 수행하였다. 이 방법에서는 음성을 인식할 때 순차적으로 과거의 출력을 네트워크 입력으로 피이드백시켜 신경회로망으로 하여금 음성의 상관성과 시간정보를 갖도록 하는 순차적인 피이드백 순환구조의 시퀀스-bldlemqor 신경회로망을 이용하였으며 시퀀스-bldlemqor 신경회로망의 입출력층의 수를 줄이는 방법으로 등분 분할을 사용하였다. 본 논문에서 제안한 방법으로 한국어 숫자음을 대상으로 실험한 결과 92.5%의 인식율을 얻었으며, 피이드포워드형 신경회로망에서의 옷인식율을 1/3배 정도로 감소시켰다.

  • PDF

하이브리드 궤도회로 태그 인식율 향상에 관한 연구 (A Study on Hybrid Track Circuit Tag Recognition Enhancement)

  • 양동인;이창룡;김철환;이기서;고윤석
    • 한국전자통신학회논문지
    • /
    • 제9권4호
    • /
    • pp.537-542
    • /
    • 2014
  • 철도신호시스템에서 열차위치 검지기능은 선로의 레일을 전기회로의 일부분으로 사용하여 차륜에 의해 단락되어 열차의 유무를 검지하는 궤도회로, RFID와 차륜센서, GPS 등과 같은 여러 가지 방식으로 구현 연구가 되고 있다. 하이브리드 궤도회로는 안테나와 리더기를 차량에 설치하고, 태그를 침목위에 설치하여, 안테나에서 태그에 저장된 절대위치정보를 제어장치에 전송하여 열차위치를 인식하는 RFID 방식의 궤도회로이다. 열차위치검지기능에서 태그의 인식율은 열차운행의 안전에 직접적인 영향을 주게 되므로 고신뢰도를 요구한다. 본 논문에서는 방향각을 갖는 태그를 이용한 태그인식율의 향상에 관한 연구를 하였다.