• 제목/요약/키워드: 음성 검출기

검색결과 137건 처리시간 0.025초

음성인식기를 이용한 한국인의 외국어 발화오류 자동 검출 (Automatic Detection of Mispronunciation Using Phoneme Recognition For Foreign Language Instruction)

  • 권철홍;강효원;이상필
    • 대한음성학회지:말소리
    • /
    • 제48호
    • /
    • pp.127-139
    • /
    • 2003
  • An automatic pronunciation correction system provides learners with correction guidelines for each mispronunciation. In this paper we propose an HMM based speech recognizer which automatically classifies pronunciation errors when Korean speak Japanese. For this purpose we also develop phoneme recognizers for Korean and Japanese. Experimental results show that the machine scores of the proposed recognizer correlate with expert ratings well.

  • PDF

입술움직임 영상신호를 고려한 음성존재 검출 (Speech Activity Decision with Lip Movement Image Signals)

  • 박준;이영직;김응규;이수종
    • 한국음향학회지
    • /
    • 제26권1호
    • /
    • pp.25-31
    • /
    • 2007
  • 본 논문은 음성인식을 위한 음성구간 검출과정에서, 음향에너지 이외에도 화자의 입술움직임 영상신호까지 확인하도록 함으로써, 외부의 음향잡음이 음성인식 대상으로 오인식되는 것을 방지하기 위하여 시도한 것이다. 먼저, PC용 화상카메라를 통하여 영상을 획득하고, 입술움직임 여부가 식별된다. 그리고 입술움직임 영상신호 데이터는 공유메모리에 저장되어 음성인식 프로세스와 공유한다. 한편, 음성인식의 전처리 단계인 음성구간 검출과정에서는 공유메모리에 저장되어 있는 데이터를 확인함으로써 사람의 발성에 의한 음향에너지인지의 여부를 확인하게 된다. 음성인식기와 영상처리기를 연동시켜 실험한 결과, 화상카메라에 대면해서 발성하면 음성인식 결과의 출력까지 정상적으로 진행됨을 확인하였고, 화상카메라에 대면하지 않고 발성하면 음성인식 결과를 출력하지 않는 것을 확인하였다. 이는 음향에너지가 입력되더라도 입술움직임 영상이 확인되지 않으면 음향잡음으로 간주하도록 한 것에 따른 것이다.

dSPACE 보드를 이용한 음성인식 명령처리시스템 실시간 구현에 관한 연구 (A study on real-time implementation of speech recognition and speech control system using dSPACE board)

  • 김재웅;정원용
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2000년도 추계종합학술대회논문집
    • /
    • pp.173-176
    • /
    • 2000
  • 음성은 인간이 가진 가장 편리한 제어전송수단으로 이를 통한 제어는 인간에게 많은 편리함을 제공할 것이다. 본 논문에서는 다층구조 신경망(Multi-Layer Perceptron)을 이용하여 간단한 음성인식 명령처리시스템을 Matlab 상에서 구성해 보았다. 음성인식을 통한 제어의 목적을 위해 화자종속, 고립단어인식기를 목표로 설정하여 연구를 수행하였다. 음성의 시작점과 끝점을 검출하기 위해 단구간 에너지와 영교차율(ZCR)을 이용하였고 인식기의 특징파라미터로는 12차 LPC켑스트럼 계수를 사용하였다. 그리고 신경망의 출력값을 기동, 정지시에 활성화되도록 3개의 계층으로 하였고, 신경망의 뉴런의 개수를 각각 12, 12, 2으로 설정하였다. 먼저 기준음성패턴으로 학습시킨 후에 Matlab 환경하에 동작하는 dSPACE 실시간처리보드에 변환된 C프로그램을 다운로드하고, 음성을 입력하여 인식 후 dSPACE보드의 D/A컨버터의 출력단에 연결된 DC모터를 기동, 정지제어를 수행하였다. 실시간 음성인식 명령처리 시스템 구현을 통하여 원격제어와 같은 음성명령을 통한 제어가 가능함을 확인할 수 있었다.

  • PDF

강인한 핵심어 인식을 위해 유용한 주파수 대역을 이용한 음성 검출기 (Accurate Speech Detection based on Sub-band Selection for Robust Keyword Recognition)

  • 지미경;김회린
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2002년도 11월 학술대회지
    • /
    • pp.183-186
    • /
    • 2002
  • The speech detection is one of the important problems in real-time speech recognition. The accurate detection of speech boundaries is crucial to the performance of speech recognizer. In this paper, we propose a speech detector based on Mel-band selection through training. In order to show the excellence of the proposed algorithm, we compare it with a conventional one, so called, EPD-VAA (EndPoint Detector based on Voice Activity Detection). The proposed speech detector is trained in order to better extract keyword speech than other speech. EPD-VAA usually works well in high SNR but it doesn't work well any more in low SNR. But the proposed algorithm pre-selects useful bands through keyword training and decides the speech boundary according to the energy level of the sub-bands that is previously selected. The experimental result shows that the proposed algorithm outperforms the EPD-VAA.

  • PDF

기능적 자기공명영상 및 확산텐서영상을 이용한 전음성 난청과 감각신경성 난청군의 비교 연구: 예비 결과

  • 이재준;황문정;이영주;김인성;배성진;장용민;이상흔;우성구;강덕식
    • 대한자기공명의과학회:학술대회논문집
    • /
    • 대한자기공명의과학회 2003년도 제8차 학술대회 초록집
    • /
    • pp.94-94
    • /
    • 2003
  • 목적: 기능적 자기공명영상과 확산텐서영상기법을 이용하여 전음성 난청과 감각신경성 난청에서의 뇌활성화 양상 그리고 청신경경로상의 차이점을 비교 연구하고자 하였다. 대상 및 방법: 전음성 난청군 (n=4)과 감각신경성 난청군(n=5) 그리고 정상군(n=5)에서의 기능적 자기 공명영상과 확산텐서영상을 획득하였다. 기능적 자기공명영상의 경우 1.5T Siemens MR scanner에서 BOLD 기법을 이용하여 500 Hz 순음 청각자극에 대한 뇌활성화 영역을 검출하였고 영상촬영시 발생하는 기계적 소음을 차폐하기 위한 청각자극기를 특별히 제작하여 사용하였다. 뇌백질신경로를 영상화하는 확산텐서영상은 3.0T GE whole body MR scanner를 사용하였으며 미세한 확산운동을 검출하기 위해 초고속 영상기법인 EPI 기법을 사용하였다. 영상의 화질을 높이기 위해 공간적으로 25개의 다른 방향으로 확산경사자장을 가하였다. 청신경로의 비등방성 영상, 신경로 방향 영상등을 구현하기 위해 획득한 확산영상들에 대한 영상 후처리과정을 시행하였다.

  • PDF

DSP를 이용한 홈 오토메이션용 음성인식 시스템의 실시간 구현 (Speech Recognition System for Home Automation Using DSP)

  • 김이재;김준성;양성일;권영헌
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 학술발표대회 논문집 제19권 2호
    • /
    • pp.171-174
    • /
    • 2000
  • 본 논문에서는 홈 오토메이션 시스템을 음성인식을 도입하여 설계하였다. 많은 계산량과 방대한 양의 데이터의 처리를 요구하는 음성인식을 DSP(Digital Signal Processor)를 통하여 구현해 보고자 본 연구를 수행하였다. 이를 위해 실시간 끝점검출기를 이용하여 추가의 입력장치가 필요하지 않도록 시스템을 구성하였다. 특징벡터로는 LPC로부터 유도한 10차의 cepstrum과 log 스케일 에너지를 이용하였고, 음소수에 따라 상태의 수를 다르게 구성한 DHMM(Discrete Hidden Marcov Model)을 인식기로 사용하였다. 인식단어는 가정 자동화를 위하여 많이 쓰일 수 있는 10개의 단어를 선택하여 화자 독립으로 인식을 수행하였다. 또한 단어가 인식이 되면 인식된 단어에 대해서 현재의 상태를 음성으로 알려주고 이에 대해 자동으로 실행하도록 시스템을 구성하였다.

  • PDF

HCI를 위한 음성 입출력 처리 기술 개발 (Speech Input/Output Processing Technology for Human-Computer Interface)

  • 이영직
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.367-370
    • /
    • 1998
  • 정보통신부 출연의 "HCI를 위한 음성 입출력 처리 기술 개발" 과제에 대하여 기술한다. 이 과제의 주 목적은 PC 윈도우 환경에서 사람과 기계 간의 음성 입출력 기술을 개발하는 것이다. 이를 위해 음성 인식 분야에서는 화자 적응, 잡음 적응, 및 인식 대상 어휘 적응 기술을 개발하며, 합성 분야에서는 시스템 메시지 합성 기술을 개발한다. 또, 음성이 기존의 입출력 수단인 키보드나 마우스를 모두 대치할 수 없으므로, 본 과제에서는 음성이 추가됨으로써 입출력이 편리해지는 다중 모드 입출력 기술의 갭라에 초점을 맞추어 기술을 개발하고 있다. 인식 분야의 주요 연구내용은 음성검출 및 비음성 제거, 인식 속도 향상, 인식 성능 향상이며, 합성 분야 주요 연구 항목은 학습형 합성기 알고리즘 및 이의 문제점 해결이다. 본 논문은 이러한 점을 정리하여 발표한다.정리하여 발표한다.

  • PDF

전력선과 조명등을 이용한 음향신호 전달 (Sound Transimitting System using Power Line and Lamp)

  • 주경돈;강민우;구경완;이승권;이명섭
    • 한국전기전자재료학회:학술대회논문집
    • /
    • 한국전기전자재료학회 2002년도 춘계학술대회 논문집 유기절연재료 전자세라믹 방전플라즈마 일렉트렛트 및 응용기술
    • /
    • pp.237-241
    • /
    • 2002
  • 전력선과 조명등을 이용한 음향전달 시스템을 구성하여 어학실습 교육용으로의 활용 가능성을 평가하였다. 음성신호를 변조하여 전력선에 실어 보내는 송신기와 조명등의 빛으로부터 음성신호를 검출하여 이어폰 또는 헤드폰 둥으로 들을 수 있는 수신기로 구성하였다. 제작한 송신기와 수신기의 주파수 특성과 스펙트럼분석을 하였다. 스피커로 출력되는 음질상태는 최적상태는 아니지만 음성이나 노래 등을 이용한 어학실습 교육용으로는 충분한 수준이 었다.

  • PDF

그림자에 강건한 색상 기반 내잡음성 코너 검출자 (Hue-based Noise-tolerant Corner Detector Robust to Shadows)

  • 박기현;박은진;최흥문
    • 대한전자공학회논문지SP
    • /
    • 제41권6호
    • /
    • pp.239-245
    • /
    • 2004
  • 본 논문에서는 그림자가 존재하는 환경 하에서도 실제 코너만을 정확하게 추출할 수 있는 색상 기반 내잡음성 코너 검출자를 제안하였다. 먼저 그림자 경계에서 명도의 변화는 크지만 색상의 변화는 크지 않으므로 각 화소에 대한 HSI 색 공간에서 색상 가중 조합 벡터 기울기를 코너 검출자에 반영함으로써 그림자의 영향을 제거하고, 선택된 에지 화소 쌍의 색 변화 방향이 서로 반대 극성일 때는 코너 기여 가중치를 상쇄시킴으로써 불규칙 잡음에도 강건하게 코너를 검출하도록 하였다. 실험을 통하여 제안한 코너 검출자가 그림자 및 불규칙 잡음에도 강건하게 실제 코너만을 효과적으로 검출함을 확인하였다.

DSI와 스펙트럼 차감법을 이용한 군중잡음 감쇄기의 설계 (Design for Crowd Noise Reduction System Using DSI and Spectral Subtraction)

  • 안용운;김상철;김중환
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (상)
    • /
    • pp.703-706
    • /
    • 2002
  • 군중잡음(crowd noise)이 발생하는 환경에서 음성 통화 및 화자 인식을 할 때에는 음성에 파열음이나 마찰음과 같은 유색잡음(colored noise)이 부가되어 원래 음성이 왜곡된다. 이와 같이 왜곡된 음성 신호를 처리할 때에는 군중잡음을 제거하는 과정이 반드시 필요하다. 본 논문에서는 전형적인 군중잡음의 모델인 쇼핑 센터 잡음을 분석하고, 그 결과를 이용하여 음성 신호처리시에 효과적으로 군중잡음만을 제거할 수 있는 모델을 제안한다. 제안된 모델은 시간 영역에서 마찰음과 파열음을 제거하고. DSI(Digital Speech Interpolation)를 이용하여 침묵 구간을 검출한다. 이때 주파수 영역에서는 이 침묵구간을 잡음으로 간주하여 이를 이용한 스펙트럼 차감법(spectral subtraction)으로 음성 신호에 부가된 군중 잡음을 제거하는 과정을 거친다.

  • PDF