• 제목/요약/키워드: 음성 검출기

검색결과 137건 처리시간 0.021초

자동차 환경에서 피치검출을 이용한 음성인식 연구 (A study on speech recognition using pitch detection in a car-noisy environment)

  • 이정기;유봉근;김학진;김순협
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 2호
    • /
    • pp.97-100
    • /
    • 1999
  • 본 논문은 자동차의 편의성 및 안전성의 동시 확보를 위하여, 보조적 스위치의 조작없이 상시 음성의 입$\cdot$출력이 가능하도록 하였고, 남성과 여성을 구별하기 위하여 피치검출법을 사용하여 속도별로 구분하였다. 또한, band pass filter를 이용하여 자동으로 잡음하에서 정확하게 음성추간 검출(End Point Detection)을 하게 하였다. Reference Pattern은 DMS(Dynaminc Multi-Section)[1]모델을 사용하려고, 음성의 특징 파라미터와 인식 알고리즘은 PLP 13차와 One Stage Dynamic Programming(OSDP)를 사용하였다. 시내주행중인 자동차 환경에서 자주 사용되는 차량제어 명령어 30단어를 가지고 실험한 결과 40-80km에서 화자독립 남성 $96\%$, 여성 $94.4\%$ 화자종속일 때 남성 $97\%$, 여성 $95\%$의 인식률을 얻을수 있었고 남성과 여성을 구분하므로 써 인식률을 향상 시켰다.

  • PDF

ETRI 방송 뉴스 자막 처리 시스템을 위한 미등록어 검출기의 개발 (Unknown Word Extractor Development, for ETRI Broadcast News Caption System)

  • 윤승;정의정;박준;이영직
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2002년도 하계학술발표대회 논문집 제21권 1호
    • /
    • pp.163-166
    • /
    • 2002
  • 본 논문에서는 ETRI 방송 뉴스 자막 처리 시스템의 성능 향상을 도모하기 위해 개발된 미등록어 검출기에 대해 기술한다. 음성 인식 성능 하락에 큰 영향을 미치는 요인들 중 하나로 꼽히는 미등록어 문제를 해결하기 위해 ETRI 방송 뉴스 자막 처리 시스템에서는 오프라인으로 동작하는 미등록어 검출기를 채택하였다. 이 미등록어 검출기는 방송 뉴스 자막 처리 시스템 가동 전에 미리 인터넷을 통해 최신 신문 기사와 방송 뉴스를 수집해와 이를 토대로 두 단계에 걸쳐 미등록어를 사전에 추출하여 인식 어휘 사전에 포함시킴으로써 미등록어로 인한 방송 뉴스의 인식 성능 저하 문제를 해결하도록 하였다.

  • PDF

핸즈프리 전화통신을 위하여 통합된 음향 반향 및 잡음 제거 시스템 (An Integrated Acoustic Echo and Noise Cancellation System for Hands-Free Telephony)

  • 박선준;조점군;이충용;윤대희
    • 한국통신학회논문지
    • /
    • 제26권6B호
    • /
    • pp.760-766
    • /
    • 2001
  • 본 논문에서는 차량내 핸즈프리 전화통신을 위한 음향 반향 및 배경 잡음 제거기를 제안한다. 제안한 시스템은 새로운 잔여 반향 제거 기법과 실시간 구현에 적합한 동시통화 검출기를 포함한다. 잔여 반향 제거에서는 근단화자가 없는 구간에 대하여 선형 예측기를 이용하여 잔여 반향 신호의 인접 샘플간의 상관도를 제거하여 잡음 제거기의 입력으로 사용한다. 잔여 반향 신호의 음성특성을 제거함으로써 잡음 제거기를 이용하여 배경 잡음과 더불어 잔여 반향의 전력을 효과적으로 줄일 수 있다. 제안된 시스템에서는 상용 저전송률 음성부호화기와의 결합을 고려하여 IS-127(EVRC)에 포함되어 있는 잡음 제거기를 사용하였다. 90 km/h로 정속 주행하는 차내의 핸즈프리 환경에서 제안된 시스템은 30 dB이상의 간섭신호 제거 성능을 보였다. 제안된 시스템은 16비트 고정 소수점 연산을 하는 저가의 DSP를 이용하여 실시간 구현되었다.

  • PDF

음성구간 검출기의 실시간 적응화를 위한 음성 특징벡터의 차원 축소 방법 (Dimension Reduction Method of Speech Feature Vector for Real-Time Adaptation of Voice Activity Detection)

  • 박진영;이광석;허강인
    • 융합신호처리학회논문지
    • /
    • 제7권3호
    • /
    • pp.116-121
    • /
    • 2006
  • 본 논문에서는 다양한 잡음환경에서의 실시간 적응화 기법을 적용하기 위한 선결 과제로 다차원 음성 특정 벡터를 저차원으로 축소하는 방법을 제안한다. 제안된 방법은 특징 벡터를 확률 우도 값으로 매핑시켜 비선형적으로 축소하는 방법으로 음성 / 비음성의 분류는 우도비 검증 (Likelihood Ratio Test; LRT) 을 이용하여 분류하였다. 실험 결과 고차원 특징 벡터를 이용하여 분류한 결과와 대등하게 분류됨을 확인할 수 있었다. 그리고, 제안된 방법에 의해 검출된 음성 데이터를 이용한 음성인식 실험에서도 10차 MFCC(Mel-Frequency Cepstral Coefficient)를 사용하여 분류한 경우와 대등한 인식률을 보여주었다.

  • PDF

가변계수 프리엠퍼시스를 이용한 마이크어레이 음성입력에 관한 연구 (On Speech Input with Microphone Array using the variable coefficient Pre-emphasis)

  • 조왕래;배명진
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2001년도 추계학술발표대회 논문집 제20권 2호
    • /
    • pp.65-68
    • /
    • 2001
  • 현재 음성인식기는 다채널의 음성입력방식을 사용하고 있는 추세이다. 이런 방법으로 음성인식기를 사용할 때에 자동적으로 음성을 검출하는 음성입력방식은 발성자와 마이크간의 거리에 따라 발성음성, 반사음성과 잡음이 입력된 경우에 원 음성의 고차포만트 성분에 왜곡이 발생하게 된다 이러한 문제점을 개선하기 위하여 본 논문에서는 고주파영역의 특성을 강조시킬 수 있는 프리엠퍼시스를 이용하여 더욱 더 정확한 음성입력 방법을 제안한다. 제안한 방법은 원음과 유사한 합성입력음을 얻었고, 또한 기존의 시간영역 법 보다 더 높은 SNR을 얻을 수 있다는 것을 알 수가 있다.

  • PDF

정규화된 오차신호 전력을 이용한 동시통화 검출기의 성능 개선 (Performance Improvement of Double-talk Detector Using Normalized Error Signal Power)

  • 허원철;배건성
    • 한국통신학회논문지
    • /
    • 제32권5C호
    • /
    • pp.478-486
    • /
    • 2007
  • 음향 반향제거기에서의 동시통화 검출 오류는 근단화자의 음성신호를 왜곡시키거나 반향제거 성능을 저하시킬 수 있다. 따라서 정확한 동시통화 구간의 검출은 음향 반향제거기의 성능을 결정짓는 중요한 요소 중의 하나이다. 기존의 상호상관계수를 이용한 동시통화 검출 알고리듬은 적응필터의 초기 수렴구간과 배경잡음이 많은 환경에서는 근단화자의 음성신호가 존재하지 않더라도 상호상관계수 값이 증가하여 동시통화 검출 오류가 자주 발생할 수 있다. 본 논문에서는 기존의 상호상관계수를 이용한 동시통화 검출 알고리듬의 문제점을 해결하기 위해 상호상관계수와 더불어 단일통화 구간에서의 적응필터의 정규화된 오차신호 전력을 이용하여 동시통화를 검출하는 알고리듬을 제안한다. 실험 결과, 제안한 동시통화 검출 알고리듬은 잡음환경에 강인할 뿐만 아니라 음향 반향제거기의 성능을 향상시킬 수 있음을 확인하였다.

반향제거를 위한 음성특징 기반의 동시통화 검출 기법 (Speech Feature based Double-talk Detector for Acoustic Echo Cancellation)

  • 박준은;이윤재;김기현;고한석
    • 전기전자학회논문지
    • /
    • 제13권2호
    • /
    • pp.132-139
    • /
    • 2009
  • 본 논문에서는 핸즈프리 통신에서의 반향제거를 위한 음성 특징 기반의 동시통화 검출 기법을 제안한다. 동시통화 검출은 반향제거를 위한 적응 필터의 적응을 제어하는 역할을 하기 때문에 매우 중요한 분야이다. 이전까지의 연구에서는 동시통화 검출을 음성의 특징에 대한 고려 없이 단순히 신호처리 영역에서만 이루어졌다. 하지만 제안한 기법에서는 음성인식으로 사용되는 음성 특징을 핸즈프리 통신상에서의 근단 화자와 원단화자 사이의 차별성을 가지는 특징으로 사용하였다. 제안한 방식이 시간 축에서의 파형만을 이용하여 판단하는 동시통화검출기보다 우수한 성능을 나타내는 것을 실험을 통하여 입증하였다.

  • PDF

묵음 검출 기능을 사용한 하이브리드 압신 델타 변조기 (Hybrid Commanding Delta Modulation with Silence Detection)

  • 조동호;은종관
    • 대한전자공학회논문지
    • /
    • 제19권6호
    • /
    • pp.84-90
    • /
    • 1982
  • 본 논물에서는 HCDM(hybrid companding delta modulation)을 사용하여 음성을 부호화할 때, 음성의 간헐성을 이용하여 전송속도를 줄이거나 잡음에 대한 신호비(SQNR)을 증가시키는 연구를 하였다. 음성부분과 묵음(silence)부분을 식별하는 판별기를 이용하여 음성의 묵음부분을 검출하며, 이때 음성부분에 대해서는 HCDM 부호화를 행한다. 음성을 5msec 간격으로 검사하여, 그때 검출되는 묵음부분에 대해서는 그 구간이 묵음이라는 정도만을 전송하며, 수신단에서는 이 정보를 이용하여 묵음부불을 재생한다. 그런데 HCDM 부호기는 2진 신호를 일정한 속도로 또 동기적으로 전송하기 때문에, 버퍼 (buffer)를 사용해야 하며 또한 그것을 효율적으로 제어해야 한다. 음성을 부호화할 때, 묵음검출 기능을 이용하는 HCDM 부호기를 사용하면, 재래의 HCDM 보다 잡음에 대한 신호비를 6dB 만큼 증가시킬 수 있거나, 전송속도를 1/3가량 줄일 수 있다.In this paper we exploit the use of the intermittent property of speech to reduce the transmission rate or to increase signal-to-quantization noise ratio (SQNR) in coding speech by hybrid companding data modulation (HCDM). In this scheme we detect silence in speech by a speech/silence discriminator. HCDM coding is done only for speech portion. For silence that is detected in evert block of 5 ms, only the information indicating that the Since the HCDM coder transmits bina교 signal synchronously at a fixed rate, the use of a buffer and its efficient control is essential. By using the HCDM with silence detection in coding speech, we could improve SONR by as much as 6 dB over the conventional HCDM or reduce the transmission rate by one third of the HCDM rate.

  • PDF

반향제거기의 수렴전 동시통화검출 (Double Talk Detection before the Convergence of Echo Canceller)

  • 유재하;김수찬;김동연
    • 한국인터넷방송통신학회논문지
    • /
    • 제13권5호
    • /
    • pp.203-208
    • /
    • 2013
  • 본 논문에서는 반향제거기가 수렴하기 전에 동작할 수 있는 동시통화검출기의 성능 향상에 대한 방법을 제안하였다. 마이크로폰에 입력된 신호를 선형예측필터에 통과시키고, 이 필터링 된 신호를 사용하여 검출을 수행하게 된다. 선형예측필터 계수는 원단화자신호의 음성으로부터 얻어진다. 단일통화 시에는 반향신호가 원단화자의 신호와 유사한 음성특성을 가지므로 필터링 된 신호가 작은 값을 갖게 된다. 그러나 동시통화가 발생한 경우에는 마이크로폰 신호에 다른 특성을 갖는 신호가 포함되어 있어서 파워가 줄어들지 않게 된다. 이를 사용하여 동시통화를 검출하게 된다. 음성신호를 사용한 모의 실험을 통하여 제안한 방법이 기존의 방법에 비해 동시통화를 빠르게 검출함으로서 성능이 우수함을 확인할 수 있었다.

500단어급 핵심어 검출기에서 화자적응 성능 평가 (Speaker Adaptation Performance Evaluation in Keyword Spotting System)

  • 서현철;이경록;김진영;최승호
    • 대한음성학회지:말소리
    • /
    • 제43호
    • /
    • pp.151-161
    • /
    • 2002
  • This study presents performance analysis results of speaker adaptation for keyword spotting system. In this paper, we implemented MLLR (Maximum Likelihood Linear Regression) method on our middle size vocabulary keyword spotting system. This system was developed for directory services of universities and colleges. The experimental results show that speaker adaptation reduces the false alarm rate to 1/3 with the preservation of the mis-detection ratio. This improvement is achieved when speaker adaptation is applied to not only keyword models but also non-keyword models.

  • PDF