• Title/Summary/Keyword: Error microphone

Search Result 87, Processing Time 0.021 seconds

음향 데이터 전송 시스템의 강인한 데이터 검출 성능을 위한 Gaussian Mixture Model 기반 연구 (Data Detection Algorithm Based on GMM in the Acoustic Data Transmission System)

  • 송지현;장준혁;김문기;김동건
    • 대한전자공학회논문지SP
    • /
    • 제48권4호
    • /
    • pp.136-141
    • /
    • 2011
  • 본 논문에서는 패턴 인식에서 우수한 성능을 보여주는 가우시안 혼합 모델을 이용하여 MCLT 기반 음향 데이터 전송 시스템의 데이터 검출 성능 향상을 위한 방법을 제안하였다. 기존의 MCLT 기반 음향 데이터 전송 시스템에 대해서 분석하고, 이를 기반으로 데이터 검출 알고리즘에서 우수한 성능을 보여주는 특징 벡터를 선택하여 GMM의 입력 벡터로 효과적으로 이용한다. 다양한 음원(rock, pop, classic, jazz)과 마이크-스피커 사이의 거리 (1∼5m)에서 시스템의 성능을 평가한 결과 GMM을 이용한 제안된 방법이 기존의 MCLT 기반 음향 데이터 전송 시스템의 데이터 검출 알고리즘보다 더욱 우수한 데이터 검출 성능을 보였다.

원거리 음성명령어 인식시스템 설계 (Performance Evaluation of an Automatic Distance Speech Recognition System)

  • 오유리;윤재삼;박지훈;김민아;김홍국;공동건;명현;방석원
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2007년도 하계종합학술대회 논문집
    • /
    • pp.303-304
    • /
    • 2007
  • In this paper, we implement an automatic distance speech recognition system for voiced-enabled services. We first construct a baseline automatic speech recognition (ASR) system, where acoustic models are trained from speech utterances spoken by using a cross-talking microphone. In order to improve the performance of the baseline ASR using distance speech, the acoustic models are adapted to adjust the spectral characteristics of speech according to different microphones and the environmental mismatches between cross-talking and distance speech. Next we develop a voice activity detection algorithm for distance speech. We compare the performance of the base-line system and the developed ASR system on a task of PBW (Phonetically Balanced Word) 452. As a result it is shown that the developed ASR system provides the average word error rate (WER) reduction of 30.6 % compared to the baseline ASR system.

  • PDF

에너지 기반 영역 선택과 TDOA에 의한 3차원 음원 위치 추정 (3-D Sound Source Localization using Energy-Based Region Selection and TDOA)

  • ;이은주
    • 한국정보통신학회논문지
    • /
    • 제21권2호
    • /
    • pp.294-300
    • /
    • 2017
  • 본 논문에서는 에너지 기반 영역 선택과 TDOA에 의해 3차원에서 음원의 방위와 높이를 계산하여 음원 위치를 추정하는 방법을 제안한다. 본 연구의 목적은 음원 위치 추정에서 계산시간 감축으로, 수평면 3개 신호의 에너지 비교에 의한 영역 선택과 선택된 영역의 TDOA에 의해 방위각을 계산하고, 또 높이 계산을 위한 마이크로폰 신호와 가장 큰 에너지를 갖는 평면 신호와의 TDOA로 높이각을 추정하는 방법을 제안한다. 제안한 방법에 대한 음원 추정실험 결과 수평 방위각 추정에서 평균 $0.778^{\circ}$, 높이각 추정에서 $1.296^{\circ}$의 오류를 보여 기존의 방법과 정확도에서 유사하고, 추정은 1회 신호 에너지 비교와 2회의 TDOA계산으로 가능하여 처리 시간이 단축된다.

새로운 잡음전력 추정 기법을 적용한 음향학적 반향 및 배경잡음 제거 통합시스템 (A New Unified System of Acoustic Echo and Noise Suppression Incorporating a Novel Noise Power Estimation)

  • 박윤식;장준혁
    • 한국음향학회지
    • /
    • 제28권7호
    • /
    • pp.680-685
    • /
    • 2009
  • 본 논문에서는 주파수 영역에서 음향학적 반향 및 잡음 제거의 통합 시스템을 위한 효과적인 잡음전력 추정 기법을 제안한다. 제안된 방법은 잡음 제거 (NS, noise suppression)가 음향학적 반향 억제 (AES, acoustic echo suppression)의 후처리단으로 결합하여 사용되는 구조에서 발생하는 잡음전력 추정오차를 줄이기 위해 마이크로폰 입력신호의 음성부재확률 (SAP, speech absence probability)을 잡음전력 갱신을 위한 스무딩 (smoothing) 파라미터로 적용한다. 따라서 제안된 기법에서는 반향 억제 후 신호에서 잡음전력 갱신을 위한 SAP를 추출하는 대신 입력신호에 대한 SAP를 NS 알고리즘에 적용함으로서 잡음 제거기가 반향 억제 후 왜곡된 잡음 스펙트럼 구간에서는 잡음전력을 갱신하지 않도록 한다. 제안된 알고리즘은 기존의 방법과 객관적인 실험을 통해 비교 평가한 결과 다양한 배경잡음 환경에서 우수한 성능을 보였다.

심층학습 알고리즘을 이용한 보청기의 음향궤환 및 잡음 제거 (Acoustic Feedback and Noise Cancellation of Hearing Aids by Deep Learning Algorithm)

  • 이행우
    • 한국전자통신학회논문지
    • /
    • 제14권6호
    • /
    • pp.1249-1256
    • /
    • 2019
  • 본 논문에서는 보청기의 음향궤환 및 잡음을 제거하기 위한 새로운 알고리즘을 제안한다. 이 알고리즘은 기존의 FIR 구조를 이용하는 대신 신경망 적응예측필터를 이용한 심층학습 알고리즘으로 궤환 및 잡음제거 성능을 향상시킨다. 먼저 궤환제거기가 마이크 신호에서 궤환신호를 제거하고, 이어서 Wiener 필터기법을 이용하여 잡음을 제거한다. 잡음 제거는 음성신호가 가진 주기적 성질에 따라 선형예측모델을 이용하여 잡음이 포함된 음성신호로부터 음성을 추정해내는 것이다. 한 루프 안에 포함된 두 적응 시스템의 안정적 수렴을 보장하기 위해 궤환제거기 및 잡음제거기의 계수 업데이트를 분리하여 실시하며 제거 후 생성된 잔차신호를 이용하여 수렴시키는 과정을 진행한다. 본 연구에서 제안한 궤환 및 잡음제거기의 성능을 검증하기 위하여 시뮬레이션 프로그램을 작성하고 모의실험을 수행하였다. 실험 결과, 제안한 심층학습 알고리즘을 사용하면 기존의 FIR 구조를 사용하는 경우보다 궤환제거기에서 약 10 dB의 SFR(: Signal to Feedback Ratio), 잡음제거기에서 약 3 dB의 SNRE(: Signal to Noise Ratio Enhancement) 개선효과를 얻을 수 있는 것으로 확인되었다.

$OakDSPCore^{\circledR}$를 이용한 적응형 다중 비트 (AMR) 음성 부호화기의 실시간 구현 (Real-time Implementation of the AMR Speech Coder Using $OakDSPCore^{\circledR}$)

  • 이남일;손창용;이동원;강상원
    • 한국음향학회지
    • /
    • 제20권6호
    • /
    • pp.34-39
    • /
    • 2001
  • 적응형 다중 비트 (AMR: adaptive multi-rate)은 ETSI (European Telecommunications Standards Institute)에서 채택한 광대역 코드분할 다중화(W-CDMA: wideband cadedivision multiple access)용 음성 부호화표준방식으로서 채널 상태의 변화에 따라 가변적인 전송률을 가진다. 본 논문에서는 적응형 다중 비트 음성 부호화 알고리즘을 분석하고 C프로그램 최적화 과정을 거친 후OakDSPCore/sup R/를 기반으로 설계된 C&S Technology사의 CSD17C00A칩을 이용하여 전과정을 어셈블리어로 실시간 구현하였다. 구현된 코덱은 최대의 계산량을 요구하는6.7 kbps 모드일때 인코더부분이 최대 20.6MIPS이며 디코더부분은 약2.7MIPS의 복잡도를 나타낸다. 사용된 메모리는 약 21.33 kwords, 데이터 RAM메모리는 약 4.25 kwords를 가지며 데이터 ROM메모리는 약 15.1kwords 이다. 구현된 코덱은 최대 약 23.29MIPS의 복잡도를 가지고 있으므로 40MIPS의 성능을 가지는 CSD17C00A를 이용한 보드상에서 실시간 동작이 가능함을 확인하였다. 구현된 프로그램은 ETSI에서 제공하는 21개의 테스트 (test) 벡터를 통하여 bit-exact함을 확인하였다. 그리고 마이크와 스피커를 이용한 실시간 음성 입출력이 음질의 왜곡이나 지연없이 실시간으로 동작함을 확인하였다.

  • PDF

음파를 이용한 비파괴 수박 내부품질 판정 시스템 개발 (Development of Nondestructive Evaluation System for Internal Quality of Watermelon using Acoustic Wave)

  • 최동수;이영희;최승렬;김기영;박종민
    • 한국식품저장유통학회지
    • /
    • 제16권1호
    • /
    • pp.1-7
    • /
    • 2009
  • 음파를 이용한 수박의 내부품질을 비파괴적으로 판정하는 시스템을 개발하였다. 개발된 수박품질판정기는 크기가 $200{\times}200\;mm$, 무게가 290 g로 휴대가 가능하여 수박 재배포장, 집하장, 슈퍼마켓 등 현장에서 쉽게 사용가능하도록 개발하였다. 수박의 음파수집한 후 음파데이터에서 영교차율, 피크(peak)점간 거리 표준편차, 시간파형에서 진폭 적분값, 주파수대역 에너지, 영점빈도수와 같은 특징인자를 추출하여 내부품질을 판정할 수 있는 주성분회귀 모델개발에 이용하였다. 개발된 수박의 주성분회귀 모델의 상관계수는 0.79, SEC는 0.28로 판정정확도는 87% 이었으며, 모델 검증한 결과 상관계수가 0.78, SEP가 0.785로 판정정확도가 83%이었다. 생산자 내부품질판정 정확도를 조사한 결과, 생산자 판정 정확도는 75% 이었다.