• 제목/요약/키워드: 음향성능

검색결과 2,165건 처리시간 0.023초

Sequence dicriminative training 기법을 사용한 트랜스포머 기반 음향 모델 성능 향상 (Improving transformer-based acoustic model performance using sequence discriminative training)

  • 이채원;장준혁
    • 한국음향학회지
    • /
    • 제41권3호
    • /
    • pp.335-341
    • /
    • 2022
  • 본 논문에서는 기존 자연어 처리 분야에서 뛰어난 성능을 보이는 트랜스포머를 하이브리드 음성인식에서의 음향모델로 사용하였다. 트랜스포머 음향모델은 attention 구조를 사용하여 시계열 데이터를 처리하며 연산량이 낮으면서 높은 성능을 보인다. 본 논문은 이러한 트랜스포머 AM에 기존 DNN-HMM 모델에서 사용하는 가중 유한 상태 전이기(weighted Finite-State Transducer, wFST) 기반 학습인 시퀀스 분류 학습의 네 가지 알고리즘을 각각 적용하여 성능을 높이는 방법을 제안한다. 또한 기존 Cross Entropy(CE)를 사용한 학습방식과 비교하여 5 %의 상대적 word error rate(WER) 감소율을 보였다.

입력신호와 오차신호의 상관도를 이용한 음향반향제거 알고리즘 (An Acoustic Echo Cancellation Algorithm Using the Correlation of Input Signals and Error Signals)

  • 류종훈
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.432-437
    • /
    • 1998
  • NLMS 알고리즘을 채용한 음향반향제거기는 주변잡음에 대해서 적응필터의 계수가 오조정되어 반향제거기의 성능이 저하된다. 본 논문에서 음향반향제거기의 마이크 입력신호와 추정 오차신호의 상관도를 이용해서 주변 잡음신호에 의한 계수 오조정이 작은 적응 알고리즘과 잔여반향을 제거하기 위한 후처리기로 구성된 음향 반향 제거기를 제안한다. 기존의 NLMS 알고리즘이 입력신호의전력으로 적응상수를 정규화하지만 제안하는 알고리즘은 마이크 입력신호와 추정 오차신호의상관도와 입력신호 전력의 합으로 정규화한다. 적응필터가 반향 경로를 추정한 경우, 추정 오차신호에는 근단화자 신호가 대부분을 차지한다. 따라서 근단화자 신호가 있는 경우에는 상관도 값이 커져서 적응 상수가 작아지고 근단화자 신호에 의한 계수의 오조정을 줄일 수 있다. 후처리기도 마이크 입력신호와 추정 오차신호의 상관도를 마이크 입력신호의 전력으로 정규화한 값으로 추정 오차신호를 감쇠시킴으로써 근단화자 신호는 감쇠를 적게 하고 잔여반향을 감쇠시킨다. 멀티미디어 PC를 이용한 실험을 통해서 제안하는 알고리즘이 기존의 알고리즘에 비해서 우수한 성능을 보임을 확인했다.

  • PDF

음성제어 PC를 위한 음향 반향 제거기의 구현 (Implementation of the Acoustic Echo Canceller for a Voice-controlled PC)

  • 한철희;이혁재;윤대희
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1998년도 학술대회
    • /
    • pp.103-106
    • /
    • 1998
  • 본 논문에서는 전이중(full duplex)으로 동작하는 멀티미디어 PC의 음성 명령어 인식기의 성능 향상을 위한 적응 음향 반향 제거기를 구현하였다. 최근 들어 일고 있는 인간과 컴퓨터의 인터페이스를 쉽고 친밀하게 하려는 노력은 음성으로 제어하는 컴퓨터의 탄생을 예고하고 있다. 이러한 시스템을 전이중 모드에서 사용할 경우 음향 반향은 피할 수 없는 현상이다. 본 논문에서는 이러한 음향 반향을 제거하기 위해서 서브밴드 적응 필터 구조를 이용하여 실시간 처리가 가능한 음향 반향 제거기를 설계하였다. 또한, 동시통화시 음성의 왜곡을 줄이는 스위칭 구조를 사용하였다. 동시통화의 검출은 상호상관도를 이용하여 구현하였다. 이렇게 구현된 반향제거기를 음향 입출력 루틴과 음성 인식기와 결합하여 Windows 95상에서 실시간으로 동작하는 음성 명령어 인식 소프트웨어를 완성하였다. 모의 실험 및 실시간 실험을 통하여 반향 제거기의 성능을 검증하였고, 음성인식 실험을 수행하여 반향 제거기가 인식율 향상에 기여함을 확인하였다.

  • PDF

독립성분분석을 이용한 음향 반향 제거 (Acoustic Echo Cancellation Using Independent Component Analysis)

  • 김대성;배현덕
    • 한국음향학회지
    • /
    • 제22권5호
    • /
    • pp.351-359
    • /
    • 2003
  • 본 논문에서는 독립성분분석을 이용한 음향 반향제거 방법을 제안하였다. 음향반향제거기의 마이크로폰에 반향 이외의 잡음이 부가될 경우 반향제거기의 성능은 저하된다. 이러한 문제를 해결하기 위해 본 연구에서는 두 개의 마이크로폰을 이용하여 반향과 선형으로 섞인 잡음을 받은 후 독립성분 분석 기법을 통해 반향과 잡음을 분리하였다. 그리고 분리된 반향 신호를 반향제거기에 사용되는 적응 알고리듬의 기준 신호로 이용함으로서 반향제거기의 성능을 향상시켰다. 컴퓨터 모의실험을 통해 제안한 방법의 타당성을 확인하였다.

복합센서의 전후방 신호에 대한 음향진동 정합기법을 이용한 수동소나 탐지성능 향상에 대한 연구 (Study on improving passive sonar detection using acoustic vibration matching method for front and rear signal of complex sensor)

  • 서동완;장우석;김동현;노응휘;양정은
    • 한국음향학회지
    • /
    • 제43권2호
    • /
    • pp.145-151
    • /
    • 2024
  • 함정 선체부착형 수동소나체계는 최근 표적탐지성능을 향상시키고자 함내 진동유기 소음을 제거하려는 연구가 활발히 진행중이다. 본 연구진은 신호처리의 관점에서 음향센서와 진동센서가 설치된 복합센서를 이용한 음향-진동 정합기법을 개선책으로 제시한다. 본 논문에서는 정합기법의 이론적 배경에 대해 기술한 후, 그것이 다중물리 유한 요소해석 상에서 실현됨을 보였다. 나아가 정합기법을 센서 시스템에 적용할 시의 표적신호 수신감도 상승 및 진동유기 소음 제거 성능을 산출하였으며, 정합기법의 실용성과 향후 연구방향에 대해 논하였다.

부산 시민회관 수선에 따른 음향평가 (Evaluatio of Acousic Properties of Modified Pusan Citizens Hall)

  • 김연수;서상준
    • 한국음향학회지
    • /
    • 제12권2호
    • /
    • pp.86-93
    • /
    • 1993
  • 준공후 10여년동안 사용한 천장 및 벽의 마감재에 대한 전면적인 보수를 실시한 부산 시민회관을 대상으로 보수 전후의 음향특성에 대해 비교 검토하였다. 본 연구에서는 특히 전객석에서의 고른 음압분포와 적절한 잔향시간을 얻기 위한 측면에 주안점을 두고 보수설계를 하였으며 보수 작업시 사전에 음향특성을 측정 분석한 후 이를 근거로 용도에 맞는 음향성능을 발휘할 수 있도록 마감재의 선정 및 배치를 하여 건축설계에 반영하였다.

  • PDF

FSN을 이용한 금액 인식 시스템 (Price Recognition System using FSN)

  • 함정표
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 2호
    • /
    • pp.331.1-334
    • /
    • 1998
  • 본 논문에서는 금액을 인식 대상으로 하는 음성 인식 시스템의 성능 향상을 위하여 프레임 동기 네트워크(Frame Synchronous Network)을 이용하였다. 연속음 인식에서 인식 대상이 가지는 규칙을 적용했을 경우 성능 향상을 가져올 수 있다. 금액이 가지는 반복적인 특성과 자릿수의 상하 관계가 인식 성능에 미치는 효과를 이용하여 다양한 수준의 제약을 갖는 FSN을 제안하였다. 제안된 FSN의 성능을 다양한 환경과 특징 벡터에 대하여 이산 hidden Markov model[5]을 이용하여 실험을 수행하였다. 인식 결과 제안된 FSN을 이용하여 금액 어휘의 인식 성능을 향상시킬 수 있었다.

  • PDF

음성 및 채널부호화의 연계성능 분석을 이용한 IMT-2000 CDMA 순방향링크 성능개선 (An Improved Seheme in IMT-2000 CDMA Forward Link Using Combined Speech and Channel Coding)

  • 김선영;강법주;윤병식
    • 한국음향학회지
    • /
    • 제17권3호
    • /
    • pp.65-71
    • /
    • 1998
  • 비균등 에러 보호에 의한 IMT-2000용 CDMA 순방향 링크의 성능개선 방법을 나타 내었다. 제안된 방법의 성능은 다경로 페이딩채널 및 BPSK변조에 대한 CS-ACELP 음성부 호화기 및 RCPC 채널부호화기를 이용하여 분석되었다. CS-ACELP 부호화기의 비트 에러 감도 정보에 근거한 연계성능분석 결과제안된 방법은 SEGSNR이 0.4∼1dB 개선되었다. 또 한 총전송율 및 전력제어비트를 펑처링하지 않고도 기존 구조를 유연성있게 변경 가능하다.

  • PDF