• 제목/요약/키워드: 음성 신호 처리

검색결과 473건 처리시간 0.022초

시간지연 신경회로망을 이용한 잡음제거 시스템 (Noise reduction system using time-delay neural network)

  • 최재승
    • 대한전자공학회논문지SP
    • /
    • 제42권3호
    • /
    • pp.121-128
    • /
    • 2005
  • 음성신호를 대상으로 하는 연구 분야에서 신경회로망은 주로 음성인식 등의 카테고리 분류의 목적으로 사용되며 신호처리의 응용에도 유망하다. 따라서 본 논문에서는 신경회로망에 시간구조를 취한 시간지연 신경회로망을 이용하여 잡음이 중첩된 음성신호의 공간으로부터 잡음이 없는 음성신호의 공간으로 사상을 실행함으로써 잡음을 제거하는 것을 목적으로 한다. 본 논문은 푸리에 변환의 진폭성분을 복원하는 잡음제거의 알고리즘을 사용하여 백색잡음 및 유색잡음에 대해서 본 수법의 유효성을 확인한다.

인간의 청각모델에 기초한 잡음환경에 적응된 잡음억압 시스템 (Adaptive Noise Suppression system based on Human Auditory Model)

  • 최재승
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2008년도 춘계종합학술대회 A
    • /
    • pp.421-424
    • /
    • 2008
  • 본 논문에서는 다양한 배경잡음에 의해 열화된 음성을 강조하기 위하여 청각모델에 기초로 한 잡음환경에 적응된 잡음억압 시스템을 제안한다. 제안한 시스템은 먼저 유성음과 무성음의 구간을 검출한 후, 각 입력 프레임에서 적응적인 청각기강의 처리를 한다. 마지막으로 진폭성분과 위상성분이 포함된 신경회로망을 사용하여 잡음신호를 제거한 후에 음성을 강조하는 처리를 한다. 본 시스템은 신호대잡음비의 평가방법을 통하여 다양한 잡음에 의해서 열화된 음성신호에 대해서 유효하다는 것을 실험으로 확인한다.

  • PDF

진폭 및 위상스펙트럼이 도입된 신경회로망에 의한 잡음억제 알고리즘 (Noise Suppression Algorithm using Neural Network based Amplitude and Phase Spectrum)

  • 최재승
    • 한국정보통신학회논문지
    • /
    • 제13권4호
    • /
    • pp.652-657
    • /
    • 2009
  • 본 논문에서는 다양한 배경 잡음에 의해 열화된 음성을 강조하기 위하여 청각모델에 기초로 한 잡음환경에 적응된 잡음억제 시스템을 제안한다. 제안한 시스템은 먼저 유성음, 무성음 및 묵음의 구간을 검출한 후, 각 입력 프레임에서 적응적인 청각기강의 처리를 한다. 마지막으로 진폭성분과 위상성분이 포함된 신경회로망을 사용하여 잡음신호를 제거 한 후에 음성을 강조하는 처리를 한다. 본 시스템은 신호대잡음비의 평가방법을 통하여 다양한 잡음에 의해서 열화 된 음성신호에 대해서 유효하다는 것을 실험으로 확인한다.

음성인식 자동시험장치 개발 (Implementation of Automatic Test System for Voice Recognition)

  • 김희경
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 2호
    • /
    • pp.219-222
    • /
    • 1998
  • 음성인식시험은 다양한 사용자의 음성을 입력으로 음성인식을 수행하고 그 결과를 이용하여 시스팀의 성능을 평가하거나, 음성의 특징을 파악하기 위한 중요한 기능으로 음성인식 서비스의 질을 향상시키기 위한 필수적인 요소이다. 본 논문에서 제시하는 음성인식 자동시험장치는 음성인식의 결과를 DTMF 신호로 처리하도록 하여 사람의 개입 없이 빠르고 정확한 결과를 통해 인식율, 인식속도 등 인식기술과 관련된 중요한 정보를 얻을 수 있도록 하였다. 본 논문에서는 한국통신의 기업체 음성다이얼서비스의 음성인식시험을 중심으로 음성인식 자동시험장치의 구성 및 기능에 대해서 설명한다.

  • PDF

독립성분분석을 이용한 강인한 화자인식 (Robust Speaker Recognition using Independent Component Analysis)

  • 장길진
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 2호
    • /
    • pp.327-330
    • /
    • 1998
  • 독립성분분석(ICA: Independent Component Analysis)이란 특징이 상이한 둘 이상의 신호들이 선형적으로 결합되어 있을 때 이를 효과적으로 분리하는 방법들을 통칭하며 잡음제거, 음질개선 및 신호처리 분야에서 많이 활용되고 있다. 본 논문에서는 전화음성 화자인식 시스템의 성능향상을 위해 독립성분분석을 이용하는 방법을 제안한다. 먼저 화자가 발성한 음성신호의 켑스트럼 계수를 여러 채널 함수들의 선형적인 합으로 가정하고, 독립성분분석을 이용하여 얻은 새로운 켑스트럼 벡터를 학습과 인식에 사용하였다. 실험자료는 잔화음성 화자식별기의 성능평가에 널리 쓰이고 있는 SPIDRE를 사용하였고 regodic 은닉 마코프 모델을 이용하여 문장 독립 화자식별 시스템을 구성하였다. 학습음성의 특징과 실험음성의 특징이 다른 조건에서 기존의 채널 정규화 방법들에 비해 10~15%이상 인식률이 향상되었다.

  • PDF

어텐션 메카니즘을 이용한 생체신호처리 연구 동향 분석 (A Research Trend Study on Bio-Signal Processing using Attention Mechanism)

  • 변영현;곽근창
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.630-632
    • /
    • 2023
  • 어텐션 메커니즘은 딥 뉴럴네트워크에 결합하여 언어 생성 모델에서 성능을 개선하였고, 이러한 성공은 다양한 신호처리 분야에 응용 및 확장되고 있다. 특정 입력 신호 부분에 선택적으로 집중함으로써, 어텐션 모델은 음성 인식, 이미지와 비디오 처리, 그리고 생체인식 등의 분야에서 더 높은 성능을 보여주고 있다. 어텐션 기반 모델은 심전도 신호를 이용한 개인식별 및 부정맥검출, 뇌파도 신호를 이용한 발작유형분류 및 수면 단계 분류, 근전도 신호를 이용한 제스처 인식 등에 사용되고 있다. 어텐션 메커니즘은 딥 뉴럴네트워크의 해석 가능성과 설명 가능성을 향상시키기 위해 사용되기도 한다. 신호 처리 분야에서의 어텐션 모델 연구는 지속적으로 진행 중이며, 다른 분야에서의 잠재력 탐구에 대한 관심이 높아지고 있다. 따라서 본 논문은 어텐션 메카니즘을 이용한 생체신호처리 연구 동향 분석을 수행한다.

벡터의 발생 순서를 이용한 효율적인 벡터양자화 (An Effective Vector Quantization using Generating Sequence of the Vector)

  • 김동환;윤재선;홍광석
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2000년도 추계종합학술대회논문집
    • /
    • pp.189-192
    • /
    • 2000
  • 벡터양자화는 신호의 압축에 이용되는 일반적인 방법이다. 그러나 유클리드 거리 등을 이용한 거리 계산량이 많아서 코드북 크기나 압축율의 제한이 있게 된다. 따라서 PDS(partial distance search)와 같은 벡터양자화 부호화의 계산량을 줄이기 위한 많은 방법들이 제안되고 있다. 본 논문에서는 이웃한 음성신호는 급격히 변하지 않고 서서히 변해가는 성질에 착안하여 현재의 벡터 다음에 발생되는 벡터를 조사하여 인덱스를 저장한 후 이를 다음 벡터의 벡터양자화 때 참고함으로써 불필요한 계산을 줄이는 방법이다. 제안한 방법으로 음성신호에 대해 실험한 결과 전탐색의 결과와 비교하여 빠른 시간에 큰 오차없이 벡터양자화 부호화를 할 수 있었다. 이 방법은 PDS와 같은 이미 제안되어 있는 많은 방법들과 같이 이용하면 더욱 효과적인 벡터양자화 부호화를 할 수 있을 것이다.

  • PDF

음성 신호의 디지털 신호처리 (Digital Processing of Speech Signals)

  • 김진현
    • 대한음성언어의학회:학술대회논문집
    • /
    • 대한음성언어의학회 1995년도 제4회 학술대회 심포지움 및 워크샵
    • /
    • pp.103-110
    • /
    • 1995
  • 디지털이라는 말은 우리 일상 생활에서 흔히 듣는다. 시계, 체온계, 체중계, 자동차의 속도계, 혈압계 등 요즘에는 디지털 표시 제품이 아주 많아 졌다 디지털이라는 말을 영어사전에서 찾아보면 '손가락의', '계수형의' 등의 뜻으로 쓰여져 있다. 그리고 측정분야에서 디지털이라는 말은 '이산적', '불연속적' 이라는 뜻이 있으며, 이것은 값이 드문드문 있다는 의미이며, 디지털의 특징으로 미리 정해진 자리수로만 값을 표현할 수 있는 것을 뜻한다. 디지털에 대해 반대 의미를 갖는 것이 아날로그이다. (중략)

  • PDF

유성음/무성음 분리를 이용한 잡음처리 (Speech Enhancement Based on Voice/Unvoice Classification)

  • 유창동
    • 한국음향학회지
    • /
    • 제21권4호
    • /
    • pp.374-379
    • /
    • 2002
  • 본 논문에서는 유성음/무성음 분리를 이용하여 잡음처리를 한다. 유성음과 무성음은 음성의 하나의 중요한 특징으로 유성음과 무성음 부분에 각각 같은 잡음처리기법을 삼는 것이 아니라 각각의 성질을 고려하여 잡음처리를 하였다. 유성음/무성음의 분리는 영 교차율과 에너지를 이용하여 구해 졌으며, 유성음/무성음 분리정보를 토대로 하여 변형된 음성/잡음우세결정방법을 제안하였다. 제안된 방법은 백색 잡음과 비행기 잡음에 오염된 음성문장에 대해 성능평가가 이루어졌다. 그리고 다양한 입력 신호대잡음비 (SNR)로 오염된 문장에 대해 세그멘탈 신호대잡음비를 구하고, 듣기 평가를 통해 기존의 방법보다 향상된 성능을 가짐을 알 수 있다.

음악 및 음성 신호의 융합 압축 기술 (Unified coding scheme of speech and music)

  • 오은미
    • 방송과미디어
    • /
    • 제16권4호
    • /
    • pp.59-71
    • /
    • 2011
  • 오디오와 음성 압축 기술적 근간은 서로 다르지만, 최근의 모바일 멀티미디어 기기 시장의 컨버전스 현상에 따라 압축하고자 하는 신호가 혼용되고 있으며, 비슷한 목표 전송률과 음질로 수렴하고 있다. 현재는 동일 기기에서 서로 다른 압축 기술을 적용하고 있으나, 음성과 음악이 동시에 서비스 되는 멀티미디어 기기에서는 단일 압축 방식으로 처리하고자 하는 이슈가 부각되고 있다. 특히, 스마트 폰 및 음악 콘텐츠 포탈 서비스의 대중화를 고려할 때, 음성 및 음악 신호 모두를 효율적으로 압축하는 음악 및 음성 신호의 융합 압축 기술이 더욱 필요해 보인다. 본 고에서는 MPEG 오디오 그룹에서 가장 최근 진행한 Unified Speech and Audio Coding(USAC)의 탄생 배경 및 표준화 현황을 소개한다. USAC는 64kbps 이하에서 기술적으로 최고 성능을 지닌 AMR-WB+ 및 HE-AAC v2보다도 우월한 음질을 보이며, 높은 비트율에서도 동등한 음질을 보장한다. 이런 우수한 음질에 기여한 USAC의 스위칭 구조와 더불어 기술적으로 향상된 주요 모듈인 파라미터 기반 스테레오 및 고주파 압축, 그리고 엔트로피 코딩 방식에 대해서 살펴 본다. 향후, 다양한 오디오 신호를 효율적으로 압축하는 USAC는 디지털 라디오, 모바일 TV, 그리고 오디오 북과 같은 사용자 시나리오에서 사용될 확률이 높아 보인다. 또한, USAC는 배경 잡음이나 배경 음악이 있는 경우에도 성능이 우수하기 때문에 YouTube 및 podcast 등과 같이 사용자가 콘텐츠를 생성할 때도 유용하게 사용 될 수 있다.