• 제목/요약/키워드: 음성신호

검색결과 1,513건 처리시간 0.028초

인지에 중요한 음향신호의 위상에 대해 (On the Perceptually Important Phase Information in Acoustic Signal)

    • 한국음향학회지
    • /
    • 제19권7호
    • /
    • pp.28-33
    • /
    • 2000
  • 음성 신호의 효과적인 양자화를 위해서 인간의 청각 인지 특성을 이용하는 방법이 널리 사용되고 있다. 그러나 아직까지는 음성 스펙트럼의 크기 정보에 대한 인지 특성만을 이용하고 있을 뿐, 음성의 위상 정보는 그 중요성에 비해 간과되어 온 것이 사실이다. 본 논문에서는, 음향 신호로부터 청각 인지 측면에서 관련 없는 위상 성분을 추정하는 PIPE(Perceptually Irrelevant Phase Elimination) 방법을 제안하였다. 제안된 방법은 청각 특성이 critical band 대역 내의 상대적인 위상 관계에 민감하다는 관측 결과에 근거하여, 일반적인 stationary 푸리에(Fourier) 신호와 고조파(harmonic) 신호에 대해 각각 인지 측면에서 관련 없는 위상을 판별하는 방법을 제공한다. 제안된 방법을 음성 분석-합성(analysis / synthesis) 시스템에 적용함으로써 일부 위상 정보만을 이용해 음성을 복원하였으며, 청취 실험 결과 제안된 방법의 효율성을 알 수 있었다.

  • PDF

음성신호를 이용한 감정인식 (An Emotion Recognition Technique using Speech Signals)

  • 정병욱;천성표;김연태;김성신
    • 한국지능시스템학회논문지
    • /
    • 제18권4호
    • /
    • pp.494-500
    • /
    • 2008
  • 휴먼인터페이스 기술의 발달에서 인간과 기계의 상호작용은 중요한 부분이다. 감정인식에 대한 연구는 이러한 상호작용에 도움을 준다. 본 연구는 개인화된 음성신호에 대하여 감정인식 알고리즘을 제안하였다. 감정인식을 위하여 PLP 분석을 이용하여 음성신호의 특징으로 사용하였다. 처음에 PLP 분석은 음성인식에서 음성신호의 화자 종속적인 성분을 제거하기 위하여 사용되었으나 이후 화자인식을 위한 연구에서 PLP 분석이 화자의 특징 추출을 위해 효과적임을 설명하고 있다. 그래서 본 논문은 PLP 분석으로 만들어진 개인화된 감정 패턴을 이용하여 쉽게 실시간으로 음성신호로부터 감정을 평가하는 알고리즘을 제안하였다. 그 결과 최대 90%이상의 인식률과 평균 75%의 인식률을 보였다. 이 시스템은 간단하지만 효율적이다.

자동차 잡음 환경에서 웨이브렛 밴드 엔트로피 앙상블 분석을 이용한 음성구간 검출 알고리즘 (Voice Activity Detection Algorithm using Wavelet Band Entropy Ensemble Analysis in Car Noisy Environments)

  • 이기현;이윤정;김명남
    • 한국멀티미디어학회논문지
    • /
    • 제16권9호
    • /
    • pp.1005-1017
    • /
    • 2013
  • 음성구간 검출은 음성과 잡음이 섞인 신호에서 음성구간과 비음성구간을 구분하는 과정으로 음성 향상을 위한 신호처리에서 매우 중요한 과정이다. 지금까지 음성구간 검출에 관한 많은 연구가 있었지만, 낮은 신호 대 잡음비 환경이나 자동차 잡음과 같은 시간에 따른 변화가 심한 잡음환경에서는 좋은 성능을 보이지 못하였다. 본 논문에서는 웨이브렛 밴드 엔트로피 기반의 앙상블 분산과 소프트 문턱치 기법을 이용한 새로운 음성구간 검출 알고리듬을 제안하였다. 제안한 알고리듬의 성능을 비교 평가하기 위하여 자동차 잡음이 있는 다양한 신호 대 잡음비 환경에서 실험을 수행하였으며 실험결과, 제안한 방법의 우수한 성능을 확인할 수 있었다.

위너필터에 의한 음성 중의 잡음제거 알고리즘 (Noise Reduction Algorithm in Speech by Wiener Filter)

  • 최재승
    • 한국전자통신학회논문지
    • /
    • 제8권9호
    • /
    • pp.1293-1298
    • /
    • 2013
  • 본 논문에서는 음성신호를 개선할 목적으로 잡음으로 오염된 음성신호로부터 잡음성분을 제거하기 위한 위너 필터를 사용한 잡음제거 알고리즘을 제안한다. 제안한 알고리즘은 먼저 잡음 복원 및 제거 방법에 기초하여 잡음으로 오염된 신호로부터 각 프레임에서 백색잡음의 잡음 스펙트럼을 제거한다. 또한 본 알고리즘은 선형예측 분석 방법에 기초한 위너 필터를 사용하여 음성신호를 강조한다. 본 실험에서는 일본 남성화자에 의한 음성과 잡음데이터를 사용하여 본 알고리즘의 실험 결과를 나타낸다. 백색잡음에 의하여 오염된 음성신호에 대하여 스펙트럼 왜곡률 척도를 사용하여 본 알고리즘이 유효하다는 것을 확인한다. 실험으로부터 백색잡음에 대하여 이전의 위너 필터와 비교하여 최대 4.94 dB의 출력 스펙트럼 왜곡률이 개선된 것을 확인할 수 있었다.

신경회로망을 이용한 DFT 성분 복원에 의한 음성강조 (Noisy Speech Enhancement by Restoration of DFT Components Using Neural Network)

  • 최재승
    • 한국정보통신학회논문지
    • /
    • 제14권5호
    • /
    • pp.1078-1084
    • /
    • 2010
  • 본 논문에서는 오차역전파알고리즘에 의한 신경회로망을 사용하여 이산푸리에변환에 의한 진폭성분과 위상 성분을 복원하는 음성강조 시스템을 제안한다. 먼저, 신경회로망이 잡음이 부가된 음성신호의 이산푸리에변환의 진폭성분과 위상성분을 사용하여 학습된 후, 제안한 시스템은 백색잡음에 의하여 열화된 잡음이 부가된 음성 신호를 강조한다. 백색잡음에 의하여 열화된 음성신호는 이산푸리에변환에 의한 진폭성분과 위상성분을 입력으로 하는 신경회로망을 사용하여 제안된 시스템에 의하여 강조되는 것을 실험결과로 증명한다. 제안한 시스템은 스펙트럼 왜곡율의 평가법을 사용하여 백색잡음에 의하여 열화된 음성신호에 대하여 효과적인 것을 실험으로 확인한다.

아날로그 음성, 비디오 및 오디오 신호의 비화방식

  • 이일우;조동호
    • 정보보호학회지
    • /
    • 제2권4호
    • /
    • pp.75-90
    • /
    • 1992
  • 본고는 아날로그 음성, 비디오 및 오디오 신호의 비화방식에 대한 연구로써 정보의 대부분을 구성하고 있는 음성, 그리고 앞으로 요구가 증가될 것으로 예견되는 위성 TV 및 CATV의 비디오와 오디오의 아날로그 비화방식의 종류 및 각각의 알고리즘에 대해 고찰하였다.

  • PDF

초음파 도플러를 이용한 음성 인식 (Automatic speech recognition using acoustic doppler signal)

  • 이기승
    • 한국음향학회지
    • /
    • 제35권1호
    • /
    • pp.74-82
    • /
    • 2016
  • 본 논문에서는 음성 신호 대신 초음파 도플러 신호를 이용하여 음성을 인식하는 새로운 음성 인식 방법을 제안하였다. 제안된 방법은 주변 잡음에 대한 강인성과 무 접촉식 센서 사용에 따른 사용자의 불편함 감소를 포함하는 기존의 음성/무음성 인식 방법에 비해 몇 가지 장점을 갖는다. 제안된 방법에서는 40 kHz의 주파수를 갖는 초음파 신호를 입 주변에 방사하여, 반사된 신호를 취득하고, 취득된 신호의 도플러 주파수 변화를 이용하여 음성 인식을 구현하였다. 단일 채널 초음파 신호를 사용하는 기존의 연구와 달리, 다양한 위치에서의 취득된 초음파 신호를 음성 인식에 사용하기 위해 다채널 취득 장치를 고안하였다. PCA(Principal Component Analysis)특징 변수를 사용한 음성 인식에는 좌-우 모델을 갖는 은닉 마코프 모델을 사용하였다. 제안된 방법의 검증을 위해 60개의 한국어 고립어에 대해 6명의 화자로부터 취득된 초음파 도플러 신호를 인식에 사용하였으며, 기존 음성기반 음성인식 기법과 비교할 만한 수준의 인식율을 얻을 수 있었다. 또한 실험 결과 제안된 방법은 기존의 단일 채널 음성 인식 방법과 비교하여 우수한 성능을 나타내었으며, 특히 잡음 환경에서도 90 % 이상의 인식율을 얻을 수 있었다.

G.729 음성 복호화기와 듀얼 SOLA 알고리즘을 통합한 최적의 음성 속도 변환 시스템 (Optimized Time Scale Modification (TSM) System Integrating G,729 Speech Decoder and Dual SOLA Algorithm)

  • 박규식;오승록;김선영
    • 한국음향학회지
    • /
    • 제21권3호
    • /
    • pp.293-303
    • /
    • 2002
  • 본 논문에서는 ITU G.729 음성 복호화기와 듀얼 SOLA (Synchronized Overlap-Add)알고리듬을 통합한 최적의 음성 속도 변환시스템 (TSM)을 구현한다. 제안된 시스템은 ITU G.729 음성 복호화기를 통한 8 Khz 80 샘플/프레임 단위의 음성 신호를 입력으로 가정하여 듀얼 SOLA를 통해 사용자가 원하는 음성 속도에 맞추어 출력, 음성을 천천히 혹은 빠르게 최적화된 음성 품질로의 재생을 가능하게 한다. 특히 본 논문에서 제안된 듀얼 SOLA는 다양한 SOLA 파라미터에 대한 모의실험과 이론적 분석에 의거하여 ITU G.729 복호화기 음성 신호에 대한 최적화된 음성 재생 변환 기능을 제공하며, 입력 음성신호의 부가적인 인터폴레이션 (interpolation) 과정을 첨가하여 최대 2배 빠르기 혹은 2배 느리기의 극한 속도율에서도 우수한 성능의 통합 음성 속도 변환 시스템을 구현할 수 있다. 제안된 시스템은 다양한 입력 음성신호와 재생 속도에 대한 모의실험을 걸쳐 그 성능을 검증한다.

마이크로컨트롤러를 이용한 완전 이식형 인공중이용 저전력 음성 신호처리 및 제어 모듈의 설계 (Design of a Low Power Voice Signal Processing and Control Module using a $\mu$-controller for Totally Implantable Middle Ear system)

  • 강호경;정의성;임형규;박일용;윤영호;김민규;송병섭;조진호
    • 전자공학회논문지SC
    • /
    • 제41권5호
    • /
    • pp.49-56
    • /
    • 2004
  • 완전 이식형 인공중이 시스템을 위한 음성 신호처리 및 제어 모듈을 소형 마이크로컨트롤러를 사용하여 저전력형으로 설계 하였다 설계된 모듈은 입력되는 음성신호를 난청자의 역치에 맞추어 이득을 조정하는 등의 신호처리를 수행함과 동시에 체내 이식부의 제어를 수행하게 된다. 설계된 마이크로컨트롤러는 전원이 켜지면 사용자의 청력 손실에 맞추어서 주파수별로 차등 되는 이득을 주도록 실시간으로 음성신호를 처리하게 된다. 그러나 체외에서 제어신호가 입력될 경우 수신된 제어 신호에 의해 마이크로컨트롤러는 인터럽트 서브루틴을 수행하여 전원 제어, 볼륨 조절과 같은 제어 명령을 수행한 후 다시 음성 신호를 처리하도록 하였다. 설계된 모듈을 구현한 후 구현된 시스템의 동작을 실험을 통하여 확인하였다.

후처리기를 이용한 음향 반향 제거기의 성능향상 (Performance Improvement of Acoustic Echo Canceller Using Post-Processor)

  • 박장식;김현태;손경식
    • 한국음향학회지
    • /
    • 제18권5호
    • /
    • pp.35-43
    • /
    • 1999
  • 본 논문에서는 크게 계산량이 증가하지 않으면서 음향 반향 제거기의 성능을 향상시킬 수 있는 잡음에 강건한 적응 알고리즘과 후처리기를 제안한다. 제안하는 적응 알고리즘은 기준 입력신호와 마이크 입력신호의 전력 합으로 적응 상수를 정규화 한다. 근단화자의 음성신호나 주변 잡음이 마이크로 입력되면 그 전력만큼 적응 상수가 작아지기 때문에 이들 주변 잡음에 의한 계수 오조정을 줄일 수 있다. 잔여 반향을 제거하기 위해서 잡음에 강건한 알고리즘과 연동하는 새로운 후처리 방법을 제안한다. 제안하는 후처리 방법은 마이크 입력신호와 추정 오차신호의 상관도를 활용한다. 잔여 반향은 마이크 입력신호의 전력으로 정규화된 상관도에 의해서 감쇠되어 제거한다. 정규화 상관도는 잔여 반향에 대해서 Wiener 필터 역할을 한다. 동시 통화시에는 추정 오차신호에는 근단화자의 음성신호가 대부분을 차지함으로 정규화 상관도는 거의 1이 되어 근단화자의 음성신호는 감쇠없이 전송된다. 반향 신호만 있을 때에는 잔여 반향은 후처리기에 의해서 대부분 감쇠되어 제거된다. 제안하는 후처리기를 이용한 음향 반향 제거기의 계산량은 NLMS 알고리즘에 비해서 크게 증가하지 않는다.

  • PDF