• 제목/요약/키워드: 음성 신호 처리

검색결과 474건 처리시간 0.034초

Directional frequency analysis and recording 소노부이의 표적 탐지 성능 향상을 위한 위너필터링 기반 주변 소음 제거 기법 (Wiener filtering-based ambient noise reduction technique for improved acoustic target detection of directional frequency analysis and recording sonobuoy)

  • 홍정표;배인영;석종원
    • 한국음향학회지
    • /
    • 제41권2호
    • /
    • pp.192-198
    • /
    • 2022
  • DIrectional Frequency Analysis and Recording(DIFAR) 소노부이는 대잠전에 효과적인 무기체계로 하나의 무지향성 센서와 두 개의 지향성 센서로 구성된 3채널 빔형성을 통해 표적의 방향을 탐지한다. 하지만, 주변 소음의 영향으로 DIFAR소노부이의 특정방위(0°, 90°, 180°, 270°) 표적 탐지 성능이 저하되는 단점이 있다. 따라서, 본 논문에서는 주변 소음을 추정하고 제거를 통해 DIFAR 소노부이의 표적 탐지 성능을 향상시키는 방법을 제안하였다. 주변 소음 추정을 위해 소나신호처리에서 널리 쓰이는 Order Truncate Average(OTA)기법을, 추정된 소음을 제거하기 위해 음성신호처리에서 널리 쓰이는 위너필터링 기법을 사용하였다. 제안한 방법을 평가하기 위해 표적 방위추정 결과의 평균 제곱 오차를 비교한 결과 신호대잡음비 0 dB이하에서 제안한 방법이 효과적임을 확인할 수 있었다.

신경망을 이용한 비정적 신호의 비선형 예측 (Nonlinear Prediction of Nonstationary Signals using Neural Networks)

  • 최한고;이호섭;김상희
    • 전자공학회논문지S
    • /
    • 제35S권10호
    • /
    • pp.166-174
    • /
    • 1998
  • 신경망은 분산된 비선형 처리구조와 학습능력 때문에 높은 차수의 비선형 동특성 구현능력을 갖고 있으므로 비정적 신호에 대한 적응예측을 수행할 수 있다. 본 논문에서는 두 가지 방법 (비선형 모듈구조와 비선형과 선형모듈이 직렬로 연결된 예측구조)으로 비정적 신호의 비선형 예측을 다루고 있다. 완전 궤환된 리커런트 신경망과 기존의 TDL(tapped-delay-line) 필터가 비선형과 선형모듈로 각각 사용되었다. 제안된 예측기의 동특성은 카오스 시계열과 음성신호에 대해 시험하였으며, 예측성능의 상대적인 비교를 위해 기존의 ARMA(autoregressive moving average) 구조의 선형 예측모델과 비교하였다. 실험결과에 의하면 신경망을 이용한 적응 예측기는 선형 예측기보다 예측성능이 훨씬 우수하였으며, 특히 직렬구조의 예측기는 신호가 크게 변화하는 시계열의 예측에 효과적으로 사용할 수 있음을 확인하였다.

  • PDF

웨이브렛의 주파수-시간 평면 해석에 관한 연구 (A Study on Frequency-Time Plane Analysis of Wavelet)

  • 배상범;류지구;김남호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 추계종합학술대회
    • /
    • pp.451-454
    • /
    • 2005
  • 현재, 신호를 해석하기 위한 많은 방법들이 제시되고 있으며, 대표적인 방법으로는 퓨리에 변환과 웨이브렛 변환이 있다. 이러한 방법들에서, 퓨리에 변환은 모든 주파수 범위에 대해 cosine과 sine 파형의 조합으로써 신호를 표현하지만, 신호 내에서 특정 주파수 성분이 발생한 시간정보를 제공하지 않으며, 분석 신호의 전체적인 특징만을 나타낸다. 따라서 이러한 한계를 극복하기 위해, 다중해상도 해석이 가능한 웨이브렛 변환이 음성과 영상처리, 컴퓨터 비전 등의 광범위한 분야에서 응용되고 있다. 그리고 웨이브렛 변환은 스케일 변수에 따라 변화하는 윈도우를 사용하여 시간-주파수 국부성을 나타낸다. 본 논문에서는 cosine과 sine 형태의 웨이브렛을 사용하여, 퓨리에 변환의 새로운 접근법을 제시하였으며, 주파수-시간 평면의 유한한 지점에서 신호의 특징을 분석하였다.

  • PDF

딥러닝 기반 한국어 실시간 TTS 기술 비교 (Comparison of Korean Real-time Text-to-Speech Technology Based on Deep Learning)

  • 권철홍
    • 문화기술의 융합
    • /
    • 제7권1호
    • /
    • pp.640-645
    • /
    • 2021
  • 딥러닝 기반 종단간 TTS 시스템은 텍스트에서 스펙트로그램을 생성하는 Text2Mel 과정과 스펙트로그램에서 음성신호를 합성하는 보코더 등 두 가지 과정으로 구성되어 있다. 최근 TTS 시스템에 딥러닝 기술을 적용함에 따라 합성음의 명료도와 자연성이 사람의 발성과 유사할 정도로 향상되고 있다. 그러나 기존의 방식과 비교하여 음성을 합성하는 추론 속도가 매우 느리다는 단점을 갖고 있다. 최근 제안되고 있는 비-자기회귀 방식은 이전에 생성된 샘플에 의존하지 않고 병렬로 음성 샘플을 생성할 수 있어 음성 합성 처리 속도를 개선할 수 있다. 본 논문에서는 비-자기회귀 방식을 적용한 Text2Mel 기술인 FastSpeech, FastSpeech 2, FastPitch와, 보코더 기술인 Parallel WaveGAN, Multi-band MelGAN, WaveGlow를 소개하고, 이를 구현하여 실시간 처리 여부를 검증한다. 실험 결과 구한 RTF로 부터 제시된 방식 모두 실시간 처리가 충분히 가능함을 알 수 있다. 그리고 WaveGlow를 제외하고 학습 모델 크기가 수십에서 수백 MB 정도로, 메모리가 제한되어 있는 임베디드 환경에 적용 가능함을 알 수 있다.

Harmonic 분산값 최소화 알고리즘에 의한 주파수 영역 평탄화 기법 (The Technique of Spectrum Flattening by Algorithm for Minimized Harmonics Variance Value)

  • 민소연;김영규
    • 한국산학기술학회논문지
    • /
    • 제11권9호
    • /
    • pp.3558-3562
    • /
    • 2010
  • 음성신호처리 분야에 있어서 정확한 기본주파수(피치)를 검출하는 것은 매우 중요하다. 그러나 포만트의 영향과 천이 진폭의 영향으로 인하여 음성신호로부터 정확한 피치를 검출하는 것은 매우 어렵다. 따라서 본 논문에서는 음소의 천이나 변동의 영향이 적은 주파수 영역에서의 하모닉스 분산값 최소화 알고리즘을 통해 스펙트럼을 평탄화 하여 피치를 검출하는 방법에 대하여 연구하였다. 실험결과에서는 제안한 방법이 기존의 방법인 LPC법, 켑스트럼법과 비교하여 평탄화 특성이 어느 정도의 우수성을 보이는지를 평가하였다. 또한 각각의 방법을 적용하여 기본주파수를 검출한 결과를 비교함으로써 제안한 방법이 우수함을 입증하였다.

VoIP 음질의 주관적 평가에 관한 연구 (A Study of Subjective Speech Quality Measurement in VoIP)

  • 강영도;강진석;최연성;김장형
    • 한국정보통신학회논문지
    • /
    • 제5권2호
    • /
    • pp.279-287
    • /
    • 2001
  • 본 논문은 초고속 인터넷을 이용한 음성전송 방식인 VoIP(Voice over IP) 서비스에서의 음질의 주관적 평가에 관한 연구이다. PSNR이나 지터 갊은 멀티미디어 서비스의 객관적 파라미터는 명료히 정의되어 있고 쉽게 측정되나, 그것이 이용자의 지각적 인지도와는 일치하지 않는다. 본 연구에서는 송화자 내용 발생과정에 있어서 어느 정도 완전히 표현되었는가를 나타내는 송화 품질과 음성이 전송계를 통해 수화자에게 전달되는 과정에서 왜곡이나 잡음 등의 방해요인에 의해 열화 되는 정도를 나타내는 전송 품질, 그리고 수화자가 청각에서 신호처리 과정을 거친 송화자의 내용을 어느 정도 이해할 수 있는지를 나타내는 수화 품질에 대한 주관적 평가법과 그 척도를 제시한다. 또한 제안된 방법으로 실험하여 그 유효성을 검증한다.

  • PDF

블루투스 무선기술을 응용한 원격제어 시스템의 설계 (The Design of Remote Control System using Bluetooth Wireless Technology)

  • 전형준;이창희
    • 한국컴퓨터산업학회논문지
    • /
    • 제4권4호
    • /
    • pp.547-552
    • /
    • 2003
  • 본 논문에서는 블루투스 기기간 전송되는 데이터에 대한 보안성을 향상시키기 위하여 인증과정에서의 PIN 코드를 특정 피코넷을 구성하는 블루투스 기기틀에 동일하게 부여하였다. 블루투스 피코넷의 구현을 위하여 블루투tm 기기들에 고유의 ID를 부여하고 기기간 데이터 포맷을 달리한 통신 알고리즘을 설계하였고, uCOS-II RTOS 기반의 ARM프로세서를 사용한 임베디드 하드웨어 모듈을 구현하였다. 여기서는 block 인수글 갖는 함수들을 nonblocking 화하고 커널을 간소화함으로써 CPU 의 효율을 약 30 % 정도 향상시켜 전체 피코넷의 효율을 증대시킴으고써 access point로 사용이 가능하도록 하였으며, 채널 상태에 따라 효과적으로 패킷을 선택함으고써 최대 10 frames의 영상신호 전송 및 음성신호 전송을 가능하게 하였다. 상기의 과정을 통하여 블루투스 피코넷을 제어하기 위한 운영 프로그램을 설계하여 영상 및 음성 그리고 데이터의 처리가 수행됨을 보였고, 이로써 블루투스 기술을 이용한 원격제어 시스템의 상용화 가능성을 제시하였다.

  • PDF

잡음 환경에서 압신을 이용한 인공 와우 환자의 언어 인지 향상 시뮬레이션 연구 (A simulation study of speech perception enhancement for cochlear implant patients using companding in noisy environment)

  • 이영우;지윤상;이종실;김인영;김선일;홍성화;이상민
    • 대한전자공학회논문지SP
    • /
    • 제43권5호
    • /
    • pp.79-87
    • /
    • 2006
  • 본 연구에서 인공 와우 환자의 잡음 상황에서 음성 신호 강조와 잡음 제거를 위한 전 처리로서 companding strategy를 적용하고 이를 평가하였다. Companding은 인간의 청각 특성인 two tone suppression에 기반하며 이는 음성 스펙트럼 피크를 강화하고 배경 잡음을 감소시킨다. 하지만 companding은 잡음 제거와 스펙트럼 피크의 강화에 효과적인 반면, 제한된 채널의 수와 비선형 블록으로 인한 음성 정보 손실의 교환 특성을 가진다. 따라서 본 연구에서는 잡음 제거와 음성 정보 손실의 정도가 상대적인 두 companding 구조를 설계하여 개인마다 잡음 상황에서 언어 인지 특성차이에 따른 적절한 필터 뱅크를 도출하였으며, 낮은 신호 대 잡음 비 환경에서 인공 와우 환자의 언어 인지 향상을 위한 방법을 제시하였다. 제안된 알고리즘은 잡음 밴드 시뮬레이션을 이용하여 정상인 5명에게 평가되었다. 모든 피실험자에게서 효과적인 언어 인지의 향상이 관측되었고, 각 피실험자가 선호하는 필터 뱅크는 다르게 나타났다.

이 기종간의 H.323 프로토콜상의 상호연동을 위한 Signaling 호환성 증대방안 연구 (Improve Communication Between Different PBX system using H.323 Research)

  • 김정훈;최현영;민성기
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.1221-1224
    • /
    • 2007
  • 현재 기업들 간의 전화비를 줄이고 각종 VoIP 부가 서비스를 위해 VoIP 시스템의 도입이 시작 되었다. 이에 VoIP 전화기들 간의 각 기능을 최대한 활용하기 위해 현재 VoIP 시장의 90%를 차지하고 있는 H.323 게이트웨이(Gateway)간의 H.323 프로토콜의 구현차이로 인한 문제점이 발생되기 시작되었다. 본 논문은 VoIP Gateway상에 H.323 프로토콜 통신을 하면서 프로토콜 연결 상 구현의 차이로 인해 VoIP 서비스에 비정상적인 작동으로 호가 종료가 되거나 음성이 들리지 않는 현상 및 전화기의 부가서비스를 사용할 수 없는 문제를 해결하기 위해 H.323 프로토콜의 작동을 분석하고 이기종간의 H.323프로토콜 신호가 호환되지 않을 경우 이를 해결하기 위해 H.323 프로토콜상의 H.245 시그널링 (signaling)을 Media gateway 서버를 이용해 구현한 RFC 2833 DTMF-compliant 프로토콜을 사용하여 H.323 프로토콜 처리함으로써 이기종간의 Call transfer, Hold 그리고 Conferenct 기능에 대한 호환성이 개선됨을 보여 준다.

  • PDF

LSP를 이용한 음성신호의 성분분리에 의한 CELP 보코더의 전송률 감소에 관한 연구 (A Study on a Reduction of the Transmission Bit Rate by the U/V Decision Using LSP in the CELP Vocoder)

  • 나덕수;박영호;정찬중;배명진
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 1호
    • /
    • pp.61-64
    • /
    • 1999
  • 기존의 CELP 보코더에서, 무성음에 대한 별도의 처리 없이 유성음과 동일하게 처리하였다. 유성음과 무성음은 발성모델측면에서 임펄스열과 랜덤 잡음으로 각각 다름에 도 불구하고 동일하게 처리함으로써 합성음에서 음질의 저하 및 계산량과 전송률 측면에서 손실을 가져왔다. 또, U/V(Unvoiced /voiced) 분류기를 사용하는 경우에는 U/V 분류기의 성능에 따라 합성음의 음질저하의 정도의 차이가 심하다. 본 논문에서는 에러율과 전처리 계산량을 쳐소로 할 수 있는 U/V 분류기를 사용하여 CELP 보코더에서 전송률을 감소시키는 방법을 제안한다. CELP 보코더에서는 스펙트럼 정보를 LPC 파라미터로 추출한 후 다시 전송형 파라미터인 LSP(Line Spectrum Frequency)로 변환한다 새로운 린/V 분류기는 이 LSP 파라미터를 이용한다. LSP 파라미터의 주파수영역 분포도와 간격정보를 이용하여 U/V를 결정하게 된다 제안한 방법을 5.3kbps ACELP에 적용하여 성능 평가를 실시하였다 실험결과 음질의 저하 없이 $5.6\%$ (280bps)의 전송률을 감소할 수 있었다.

  • PDF