• Title/Summary/Keyword: wideband speech

검색결과 57건 처리시간 0.019초

시간 영역에서 개선된 파라미터 추론을 통한 효율적인 초광대역 확장 시스템 설계 (Designing of efficient super-wide bandwidth extension system using enhanced parameter estimation in time domain)

  • 전종근
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 추계학술대회
    • /
    • pp.431-433
    • /
    • 2018
  • 본 논문은 광대역 음성의 음질 향상을 위해 시간 영역에서 인공대역 확장 기술을 사용하여 초광대역 음성신호를 출력하여 사용자에게 개선된 음질의 음성을 제공하는 시스템을 제안한다. 시간 영역에서 소스필터 모델에 기반하여 광대역 여기신호 및 LSP를 추출하고, 각각의 대역폭 확장 알고리즘을 적용였고, 초광대역 여기신호 및 LSP를 추론하여 초광대역 음성신호를 합성한다. 주관적인 테스트를 통해 광대역 음성신호보다 초광대역 음성신호의 음질을 더 선호하는 결과를 도출하였다.

  • PDF

웨이브렛 변환을 적용한 광대역 음성부호화 알고리즘 (Wideband Speech Coding Algorithm with Application of Wavelet Transform)

  • 이승원;배건성
    • 한국음향학회지
    • /
    • 제21권5호
    • /
    • pp.462-470
    • /
    • 2002
  • 협대역 음성부호화기에 비해 훨씬 우수한 합성음의 음질을 보이는 광대역 음성부호화기는 상대적으로 높은 전송률을 가져서 협대역 음성부호화기에 비해 사용범위가 제한되었다. 광대역 음성부호화기에서 이러한 전송 속도를 협대역 음성부호화기와 비슷한 수준으로 낮출 수 있다면, 보다 나은 음질의 음성 통신 시스템을 구현할 수 있을 것이다. 본 논문에서는 16㎑로 샘플링 된 입력 음성신호를 동일한 대역폭을 갖는 두부대역으로 분리하여, 저대역 부호화에는 유럽의 이동통신 표준안인 GSM-EFR 협대역 음성부호화기를 적용하고, 고대역 부호화에는 웨이브렛 변환을 이용하여 고안한 부대역 음성부화기를 적용한 광대역 음성부화기를 제안하였다. 제안한 음성부호화기는 저대역 신호와 고대역 신호의 부호화에 각각 12.2 kbps, 6.7 kbps의 전송 속도를 할당하여 18.9 kbps의 전송속도를 가지며, 합성음의 음질은 56 kbps의 전송속도를 갖는 G.722음성부호화기의 합성음과 비슷한 음질을 유지하였다.

Spectral Folding방법과 GMM 변환을 이용한 대역폭 확장의 Hybrid 방법 (The Hybrid Bandwidth Extenstion Method Using Spectral Folding and GMM Transformation)

  • 최무열;김형순
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2006년도 춘계 학술대회 발표논문집
    • /
    • pp.131-134
    • /
    • 2006
  • The narrowband speech over the telephone network is lacking in the information from low-band (0-300 Hz) and high-band (3400-8000 Hz) that are found in wideband speech (0-8000 Hz). As a result, narrowband speech is characterized by the reduced intelligibility and muffled quality, and degraded speaker identification. Spectral folding is the easiest way to reconstruct the missing high-band; however, the reconstructed speech still brings the sense of band-limited characteristic because of the absence of low-band and mid-band frequency components. To compensate for the lack of the extended speech, we propose to combine the spectral folding method and GMM transformation method, which is a statistical method to reconstruct wideband speech. The reconstructed wideband speech showed that the absent frequency components was filled up with relatively low spectral mismatch. According to the subjective speech quality evaluations, the proposed method was preferred to other methods.

  • PDF

4800bps CELP 음성 부호화기에 적용한 대역폭 확장에 관한 연구 (A Study on the Bandwidth Extension Adopted for 4800 bps CELP Speech Coder)

  • 박진수;김형순
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2002년도 11월 학술대회지
    • /
    • pp.175-178
    • /
    • 2002
  • Most existing telephone networks transmit narrowband speech witch has been bandlimited below 4 kHz. Compared with wideband speech up to 8 kHz, narrowband speech shows reduced intelligibility and a muffled quality. Bandwidth extension is a technique to generate wideband speech by reconstructing 4-8 kHz highband speech without any additional information. This paper presents experimental results of the bandwidth extension adopted for 4800 bps CELP speech coder. In this experiment, we examine various methods for reconstruction of wideband spectrum and excitation signal, compare and analyze their performance by performing the subjective preference test and measuring the cepstral distortion.

  • PDF

모듈화한 신경 회로망을 이용한 광대역 음성 복원 (Wideband Speech Reconstruction Using Modular Neural Networks)

  • 우동헌;고참한;강현민;정진희;김유신;김형순
    • 대한음성학회지:말소리
    • /
    • 제48호
    • /
    • pp.93-105
    • /
    • 2003
  • Since telephone channel has bandlimited frequency characteristics, speech signal over the telephone channel shows degraded speech quality. In this paper, we propose an algorithm using neural network to reconstruct wideband speech from its narrowband version. Although single neural network is a good tool for direct mapping, it has difficulty in training for vast and complicated data. To alleviate this problem, we modularize the neural networks based on appropriate clustering of the acoustic space. We also introduce fuzzy computing to compensate for probable misclassification at the cluster boundaries. According to our simulation, the proposed algorithm showed improved performance over the single neural network and conventional codebook mapping method in both objective and subjective evaluations.

  • PDF

광대역 AMR 음성 압축기를 위한 효율적인 코드북 검색 방법 (Efficient Codebook Search Method for AMR Wideband Speech Codec)

  • 김윤희;박호종
    • 한국음향학회지
    • /
    • 제22권4호
    • /
    • pp.308-314
    • /
    • 2003
  • 3.4 ㎑ 대역폭을 가지는 협대역 음성 통신의 품질 한계를 극복하여 새로운 고품질 음성 서비스를 제공하기 위하여 7㎑ 대역폭을 가지는 광대역 음성 통신 시스템이 개발중이며, 광대역 음성 신호의 효율적인 압축을 위하여 광대역 AMR 음성 압축기가 개발되었다. 광대역 AMR음성 압축기는 ACELP 구조를 가지며 뛰어난 음질을 제공하지만 최적의 코드벡터를 찾기 위하여 매우 많은 계산량이 필요한 단점을 가진다. 이와 같은 문제점을 해결하기 위하여 본 논문에서는 광대역 AMR 음성 압축기의 코드북을 효율적으로 검색하는 새로운 방법을 제안한다. 제안하는 방법은 대략적으로 초기 코드벡터를 구하고, 코드벡터의 각 펄스의 중요도를 계산하여 중요도가 낮은 펄스를 제거하고 새로운 펄스를 찾는 과정을 통하여 코드벡터의 성능을 점차적으로 향상시키는 기법을 사용한다 제안한 방법을 광대역 AMR 음성 압축기에 적용하여 성능을 측정하였으며, 매우 적은 계산량으로 기존의 방법보다 약간 우수한 성능을 제공하는 것을 확인하였다.

고조파 복원에 의한 CELP 음성 부호화기의 저대역 확장 (Low-band Extension of CELP Speech Coder by Recovery of Harmonics)

  • 박진수;최무열;김형순
    • 대한음성학회지:말소리
    • /
    • 제49호
    • /
    • pp.63-75
    • /
    • 2004
  • Most existing telephone speech transmitted in current public networks is band-limited to 0.3-3.4 kHz. Compared with wideband speech(0-8 kHz), the narrowband speech lacks low-band (0-0.3 kHz) and high-band(3.4-8 kHz) components of sound. As a result, the speech is characterized by the reduced intelligibility and a muffled quality, and degraded speaker identification. Bandwidth extension is a technique to provide wideband speech quality, which means reconstruction of low-band and high-band components without any additional transmitted information. Our new approach considers to exploit harmonic synthesis method for reconstruction of low-band speech over the CELP coded speech. A spectral distortion measurement and listening test are introduced to assess the proposed method, and the improvement of synthesized speech quality was verified.

  • PDF

대역폭 계층 구조의 광대역 음성 부호화기를 위한 상위 대역 부호화기 연구 (High-Band Codec for Bandwidth Scalable Wideband Speech Codec)

  • 김영보;정병학;손창용;성호상;박호종
    • 한국음향학회지
    • /
    • 제24권7호
    • /
    • pp.395-401
    • /
    • 2005
  • 본 논문에서는 대역폭 계층 구조의 광대역 음성 부호화기를 위한 8kbps 상위 대역 부호화기를 제안한다. 광대역 입력 음성 신호는 하위 대역 신호와 상위 대역 신호로 분리되고, 하위 대역 신호는 표준 협대역 음성 부호화기로 처리하고, 상위 대역 신호는 제안하는 부호화기로 처리하는 구조를 가진다. 제안한 상위 대역 부호화기는 입력 신호를 부프레임 단위로 MLT 변환하고 MLT 계수를 크기와 부호로 분리하여 각각의 특성에 적합하도록 양자화 한다. MLT 계수 크기는 다수의 시간과 주파수 성분을 함께 가지는 밴드로 분할하고, 각 밴드 신호는 2차원 DCT 변환하여 양자화하며, 하위 대역의 에너지 정보를 이용하여 양자화 성능을 향상시킨다. MLT 계수 부호는 각각의 중요도를 판정하여 일부 부호만 선택적으로 양자화 하는 방법을 사용한다. 제안한 상위 대역 부호화기를 포함하는 19.8kbps 광대역 부호화기의 객관적 성능과 주관적 성능을 측정하였으며, 32kbps G.722.1보다 우수한 성능을 가지는 것을 확인하였다.

Split Model Speech Analysis Techniques for Wideband Speech Signal

  • Park YoungHo;Ham MyungKyu;You KwangBock;Bae MyungJin
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 1호
    • /
    • pp.20-23
    • /
    • 1999
  • In this paper, The Split Model Analysis Algorithm, which can generate the wideband speech signal from the spectral information of narrowband signal, is developed. The Split Model Analysis Algorithm deals with the separation of the $10^{th}$ order LPC model into five cascade-connected $2^{nd}$ order model. The use of the less complex $2^{nd}$ order models allows for the exclusion of the complicated nonlinear relationships between model parameters and all the poles of the LPC model. The relationships between the model parameters and its corresponding analog poles is proved and applied to each $2^{nd}$ order model. The wideband speech signal is obtained by changing only the sampling rate

  • PDF

대역폭 계층 구조의 광대역 음성 부호차기 개발 (Bandwidth Scalable Wideband Speech Codec)

  • 이우석;손창용;이영범;박호종
    • 한국음향학회지
    • /
    • 제23권6호
    • /
    • pp.481-487
    • /
    • 2004
  • 본 논문에서는 대역폭 계층 구조의 광대역 음성 부호화기 구조와 이를 위한 상위 대역 부호화기를 제안한다. 상위 대역 부호화기는 상위 대역 신호를 다수의 주파수 밴드로 분할하고, 각 밴드 신호를 DCT 변환하여 양자화한다. DCT 계수는 크기와 부호로 분리하여 독립적으로 처리하며, 각각의 특성에 적합한 양자화 방법을 개발하여 성능을 향상시킨다. 또한, 하위 대역의 부호화된 이득 파라미터를 상위 대역의 양자화에 이용함으로써 부호화 성능을 향상시키는 방법을 제안한다. G.729E로 하위 대역을 부호화하고 제안한 부호화기로 상위 대역을 처리하는 대역폭 계층 구조의 광대역 음성 부호화기를 개발하였고, 주관적 음질을 측정하여 24kbps G.722.1보다 우수한 음질을 가지는 것을 확인하였다.