• 제목/요약/키워드: 음성 부호기

검색결과 76건 처리시간 0.023초

견실한 배음 축척과 결합된 4.8KBPS 트리 음성부호기 (Robust Tree Coding Combined with Harmonic Scaling of Speech at 4.8 Kbps)

  • 강상원;이인성;한경호
    • 한국통신학회논문지
    • /
    • 제18권12호
    • /
    • pp.1806-1814
    • /
    • 1993
  • 본 논문에서는 음성 신호기의 4.8 Kbps에서 효율적인 배음 축척과 결합된 트리 부호기를 실현한다. 음성신호를 2대 1 압축하기 위해 TDHS 알고리즘을 사용한다. 이 과정은 4.8 Kbps에서 6.4 KHz 샘플링율을 적용하면 트리 부호기에 1.5 비트/샘플을 할당할 수 있다. 트리 부호기의 견실성은 short-term 예측기의 적응시 사용되는 입력 신호를 효율적 선택함으로써 개선되어진다. 또한 채널에서 전송에러기 트리 부호기의 성능은 피치 예측기에 스무더를 부가함으로써 개선된다. 배음 축척과 결합된 트리 부호기는 4.8 Kbps 전송률에서 좋은 질의 음성을 출력한다.

  • PDF

이동통신 시스템을 위한 음성 부호화기와 결합된 적응 반향제거기에 관한 연구 (Adaptive echo canceller combined with speech coder for mobile communication systems)

  • 이인성;박영남
    • 한국통신학회논문지
    • /
    • 제23권7호
    • /
    • pp.1650-1658
    • /
    • 1998
  • 본 논문에서는 이동통신 시스템의 반향을 제거하기 위해 음성부호화기에서 얻은 음성 분석 정보를 이용하여 반향을 제거하는 방법을 제시하였다. 반향 제거기 적응 알고리즘의 입력 신호로서 기존의 방법인 음성부호화기의 출력 음성신호를 사용하지 않고 음성 부호화기 디코더 과정에서 제공되어지는 여기 신호, 선형 예측 오차 신호를 사용하였다. 모의 실험을 위해 Normalized Least Mean Square(NLMS) 알고리즘을 이용한 적응 반향 제거기를 구성하였고, 기존의 음성신호를 사용하는 반향제거기에 비해 음성 부호화기에서 제공되어지는 음성의 여기 신호 성분을 적응 알고리즘 입력신호로 사용함으로써 40 dB Echo Return Loss Enhancement(ERLE)를 얻는데 걸리는 시간에 있어서 약 4배 정도의 빠른 속도를 얻을 수 있다.

  • PDF

음성파형 부호화에서의 잡음 SPECTRUM 변형에 관한 연구 (Noise Spectral Shaping in Speech Waveform Coding)

  • 이황수;은종관
    • 한국음향학회지
    • /
    • 제3권2호
    • /
    • pp.69-90
    • /
    • 1984
  • 본 논문에서는 잡음 spectrum 변형 기능을 가진 APCM, ADPCM 및 ADM 음성 부호기의 성능 에 관해서 연구하였다. 잡은 SPECTRUM 변형방식은 두가지를 고려할 수 있는데, APCM과 ADPCM에 서는 C-massage weighting 된 양자화 잡음을 최소화하는 noise feedback filter를 이용하는 방법을 채택 하고, ADM에서는 in-band의 잡음의 일부를 신호대역의 밖으로 옮기는 방법을 사용하였다. APCM 과 ADPCM 부호기의 성능을 측정하는데는 주파수가 weighting이 된 신호대 잡음비와 segment된 FWSQNR를 사용하였다. 실제음성을 사용한 simulation 결과에 의하면 잡음 spectrum 변형기능을 가진 부호기가 없는 것보다 0.5 내지 3dB 가량 좋은 것으로 나타났다. 이러한 개선은 양적으로 비교적 적은 것이 사실이지만 실제로 음성을 들어보면 음질이 현저히 좋아짐을 알 수 있었다.

  • PDF

웨이브렛 변환을 적용한 광대역 음성부호화 알고리즘 (Wideband Speech Coding Algorithm with Application of Wavelet Transform)

  • 이승원;배건성
    • 한국음향학회지
    • /
    • 제21권5호
    • /
    • pp.462-470
    • /
    • 2002
  • 협대역 음성부호화기에 비해 훨씬 우수한 합성음의 음질을 보이는 광대역 음성부호화기는 상대적으로 높은 전송률을 가져서 협대역 음성부호화기에 비해 사용범위가 제한되었다. 광대역 음성부호화기에서 이러한 전송 속도를 협대역 음성부호화기와 비슷한 수준으로 낮출 수 있다면, 보다 나은 음질의 음성 통신 시스템을 구현할 수 있을 것이다. 본 논문에서는 16㎑로 샘플링 된 입력 음성신호를 동일한 대역폭을 갖는 두부대역으로 분리하여, 저대역 부호화에는 유럽의 이동통신 표준안인 GSM-EFR 협대역 음성부호화기를 적용하고, 고대역 부호화에는 웨이브렛 변환을 이용하여 고안한 부대역 음성부화기를 적용한 광대역 음성부화기를 제안하였다. 제안한 음성부호화기는 저대역 신호와 고대역 신호의 부호화에 각각 12.2 kbps, 6.7 kbps의 전송 속도를 할당하여 18.9 kbps의 전송속도를 가지며, 합성음의 음질은 56 kbps의 전송속도를 갖는 G.722음성부호화기의 합성음과 비슷한 음질을 유지하였다.

1차원 SPIHT를 이용한 가변 비트율 음성 부호기의 설계 (Design of a Variable Bit Rate Speech Coder Based on One-dimensional SPIHT)

  • 나훈;정대권
    • 한국음향학회지
    • /
    • 제22권6호
    • /
    • pp.443-451
    • /
    • 2003
  • 코드북 기반의 CELP 부호기는 코드북에 미리 할당된 부호화 비트율에 따라서 여기 신호를 모델링한 후 코드북을 이용하여 음성신호를 합성한다. 따라서 임의의 다양한 비트율을 하나의 부호기에서 지원하지 못하는 단점이 있다. 본 논문에서 제안하는 가변 비트율 부호기는 웨이블렛 변환 (wavelet transform과 1차원 SPIHr (one dimensional SPIHT)를 이용하여 현재 프레임에 할당되는 비트수에 따라서 여기신호를 부호화한다. 또한 CELP 부호기의 경우처럼 특정한 몇 가지 형태로 여기신호(또는 코드북)를 모델링할 필요가 없고, 정확한 피치정보가 없어도 여기신호를 사용자의 요구에 따라 다양한 비트율로 부호화할 수 있다. 그 결과 코드북이 존재하지 않기 때문에 부호기의 복잡도가 낮으며, CELP 기반의 G.729와 G.723.1 부호기와의 음질 비교 결과 동등하거나 나은 결과를 보여준다.

Pulse-Train code 여기 선형 예측 (PT-CELP) 부호화기에 관한 연구 (A Study on the Pulse-Train Code Excited Linear Prediction Coder: PT-CELP)

  • 김흥국
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1995년도 제12회 음성통신 및 신호처리 워크샵 논문집 (SCAS 12권 1호)
    • /
    • pp.246-249
    • /
    • 1995
  • 4.16kbps의 전송률을 갖는 음성 부호화기 구조에 관하여 기술한다. 제안된 음성 부호화기는 개방 회로 피치 검출기와 이로부터 생성된 pulse train을 코드북으로 갖는 CELP 부호화기이다. Pulse-Train codebook은 분석 프레임별로 부호화 및 복호화 양단에서 생성되며 음성의 피치 및 포만트 정보를 내포하고 있다. 구현된 PT-CELP는 random codebook 방식의 CELP에 비해 적은 크기로 codebook을 만들 수 있으며 음성의 특징을 충분히 반영하므로 합성된 음성의 음질을 향상시킬 수 있다.

  • PDF

개량형 다중대역 여기 (IMBE: Improved Multi-band Excitation) 음성 부호기의 피치 예측 개선 (An Efficient Pitch Estimation for IMBE (Improved Multi-band Excitation) Speech Coder)

  • 나훈;정대권
    • 한국음향학회지
    • /
    • 제20권3호
    • /
    • pp.34-41
    • /
    • 2001
  • 기존의 IMBE (개량형 다중대역 여기 : Improved Multi-band Excitation) 음성 부호기의 초기 피치 추정 과정은 전체 부호기 연산 시간의 대부분을 차지하며 또한 미래의 음성 프레임들이 초기 피치 추정시 사용되므로 시간 지연이 유발되어 실시간 구현에 장애 요소로 작용되었다. 또한 무성음에 해당되는 프레임에 대해서도 유성음과 동일한 피치 추정을 수행하므로 알고리즘의 효율성을 떨어뜨린다 본 논문에서는 초기 피치 추정 전에 다이애딕 웨이브렛 변환 (Dyadic Wavelet Transform)을 이용하여 이를 바탕으로 유/무성음을 판별한 후 유성음으로 결정된 프레임에 대해서만 피치 추정을 행하고 무성음으로 결정된 프레임은 랜덤 잡음을 주어서 부호화시의 처리 시간을 단축하였다. 또한, 초기 피치 추정 전에 판별된 유/무성음을 판별하여 유성음과 무성음에 각기 다른 초기 피치 추정 알고리즘을 사용하고 미래의 두 프레임을 사용하지 않음으로써 송, 수신단에 유발되는 시간 지연을 제거하였다. 그 결과 초기 피치 추정 과정의 상대적인 복잡도가 23% 감소되었고 프레임당 처리 시간이 1/10∼ 1/11로 감소되었고 기존의 부호기와 거의 같은 음질을 얻을 수 있었다.

  • PDF

견실, 저지연 멀티트리 9.6Kbits/s 음성부호기에 관한 연구 (Robust, Low Delay Multi-tree Speech Coding at 9.6Kbits/sec)

  • 우홍체;문병현;이채욱
    • 한국통신학회논문지
    • /
    • 제18권3호
    • /
    • pp.348-354
    • /
    • 1993
  • 본 논문에서는 음성의 short-term 계수 추출에 대한 새로운 방식을 제안하였으며, 데이타량 9.6Kbits/sec의 멀티 트리 부호기를 실현하였다. 이 트리 부호기는 총 지연시간 2.5msec을 (6.4KHz 샘플링 주파수에서 16샘플) 가지며, 좋은 출력 음질을 가지며, bit 오욜 (BER) $10^{-3}$에서도 견실한 상태를 유지한다. 이 견실성은 short-term 계수 추출을 위해 수신된 여기 신호를 smoothing 하여, 병렬 구성과 함께 사용하므로 가능 하였다. 이 부호기의 출력 음성은 SNR, SNRSEG, 그리고 듣기 시험으로 평가 되었다.

  • PDF

음성 합성용 저전력 고음질 부호기/복호기 설계 및 구현 (Design and Implementation of the low power and high quality audio encoder/decoder for voice synthesis)

  • 박노경;박상봉;허정화
    • 한국인터넷방송통신학회논문지
    • /
    • 제13권6호
    • /
    • pp.55-61
    • /
    • 2013
  • 본 논문은 음성합성에서 사용되는 오디오 부호기/복호기 설계 및 구현을 기술한다. 설계된 회로는 원래 음성 샘플대신에 연속되는 음성 샘플의 차를 부호화하는 방식으로 압축율은 4:1 이다. FPGA를 이용해서 각각의 기능을 검증하고, $0.35{\mu}m$ 표준 CMOS 공정을 이용하여 칩으로 제작해서 성능을 측정하였다. 시스템 클럭 주파수는 16.384MHz를 사용한다. THD(Total Harmonic Distortion)+n은 주파수에 따라서 -40dB에서 -80dB 값을 지니고, 전력 소모는 전원 전압 3.3V에서 80mW로써, 고음질과 저전력 소모를 요구하는 모바일 응용에 적합하다.

통계적 모델에 근거한 음성 검출기의 설계 (Design of a Statistical Model Based Voice Activity Detector)

  • 손종서
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.465-469
    • /
    • 1998
  • 가변 전송율 음성 부호화기를 위한 음성 검출기를 통계적 모델을 적용하여 설계한다. 제안된 음성 검출기는 음성 파라미터를 decision-directed 방식으로 추정함으로써 LRT를 이용하여 동작 특성이 우수한 판정 규칙을 유도한다. 또한 음성 발생 사건들을 1차의 Markov process 로 모델링 함으로써 과거의 관찰들을 현재 프레임의 음성 검출 과정에서 고려할 수 있는 행오버 알고리즘을 개발한다. 개발된 음성 검출기는 고려된 실험환경에서 ITU-T 표준인 G.729 Annex B 음성 검출기보다 맹 우수한 성능을 나타내었다.

  • PDF