• 제목/요약/키워드: 음성 부호화기

검색결과 239건 처리시간 0.021초

이동통신을 위한 음성 부호화 방식 (Speech Coding Algorithms for Mobile Communication)

  • 이황수
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.3-11
    • /
    • 1998
  • 정보통신 문화가 발달함에 따라 디지털 이동통신이나, 멀티미디어, 음성우편 시스템 등 음성을 이용한 여러 가지 새로운 산업들이 급속히 성장하고 있다. 이 중에서도 특히 디지털 이동통신분야에 대한 연구가 활발한데, 이는 디지털 시스템에서는 부호화기를 사용하여 음성신호를 압축하기 때문에 아날로그 시스템에 비해 패널 증대를 가져올 수 있기 때문이다. 이처럼 음성 부호화기는 실질적인 상업화와 매우 밀접한 관계를 갖고 있기 때문에 그에 대한 연구가 화발히 진행되고 있다. 본 논문에서는 먼저 일반적인 음성부호화 방법들에 대해 살펴본 다음에, 현재 디지털 셀룰라 시스템에서 사용하고 있는 full-rate 음성 부호화기 및 half-rate 음성 부호화기의 표준화 동향과 최근에 여러 응용분야에서 널리 사용되고 있는 음성 부호화기에 대해서 설명하기로 한다. 또한 ITU-T 의 표준화 동향 및 4kbps 이하의 전송률을 갖는 음성 부호화기의 연구추세에 대해서 살펴보기로 한다.

  • PDF

OakDSP Core를 이용한 GSM-EFR 음성 부호화기의 실시간 구현 (Real-time Implementation of a GSM-EFR Speech Coder using a OakDSP Core)

  • 최민석;변경진;김경수
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.135-138
    • /
    • 2000
  • 본 논문에서는 DSP Group사의 16 비트 고정 소수점 DSP인 OaKDSP Core를 사용하여 유럽의 이동통신에서 표준으로 사용되고 있는 음성 부호화기 알고리즘인 GSM-EFR (Global System for Mobile communications -Enhanced Full Rate) 을 실시간으로 구현하였다. 구현된GSM-EFR 음성 부호화기의 계산량은 약 24 MIPS가 소요되며, 7.06K 워드의 코드 메모리와 12.19K 워드의 데이터 메모리를 사용하였다. 구현된 음성 부호화기는 ETSI에서 제공하는 시험 벡터 샘플을 모두 통과하였으며, 객관적 평가 툴을 이용하여 지각 평가를 수행한 결과, 32kbps ADPCM과 비슷한 음질을 보였다. 본 논문에서 실시간으로 구현된 GSM-EFR 음성 부호화기는 IMT2000 비동기 방식의 음성 부호화기 표준인 GSM-AMR의 최상위 전송률 모드로서. 앞으로 IMT-2000 비동기식 단말기용 모뎀 ASIC에 탑재할 GSM-AMR 음성부호화기의 구현을 위한 기본 구조로 이용될 예정이다.

  • PDF

CELP 음성 부호화기의 성능 향상 방법 (Performance Improvement of CELP Speech Coder)

  • 박호종
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 2호
    • /
    • pp.289-292
    • /
    • 1998
  • 본 논문에서는 CELP 음성 부호화기의 성능을 향상시키는 방법을 제안한다. 제안된 방법은 최적 코드북 검색 과정에서 추가적인 알고리듬의 지연 없이 미래 정보를 이용하고 두 인접한 코드북 부프레임 사이의 동시 최적화를 통하여 음성 부호화기의 성능을 향상시킨다. 또한, 제안된 코드북 검색 과정의 계산량을 조절하기 위한 방법도 제공된다. 제안된 방법의 성능을 검증하기 위하여 IS-96A QCELP 음성 부호화기를 이용하여 합성음의 스펙트럼과 Segmental SNR로 성능을 측정하는 모의실험을 실시하였으며, 제안된 방법을 적용한 QCELP 음성 부호화기가 기존의 QCELP에 비하여 향상된 성능을 보여주었다.

  • PDF

ADSP-2181 DSP를 이용한 G.723.1 음성부호화기 개발 (Development of G.723.1 Speech Codec Using a Fixed-point DSP(ADSP-2181))

  • 박정재
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.121-126
    • /
    • 1998
  • 고정 소수점 DSP 인 analog devices 사의 ADSP-2181을 이용하여 실시간 G.723.1 음성부호화기를 개발한 사례이다. G.723.1은 ITU에서 개발한 세계 표준 음성 부호화기로 낮은 전송율에서 고음질을 얻을 수 있다. 본 논문에서는 고정 소수점 DSP를 이용하여 부호화기를 갭라하는데 필요한 사항들을 제시하였다. 먼저 1절에서는 DAM성 부호화기의 특성에 대한 개괄을 설명하고, 2절에서는 G.723.1 부호화기의 특징을, 3절에서는 고정소수점 DSP를 이용하여 개발하는 과정을, 4절에서는 구현결과를 분석하였으며, 마지막으로 5절에서 결론을 맺는다.

  • PDF

디지털 통신 시스템에서의 음성 인식 성능 향상을 위한 전처리 기술 (Pre-Processing for Performance Enhancement of Speech Recognition in Digital Communication Systems)

  • 서진호;박호종
    • 한국음향학회지
    • /
    • 제24권7호
    • /
    • pp.416-422
    • /
    • 2005
  • 디지털 통신 시스템에서의 음성 인식은 음성 부호화기에 의한 음성 신호의 왜곡으로 인하여 성능이 크게 저하된다. 본 논문에서는 음성 부호화기에 의한 스펙트럼 왜곡을 분석하고 왜곡된 주파수 정보를 보상하는 전처리 과정을 통하여 음성 인식 성능을 향상시키는 방법을 제안한다. 현재 널리 사용되는 표준 음성 부호화기인 IS-127 EVRC, ITU G.729 CS-ACELP. IS-96 QCELP를 사용하여 부호화에 의한 왜곡을 분석하고, 모든 음성 부호화기에 공통으로 적용하여 왜곡을 보상할 수 있는 전처리 방법을 개발하였다. 본 논문에서 제안하는 왜곡 보상 방법을 세 종류의 음성부호화기에 각각 적용하였으며, 왜곡된 음성 신호에 대한 음성 인식률에 비하여 최대 $15.6\%$의 인식률 향상을 얻을 수 있었다.

Pulse-Train code 여기 선형 예측 (PT-CELP) 부호화기에 관한 연구 (A Study on the Pulse-Train Code Excited Linear Prediction Coder: PT-CELP)

  • 김흥국
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1995년도 제12회 음성통신 및 신호처리 워크샵 논문집 (SCAS 12권 1호)
    • /
    • pp.246-249
    • /
    • 1995
  • 4.16kbps의 전송률을 갖는 음성 부호화기 구조에 관하여 기술한다. 제안된 음성 부호화기는 개방 회로 피치 검출기와 이로부터 생성된 pulse train을 코드북으로 갖는 CELP 부호화기이다. Pulse-Train codebook은 분석 프레임별로 부호화 및 복호화 양단에서 생성되며 음성의 피치 및 포만트 정보를 내포하고 있다. 구현된 PT-CELP는 random codebook 방식의 CELP에 비해 적은 크기로 codebook을 만들 수 있으며 음성의 특징을 충분히 반영하므로 합성된 음성의 음질을 향상시킬 수 있다.

  • PDF

AMR부호화기와 MLT-VQ방법을 이용한 다전송률 광대역 음성부호화기 (Multi Rate Wideband Speech Coder with the AMR Speech Coder and MLT-VQ)

  • 김은주;이인성
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.809-812
    • /
    • 2001
  • 본 논문에서는 AMR(Adaptive Multi-Rate)과 MLT (Modulated Lapped Transform) 벡터 양자화 방법을 이용하여 광대역 음성부호화기를 설계하였다. 제안한 음성부호화 알고리즘은 split-band 구조를 가지고 있으며 16kHz로 샘플링 된 신호를 입력받아 QMF 필터에 의해 두 개의 대역으로 나누어, 각각 8kHz 샘플링 신호로 변환시킨 후 저대역(0Hz-3400Hz)의 신호와 고대역(3400Hz -7000Hz)의 신호로 나누어 각각 부호화한다. 나누어진 두 개의 협대역 음성신호는 AMR(Adaptive Multi-Rate)부호화기와 MLT (Modulated Lapped Transform)벡터 양자화 방법을 사용하여 각각 부호화되어 전송된다. 수신단에서는 각 대역을 AMR과 IMLT(Inverse MLT) 벡터 양자화 방법으로 역부호화하여 음성신호를 합성한다. 제안한 음성부호화기는 20.2kbps에서 12.15kbps까지의 다전송률로 동작된다. 설계된 광대역 음성부호화기는 MOS시험 결과로부터 G.722의 56 kbps 음성이 설계된 코더의 20.2 kbps와 비슷한 음질을 갖음을 확인할 수 있었다.

  • PDF

가변율 half rate 음성 부호화기의 설계 (Design of a Variable half rate speech codec)

  • 성호상
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 2호
    • /
    • pp.293-296
    • /
    • 1998
  • 본 논문에서는 다양한 멀티미디어 서비스를 위해 가변율 half rate 음성 부호화기를 설계하였다. 유, 무성음과 묵음의 구분을 위해 본 논문에서는 프레임 에너지와 음성 파라메터들을 이용한 효과적인 voicing 결정 알고리즘을 사용하였다. 유성음을 위한 half rate 음성 부호화기는 저속에서 좋은 특성을 보이는 generalized AbS구조를 이용하였다. LPC 계수는 LSP 계수로 변환한 후 predictive 2-stage VQ를 통해서 양자화하며, 여기 신호는 음질저하를 최소화하며 복잡도를 감소시킨 shift 방식의 대수적 고정 코드북 구조를 사용하고, 적응코드북과 여기코드북의 이득은 VQ로 양자화 하였다. 무성음을 위한 부호화기는 대부분이 유성음을 위한 부호화기와 동일하지만, 무성음에서는 피치간 상관도가 매우 낮으므로 피치 보간 방법을 사용하지 않고 개루프로 피치 lag를 찾은 후 전체 프레임에 사용한다. 1 kb/s 부호화기는 묵음 구간과 주변소음 구간에 사용되며 이 구간의 신호를 피치 성분이 미약한 주변소음들로 제한하고 이에 최적인 부음성 부호화기를 설계하였다. 최종적으로 완성된 가변율 half rate 부호화기는 voice activity factor(VAF)가 0.47인 시험음성에서 약 2.6 kb/s의 평균 전송률을 보였다. 주관적 음질 평가의 일환으로 IS-96 표준 코덱인 가변율 8 kb/s QCELP와 A-B preference 시험을 실시하였다. 시험 결과 평균전송률이 약 2배인 가변율 8 kb/s QCELP 보다 우수한 음질 성능을 보였다.

  • PDF

웨이브렛 변환을 적용한 광대역 음성부호화 알고리즘 (Wideband Speech Coding Algorithm with Application of Wavelet Transform)

  • 이승원;배건성
    • 한국음향학회지
    • /
    • 제21권5호
    • /
    • pp.462-470
    • /
    • 2002
  • 협대역 음성부호화기에 비해 훨씬 우수한 합성음의 음질을 보이는 광대역 음성부호화기는 상대적으로 높은 전송률을 가져서 협대역 음성부호화기에 비해 사용범위가 제한되었다. 광대역 음성부호화기에서 이러한 전송 속도를 협대역 음성부호화기와 비슷한 수준으로 낮출 수 있다면, 보다 나은 음질의 음성 통신 시스템을 구현할 수 있을 것이다. 본 논문에서는 16㎑로 샘플링 된 입력 음성신호를 동일한 대역폭을 갖는 두부대역으로 분리하여, 저대역 부호화에는 유럽의 이동통신 표준안인 GSM-EFR 협대역 음성부호화기를 적용하고, 고대역 부호화에는 웨이브렛 변환을 이용하여 고안한 부대역 음성부화기를 적용한 광대역 음성부화기를 제안하였다. 제안한 음성부호화기는 저대역 신호와 고대역 신호의 부호화에 각각 12.2 kbps, 6.7 kbps의 전송 속도를 할당하여 18.9 kbps의 전송속도를 가지며, 합성음의 음질은 56 kbps의 전송속도를 갖는 G.722음성부호화기의 합성음과 비슷한 음질을 유지하였다.

대역폭 계층 구조의 광대역 음성 부호화기를 위한 상위 대역 부호화기 연구 (High-Band Codec for Bandwidth Scalable Wideband Speech Codec)

  • 김영보;정병학;손창용;성호상;박호종
    • 한국음향학회지
    • /
    • 제24권7호
    • /
    • pp.395-401
    • /
    • 2005
  • 본 논문에서는 대역폭 계층 구조의 광대역 음성 부호화기를 위한 8kbps 상위 대역 부호화기를 제안한다. 광대역 입력 음성 신호는 하위 대역 신호와 상위 대역 신호로 분리되고, 하위 대역 신호는 표준 협대역 음성 부호화기로 처리하고, 상위 대역 신호는 제안하는 부호화기로 처리하는 구조를 가진다. 제안한 상위 대역 부호화기는 입력 신호를 부프레임 단위로 MLT 변환하고 MLT 계수를 크기와 부호로 분리하여 각각의 특성에 적합하도록 양자화 한다. MLT 계수 크기는 다수의 시간과 주파수 성분을 함께 가지는 밴드로 분할하고, 각 밴드 신호는 2차원 DCT 변환하여 양자화하며, 하위 대역의 에너지 정보를 이용하여 양자화 성능을 향상시킨다. MLT 계수 부호는 각각의 중요도를 판정하여 일부 부호만 선택적으로 양자화 하는 방법을 사용한다. 제안한 상위 대역 부호화기를 포함하는 19.8kbps 광대역 부호화기의 객관적 성능과 주관적 성능을 측정하였으며, 32kbps G.722.1보다 우수한 성능을 가지는 것을 확인하였다.