• 제목/요약/키워드: CELP Vocoder

검색결과 52건 처리시간 0.034초

화자 의존 환경의 AMR 7.4Kbit/s모드에 기반한 보코더 (A New Vocoder based on AMR 7.4Kbit/s Mode for Speaker Dependent System)

  • 민병제;박동철
    • 한국통신학회논문지
    • /
    • 제33권9C호
    • /
    • pp.691-696
    • /
    • 2008
  • 본 논문은 AMR(Adaptive Multi Rate)코더의 7.4kit/s 모드를 기반으로 화자 의존적인 환경에서 더욱 압축률을 높인 새로운 켈프(CELP)계열의 코더를 제안한다. 제안된 코더는 OGM(OutGoing Message)이나 TTS(Text-To-Speech) 등 한 사람의 음성만을 필요로 하는 시스템에서 유용하게 사용할 수 있다. 새로운 코더의 압축률을 높이기 위해서 무감독 학습 신경망인 Centroid Neural Networks(CNN)를 이용한 새로운 LSP 코드북을 생성하여 사용한다. 또한 고정 코드북 탐색 단계에서 AMR 7.4 kbit/s 모드에서는 4개의 펄스를 서브프레임 마다 사용하는 대신에 새로운 코더에서는 오직 2개의 펄스만을 사용하기 때문에 압축률을 더 높일 수 있다. 이로 인해서 스피치의 질이 감소하게 되는데, 각 서브프레임 마다 예상하는 펄스를 적용함으로써 보상받을 수 있다. 제안된 보코더는 기존 AMR 7.4Kbps모드와 비교해 27% 높은 압축률을 가지는 동시에, MOS( Mean Opinion Score)의 면에서 볼 때, 대등한 음질을 보였다.

발성 속도에 따른 가변전송률 CELP 부호화기 설계에 관한 연구 (A Study on a Design of the Variable Bit-Rate Vocoder by Measuring of the Speaking Rate)

  • 나덕수;배명진
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 하계종합학술대회 논문집(4)
    • /
    • pp.273-276
    • /
    • 2001
  • CELP 부호화기는 선형 예측 합성에 의한 분석 부호화의 원칙에 기본을 두고 있다. 그리고 음성 신호의 스펙트럼을 LPC 분석을 통해 부호화하는데 고정 윈도우를 사용하여 부호화한다. 그러나 음성신호는 화자의 발성속도에 따라 파형의 변화가 시간적으로 빠르게 변화하기도 하고, 반대로 유사한 파형이 일정시간 유지되기도 한다. 따라서 윈도우의 크기를 발성속도에 맞추어 분석한다면 보다 효율적인 부호화를 할 수 있다. 본 논문에서는 발성속도에 따라 전송률을 달리 적용하는 방법을 제안한다. 발성속도의 측정은 스펙트럼 변화도를 이용하여 측정하였고, 발성속도가 빠를 때는 프레임 크기를 줄여 시간적으로 빠르게 변화하는 신호에 적응적으로 분석하고 대신 파라미터 표현에 비트를 줄인다. 반대로 발성속도가 느릴 때는 프레임 크기를 키우고 파라미터 표현에 비트를 더 할당한다. 제안한 방법을 실험하기 위해 G.723.1 5.3kbps ACELP 부호화기를 이용하였다 음질의 열하 없이 평균 16.34% 전송률 감소효과를 얻을 수 있었다.

  • PDF

가변전송률 CELP 부호화기 설계를 위한 발성률 비교 분석에 관한 연구 (A Study on a comparison and analysis of Speaking rate estimation for adaptive bit rate on CELP vocoder)

  • 장경아;민소연;배명진
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 춘계학술발표대회 논문집 제23권 1호
    • /
    • pp.105-108
    • /
    • 2004
  • 음성 부호화 기술은 전송률과 복잡도를 줄이고 음질을 향상시키는 방향으로 진행되고 있다. 현재 상용화되고 있는 CELP형 보코더는 낮은 전송률에 비해 우수한 음질을 제공한다. 본 논문에서는 기존의 방식과 다르게 보코더 단에 입력 음성이 들어가기 앞서 전처리 기법을 수행하는 전처리단을 부가하여 전송률을 낮추는 방법을 소개하고, 소개된 방법들을 각기 비교하고 분석하고자 한다. 전처리기법들을 음성 인식이나 합성에서 사용되는 파라미터들을 적용시켰으며, 처리시간이나 계산시간에 있어 기존의 방식에서 많은 영향을 미치지 않은 간단한 알고리즘으로 구현하였다. 소개하는 전처리단에서는 기존의 코딩방식에서 사용하지 않은 파라미터들, 발성율, 지속시간, PSOLA 방식들을 이용하였다.

  • PDF

전이구간에서의 Energy 평탄화를 통한 피치정확도 향상에 의한 G.723.1 Vocoder의 음질향상 (The Speech Enhancement of G.723.1 Vocoder by the Improvement of Pitch Accuracy Using a Flattened Energy in a Transient Period)

  • 박원;김정진;배명진
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 하계학술발표대회 논문집 제19권 1호
    • /
    • pp.59-62
    • /
    • 2000
  • 화상회의 및 인터넷폰을 목적으로 개발된 G.723.1은 CELP계열 보코더와 같이 화자의 개성정보를 위해 피치를 전송하고 있다. 하지만 안정구간과 비 안정구간의 차이를 두지 않고 처리를 하기 때문에 비 안정구간, 특히 전이구간에서 정확한 피치검출이 이루어지지 않는 이유로 음질의 열하가 발생하게 된다. 따라서 본 논문에서는 한 프레임 구간에서 에너지의 기울기로 대략적인 피치이득을 구한 다음 안정구간일 때와 프레임 내의 에너지의 기울기가 문턱 값을 넘을 때에는 기존의 방법으로 피치를 구하고 그런지 않은 경우에는 에너지를 조정하여 피치를 다시 구하는 방법을 사용하였다. 실제 음성시료에 대해 기존의 방법과 제안한 방법을 비교하기 위해 SegSNR 과 MOS를 비교하였을 때 각각 1.302(dB)와 평균 0.045 MOS가 향상되었다.

  • PDF

디지틀 셀룰라 시스템을 위한 효율적인 음성부호화 기술 (An Efficient Vocoder for Digital Cellular System)

  • 강상원;이인성;한경호
    • 한국통신학회논문지
    • /
    • 제18권9호
    • /
    • pp.1348-1357
    • /
    • 1993
  • 본 논문에서는 디지틀 셀룰라 시스템을 위한 효율적인 8 kbps 음성부호화기로서, Code-excited linear prediction (CELP) 구조에 Trellis Coded Vector Excitation을 이용한 trellis code-excited linear prediction (TCELP) 음성 부호화 방식을 제시하였다. TCELP 구조에 근거한 최적 코드북 설계를 위해 traing seguence-based 알고리즘과 부호화 지연을 줄이는 trellis 심볼 release 방식이 개발되었고, 제시된 TCELP 시스템과 부호화 복잡도가 분석되었다. 끝으로 8 kbps TCELP 부호화기의 성능이 SNR/SEGSNR과 비공식 청취시험을 통해 평가되었다.

  • PDF

개선된 Skipping 기법을 이용한 CELP 보코더에서의 고속피치검색 알고리듬 (A Simple and Fast Pitch Search Algorithm Using a Modified Skipping Technique in CELP Vocoder)

  • 이주헌;배명진;권춘우
    • The Journal of the Acoustical Society of Korea
    • /
    • 제14권2E호
    • /
    • pp.33-36
    • /
    • 1995
  • CELP 보코더에서의 피치검색에 있어서, 음성신호의 상관함수의 몇가지 특성을 이용한 스킵기법은 음질의 저하를 거의 일으키지 않으면서 피치검색에 필요한 계산량을 줄여준다. 하지만, 때때로 양의 상관값을 갖는 검색대상피치들이 검색에서 제외되어 음질이 저하되는 것을 완전히 막을 수는 없다. 이러한 단점을 보완하기 위해서 약식의 상관함수식을 이용한 개선된 스킵기법을 제안한다. 제안된 방법을 기존의 전체검색방법보다 계산량을 35% 이상 줄이면서도 음절이 저하는 일어나지 않는다.

  • PDF

QCELP 음성부호화기의 양방향 실시간 구현 (The Full-Duplex and Real-Time Implementation of QCELP Vocoder)

  • 장석진
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1995년도 제12회 음성통신 및 신호처리 워크샵 논문집 (SCAS 12권 1호)
    • /
    • pp.239-241
    • /
    • 1995
  • 본 논문은 CELP 계열인 QCELP의 성능 평가와 설계된 효율적인 구조, 구현된 양방향 실시간 시스템에 대해 기술한다. 공인된 음성 샘플을 이용 SNR 과 분할 SNR 의 객관적 테스트를 수행하여 QCELP의 성능을 확인하였다. 본 실에서는 QCELP 알고리듬이 하나의 DSP 칩에 이식되고, 무선 환경하에서 실시간으로 음성 부호화 과정을 수행할 수 있도록 새로운 고조를 설계하였다. 다음에 본 실에서는 양 방향 통신의 하드웨어 플랫폼을 구성하여 설계된 QCELP 구조의 타당성을 입증하였다. 본 실에서 구현된 QCELP 음성부호화기는 현재 ETRI에서 개발된 디지틀 이동 통신 시스템인 CMS -2에서 사용되어 그 성능이 입증되었다.

  • PDF

상관관계 특성을 용한 CELP 보코더의 고속 피치검색 알고리듬 (A Fast Pitch Searching Algorithm Using Correlation Characteristics in CELP Vocoder)

  • 이주헌;배명진;안수길
    • The Journal of the Acoustical Society of Korea
    • /
    • 제13권2E호
    • /
    • pp.20-25
    • /
    • 1994
  • CELP 타입의 보코더에서 가장 큰 단점은 계산량이 상당히 커서 실시간 구현에 어려움이 많다는데 있다. 이러한 계산량의 부담을 줄이기 위해서 본 논문에서는 음질의 저하없이 피치검색시간을 단축하는 간단한 방법을 제안한다. 음성신호의 상관함수에서 발견되는 몇 가지의 특성으로부터 피치검색은 상관함수의 양의 구간만으로 한정될 수 있다. 이러한 피치검색구간의 한정은 상관함수에서 음의 진폭구간을 앞선 양의 진폭 구간의 폭만큼으로 추정하여 건너뜀으로서 구현할 수 있다. 또한 검색되는 피치래그의 개수를 일정한 수로 제한할 수도 있는데 실험적으로 약 58로 제한된다. 따라서 제안된 수의 피치래그에서만 피치검색이 수행된다. 제안된 방법으로 피치검색을 수행한 결과 기존의 방법에 비하여 음질의 저하없이 약 51%의 시간단축이 되었다.

  • PDF

G.723.1 MP-MLQ 부호화기의 성능개선에 관한 연구 (The Research of Improving The Performance of the G.723.1 MP-MLQ Vocoder)

  • 민소연;나덕수;김정진;배명진
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 2호
    • /
    • pp.49-52
    • /
    • 1999
  • 4.8kbps 내외의 전송률에서 양호한 음질을 제공하는 CELP 계열 음성 부호화기 중에서 인터넷 폰 및 화상회의를 목적으로 개발된 G.723.1은 5.3kbps ACELP(Algebraic CELP)와 6.3kbps MP-MLQ(Multi-Pulse Maximum Likelihood Quantization) 두 개의 부호화기를 포함하고 있다[1]. 이 중 MP-MLQ는 고정 코드북 검색 시 많은 계산량으로 인해 실시간 구현에 어려움이 따르고 있다. 이러한 문제점을 개선하기 위해 본 논문에서는 유/무성음을 분리한 후 grid bit를 먼저 결정하여 코드북을 검색하는 방법 제안한다. LSP 파라미터의 분포특성을 이용하여 유/무성음을 분리한 후 무성음에 대해서는 스펙트럼 정보만 전송하고 유성음에 대해서만 코드북 검색을 수행한다. 그리고 코드북 검색 시 Grid bit를 먼저 결정하여 수행하였다. Grid bit는 짝/홀수번째 전체 펄스를 이용하여 합성한 합성음과 DC 성분이 제거된 원음과의 비교를 통하여 결정하였다. 실험 결과 전체 처리시간은 평균적으로 약 $20.55\%$ 감소하였으며 주관적 음질평가 결과 음질 열하는 거의 발생하지 않았다.

  • PDF

상관관계 대칭성을 이용한 CELP 보코더의 델타피치 검색에 관한 연구 (A Study on Delta Pitch Searching of CELP Vocoder using the Symmetry of Correlation)

  • 정현욱;민소연;배명진
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 추계학술발표대회논문집 제23권 2호
    • /
    • pp.119-122
    • /
    • 2004
  • G.723.1은 저 전송률 환경에서 고 음질을 제공하여 주고 있으나 CELP형 부호화기가 갖는 합성에 의한 분석(Analysis by Synthesis)방식의 구조로 인해 많은 처리 시간과 계산량을 요구하게 된다. 본 논문에서는 G.723.1에 대해 NAMDF함수를 적용하여 델타 피치 검색과정의 계산량을 줄여 부호화기의 전체 계산량을 감소시키는 방법을 제안하였다. 기존의 피치 검출 알고리즘에서 피치 검출을 위해 사용하고 있는 자기상관함수는 곱셈 연산에서 발생하는 bit의 dynamic range가 커서 나눗셈 연산에서도 과도한 연산량을 필요로 한다. 따라서, 이러한 계산량의 감소를 위해 기존의 자기상관함수 대신 계산량을 감소하기 위하여 NAMDF 방법을 적용하였고 추가된 skipping 기법을 사용하였다. 계산량 감소율 측면에서는 약 $64\%$의 감소율을 보였고 기존의 방법과 제안한 방법간의 피치 pitch contour은 원음성의 피치 contour와 유사하였고, 음질 평가에서도 기존의 G.723.1 부호화기 합성음과 유사한 길과를 얻을 수 있었다.

  • PDF