• 제목/요약/키워드: Speech coding

검색결과 303건 처리시간 0.028초

백터양자화가의 구조적 코더 찾기 (STRUCTURED CODEWORD SEARCH FOR VECTOR QUANTIZATION)

  • 우홍체
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2000년도 추계학술대회 학술발표 논문집
    • /
    • pp.467-470
    • /
    • 2000
  • Vector quantization (VQ) is widely used in many high-quality and high-rate data compression applications such as speech coding, audio coding, image coding and video coding. When the size of a VQ codebook is large, the computational complexity for the full codeword search method is a significant problem for many applications. A number of complexity reduction algorithms have been proposed and investigated using such properties of the codebook as the triangle inequality. This paper proposes a new structured VQ search algorithm that is based on a multi-stage structure for searching for the best codeword. Even using only two stages, a significant complexity reduction can be obtained without any loss of quality.

  • PDF

윈도우의 영향이 제거된 에너지 파라미터에 관한 연구 (A Study of Energy Parameter without Windowing Influence in Speech Signal)

  • 조태수;신동성;배명진
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 하계종합학술대회 논문집(4)
    • /
    • pp.277-280
    • /
    • 2001
  • The preprocessing is very important course in speech signal processing. It influence the compression-rate in speech coding and the recognition-rate in speech recognition etc. In this paper, we propose that minimizing window-influence method with pitch period and start points. The proposed method is available for voiced detection and word labeling.

  • PDF

Simulink를 이용한 음원모델 시뮬레이터 구현 (Implementation of Voice Source Simulator Using Simulink)

  • 조철우;김재희
    • 말소리와 음성과학
    • /
    • 제3권2호
    • /
    • pp.89-96
    • /
    • 2011
  • In this paper, details of the design and implementation of a voice source simulator using Simulink and Matlab are discussed. This simulator is an implementation by model-based design concept. Voice sources can be analyzed and manipulated through various factors by choosing options from GUI input and selecting pre-defined blocks or user created ones. This kind of simulation tool can simplify the procedure of analyzing speech signals for various purposes such as voice quality analysis, pathological voice analysis, and speech coding. Also, basic analysis functions are supported to compare the original signal and the manipulated ones.

  • PDF

1차 차분신호의 영비트 제거에 의한 음성신호의 패킷부호화에 관한 연구 (A Study on the Speech Packetized Coding by Zero Bit Reduction of 1'st Order Differences)

  • 신동진;임운천;배명진;안수길
    • 한국음향학회지
    • /
    • 제8권4호
    • /
    • pp.74-82
    • /
    • 1989
  • 본 논문에서는 음성신호의 다중채널 실시간 부호화를 위하여 1차 차분신호의 불필요한 영비트를 제거하고 5개 단위로 음성 패킷을 구성해 주는 패킷 부호화에 관하여 그 실현방법 및 성능을 연구하였다. 제안된 패킷부호화 방법은 알고리즘이 매우 간단하며 수치연산보다는 주로 데이터의 조작에 의해 이루어지므로 많은 정보량의 압축은 기대하기 어려우나, 10가지의 음성 안내문에 적용한 결과 약 $40\%$정도의 정보 압축이 가능하였다. 따라서 제안된 방법을 사용하면 매우 간단하게 음성신호 저장시 메모리를 절약해줄 수 있으며 또한 전송시 전송 효율을 높여줄 수 있고, 특히 알고리즘이 간단하므로 부호화시 채널을 다중좌하기에 유리한 장점이 있다.

  • PDF

8kbps에 있어서 PCFBD-MPC에 관한 연구 (A Study on PCFBD-MPC in 8kbps)

  • 이시우
    • 인터넷정보학회논문지
    • /
    • 제18권5호
    • /
    • pp.17-22
    • /
    • 2017
  • 유성음원과 무성음원을 사용하는 멀티펄스 음성부호화 방식에 있어서, 대표구간의 멀티펄스 음원을 사용하는 경우에 유성음의 합성음성파형에서 일그러짐이 나타난다. 이러한 원인은 대표구간의 멀티펄스를 피치구간마다 복원하는 과정에서 재생 음성파형이 정규화 되는 것이 원인으로 작용한다. 본 논문에서는 합성 음성파형의 일그러짐을 제어하기 위하여 V/UV/S(Voiced / Unvoiced / Silence)의 스위칭을 사용하고, 피치구간 마다 멀티펄스의 위치를 보정하며, 무성자음(Unvoiced)의 근사합성에 특정주파수를 이용하는 PCFBD-MPC(Position Compensation Frequency Band Division-Multi Pulse Coding)를 제안하였다. 또한 8kbps의 부호화 조건에서 PCFBD-MPC 시스템을 구현하고, PCFBD-MPC의 SNRseg를 평가하였다. 그 결과 PCFBD-MPC의 남자음성에서 13.8dB, 여자음성에서 13.4dB 임을 확인할 수 있었다. 향후 멀티펄스 음원의 진폭과 위치를 동시에 보정하는 8kbps 음성부호화 방식의 음질을 평가하는 연구를 수행하고자 한다. 향후, 멀티펄스 음원의 진폭과 위치를 동시에 보정하는 8kbps 음성부호화 방식의 음질을 평가하는 연구를 하고자 한다. 이러한 방법들은 셀룰러폰이나 스마트폰과 같이 낮은 비트율의 음원을 사용하여 음성신호를 부호화하는 방식에 활용할 수 있을 것으로 기대된다.

비균등 표본화 기법과 음성 부호화로의 응용 (A Nonuniform Sampling Technique and Its Application to Speech Coding)

  • 임병관
    • 한국지능시스템학회논문지
    • /
    • 제24권1호
    • /
    • pp.28-32
    • /
    • 2014
  • 국소적으로 선형적인 특성을 보이는 음성신호와 같은 신호의 데이터율을 감소시키기 위하여 변곡점 검출에 기반한 비균등 표본화 방법을 제안한다. 국소적인 최대값과 최소값 검출에 기반하여 비균등 표본화를 수행하는 기존의 방법에 비하여 변곡점에 기반한 비균등 표본화는 신호의 기하학적인 특징을 충실히 활용한다. 결과로서, 변곡점 검출에 기반하여 비균등 표본화된 데이터를 보간법으로 처리하면 기존의 방법보다 원시신호를 정밀하게 복원할 수 있다. 컴퓨터 모의실험을 통하여 기존의 최대값/최소값 검출 방법에 비교해서 제안된 변곡점 검출 기반의 비균등 표본화가 약 9~23dB의 신호대 잡음비 개선효과가 있음을 확인하였다. 제안된 변곡점 검출 기반의 비균등 부호화의 유용성을 보이기 위하여 음성신호의 부호화에 적용하였으며, Continuously variable slope delta modulation (CVSD)방법과 성능을 비교하였다. 변곡점 표본은 1로 설정된 플래그와 함께 이진수로 전송되며, 비 변곡점은 플래그만 0으로 설정된다. 음성신호에 따라 약 0.3 ~ 9dB의 신호대 잡음비 개선효과가 있으며, 주관적인 성능지표인 Mean Opinion Score (MOS)는 약 0.5 ~ 1.3 개선되었다.

G.729.1 코더에서 프레임 간의 상호상관 관계를 이용한 개선된 스펙트럼 포락 코딩 방법 (Enhanced Spectral Envelope Coding Scheme Using Inter-frame Correlation for G.729.1)

  • 조근석;성종모;한민수;김영일;정상배
    • 말소리와 음성과학
    • /
    • 제1권4호
    • /
    • pp.97-103
    • /
    • 2009
  • This paper describes a new algorithm for encoding spectral envelope in the time domain alias cancellation (TDAC) part of G.729.1. The spectral envelope and modified discrete cosine transform (MDCT) coefficients of the weighted code-excited linear predictive (CELP) coding error in lower-band and the higher-band input signal are encoded in the TDAC part. In order to reduce allocation bits for spectral envelope coding, a new algorithm using sub-band correlation between adjacent frames is proposed. In addition, to improve the quality of decoded signals, two bit allocation strategies using reduced bits from the proposed algorithm are proposed. The performance of the proposed algorithm is evaluated in terms of objective quality and bit reduction rates. Experimental results show that the proposed algorithm increases the quality of sounds significantly.

  • PDF

시간/주파수 전이신호를 위한 향상된 2.4 kbps 하모닉 스토케스틱 여기 음성 부호화 방법 (Enhaced 2.4 kbps Harmonic Stochastic Excitation Coding for Time/Frequency Transitional Speech)

  • 김종학;이인성
    • 한국음향학회지
    • /
    • 제19권7호
    • /
    • pp.53-58
    • /
    • 2000
  • 본 논문은 주파수 전이신호와 시간 전이 신호에 대해서 고조파 잡음 여기 방법과 시간 분리 여기 방법을 적용한 2.4 kbps 음성부호화 방법을 제안한다. 혼합 여기 부호화 방법은 주기 신호와 비 주기 신호를 효과적으로 표현하기 위해 하모닉 잡음 모델을 사용한다. 혼합신호에 대한 잡음 성분은 캡스트럴 분석 방법을 사용함으로써 추출되고, AR (Autoregressive Model) 모델에 의해 표현된다. 시간 전이구간 신호에서의 모호한 음성을 효과적으로 제거하기 위한 또 다른 방법이 제안된다. 제안된 시간 분리 방법은 시간 에너지 변화정도를 관찰함으로써 전이 시점을 감지하고 다른 시간 길이를 가지는 두 블록으로 분리하여 분석한다. 시간 분리 방법은 분석을 위한 비대칭 윈도우와 합성에서의 위상 합성 방법을 포함한다. 제안된 방법을 사용한 2.4 kbps 음성부호화 방법은 주관적 음질 평가에서 전이구간에서의 지각적 음질의 향상을 보여주었으며, 원본 음성 스펙트럼과의 고조파 비 매칭에 의한 윙윙거리는 기계적인 잡음을 감소시킨다.

  • PDF

라플라시안 피라미드 프로세싱과 백터 양자화 방법을 이용한 영상 데이타 압축 (Image Data Compression Using Laplacian Pyramid Processing and Vector Quantization)

  • 박광훈;차일환;윤대희
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1987년도 전기.전자공학 학술대회 논문집(II)
    • /
    • pp.1347-1351
    • /
    • 1987
  • This thesis aims at studying laplacian pyramid vector quantization which keeps a simple compression algorithm and stability against various kinds of image data. To this end, images are devied into two groups according to their statistical characteristics. At 0.860 bits/pixel and 0.360 bits/pixel respectively, laplacian pyramid vector quantization is compared to the existing spatial domain vector quantization and transform coding under the same condition in both objective and subjective value. The laplacian pyramid vector quantization is much more stable against the statistical characteristics of images than the existing vector quantization and transform coding.

  • PDF

A Fast Harmonic Estimation Method for Low Bit Rate Harmonic Speech Coders

  • Park, Yong-Soo;Youn, Dae-Hee;Kang, Tae-lk
    • The Journal of the Acoustical Society of Korea
    • /
    • 제20권4E호
    • /
    • pp.24-30
    • /
    • 2001
  • This paper describes a fast harmonic estimation, referred to as Delta Adjustment (DA), using a low resolution pitch. The presented DA method is based on modification of the Generalized Dual Excitation (GDE) technique[1] which was proposed to improve speech enhancement performance. We introduce the GDE technique and modify it to be suitable for low bit rate harmonic coding that uses only an integer pitch estimate. Unlike the GDE, the DA matches a frequency-warped version of the original spectrum that conforms to a fixed pitch at all harmonic bands. In addition, complexity and performance of the presented method are described in comparison with those of the conventional Fractional Pitch (FP) based harmonic estimation. Experimental results showed that the DA algorithm significantly reduces the complexity of the FP method while maintaining the performance.

  • PDF