• 제목/요약/키워드: speech codec

검색결과 127건 처리시간 0.021초

TMS320VC5510 DSP를 이용한 AMR 음성부호화기의 실시간 구현 (Real-Time Implementation of AMR Speech Codec Using TMS320VC5510 DSP)

  • 김준;배건성
    • 대한음성학회지:말소리
    • /
    • 제65호
    • /
    • pp.143-152
    • /
    • 2008
  • This paper focuses on the real time implementation of an adaptive multi-rate (AMR) speech codec, that is a standard speech codec of IMT-2000, using the TMS320VC5510. The series of TMS320VC55x is a 16-bit fixed-point digital signal processor (DSP) having low power consumption for the use of mobile communications by Texas Instruments (TI) corporation. After we analyze the AMR algorithm and source code as well as the structure and I/O of 7MS320VC55x, we carry out optimizing the programs for real time implementation. The implemented AMR speech codec uses 55.2 kbyte for the program memory and 98.3 kbyte for the data memory, and it requires 709,878 clocks, i.e. about 3.5 ms, for processing a frame of 20 ms speech signal.

  • PDF

고정소수점 DSP(ADSP-2181)을 이용한 실시간 G.723.1 음성부호화기 개발에 관한 연구 (A Study on the Development of the Real-Time G.723.1 Speech Codec Using a Fixed-Point DSP(ADSP-2181))

  • 박정재;정익주
    • 음성과학
    • /
    • 제3권
    • /
    • pp.177-186
    • /
    • 1998
  • This paper describes the procedure of implementing a real-time speech codec, G.723.1 which was developed by DSP Group and standardized by ITU-T, using fixed-point DSP, ADSP-2181. This codec has two bit rates associated with it, 5.3 and 6.3 kbit/s. We implemented only one bit rate, 6.3 kbit/s, of the two with fixed-point 32-bit precision. According to the result of the experiment, the amount of computational burden is about 55 MIPS and its quality is similar to the result of the PC simulation with floating-point arithmetic. In this paper, we proposed a method to use a fixed-point DSP and a procedure for developing a real-time speech codec using DSPs and finally developed a G.723.l speech codec for ADSP-2181.

  • PDF

대역폭 계층 구조의 광대역 음성 부호차기 개발 (Bandwidth Scalable Wideband Speech Codec)

  • 이우석;손창용;이영범;박호종
    • 한국음향학회지
    • /
    • 제23권6호
    • /
    • pp.481-487
    • /
    • 2004
  • 본 논문에서는 대역폭 계층 구조의 광대역 음성 부호화기 구조와 이를 위한 상위 대역 부호화기를 제안한다. 상위 대역 부호화기는 상위 대역 신호를 다수의 주파수 밴드로 분할하고, 각 밴드 신호를 DCT 변환하여 양자화한다. DCT 계수는 크기와 부호로 분리하여 독립적으로 처리하며, 각각의 특성에 적합한 양자화 방법을 개발하여 성능을 향상시킨다. 또한, 하위 대역의 부호화된 이득 파라미터를 상위 대역의 양자화에 이용함으로써 부호화 성능을 향상시키는 방법을 제안한다. G.729E로 하위 대역을 부호화하고 제안한 부호화기로 상위 대역을 처리하는 대역폭 계층 구조의 광대역 음성 부호화기를 개발하였고, 주관적 음질을 측정하여 24kbps G.722.1보다 우수한 음질을 가지는 것을 확인하였다.

대역폭 계층 구조의 광대역 음성 부호화기를 위한 상위 대역 부호화기 연구 (High-Band Codec for Bandwidth Scalable Wideband Speech Codec)

  • 김영보;정병학;손창용;성호상;박호종
    • 한국음향학회지
    • /
    • 제24권7호
    • /
    • pp.395-401
    • /
    • 2005
  • 본 논문에서는 대역폭 계층 구조의 광대역 음성 부호화기를 위한 8kbps 상위 대역 부호화기를 제안한다. 광대역 입력 음성 신호는 하위 대역 신호와 상위 대역 신호로 분리되고, 하위 대역 신호는 표준 협대역 음성 부호화기로 처리하고, 상위 대역 신호는 제안하는 부호화기로 처리하는 구조를 가진다. 제안한 상위 대역 부호화기는 입력 신호를 부프레임 단위로 MLT 변환하고 MLT 계수를 크기와 부호로 분리하여 각각의 특성에 적합하도록 양자화 한다. MLT 계수 크기는 다수의 시간과 주파수 성분을 함께 가지는 밴드로 분할하고, 각 밴드 신호는 2차원 DCT 변환하여 양자화하며, 하위 대역의 에너지 정보를 이용하여 양자화 성능을 향상시킨다. MLT 계수 부호는 각각의 중요도를 판정하여 일부 부호만 선택적으로 양자화 하는 방법을 사용한다. 제안한 상위 대역 부호화기를 포함하는 19.8kbps 광대역 부호화기의 객관적 성능과 주관적 성능을 측정하였으며, 32kbps G.722.1보다 우수한 성능을 가지는 것을 확인하였다.

무선랜 환경에서 AMR 음성부호화기를 적용한 VoIP 전송 실험 (Experiment of VoIP Transmission with AMR Speech Codec in Wireless LAN)

  • 신혜정;배건성
    • 음성과학
    • /
    • 제11권4호
    • /
    • pp.67-73
    • /
    • 2004
  • Packet loss, jitter, and delay in the Internet are caused mainly by the shortage of network bandwidth. It is due to queuing and routing process in the intermediate nodes of the packet network. In the Internet whose bandwidth is changing very rapidly in time depending on the number of users and data traffic, controlling the peak transmission bit-rate of a VoIP. system depending on the channel condition could be very helpful for making use of the available network bandwidth. Adapting packet size to the channel condition can reduce packet loss to improve the speech quality. It has been shown in [1] that a VoIP system with an AMR speech codec provides better speech quality than VoIP systems with fixed rate speech codecs. With the adaptive codec mode assignment. algorithm proposed in [1], in this paper, we performed the voice transmission experiments using the wireless LAN through the real Internet environment. Experimental results are analyzed and discussed with our findings.

  • PDF

An Embedded ACELP Speech Coding Based on the AMR-WB Codec

  • Byun, Kyung-Jin;Eo, Ik-Soo;Jeong, Hee-Bum;Hahn, Min-Soo
    • ETRI Journal
    • /
    • 제27권2호
    • /
    • pp.231-234
    • /
    • 2005
  • This letter proposes a new embedded speech coding structure based on the Adaptive Multi-Rate Wideband (AMR-WB) standard codec. The proposed coding scheme consists of three different bitrates where the two lower bitrates are embedded into the highest one. The embedded bitstream was achieved by modifying the algebraic codebook search procedure adopted for the AMR-WB codec. The proposed method provides the advantage of scalability due to the embedded bitstream, while it inevitably requires some additional computational complexity for obtaining two different code vectors of the higher bitrate modes. Compared to the AMR-WB codec, the embedded coder shows improved speech qualities for two higher bitrate modes with a slightly increased bitrate caused by the decreased coding efficiency of the algebraic codebook.

  • PDF

16kbps 광대역 음성 압축기 개발 (16kbps Windeband Sideband Speech Codec)

  • 박호종;송재종
    • 한국음향학회지
    • /
    • 제21권1호
    • /
    • pp.5-10
    • /
    • 2002
  • 본 논문에서는 7 kHz 대역폭을 가지는 새로운 16 kbps 광대역 음성 압축기를 제안한다. 제안하는 압축기는 QMF (Quadrature Mirror Filter)를 사용하여 입력 신호를 하위 밴드와 상위 밴드로 분리하고, 하위 밴드는 AMR (Adaptive Multi Rate)음성 압축기를 이용하여 압축하고 상위밴드는 G.722.1 광대역 음성 압축기를 기반으로 새로운 압축기를 개발하여 압축한다. 특히 입력신호의 성질에 따라 상위 밴드와 하위 밴드에 할당되는 비트수를 다르게 함으로써 고정적으로 비트를 할당하는 음성 압축기보다 향상된 압축 성능을 제공하고, 웨이블릿 변환을 이용하여 상위 밴드 신호의 압축 성능을 향상시켰다. 주관적 방법으로 제안된 음성 압축기의 성능을 측정하였으며, 다양한 입력신호에 대하여 제안한 16 kbps음성 압축기가 G.722 48 kbps SB-ADPCH보다 우수한 성능을 가지는 것을 할인하였다.

Performance Comparison on Speech Codecs for Digital Watermarking Applications

  • Mamongkol, Y.;Amornraksa, T.
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 ITC-CSCC -1
    • /
    • pp.466-469
    • /
    • 2002
  • Using intelligent information contained within the speech to identify the specific hidden data in the watermarked multimedia data is considered to be an efficient method to achieve the speech digital watermarking. This paper presents the performance comparison between various types of speech codec in order to determine an appropriate one to be used in digital watermarking applications. In the experiments, the speech signal encoded by four different types of speech codec, namely CELP, GSM, SBC and G.723.1codecs is embedded into a grayscale image, and theirs performance in term of speech recognition are compared. The method for embedding the speech signal into the host data is borrowed from a watermarking method based on the zerotrees of wavelet packet coefficients. To evaluate efficiency of the speech codec used in watermarking applications, the speech signal after being extracted from the attacked watermarked image will be played back to the listeners, and then be justified whether its content is intelligible or not.

  • PDF

계층구조 음성 부호화기를 위한 지연 없는 MDCT 구조 (Delayless MDCT for Scalable Speech Codec)

  • 성호상;박호종
    • 한국음향학회지
    • /
    • 제26권3호
    • /
    • pp.102-108
    • /
    • 2007
  • 고성능 계층구조 음성 부호화기는 매우 낮은 전송율의 1차 계층과 미세 계층구조를 가지는 2차 계층을 요구하고, 이는 각 계층에서 하모닉 부호화기와 MDCT 기반 변환 부호화기를 사용하여 구현할 수 있다. 그러나 이 구조는 하모닉 부호화기와 변환부호화기에서 각각 독립적인 주파수 변환이 필요하고 각 변환에서 발생하는 시간지연이 누적되어 전체 부호화기의 시간지연이 증가하는 문제를 가진다. 본 논문에서는 시간지연이 누적되는 문제를 해결하기 위하여 2차 계층의 MDCT가 1차 계층의 Look-Ahead 영역을 공유하도록 하고 이 때 발생하는 MDCT 동작의 오류를 분석하고 이 성분을 IMDCT출력에서 제거하는 새로운 MDCT동작 구조를 제안한다 제안한 지연 없는 MDCT구조를 위하여 추가로 전송할 정보는 없으며 동등한 부호화 성능을 유지하면서 시간지연을 감소시켜 부호화기 성능을 크게 향상시킨다.

LTJ 적응필터의 실용적 구현과 적응반향제거기에 대한 적용 (A Practical Implementation of the LTJ Adaptive Filter and Its Application to the Adaptive Echo Canceller)

  • 유재하
    • 음성과학
    • /
    • 제11권2호
    • /
    • pp.227-235
    • /
    • 2004
  • In this paper, we proposed a new practical implementation method of the lattice transversal joint (LTJ) adaptive filter using speech codec's information. And it was applied to the adaptive echo cancellation problem to verify the efficiency of the proposed method. Realtime implementation of the LTJ adaptive filter is very difficult due to high computational complexity for the filter coefficients compensation. However, in case of using speech codec, complexity can be reduced since linear predictive coding (LPC) coefficients are updated each frame or sub-frame instead of every sample. Furthermore, LPC coefficients can be acquired from speech decoder and transformed to the reflection coefficients. Therefore, the computational complexity for updates of the reflection coefficients can be reduced. The effectiveness of the proposed LTJ adaptive filter was verified by the experiments about convergence and tracking performance of the adaptive echo canceller.

  • PDF