• 제목/요약/키워드: Transform coder

검색결과 72건 처리시간 0.022초

웨이브렛 변환을 적용한 광대역 음성부호화 알고리즘 (Wideband Speech Coding Algorithm with Application of Wavelet Transform)

  • 이승원;배건성
    • 한국음향학회지
    • /
    • 제21권5호
    • /
    • pp.462-470
    • /
    • 2002
  • 협대역 음성부호화기에 비해 훨씬 우수한 합성음의 음질을 보이는 광대역 음성부호화기는 상대적으로 높은 전송률을 가져서 협대역 음성부호화기에 비해 사용범위가 제한되었다. 광대역 음성부호화기에서 이러한 전송 속도를 협대역 음성부호화기와 비슷한 수준으로 낮출 수 있다면, 보다 나은 음질의 음성 통신 시스템을 구현할 수 있을 것이다. 본 논문에서는 16㎑로 샘플링 된 입력 음성신호를 동일한 대역폭을 갖는 두부대역으로 분리하여, 저대역 부호화에는 유럽의 이동통신 표준안인 GSM-EFR 협대역 음성부호화기를 적용하고, 고대역 부호화에는 웨이브렛 변환을 이용하여 고안한 부대역 음성부화기를 적용한 광대역 음성부화기를 제안하였다. 제안한 음성부호화기는 저대역 신호와 고대역 신호의 부호화에 각각 12.2 kbps, 6.7 kbps의 전송 속도를 할당하여 18.9 kbps의 전송속도를 가지며, 합성음의 음질은 56 kbps의 전송속도를 갖는 G.722음성부호화기의 합성음과 비슷한 음질을 유지하였다.

Multi Mode Harmonic Transform Coding for Speech and Music

  • Kim, Jonghark;Shin, Jae-Hyun;Lee, Insung
    • The Journal of the Acoustical Society of Korea
    • /
    • 제22권3E호
    • /
    • pp.101-109
    • /
    • 2003
  • A multi-mode harmonic transform coding (MMHTC) for speech and music signals is proposed. Its structure is organized as a linear prediction model with an input of harmonic and transform-based excitation. The proposed coder also utilizes harmonic prediction and an improved quantizer of excitation signal. To efficiently quantize the excitation of music signals, the modulated lapped transform(MLT) is introduced. In other words, the coder combines both the time domain (linear prediction) and the frequency domain technique to achieve the best perceptual quality. The proposed coder showed better speech quality than that of the 8 kbps QCELP coder at a bit-rate of 4 kbps.

다차원 DCT를 이용한 비디오 부호화기 설계 (Design of video encoder using Multi-dimensional DCT)

  • 전수열;최우진;오승준;정세윤;최진수;문경애;홍진우;안창범
    • 방송공학회논문지
    • /
    • 제13권5호
    • /
    • pp.732-743
    • /
    • 2008
  • 본 논문은 H.264/AVC가 이전의 비디오 코덱에서 사용하는 8$\times$8 변환이 아닌 4$\times$4 변환을 도입하면서 인트라 및 인터 예측 성능을 높인 반면 공간적 압축도가 낮은 점을 개선하기 위한 다차원 변환 방법을 제안한다. 다차원 변환 방법은 H.264/AVC가 갖는 시간적 예측의 장점과 공간적 압축도를 동시에 충족시킬 수 있는 방법이다. 먼저 실험을 통해 다차원 DCT가 H.264/AVC의 2차원 정수 변환(Integer Transform)보다 에너지 압축율이 높다는 것을 보였다. 다차원 DCT를 위한 정수형 변환과 양자화기를 설계하였으며, H.264에서 사용하는 컨텍스트 기반 적응 가변 길이 코딩 (CAVLC)을 엔트로피 코더로 사용하여 다차원 부호화기를 설계하였다. 다차원 부호화기에는 다차원 변환에 따른 블록 주사 방식과 파라미터 갱신, 다차원 변환 모드 선택 등의 도구가 적용되었다. 실험 결과, 다차원 부호화기는 낮은 비트율에서 H.264/AVC와 유사한 압축 효율을 보였지만, 엔트로피와 0이 아닌 계수를 계산하여 비교한 통계적 성능 비교에서는 높은 성능을 보였다. 따라서, 다차원 부호화에 대한 추가적인 연구가 진행된다면 기존의 H.264/AVC의 성능을 보완할 수 있는 부호화 알고리즘으로서 발전할 수 있을 것이다.

HEVC 화면내 부호기를 위한 효율적인 변환 계수 부호화 방법 (Efficient Transform Coefficient Coding for the HEVC Intra Frame Coder)

  • 최정아;호요성
    • 스마트미디어저널
    • /
    • 제1권2호
    • /
    • pp.6-11
    • /
    • 2012
  • HEVC 표준에서 변환 계수 부호화 과정은 비트스트림에 포함되는 정보를 직접 부호화하는 핵심 부분으로 변환 계수 주사와 엔트로피 부호화를 포함한다. 최근, JCT-VC(Joint Collaborative Team on Video Coding)는 HEVC 위원회 초안(Committee Draft)을 완성했다. 본 논문에서는 HEVC 표준의 변환 계수 부호화 기술을 설명하고, 화면내 부호기에서의 변환 계수 발생확률을 고려한 효율적인 변환 계수 부호화 기술을 제안한다. 제안하는 방법은 기존 HEVC 변환 계수 부호화 기술에 비해 평균 0.74%의 BD-Rate를 절약한다.

  • PDF

분석/합성 구조의 저 전송률 변환여기 광대역 음성/오디오 부호화기 설계 (Design of Low Bits Rate Transform Excitation Wide Band Speech and Audio Coder of Analysis-by-Synthesis Structure)

  • 장성훈;홍기봉;이인성
    • 한국음향학회지
    • /
    • 제31권7호
    • /
    • pp.472-479
    • /
    • 2012
  • 본 논문은 음성과 오디오의 혼합 콘텐츠를 대상으로 하는 9.2 kbps 저 전송률 변환여기 부호화기 설계를 목표로 한다. 저 전송률 환경을 위하여 주파수 영역 신호의 중요도에 따른 Band-Selection 방법과 Gain-Shape 양자화를 이용한 Analysis by Synthesis(AbS) 구조를 이용한다. AbS 구조를 이용하는 과정에서 발생하게 되는 연산량을 감소시키기 위하여 밴드별 IDFT를 취하고 합성하는 방법을 이용한다. 전송 되지 않는 구간에 대하여 Comfort Noise를 삽입함으로써 음질 저하 없이 설계한다. 기존의 TCX모드와 비교하여 저 전송률에서 성능의 저하 없는 부호화기를 제안한다.

1차원 SPIHT를 이용한 가변 비트율 음성 부호기의 설계 (Design of a Variable Bit Rate Speech Coder Based on One-dimensional SPIHT)

  • 나훈;정대권
    • 한국음향학회지
    • /
    • 제22권6호
    • /
    • pp.443-451
    • /
    • 2003
  • 코드북 기반의 CELP 부호기는 코드북에 미리 할당된 부호화 비트율에 따라서 여기 신호를 모델링한 후 코드북을 이용하여 음성신호를 합성한다. 따라서 임의의 다양한 비트율을 하나의 부호기에서 지원하지 못하는 단점이 있다. 본 논문에서 제안하는 가변 비트율 부호기는 웨이블렛 변환 (wavelet transform과 1차원 SPIHr (one dimensional SPIHT)를 이용하여 현재 프레임에 할당되는 비트수에 따라서 여기신호를 부호화한다. 또한 CELP 부호기의 경우처럼 특정한 몇 가지 형태로 여기신호(또는 코드북)를 모델링할 필요가 없고, 정확한 피치정보가 없어도 여기신호를 사용자의 요구에 따라 다양한 비트율로 부호화할 수 있다. 그 결과 코드북이 존재하지 않기 때문에 부호기의 복잡도가 낮으며, CELP 기반의 G.729와 G.723.1 부호기와의 음질 비교 결과 동등하거나 나은 결과를 보여준다.

웨이브릿 변환에서 인지적 가중치를 이용한 SPIHT 비디오 부호기 (SPIHT Video Coder Using Perceptual Weight in Wavelet transform)

  • 정용재;강경원;문광석
    • 융합신호처리학회논문지
    • /
    • 제3권1호
    • /
    • pp.15-20
    • /
    • 2002
  • 동영상 부호기에서 화면내 프레임 부호화는 전체 프레임의 화질에 중요한 영향을 미친다. 표준화된 동영상의 부호기는 DCT를 쓰지만, 저 비트율에서의 블록화 현상으로 화질의 열화를 가져올 수 있다. 본 논문에서는 화질의 열화를 감소시키고 인간 시각적인 측면에서의 화질 개선을 위한 비디오 코딩을 제안한다. 제한안 방법에서는 웨이브릿 변환에서 인지적 가중치를 화면내 프레임에 적용하여 SPIHT와 VLC를 이용하여 부호화하였고, 인간 시각 특성을 고려하여 시각적인 노이즈를 제거하여 주관적인 화질을 향상 시켰다.

  • PDF

CS-ACELP와 호환성을 갖는 광대역 음성 부호화기 설계 (Design of Wideband Speech Coder Compatible with CS-ACELP)

  • 김동주;이인성
    • 한국음향학회지
    • /
    • 제19권4호
    • /
    • pp.52-57
    • /
    • 2000
  • 본 논문에서는 CS-ACELP와 호환성을 갖는 광대역 음성 부호화기를 설계하였다. 16㎑로 샘플링된 광대역 음성신호는 QMF 필터와 Decimation에 의하여 두 개의 협대역 음성신호로 나누어진다. 나누어진 두 개의 협대역 음성신호는 CS-ACELP와 ATC(Adaptive Transform Coding) 방법으로 각각 부호화되어 전송된다. 두 대역으로부터 부호화된 정보는 16 Kbps의 전송률을 갖고, 수신단에서는 각 대역을 CS-ACELP와 ATC 방법으로 역 부호화하여 음성신호를 합성한다. 설계된 광대역 음성부호화기의 성능을 평가하기 위하여 ITU-T의 표준안인 G.722를 포함하여 MOS 시험을 하였다.

  • PDF

임베디드 마이크로 프로세서 기반의 웨이블릿 영상 부호화기 (The wavelet image coder based on the embedded microprocessor)

  • 박성욱;김영봉;박종욱
    • 전기학회논문지P
    • /
    • 제51권4호
    • /
    • pp.198-205
    • /
    • 2002
  • In this paper, we proposed a wavelet image coder based on the portable embedded microprocessor. The proposed coder stores the bit level information of the wavelet coefficient in the 2D significance array. Using this information, the coder make the significance check for coefficient and bit level scanning at the same pass. The proposed method has the advantage that we can reduce the scan iteratively and the memory usage for the coding process. Experimental results show that the proposed method outperforms popular image coders such as JPEG, EZW and SPIHT in based on the portable embedded system environment.

개량형 다중대역 여기 (IMBE: Improved Multi-band Excitation) 음성 부호기의 피치 예측 개선 (An Efficient Pitch Estimation for IMBE (Improved Multi-band Excitation) Speech Coder)

  • 나훈;정대권
    • 한국음향학회지
    • /
    • 제20권3호
    • /
    • pp.34-41
    • /
    • 2001
  • 기존의 IMBE (개량형 다중대역 여기 : Improved Multi-band Excitation) 음성 부호기의 초기 피치 추정 과정은 전체 부호기 연산 시간의 대부분을 차지하며 또한 미래의 음성 프레임들이 초기 피치 추정시 사용되므로 시간 지연이 유발되어 실시간 구현에 장애 요소로 작용되었다. 또한 무성음에 해당되는 프레임에 대해서도 유성음과 동일한 피치 추정을 수행하므로 알고리즘의 효율성을 떨어뜨린다 본 논문에서는 초기 피치 추정 전에 다이애딕 웨이브렛 변환 (Dyadic Wavelet Transform)을 이용하여 이를 바탕으로 유/무성음을 판별한 후 유성음으로 결정된 프레임에 대해서만 피치 추정을 행하고 무성음으로 결정된 프레임은 랜덤 잡음을 주어서 부호화시의 처리 시간을 단축하였다. 또한, 초기 피치 추정 전에 판별된 유/무성음을 판별하여 유성음과 무성음에 각기 다른 초기 피치 추정 알고리즘을 사용하고 미래의 두 프레임을 사용하지 않음으로써 송, 수신단에 유발되는 시간 지연을 제거하였다. 그 결과 초기 피치 추정 과정의 상대적인 복잡도가 23% 감소되었고 프레임당 처리 시간이 1/10∼ 1/11로 감소되었고 기존의 부호기와 거의 같은 음질을 얻을 수 있었다.

  • PDF