• 제목/요약/키워드: 선형 예측 부호화

검색결과 52건 처리시간 0.028초

간략화된 형상학적 다항식 변환과 형상학적 보간을 이용한 배설형 예측 방법 (Non-linear Predictive Method using Simplified Morphological Polynomial Transform and Morphological Interpolation)

  • 김수현;한헌수;홍민철;차형태
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2002년도 정기총회 및 학술대회
    • /
    • pp.81-84
    • /
    • 2002
  • 본 논문에서는 간략화 된 형상학적 다항식 변환(Morphological Polynomial Transform)과 형상학적 보간법(Morphological Interpolation)을 이용하는 비선형 예측 방법을 제안한다. 형상학적 다항식 변환은 형상학적 연산을 통해 데이터를 구조함수들의 계수들로 표현하는 변환이며, 형상학적 보간법은 형상학적 다항식 변환에 의한 계수들을 이용하여 보간하는 방법이다. 형상학적 다항식 변환을 간략화 하여 정수 연산만으로 적용할 수 있도록 개선하였으며, 보다 영상에 적합한 형상학적 보간법에 기반 한 예측 방법을 사용한다. 제안하는 예측 방법과 허프만 부호화를 사용하여 적은 비트로 영상을 손실 없이 저장할 수 있음을 실험으로 검증한다.

  • PDF

전이구간 부호화를 이용한 2.4 kbit/s 다중모드 음성 부호화 방법 (Method of a Multi-mode Low Rate Speech Coder Using a Transient Coding at the Rate of 2.4 kbit/s)

  • 안영욱;김종학;이인성;권오주;배문관
    • 대한전자공학회논문지SP
    • /
    • 제42권2호
    • /
    • pp.131-142
    • /
    • 2005
  • 현재 개발된 4 kbit/s이하의 저 전송율 음성부호화 시스템은 STC(Sinusoidal Transform Coding)나 MBE (Multi-band Excitation Coding)에 바탕을 두고 있다. 이러한 저 전송율 부호화기들은 대표적인 전이구간 신호인 유성음의 시작점과 끝점에서의 혼합신호(onset signal, offset signal), 비주기적인 신호(non-period signal) 등은 정확히 표현하지 못하기 때문에 자연스런 음질을 만들어 내지 못한다. 본 논문에서는 유성음에는 하모닉 모델, 무성음에서는 스토케스틱 모델, 전이구간에는 하모닉 기반의 비주기적인 펄스의 위치를 추적하는 방식을 사용하여 효과적으로 전이구간을 모델링 하는 방법과 2.4 kbit/s 다중모드 부호화방법을 제안한다. 제안한 방법은 원본신호에서 선형예측 부호화 방법으로 추출된 잔여신호를 신호의 성격에 따라 모델을 달리하는 방법이며, 자각의 신호의 성격에 따라 좋은 성능을 나타내는 모델을 사용하였다. 또한 효율적인 전이구간 모델링 방법의 도입으로 저 전송율에서 CELP(Code Excitation Linear Predictive) 부호화 방식에 의해 시간축에서 합성되는 여기신호와 선형위상을 이용한 하모닉 부호화 방식에 의해 주파수축에서 합성되는 여기신호를 효율적으로 결합이 가능하다는 것이 제안된 2.4 kbit/s 다중모드 부호화기의 장점이다. 제안된 방법의 2.4kbit/s 다중모드 부호화기는 미국 연방 표준부호화기인 2.4 kbit/s MELP(Mixed Excitation Linear Prediction) 부호화기보다 더 좋은 성능을 나타낸다.

윈도우가 적용된 자기상관에 의한 선형예측부호의 개선 (Improvement of the Linear Predictive Coding with Windowed Autocorrelation)

  • 이창영;이채봉
    • 한국전자통신학회논문지
    • /
    • 제6권2호
    • /
    • pp.186-192
    • /
    • 2011
  • 본 논문은 선형예측부호의 개선을 위한 새로운 과정을 제안한다. 코딩에 따른 오차를 줄이기 위하여, 신호에 윈도우를 적용하는 과정과 선형예측 과정의 순서를 바꾸었다. 이 처방은 윈도우를 적용한 자기상관을 이용하여 선형예측부호를 추출하는 것에 해당한다. 기존의 방법에서는 보다 적은 파라미터에 대해 레빈슨-더빈의 재귀적 계산법을 적용하는 것이 가능한 반면, 본 논문에서 제안된 방법에서는 더 많은 작업 파라미터에 대한 역행렬 계산이 필요하므로, 보다 긴 계산 시간이 요구된다. 하지만, 여러 음성 음소에 대해 테스트한 결과, 제안된 방법에 의하면 기존의 기술에 비해 약 5 % 적은 파워 왜곡이 얻어짐이 밝혀졌다. 따라서 부호화의 신뢰성에 관한 한, 기존의 기술에 비해 본 논문에서 제안된 방법이 더 나은 것으로 사료된다. 40명에 의해 발성된 50 고립단어에 대한 화자종속 음성인식 시험에서도 제안된 방법이 보다 우수한 성능을 보여주었다.

저 전송률 환경에서 선형예측 전처리기를 사용한 HE-AAC의 성능 향상 (Quality Improvement of Low Bitrate HE-AAC using Linear Prediction Pre-processor)

  • 이재성;이건우;박영철;윤대희
    • 한국통신학회논문지
    • /
    • 제34권8C호
    • /
    • pp.822-829
    • /
    • 2009
  • 본 논문은 선형예측 전처리기을 이용하여 저 전송률 환경에 적합한 HE-AAC의 구조를 제안한다. 저 전송률 환경에서는 HE-AAC의 적절하지 못한 비트 할당 알고리즘 때문에 많은 스펙트럴 홀(스펙트럼 홀)들이 발생을 하고 있으며, 그로 인해서 심각한 음질의 열화가 발생하고 있다. 이를 해결하기 위해서 선형예측 전처리기을 사용하여 저 전송률에서 비트가 적절하게 할당되도록 하였다. HE-AAC로 들어오는 입력신호는 선형예측 전처리기에 의해서 LP 계수와 레지듀얼 신호로 나눠지게 되며, AAC 부분은 분리된 레지듀얼 신호를 부호화하게 된다. 제안된 방법의 성능 평가를 위해서 지각적 잡음(Perceptual noise)의 측정을 통한 객관적인 실험과 MUSHRA 테스트를 통한 주관적인 실험을 하였고, 그 결과 저 전송률 환경에서 제안된 방법을 사용함으로써 성능을 향상시킬 수 있음을 확인하였다.

Pulse-Train code 여기 선형 예측 (PT-CELP) 부호화기에 관한 연구 (A Study on the Pulse-Train Code Excited Linear Prediction Coder: PT-CELP)

  • 김흥국
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1995년도 제12회 음성통신 및 신호처리 워크샵 논문집 (SCAS 12권 1호)
    • /
    • pp.246-249
    • /
    • 1995
  • 4.16kbps의 전송률을 갖는 음성 부호화기 구조에 관하여 기술한다. 제안된 음성 부호화기는 개방 회로 피치 검출기와 이로부터 생성된 pulse train을 코드북으로 갖는 CELP 부호화기이다. Pulse-Train codebook은 분석 프레임별로 부호화 및 복호화 양단에서 생성되며 음성의 피치 및 포만트 정보를 내포하고 있다. 구현된 PT-CELP는 random codebook 방식의 CELP에 비해 적은 크기로 codebook을 만들 수 있으며 음성의 특징을 충분히 반영하므로 합성된 음성의 음질을 향상시킬 수 있다.

  • PDF

시간특성을 고려한 음성신호의 발성율 검출에 관한 연구

  • 김익성;서지호;배명진
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 춘계학술발표대회 논문집 제23권 1호
    • /
    • pp.109-111
    • /
    • 2004
  • 발성율은 일정한 시간동안 발성되는 음성신호 내에 몇 개의 음절이 포함되어 있는 지를 나타낸다. 발성율은 화자마다 다르고 각 음소들의 특징에 따라 변화할 수 있다. 발성율의 사전 측정이 이루어 진다면 음성부호화 측면에서도 중용한 정보로 사용될 수 있다. 기존의 음성부호화기는 발성율에 관계없이 고정적인 분석 구간을 정하여 전송률을 결정하고 있다. 따라서, 발성율을 미리 측정한다면, 발성율이 느린 부분과 빠른 부분에 각기 다른 부호화 방법을 적용하여 음질을 향상할 수도 있고 전송률을 가변적으로 적용할 수 도 있게 된다. 정확한 발성율을 측정하기 위해서는 음절의 변화를 추정하여야 한다. 음절의 변화를 추정하기 위한 방법으로 음성신호의 에너지 포락선 측정법과 LSP를 이용한 측정법이 각각 제안된 바 있으나, 본 논문에서는 위 두 가지 방법을 혼합한 방법을 사용하였다. 에너지 변동은 음성신호의 시간영역 처리방법으로 LSP 파라미터는 음성신호의 선형예측 분석에 의해 구해질 수 있다.

  • PDF

HEVC 확장 표준 내 Residual DPCM 을 위한 L1 정규화 기반의 가중 계수 추정 기법 (Estimation of Weight Coefficients of Residual DPCM based on L1 Regularization in HEVC Format Range Extension)

  • 류수경;강제원
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2016년도 하계학술대회
    • /
    • pp.373-374
    • /
    • 2016
  • Residual Differnetial pulse-code Modulation (RDPCM) 기법은 비디오의 압축을 위한 시간 및 공간 예측 후 남은 잔여신호를 인접 화소를 이용하여 추가적인 중복정보를 제거하는 기법을 의미한다. 본 논문에서는 우선 잔차 신호의 예측을 위하여 인접 화소 사이 선형 가중 합으로 예측 모델을 세우고, 각 가중치를 $L_1$ 정규화를 포함하는 비용함수를 통해 추정함으로써 보다 효율적인 부호화 성능을 제공하는 알고리즘을 제안한다.

  • PDF

Zinc 함수 여기신호를 이용한 분석-합성 구조의 초 저속 음성 부호화기 (A Very Low-Bit-Rate Analysis-by-Synthesis Speech Coder Using Zinc Function Excitation)

  • 서상원;김종학;이창환;정규혁;이인성
    • 한국음향학회지
    • /
    • 제25권6호
    • /
    • pp.282-290
    • /
    • 2006
  • 본 논문에서는 1.2 kbps 의 전송률을 가지는 초 저속 음성 부호화기를 위한 방법과 구조를 제안한다. ZFE-CELP (Zinc Function Excitation-Code Excited Linear Prediction) 음성 부호화기는 선형예측 분석 후, 추출된 잔여 신호가 유성음일 경우 Zinc Function을 이용하여 부호화하고, 무성음일 경우에는 CELP 구조를 이용하여 부호화한다. 또한 Super-frame (40ms) 의 영향으로 발생하는 하모닉의 불연속 문제를 해결하기 위해 오버 샘플링을 이용한 선형 위상 합성 기법을 이용하고 Zinc 함수의 정확한 표준파형을 추출하기 위하여 분석-합성 구조를 제안한다. 제안된 초 저속음성 부호화기의 성능을 2.4 kbps의 MELP (Multi Pulse Linear Prediction) 부호화기 및 1.9kbps의 ZFE-PWI (Zinc Function Excitation-Prototype Waveform Interpolation) 음성 부호화기와 비교하였다 제안된 부호화 방법은 19kbps ZFE-PWI 부호화기와 유사한 성능을 보이는 것을 확인하였다.

H.264/AVC를 위한 초기 Quantization Parameter 결정 알고리즘 (The First Quantization Parameter Decision Algorithm for the H.264/AVC Encoder)

  • 권순영;이상헌;이동하
    • 한국정보과학회논문지:정보통신
    • /
    • 제35권3호
    • /
    • pp.235-242
    • /
    • 2008
  • 동영상 압축 표준인 H.264/AVC는 압축 효율을 높이기 위해서 기존의 표준과는 다른 적응적인 비트율 제어(Adaptive Rate Control) 기법을 제공한다. 하지만 동영상의 첫 프레임에 대한 QP를 정확히 예측하지 못하는 문제점을 보인다. 부호화 입력 변수 중 일부 값을 이용해서 $3{\sim}4$개의 특정 상수 값 중에 하나를 선택하여 초기 QP 값을 정하게 된다. 이렇게 구해진 초기 QP값은 실제 부호화 되었을 때의 비트양을 고려하지 않은 방법이라서 특정 영상에서는 비트율 제어에 실패하거나 화질이 급격하게 변하는 모습들을 보여준다. 본 논문에서는 H.264/AVC 부호화기에서 첫 번째 프레임의 QP값을 결정하는 새로운 알고리즘을 제안한다. 제안된 알고리즘은 기존의 방법에 따라 초기 QP를 결정해서 부호화를 수행한 후 생성되는 비트양에 따라서 새로운 초기 QP 값을 구한다. 생성되는 비트양과 새로운 초기 QP 값 사이에는 선형 관계(A linear QP prediction model)가 성립하므로 최적에 가까운 초기 QP값을 예측 할 수 있다. 이렇게 구해진 새로운 초기 QP값을 이용해서 첫 프레임을 재부호화 한다. 실험결과 기존 알고리즘으로는 비트율 제어가 불가능 했던 영상을 효율적으로 비트율 제어를 하였고 기존의 방법보다 평균 PSNR의 향상을 확인하였다. 화면 사이의 화질 변화 폭을 줄임으로써 주관적인 화질 또한 향상하였다.

동영상 압축 방식을 위한 최소 자승 기반 적응 움직임 벡터 예측 알고리즘 (Least Squares Based Adaptive Motion Vector Prediction Algorithm for Video Coding)

  • 김지희;정종우;홍민철
    • 한국통신학회논문지
    • /
    • 제29권9C호
    • /
    • pp.1330-1336
    • /
    • 2004
  • 본 논문에서는 동영상 부호화 기의 성능을 개선하기 위한 최소 자송 기반 적응 움직임 벡터 예측 알고리즘을 제안 하고자 한다. 적응 움직임 벡터 예측 방식은 동영상 움직임 벡터의 국부 통계적인 특성의 돌연한 변화로 특정지어 진다는 것을 바탕으로 최소 자승(Least Squared) 기반의 선형 움직임의 계수들을 통계적 특성에 따라 최적화하는 방식이지만 상기 방식은 애우 높은 계산 량을 요구하는 단정을 지니고 있다. 본 논문에서는 공간적인 움직임 변화 방향성을 가지는 최소 자승 최적화를 기반으로 움직임 예측기의 계수를 적응적으로 조절하여 움직임 예측 오류뿐만 아니라 계산 량도 감소시키는 방식에 대해 기술한다. 실험을 통해 제안된 방식의 성능을 확인할 수 있었다.