통합 검색 | Korea Science

예측 VQ-Pyramid VQ를 이용한 광대역 음성용 LSF 양자학기 설계 (A LSF Quantizer for the Wideband Speech Using the Predictive VQ-Pyramid VQ)

이강은;이인성;강상원
- 한국음향학회지
- /
- 제23권4호
- /
- pp.333-339
- /
- 2004
본 논문에서는 벡터 양자화기와 피라미드 벡터 양자화기를 직렬로 결합하여 16차 벡터 소스에 대한 vector quantizer-pyramid vector quantizer (VQ-PVQ)를 개발하였으며, 예측 구조와 세이프티-넷 (safety-net) 개념을 결합시켜 광대역 음성 부호화기용 LPC 계수 양자화 기를 설계하였다. 본 양자화기의 성능은 AMR-WB(ITRT-T G.722.2)의 LPC양자화기 성능과 비교하였는데, 스펙트럼 왜곡 및 메모리 요구량에서 상당한 이득을 얻었다.
PDF KSCI

전송에러가 있는 채널에서 LSP 순서화특성을 이용한 선형예측계수(LPC)의 양자화 방법 (Coding of LPC Parameters Using the Ordering Property of LSP in the Presence of Channel Errors)

이인성
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 1995년도 제12회 음성통신 및 신호처리 워크샵 논문집 (SCAS 12권 1호)
- /
- pp.76-80
- /
- 1995
Differential pulse code modulation 구조의 Line spectrum pairs 양자화기에 높은 차수 LSP 파라미터 값은 낮은 차수 LSP 파라미터 값보다 커야한다는 LSP 파라미터의 순서화 특징을 이용하여 양자화하는 방법을 제시한다. 31 비트/프레임에서 1 dB 이하의 스펙트럴 왜곡을 갖는 명료한 음질을 보였다. 또한 LSP 주파수의 순서화 특성은 벡터-스칼라 결합 양자화기에 적용하였다. 벡터-스칼라 결합 양자화기에서는 26비트/프레임에서 명료한 음질을 보였다. 새로운 LSP 양자화 방법들은 전송에러 발생시 성능을 시험하고, 전송 에러에 강인하도록 프레임간 예측을 위해 Moving Average 예측기를 사용한다.
PDF

광대역 음성 부호화기용 선 스펙트럼 주파수 계수 양자화기 설계 (Design of the LSF Parameter Quantizer for the Wideband Speech Codec)

지상현;강상원;윤병식
- 한국음향학회지
- /
- 제20권4호
- /
- pp.29-34
- /
- 2001
본 논문에서는 고품질 음성 서비스를 가능하게 하는 광대역 음성 부호화기의 선 스펙트럼 주파수 (line spectral frequency: ISF) 계수 양자화기를 설계하였다. 광대역 음성 부호화기를 위한 효율적인 LSF 계수 양자화기를 설계하기 위하여, 인접 프레임간의 상관도를 이용하였으며, 각 해당 프레임의 ISF 계수에 대한 양자화를 인접 프레임간 상관도가 높은 프레임과 상관도가 낮은 프레임으로 나누어 독립적으로 수행하였다. 인접 프레임간 상관도가 높은 프레임의 LSF계수 양자화를 위하여 예측 피라미드형 벡터 양자화기 (predictive pyramid vector quantizer: PPVQ)를 사용하여 양자화하였고, 상관도가 낮은 프레임의 LSF 계수는 피라미드형 벡터 양자화기 (PVQ)를 사용하여 양자화 하였다. PPVQ에서 예측기로 1차 AR 예측기를 사용하였다. 광대역 음성 부호화기를 위해 본 논문에서 설계된 UF 계수양자화기를 평균스펙트럼 왜곡(spectral distortion: SD) 성능 관점에서 실험한 결과, LSF계수 양자화에 할당된 비트가 프레임당 40비트일 때, 평균 SD값이 1 dB 내외이고, 2 dB 이상 및 4 dB 이상 outlier가 각각 3.87%및 0.01%인 transparent한 성능을 얻을 수 있었다.
PDF

분산 음성 인식 시스템을 위한 특징 계수 양자화 방식 설계 (Design of a Quantization Algorithm of the Speech Feature Parameters for the Distributed Speech Recognition)

이준석;윤병식;강상원
- 한국음향학회지
- /
- 제24권4호
- /
- pp.217-223
- /
- 2005
본 논문에서는 분산 음성 인식 시스템에서 사용되는 멜켑스트럼 계수를 양자화 하기 위하여 예측 구조를 갖는 BC-TCQ 양자화기를 제안하였다. 분산 음성 인식 시스템을 위한 효율적인 멜켑스트럼 계수 양자화기를 설계하기 위하여, 인접 프레임간의 높은 상관도를 이용한 1차 AR 예측 필터를 적용하였다. 그리고 예측 필터에 의해서 구해지는 예측 에러 벡터는 BC-TCQ를 사용하여 양자화를 수행하였다. 본 연구에서 제안된 예측 BC-TCQ멜켑스트럼 계수 양자화기는 분산 음성 인식 시스템을 위해 ETSI 규격에서 사용되는 split VQ 멜켑스트럼 계수 양자화 방식보다 cepstral distortion (CD) 측면에서 훨씬 좋은 성능을 보이며, 인코딩 연산 복잡도 및 메모리 요구량에서도 더 유리하다.
PDF KSCI

고속 영상 부호화를 위한 양자화 변환 및 움직임 예측 알고리즘 (Motion estimation algorithm using quantization for fast video encoding)

박상욱;심재영;이상욱
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송공학회 2012년도 추계학술대회
- /
- pp.186-187
- /
- 2012
본 논문에서는 기존의 표준 동영상 부호기의 산술적 연산 복잡도 및 대역폭을 낮추기 위하여 양자화된 두 영상에서 움직임을 예측하는 고속 영상 부호화 알고리즘을 제안한다. 기존에 제안된 이진 변환 기반 움직임 예측 알고리즘은 표적 영상과 참조 영상의 각 매크로 블록 단위로 가우시안 양자화를 적용한 뒤, 움직임 예측을 수행하기 때문에 블록 단위의 아티팩트로 인한 탐색 성능 저하를 피할 수 없다. 따라서, 우리는 참조 영상의 탐색 영역에 대해 하나의 양자화기를 적용함으로써 보다 정확한 움직임을 예측한다. 또한, 기존 알고리즘이 하나의 가우시안 양자화기를 적용하는 것과 달리, 제안 알고리즘은 데이터 특성 파악에 따른 다양한 확률 모델을 가정한 뒤 각 모델에 적합한 최적의 양자화기를 적용함으로써 블록 매칭 오류를 낮춘다. 실험 결과를 통해 제안 알고리즘이 기존의 이진 변환 기반 움직임 예측 알고리즘에 비해 보다 정확한 움직임 벡터를 예측함을 보인다.
PDF

적응적인 확장된 코드북을 이용한 분할 벡터 양자화기 구조의 ISF 양자화기 개선 (A Method For Improvement Of Split Vector Quantization Of The ISF Parameters Using Adaptive Extended Codebook)

임종하;정규혁;홍기봉;이인성
- 한국음향학회지
- /
- 제30권1호
- /
- pp.1-8
- /
- 2011
본 논문에서는 ISF 계수의 순서화 성질을 이용하여 분할구조 벡터양자화기의 단점을 보완하여 ISF 계수 양자화의 성능을 높이는 알고리듬을 제안하고, 이를 이용한 광대역 음성 부호화기용 ISF 계수 양자화기를 설계한다. 16차 이상의 광대역 코덱의 ISF 계수는 계산량과 메모리 사용을 줄이기 위해서 분할구조의 벡터 양자화기를 사용한다. 분할구조 양자화기는 ISF 계수간의 상관도를 충분히 활용하지 못하는 단점이 발생한다. 제안하는 알고리듬은 이러한 단점을 극복하기 위하여 ISF 계수의 순서화 성질을 이용한다. ISF 계수의 순서화 성질을 이용하여 각 서브벡터의 불필요한 코드북 (Codebook Redundancy)을 검색할 수 있다. 이러한 불필요한 코드북은 ISF 계수의 순서화 성질, ISF 계수 예측과정과 기존 코드북의 보간법 (Interpolation)을 통해 적응적인 확장된 코드북으로 교체되어 양자화기의 성능을 향상시킨다. 제안된 알고리듬은 기존의 분할구조 양자화기에서 사용되지 못했던 17 %가량의 불필요한 코드북 인덱스를 적응적인 확장된 코드북에 할당하여, 표준화된 코덱인 AMR-WB의 ISF 계수 양자화기에 비해서 주파수 왜곡 관점에서 약 2 bit 가량의 이득을 보는 결과를 얻었다.
https://doi.org/10.7776/ASK.2011.30.1.001 인용 PDF KSCI

BWE 예측기반 대역분할 부호화기에 대한 연구 (A Study of BWE-Prediction-Based Split-Band Coding Scheme)

송근배;김석호
- 한국음향학회지
- /
- 제27권6호
- /
- pp.309-318
- /
- 2008
본 논문에서는 입력신호를 하위대역 (low-band)과 상위대역 (high-band)으로 나누어 각 대역을 개별적으로 부호화하는 대역분할 부호화 (split-band coding) 방식에 있어서, 상인대역 신호를 효율적으로 부호화하는 방법에 대해 다룬다. 일반적으로 그리고 특히, 그 동안 대역폭 확장법 (Bandwidth Extension, BWE)에 관한 연구를 통하여 두 대역 사이에 일정 정도의 상관관계가 존재한다는 사실이 밝혀져 있다. 따라서 두 대역간에 예측 부호화 기법을 도입함으로써 부호화 효율을 향상시킬 수 있다. BWE 예측기반 부호화 기법과 관련하여, 단순히 선형 BWE 함수를 이용하는 것은 두 대역간의 관계가 비선형성을 가지고 있으므로 최적의 결과를 얹기 어렵다. 따라서 비선형 BWE 함수를 포함한 다양한 예측 함수들의 성능비교를 통하여 가장 적절한 예측기를 선택하고자 하는 노력이 필요하다. 본 논문에서는 몇몇 대표적인 BWE 함수를 이용한 주파수 대역간 예측 부호화 방법에 대해 살펴 보고 각각의 성능을 평가한다. 또한 BWE 예측기반 부호화기를 (주파수)공간상의 중복제거 기술로 볼 때, 시간적 중복 제거 기술 즉, 예측 벡터 양자화기 (predictive vector quantizer)와의 결합이 부호화 효율향상에 상승효과가 있는지에 대해서도 검토한다.
https://doi.org/10.7776/ASK.2008.27.6.309 인용 PDF KSCI

이동 보상과 분류 벡터 양자화기를 이용한 영상 부호화에 관한 연구 (Ⅰ: 이론및 모의실험) (A Study on the Interframe Image Coding Using Motion Compensated and Classified Vector Quantizer (Ⅰ: Theory and Computer Simulation))

김중남;최성남;박규태
- 대한전자공학회논문지
- /
- 제27권3호
- /
- pp.13-20
- /
- 1990
본 논문에서는 이동보상과 분류 벡터양자화기를 이용한 화면각 부호화방법을 제안하였다. 이동보상벡터양자화방식에서는 중요화소를 포함하는 블록을 효과적으로 부호화하는 것이 중요하다. 이러한 관점에서, 이동보상후에 나타나는 화면간 예측오차에 적합한 분류법을 갖는 새로운 CVQ 알고리듬을 제안하였다. 본 연구에서는 저 전송율에서 영상을 효과적으로 부호화하기 위하여 이동보상에서 처리단위인 블록을 4개의 크기가 같은 벡터로 나누고, 각 벡터들을 벡터내의 중요화소의 위치에 따라 15부류로 분류하여 각기 독립적으로 제작된 부호책에 따라 벡터양자화기로 부호화하였다. 컴퓨터 모의실험 결과에서 영상회의와 영상전화와 같은 상대적으로 움직임이 적은 영상에 대하여, 평균 비트율이 0.2~0.25 bit/pel에서 35~37dB의 신호대 잡음비를 얻었다.
PDF

블록 제한 트렐리스 부호화 양자화 기법을 이용한 협대역 음성 부호화기용 LPC 계수 양자화기 설계 (Designing a Quantizer of LPC Parameters for the Narrowband Speech Coder using Block-Constrained Trellis Coded Quantization)

전자경;박상국;강상원
- 한국통신학회논문지
- /
- 제32권3C호
- /
- pp.234-240
- /
- 2007
본 논문에서는 기존의 트렐리스 부호화 양자화 기법을 이용, 변형하여 저 복잡도 블록 제한 격자 부호화 양자화 기법 (Block-Constrained Trellis Coded Quantization, 이하 BC-TCQ)을 제안하곤 이를 이용한 협대역 음성 부호화기용 예측 BC-TCQ를 설계하였다. 트렐리스 부호화 양자화 기법은 일종의 벡터 양자화 방식으로 부호화에 요구되는 벡터 코드북을 트렐리스 구조에 기반한 스칼라 코드북으로 구성함으로써 VQ와 비교 할 만한 성능을 보일 뿐 아니라 복잡도가 훨씬 작은 특성을 보인다. 본 논문에서 제안한 예측 BC-TCQ는 프레임당 26비트에서 IS-641 음성 부호화기보다 평균 SD가 0.4107dB 향상되었으며, 더하기 연산이 64.54%, 곱하기 연산이 76.93%, 비교 연산이 2.35% 감소하였다.
PDF KSCI

하드웨어 구현에 적합한 HEVC 의 CU 단위 율 및 왜곡 예측 방법 (A Rate and Distortion Estimation Scheme for HEVC Hardware Implementation)

이범식;김문철
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송공학회 2014년도 추계학술대회
- /
- pp.15-17
- /
- 2014
본 논문에서는 하드웨어의 제한된 자원을 이용하여 HEVC 코덱을 구현할 때 DCT 와 엔트로피 부호화를 사용하지 않고 율 및 왜곡값을 예측하여 고효율의 부호화를 수행하는 방법에 대하여 제안한다. HEVC 는 기존의 부호화기에 비하여 계층적 부호화 구조와 함께 큰 블록 크기를 갖는 DCT 와 엔트로피 부호화를 반복적으로 수행하기 때문에 하드웨어 구현 시 그 복잡도가 매우 크게 증가한다. 먼저 DCT 는 하다마드변환 행렬과 또 다른 정규 직교 변환 행렬의 곱으로 표현될 수 있는 성질을 이용하여 부호화 변환 시 생성된 하드마드변환 행렬에 저복잡도의 정규 직교 변환 행렬을 곱하여 DCT 변환 계수를 생성한 후 변환 및 양자화를 수행한다. 왜곡값의 경우, 이 때 생성된 양자화 계수와 변환 계수 간의 차이를 변환도메인에서 제곱합을 이용하여 계산하여 역변환을 생략함으로써 복잡도를 감소시킬 수 있다. 또한 텍스처에 대한 비트율 예측은 각 CU 블록내의 양자화 계수의 수를 더하여 계산하여 엔트로피를 수행하지 않고 예측할 수 있다. 그리고 비 텍스처에 대한 비트율 예측의 경우 움직임벡터의 비트에 대한 Pseudo CABAC 코드를 수행하여 예측할 수 있다. 이러한 저 복잡도의 텍스처 및 비텍스처 비트와 왜곡을 예측함으로써 하다마드변환만을 이용하여 부호화하였을 때에 비해 최대 33%의 비트율 감소를 얻을 수 있었다.
PDF

검색결과 15건 처리시간 0.023초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)