• Title/Summary/Keyword: Distortion rate

Search Result 820, Processing Time 0.027 seconds

비트율-왜곡 기반 음성 신호 시간축 분할 (A Temporal Decomposition Method Based on a Rate-distortion Criterion)

  • 이기승
    • 한국음향학회지
    • /
    • 제21권3호
    • /
    • pp.315-322
    • /
    • 2002
  • 본 논문에서는 음성 신호 시간축 분할의 새로운 기법으로, 비트율과 왜곡을 함께 고려한 기법이 제안되었다. 시간축 분할에 필요한 보간 함수는 학습 음성 데이터로부터 얻어진다. 보간 함수는 두 타겟간의 길이에 따라 유일하게 결정되므로 보간 함수는 추가 정보없이 표현된다. 타겟 샘플은 비트율을 최소화시키면서 동시에 최대 스펙트럼 오차가 문턱 치보다 작게 되도록 선택하였다. 제안된 기법은 음성 부호화기의 스펙트럼 변수로 널리 사용되는 LSP계수의 부호화에 적용되었으며, 모의실험 결과 평균적으로 8 bits/Frame의 비트율에서 1.4 dB의 스펙트럼 왜곡이 얻어짐을 알 수 있었다.

An Adaptive Control for the Propagation Errors Incurred by DCT Coefficient-Dropping Transcoder

  • Kim, Jin-Soo;Kim, Jae-Gon;Seo, Kwang-Deok;Yun, Mong-Han
    • ETRI Journal
    • /
    • 제29권5호
    • /
    • pp.559-568
    • /
    • 2007
  • This paper presents a new distortion control scheme with a simple estimation model for the propagation errors incurred by dropping some parts of the bitstream in a frame dropping-coefficient dropping (FD-CD) transcoder. The primary goal of this paper is to facilitate bit-rate conversions and rate-distortion controls in the compressed domain without introducing a full decoding and reencoding system in the pixel domain. First, the error propagation behavior over several frame sequences due to coefficient dropping is investigated on the basis of statistical and empirical properties. Then, such properties are used to develop a simple estimation model for the CD distortion accounting for the characteristics of the underlying coded-frame. Finally, the proposed estimation model allows us to determine the amount of coefficient dropping and to effectively allocate rate-distortions into coded-frames. Experimental results show that the proposed estimation model accurately describes the characteristics of propagation errors adaptively in the compressed domain and can be easily applied to distortion control over different kinds of video sequences.

  • PDF

Multi-frame AR model을 이용한 LPC 계수 양자화 (Quantization of LPC Coefficients Using a Multi-frame AR-model)

  • 정원진;김무영
    • 한국음향학회지
    • /
    • 제31권2호
    • /
    • pp.93-99
    • /
    • 2012
  • 음성코딩 시 성도는 Linear Predictive Coding (LPC) 계수를 이용해서 모델링 한다. 일반적으로 LPC 계수는 양자화와 선형보간 관점에서 유리한 Line Spectral Frequency (LSF) 파라미터로 변경하여 사용한다. 10차 이상의 다차원 LSF 데이터를 벡터 양자화를 이용하여 직접 코딩하게 되면 벡터 내 상관관계 (intra-frame correlation)를 모두 이용할 수 있으므로 rate-distortion 관점에서는 높은 효율을 기대할 수 있다. 하지만, 계산량과 메모리 요구량이 높아져서 실제 코딩 시스템에서는 사용할 수 없게 되므로, 차원을 나누어 압축하는 Split Vector Quantization (SVQ)이 이용된다. 또한, LSF 데이터는 과거 벡터와의 벡터 간 상관관계 (inter-frame correlation)가 높으므로, 이를 이용한 Predictive Split Vector Quantization (PSVQ)이 사용되고 있다. PSVQ는 SVQ 보다 높은 rate-distortion 성능을 보인다. 본 논문에서는 음성 저장 장치를 위한 최적의 PSVQ를 구현하기 위해서 다수의 과거 프레임 정보와의 벡터 간상관관계 (inter-frame correlation)를 고려한 Multi-Frame AR-model 기반 SVQ (MF-AR-SVQ)를 제안하였다. 기존 PSVQ와 비교해 보았을 때, MF-AR-SVQ는 계산량과 메모리 요구량의 큰 증가 없이, 평균 spectral distortion 관점에서 약 1비트의 성능 향상을 보였다.

JPEG2000 영상 압축을 위한 효율적인 비율-왜곡 최적화 알고리즘 구현 (Implementation of an Efficient Rate-Distortion Optimization Algorithm for JPEG2000)

  • 문형진;정갑천;박성모
    • 전자공학회논문지CI
    • /
    • 제43권3호
    • /
    • pp.50-58
    • /
    • 2006
  • 본 논문은 JPEG2000의 비율 제어과정의 성능을 향상시키기 위해 효율적인 비율-왜곡 최적화 알고리즘 구현에 대해 기술한다. 기존의 비율-왜곡 최적화 알고리즘에서는 전체 코드 블록들의 최대 비율-왜곡 기울기와 최소 비율-왜곡 기울기를 참조하여 그 평균을 비율 제한상수로 설정하는 반면 제안된 알고리즘 구현에서는 절단점 인접의 비율-왜곡 기울기를 참조하여 비율 제한상수를 설정하고, 이전의 비율 할당과정에서 배제된 코딩 패스에 대해서만 비율 할당과정을 수행함으로서 비율-왜곡 최적화를 위한 연산수를 감소하도록 하였다. 비율-왜곡 최적화 알고리즘은 C 언어를 통해 구현되었으며, Altera Excalibur(EPXA4)개발 보드를 통해 실험되었다.

최적의 FEC 부호율 결정을 위한 정확한 채널손실 한계집합 추정기법 (An Accurate Estimation of Channel Loss Threshold Set for Optimal FEC Code Rate Decision)

  • 정태준;정요원;서광덕
    • 방송공학회논문지
    • /
    • 제19권2호
    • /
    • pp.268-271
    • /
    • 2014
  • 소스 부호 왜곡 모델 및 채널 유도 왜곡 모델 기반의 기존의 FEC 부호율 결정 기법들은 일반적으로 높은 계산 복잡도와 구현 비용을 요구하는 모델 파라메터 트레이닝 과정을 요구한다. 본 논문에서는 복잡한 모델링 과정을 피하기 위해서 최적의 FEC 부호율 결정을 위한 채널 손실 한계집합을 추정하기 위한 정확한 소스-채널 결합 왜곡 모델을 제안한다.

Orthopantomograph에 있어서 치근부 상의 변화에 관한 연구 (THE STUDY OF APICAL CHANGES ON THE ORTHOPANTOMOGRAPH)

  • 안형규
    • 치과방사선
    • /
    • 제9권1호
    • /
    • pp.19-23
    • /
    • 1979
  • A study was made primarily to investigate vertical and horizontal distortion of the image at the apical region of the dental roots in orthopantomographs. The subjects consisted of two dry skulls with radiopaque materials attached to root surface. Measuring of the width and length of each predetermined point at 23 teeth was performed in dry skulls and radiographic films. The results obtained were as follows; 1. There was overall magnification of image in the vertical dimension. And anterior portion had greater magnification rate than posterior portion, while lower anterior portion had less magnification rate than upper anterior portion. 2. There was reduction of the image in the horizontal dimension of the teeth, because of the position relation between dry skull and image layer of the orthopantomograph. 3. There was a significant difference in distortion rate between the oposite teeth. 4. Cervical portion of the tooth had more decreased rate of horizontal distortion than apical portion.

  • PDF

Optimal Packet Scheduling Algorithms for Token-Bucket Based Rate Control

  • Mehta Neerav Bipin;Karandikar Abhay
    • Journal of Communications and Networks
    • /
    • 제7권1호
    • /
    • pp.65-75
    • /
    • 2005
  • In this paper, we consider a scenario in which the source has been offered QoS guarantees subject to token-bucket regulation. The rate of the source should be controlled such that it conforms to the token-bucket regulation, and also the distortion obtained is the minimum. We have developed an optimal scheduling algorithm for offline (like pre-recorded video) sources with convex distortion function and which can not tolerate any delay. This optimal offline algorithm has been extended for the real-time online source by predicting the number of packets that the source may send in future. The performance of the online scheduler is not substantially degraded as compared to that of the optimal offline scheduler. A sub-optimal offline algorithm has also been developed to reduce the computational complexity and it is shown to perform very well. We later consider the case where the source can tolerate a fixed amount of delay and derive optimal offline algorithm for such traffic source.

A Fast Intra-Prediction Method in HEVC Using Rate-Distortion Estimation Based on Hadamard Transform

  • Kim, Younhee;Jun, DongSan;Jung, Soon-Heung;Choi, Jin Soo;Kim, Jinwoong
    • ETRI Journal
    • /
    • 제35권2호
    • /
    • pp.270-280
    • /
    • 2013
  • A fast intra-prediction method is proposed for High Efficiency Video Coding (HEVC) using a fast intra-mode decision and fast coding unit (CU) size decision. HEVC supports very sophisticated intra modes and a recursive quadtree-based CU structure. To provide a high coding efficiency, the mode and CU size are selected in a rate-distortion optimized manner. This causes a high computational complexity in the encoder, and, for practical applications, the complexity should be significantly reduced. In this paper, among the many predefined modes, the intra-prediction mode is chosen without rate-distortion optimization processes, instead using the difference between the minimum and second minimum of the rate-distortion cost estimation based on the Hadamard transform. The experiment results show that the proposed method achieves a 49.04% reduction in the intra-prediction time and a 32.74% reduction in the total encoding time with a nearly similar coding performance to that of HEVC test model 2.1.

왜곡 패턴 유형에 의한 다각형 기반 형상 부호화의 근사 정점 탐색 (Approximation Vertex Search of Polygon-based Shape Coding by the Type of Distortion Patterns)

  • 서정구;곽노윤;서범석;황병원
    • 디지털콘텐츠학회 논문지
    • /
    • 제3권2호
    • /
    • pp.197-209
    • /
    • 2002
  • 다각형 기반 형상 부호화 기법은 정보량을 줄이기 위해 정점수를 줄일 경우, 근사 다각형 에지들 간의 연결이 원 윤곽선과는 다르게 급변함으로써 근사 오차가 급격히 증가한다. 반면에, 허용 왜곡을 작게 하여 근사 오차를 줄일 경우, 정점 수가 급격히 늘어나 정점을 부호화하기 위해 많은 정보량이 소요되는 문제점이 있다. 제안된 방법에 있어서, 부호기는 다각형 에지와 원 윤곽 세그먼트가 이루는 모양과 가장 유사한 왜곡 패턴의 유형을 찾아 부호화하고 복호기는 복호된 왜곡 패턴 정보로부터 근사 정점을 산술적으로 구해낸다. 이를 통해, 부가 정보의 증가를 효과적으로 억제시키면서도 전체적으로는 정점수가 늘어나 기존의 방법보다. 다각형 에지의 급속한 변화를 현저하게 완화시킴으로써 좀 더 부드러운 근사 모양 정보를 얻을 수 있다. 컴퓨터 시뮬레이션 결과를 통해 고찰할 때, 제안된 방법은 기존의 방식에 비해 왜곡이 적으며, 동일한 왜곡을 가지는 근사 모양 정보를 부호화하는데 필요한 비트량이 기존의 방법에 비해 대략 $10{\sim}20%$ 정도 감소함을 알 수 있다.

  • PDF

Correction of Signboard Distortion by Vertical Stroke Estimation

  • Lim, Jun Sik;Na, In Seop;Kim, Soo Hyung
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제7권9호
    • /
    • pp.2312-2325
    • /
    • 2013
  • In this paper, we propose a preprocessing method that it is to correct the distortion of text area in Korean signboard images as a preprocessing step to improve character recognition. Distorted perspective in recognizing of Korean signboard text may cause of the low recognition rate. The proposed method consists of four main steps and eight sub-steps: main step consists of potential vertical components detection, vertical components detection, text-boundary estimation and distortion correction. First, potential vertical line components detection consists of four steps, including edge detection for each connected component, pixel distance normalization in the edge, dominant-point detection in the edge and removal of horizontal components. Second, vertical line components detection is composed of removal of diagonal components and extraction of vertical line components. Third, the outline estimation step is composed of the left and right boundary line detection. Finally, distortion of the text image is corrected by bilinear transformation based on the estimated outline. We compared the changes in recognition rates of OCR before and after applying the proposed algorithm. The recognition rate of the distortion corrected signboard images is 29.63% and 21.9% higher at the character and the text unit than those of the original images.