• 제목/요약/키워드: Quantization Error

검색결과 296건 처리시간 0.027초

이동형 멀티미디어 기기를 위한 개선된 JPEG 비트율 조절 알고리즘 (Advanced JPEG bit rate control for the mobile multimedia device)

  • 양윤기;이창수;김진율
    • 한국멀티미디어학회논문지
    • /
    • 제11권5호
    • /
    • pp.579-587
    • /
    • 2008
  • JPEG 알고리듬은 같은 크기의 영상이라도 영상의 복잡도에 따라 다른 크기의 압축된 파일이 생성된다. 따라서, 디지털 카메라와 같은 제한된 저장용량을 갖는 기기에서 추후에 저장될 수 있는 영상의 개수를 추정하기 어렵다. 이를 해결하기 위한 대표적인 JPEG 비트율 조절알고리듬은 양자화표를 조절하는 방식이다. 기존의 연구가 영상의 복잡성과 양자표의 관계를 선형적으로 보는 반면, 본 연구에서는 복잡성과 양자표의 조절에 정교한 통계적 모델을 적용하여, 목표가 되는 비트율을 얻을 수 있는 함수관계를 추출하여, 기존의 방식보다 개선된 비트율 조절결과를 얻을 수 있었다. 모의실험결과 제안한 방식이 목표 비트율과의 오차의 표준편차가 2배 이상 감소하는 결과를 얻었다.

  • PDF

다층 신경회로망 학습에 의한 정지 영상의 벡터 (Vector Quantization Compression of the Still Image by Multilayer Perceptron)

  • 이상찬;최태완;김지홍
    • 한국정보처리학회논문지
    • /
    • 제3권2호
    • /
    • pp.390-398
    • /
    • 1996
  • 본 논문에서는 다층 신경회로망의 일반화 특성을 이용한 새로운 영상 압축 알 고리즘을 제안한다. 제안 알고리즘은 벡터 양자화방식을 이용하여 영상을 몇 개의 클래스로 분류하고 이들을 다층 신경회로망으로 학습한다. 이렇게 학습된 다층신경회 로망은 일반화 특성에 의하여 무 학습의 영상에 대해서도 압축과 복원을 수행 한다. 아울러 벡터 양자화방식에 있어서 벡터 양자화 오차와 수신측에서의 메모리를 감소시 킨다. 본 논문에서는 Lena 영상을 학습 영상으로 하여 이를 16개의 클래스로 나누고 각 클래스를 1개의 다층 신경회로망으로 학습하였다. 그리고 학습에 사용된 Lean 영상 및 무 학습 영상들에 대하여 압축과 복원을 수행하여 우수한 화질의 영상이 복원 되어 짐이 보인다.

  • PDF

양자화 삼각 퍼지 함수를 이용한 FDNN 구현 및 성능 분석 (Implementation and Performance Analysis of FDNN Using Quantization Triangularity Fuzzy Function)

  • 변오성;이철희;문성용
    • 전자공학회논문지C
    • /
    • 제36C권11호
    • /
    • pp.84-91
    • /
    • 1999
  • 본 논문에서는 삼각함수와 양자화 된 삼각 퍼지함수를 가중퍼지평균(WFM: Weighted Fuzzy Mean)에 적용하여 비교하였다 또한 잡음의 특성에 따라서 영상에 포함된 잡음을 완전히 제거할 수 없는 단점을 개선하기 위하여, 계층적 구조의 결정기반 신경회로망(DBNN: Decision Based Neural Network)에 퍼지알고리즘을 적용하여서, 영상에 포함된 잡음을 제거하고 동시에 정보의 손실을 최소화하고 최적의 정보를 얻을 수 있는 고속 가중 퍼지결정 신경회로망(FDNN: fuzzy Decision Neural Network)을 구현하였다. 그리고 모의실험을 통하여 WFM과 FDNN의 성능을 비교하였으며, 보트(boats)의 영상에 대한 평균자승오차 (MSE:Mean Square Error)를 비교한 결과 제안된 FDNN이 우수함을 확인하였다.

  • PDF

Precoder Distribution and Adaptive Codebook in Wideband Precoding

  • Long, Hang;Kim, Kyeong Jin;Xiang, Wei;Wang, Jing;Liu, Yuanan;Wang, Wenbo
    • ETRI Journal
    • /
    • 제34권5호
    • /
    • pp.655-665
    • /
    • 2012
  • Based on wideband precoding (WBP) in the multiple-input multiple-output orthogonal frequency division multiplexing system, an adaptive nonuniform codebook is presented in this paper. The relationship between the precoder distribution and spatial correlation is analyzed at first. A closed-form expression based on overlapped isosceles triangles is proposed as an approximation of the precoder distribution. Then, the adaptive codebook design is derived with the approximate distribution to minimize quantization errors. The capacity and bit error rate performance demonstrate that the adaptive codebook with WBP outperforms the conventional fixed uniform codebook.

시각 특징과 퍼지 적분을 이용한 내용기반 영상 검색 (Content-Based Image Retrieval Using Visual Features and Fuzzy Integral)

  • 송영준;김남;김미혜;김동우
    • 한국콘텐츠학회논문지
    • /
    • 제6권5호
    • /
    • pp.20-28
    • /
    • 2006
  • 본 논문은 공간주파수 특징들과 다중 해상도 특징들을 가진 웨이블렛 영역에서 추출된 각 대역의 시각 특징 추출과 이들의 퍼지 적분 조합에 대하여 제안하였다. 칼라 양자화 이후에 똑같은 칼라의 빈도를 취함으로써 기존의 칼라 히스토그램 인터섹션 방법의 단점인 양자화 에러를 줄일 수 있게 칼라 특징을 표현한다. 또한 유사도는 서로 독립적인 특성을 갖는 호모그램, 칼라, 에너지 특징을 퍼지 측도와 퍼지 적분을 사용하여 조합한다. 1,000개의 칼라 영상에 대하여 실험을 하였고, 제안된 방법이 기존 방법들보다 객관적이고 주관적인 성능에서 우수함을 보였다.

  • PDF

문장종속 화자확인 시스템을 위한 개선된 군집화 알고리즘에 관한 연구 (A Study on Modified Clustering Algorithm for Text-Dependent Speaker Verification System)

  • 강철호;정희석
    • 한국음향학회지
    • /
    • 제23권7호
    • /
    • pp.548-553
    • /
    • 2004
  • 본 연구에서는 집단화 오차를 최소로 하기위해 개선된 LBG 알고리즘을 제안한다. 기존의 LBG 알고리즘은 화자확인 시스템에 적용시 소량의 학습 데이터의 분포가 가지는 특수성으로부터 기인하는 문제점들이 발생한다. 즉, 개인별 특성을 무시하고 항상 일정한 크기의 코드북을 생성해야 하는데서 기인하는 군집화 오류와 분할할 (Splitting) 방향을 잘못 선택하면서 발생하는 집단화의 오류가 전체 화자 인식율 저하의 원인이 된다. 따라서, 본 연구에서는 개인별로 최적의 크기를 가지는 가변길이 코드북 생성 기법과 중심값으로부터 최외곽의 멤버 벡터 인덱스를 찾고 다시 최외곽 멤버 벡터에서 가장 먼 멤버 벡터 인덱스를 찾음으로써 분할할 방향을 인위적으로 지정해 주는 개선된 군집화 알고리즘을 제안한다. 실험 결과, 제안된 방식을 적용한 화자확인 시스템이 기존의 LBG알고리즘을 사용한 시스템보다 오거부율(FR)은 3.165%, 오수락율 (FA)는 0.06%씩 각각 향상 되었다.

협 양자화 제약 조건을 이용한 부호화된 영상의 후처리 (On Post-Processing of Coded Images by Using the Narrow Quantization Constraint)

  • 박섭형;김동식;이상훈
    • 한국통신학회논문지
    • /
    • 제22권4호
    • /
    • pp.648-661
    • /
    • 1997
  • This paper presents a new method for post-processing of coded images based upon the low-pass filtering followed by the projection onto the NQCS (narrow quantization constraint set). We also investigate how the proposed method works on JPEG-coded real images. The starting point of the QCS-based post-processing techniques is the centroid of the QCS, where the original image belongs. The low-pass filtering followed by the projection onto the QCS makes the images lie on the boundary of the QCS. It is likely that, however, the original image is inside the QCS. Hence projection onto the NQCS gives a lower MSE (mean square error) than does the projection onto the QCS. Simulation results show that setting the narrowing coefficients of the NQCS to be 0.2 yields the best performance in most cases. Even though the JPEG-coded image is low-pass filtered and projected onto the NQCS repeatedly, there is no guarantee that the resultant image has a lower MSE and goes closer to the original image. Thus only one iteration is sufficient for the post-processing of the coded images. This is interesting because the main drawback of the iterative post-processing techniques is the heavy computational burden. The single iteration method reduces the computational burden and gives us an easy way to implement the real time VLSI post-processor.

  • PDF

네트워크 환경에서 서버용 음성 인식을 위한 MFCC 기반 음성 부호화기 설계 (A MFCC-based CELP Speech Coder for Server-based Speech Recognition in Network Environments)

  • 이길호;윤재삼;오유리;김홍국
    • 대한음성학회지:말소리
    • /
    • 제54호
    • /
    • pp.27-43
    • /
    • 2005
  • Existing standard speech coders can provide speech communication of high quality while they degrade the performance of speech recognition systems that use the reconstructed speech by the coders. The main cause of the degradation is that the spectral envelope parameters in speech coding are optimized to speech quality rather than to the performance of speech recognition. For example, mel-frequency cepstral coefficient (MFCC) is generally known to provide better speech recognition performance than linear prediction coefficient (LPC) that is a typical parameter set in speech coding. In this paper, we propose a speech coder using MFCC instead of LPC to improve the performance of a server-based speech recognition system in network environments. However, the main drawback of using MFCC is to develop the efficient MFCC quantization with a low-bit rate. First, we explore the interframe correlation of MFCCs, which results in the predictive quantization of MFCC. Second, a safety-net scheme is proposed to make the MFCC-based speech coder robust to channel error. As a result, we propose a 8.7 kbps MFCC-based CELP coder. It is shown from a PESQ test that the proposed speech coder has a comparable speech quality to 8 kbps G.729 while it is shown that the performance of speech recognition using the proposed speech coder is better than that using G.729.

  • PDF

높은 자기부상 정밀도를 갖는 자기베어링 제어기 개발 (Development of Magnetic Bearing Controller with High Magnetic Levitation Accuracy)

  • 이석원;허헌
    • 한국인터넷방송통신학회논문지
    • /
    • 제19권1호
    • /
    • pp.225-229
    • /
    • 2019
  • 자기베어링은 기계적인 마찰이 없고 안정적인 동역학 특성을 갖기 때문에 진공 및 청정 환경이나 고정도가 요구되는 분야에서 많이 활용되고 있다. 그러나 자기베어링은 다양한 장점에도 불구하고 일반적으로 제어기가 복잡해서 적용 범위의 확산이 제한적이다. 본 논문에서는 복잡도가 낮은 디지털 방식의 자기베어링 제어기를 제안하였다. 또한 디지털 제어기 성능열화의 주된 원인인 아날로그 신호를 디지털 신호로 변환하는 과정에서 발생하는 오류와 제어 알고리즘 구현상의 문제점들을 분석하고 해결하였다. 제안한 제어기를 실제 자기베어링에 적용한 실험을 통해 제어기가 자기부상 목표 정밀도를 갖는 것을 확인하였다.

Weibull 신호원에 최적인 양자기의 지지역에 관한 연구 (On the Support Region of a Minimum Mean-Square Error Scalar Quantizer for a Weibull Source)

  • 임실규;나상신
    • 한국통신학회논문지
    • /
    • 제29권1C호
    • /
    • pp.129-139
    • /
    • 2004
  • 이 논문은 최소평균제곱오차의 의미에서 Weibull 신호원에 최적인 홑양자기의 지지역에 관한 연구이다. 양자기의 지지역은 최외곽 양자경계값으로 정해지는 구간으로, 이는 양자기의 왜곡양의 결정에 중요한 영향을 미치므로 이에 대한 연구를 시작하였다. 이 논문에 제시된 연구결과는 다음과 같다. 첫째, Weibull 분포에 최적인 양자기의 최외곽 경계값의 근사식을 유도하였다. 둘째, Weibull 신호원의 중요한 형태인 레일리 분포와 지수 분포의 경우에 최적 양자기를 설계하여, 유도된 근사식을 실제값과 비교하여, 근사식의 정확도를 평가하였다. 양자기 지지역 왼쪽 끝경계값의 근사식은, 레일리와 지수 분포 각각의 경우에 양자점이 128과 256 이상일 때 실제값과 약 1% 이내의 오차를 갖으며, 오른쪽 끝경계값 근사식도 각각 양자점이 512와 32 이상일 때 약 1% 이내의 오차를 갗는 것으로 판명되었다. 또, 양자점의 개수가 증가하면 공식의 정확도가 높아졌다. 결론적으로 경계값, 근사식은 매우 높은 정확도를 갖는 것으로 사료된다. 따라서, 이 논문의 기여점은, Weibull 분포에 최적인 양자기의 지지역을 정확하게 표현할 수 있는 구체적인 공식을 유도·제시한 것이다. 이 공식은 Weibull 신호원에 최적인 양자기의 성능분석과 양자기 불일치 연구에 귀중하게 사용될 수 있을 것으로 사료된다.