• 제목/요약/키워드: image compression

검색결과 1,582건 처리시간 0.028초

저전송률 비디오 압축에서 적응적 초기 QP 결정 알고리즘 (Adaptive Initial QP Determination Algorithm for Low Bit Rate Video Coding)

  • 박상현
    • 한국정보통신학회논문지
    • /
    • 제14권9호
    • /
    • pp.1957-1964
    • /
    • 2010
  • 비디오 코딩에서 GOP의 첫 번째 프레임은 많은 비트를 발생시키는 인트라 모드로 압축되고 다음 프레임의 인터모드 압축에 사용되기 때문에 첫 프레임을 위한 초기 QP 값은 첫 프레임뿐만 아니라 이후 프레임에도 영향을 주게 된다. 일반적으로 GOP의 초기 QP 값은 이전 GOP의 인터 모드로 압축된 프레임의 평균 QP 값과 이전 GOP의 초기 QP 값에 의해 결정된다. 기존 방식인 JM의 경우 초기 QP 값이 인터 모드 평균 QP 값보다 2 정도 작게 설정 되도록 하고 있는데, 이것은 저전송률 비디오 코딩에 맞지 않다. 본 논문에서는 GOP의 초기 QP 값과 인터 모드로 압축된 프레임의 평균 QP 값의 비와 최적 초기 QP 값 사이에 존재하는 선형 관계를 분석하고 이를 바탕으로 선형 모델을 제안한다. 제안된 선형 모델은 이전 GOP의 인코딩 결과를 이용하여 현재 GOP의 초기 QP 값을 계산한다. 실험 결과는 제안하는 방법이 기존의 JM 알고리즘에 비해 정확하게 최적의 초기 QP 값을 예측하고 PSNR 성능도 더 우수함을 보여준다.

디지털 시네마용 Motion JPEG2000 인코더의 FPGA 설계 (FPGA Design of Motion JPEG2000 Encoder for Digital Cinema)

  • 서영호;최현준;김동욱
    • 한국통신학회논문지
    • /
    • 제32권3C호
    • /
    • pp.297-305
    • /
    • 2007
  • 본 논문에서는 주요 영화사들로 구성된 DCI(Digital Cinema Initiatives)에 의해 디지털 시네마를 위한 영상 압축 표준으로 제정된 Motion JPEG2000 부호화기를 FPGA를 타겟으로 구현하였다. JPEG2000의 주요 구성요소인 리프팅-기반의 DWT(Discrete Wavelet Transform)와 EBCOT(Embedded Block Coding with Optimized Truncation)의 Tier 1을 하드웨어로 구현하였고, Tier 2과정은 소프트웨어로 구현하였다. 디지털 시네마를 위해 입력 영상의 크기(tile size)는 최대 $1024\times1024$까지의 고해상도를 지원할 수 있도록 하였고, 실시간성을 보장하기 위해 3개의 엔트로피 부호화기를 사용하였다. Verilog-HDL을 이용하여 하드웨어로 구현했을 경우 Altera사의 Stratix EP1S80에서 32,470 LE (logic element)에 해당하는 자원을 사용하면서 FPGA에 사상되었고, 150Mhz의 주파수에서 안정적으로 동작하였다.

동영상에서 모드 선택을 위한 코스트 평가 방법 (Coast Evaluation Techniques for Mode Selection in Video Coding)

  • 송대건
    • 한국인터넷방송통신학회논문지
    • /
    • 제13권6호
    • /
    • pp.275-280
    • /
    • 2013
  • 최근 액서스망의 브로드밴드화와 영상기기의 고성능화에 따라 인터넷을 통한 음성, 영상 등의 미디어 정보를 다루는 멀티미디어 서비스가 주목받고 있으며 점차 보급되어 가고 있다. 앞으로 더욱더 영상 기기나 네트워크 환경에 발맞추어 고품질의 영상을 다루고 이용하는 형태가 점점 다양화되고 활용화 되리라 예측된다. 그 중에서도 동영상 부호화 기술 즉, 영상 정보의 압축 부호화 기술은 중심적인 역할을 하는 기술 중의 하나이다. 동영상 부호화 기술은 방대한 정보량을 필요로 하는 영상 신호 중에 포함되어 있는 용장성을 배제하고 적절한 정보량을 디지털 부호로서 효율인 영상 신호를 표현하는 기술로서 발전되어 가고 있다. 따라서 본 연구는 동영상 부호화에서의 모드 선택에 적용하는 코스트 평가 방법을 검토하고 부호화 효율을 최대화하기 위해 방법을 제안 하고자하며 이를 기존 방법과 비교해 우수성을 확인하였다.

동적 주소 사상을 이용한 벡터 양자화 (Vector Quantization Using a Dynamic Address Mapping)

  • 배성호;서대화;박길흠
    • 한국정보처리학회논문지
    • /
    • 제3권5호
    • /
    • pp.1307-1316
    • /
    • 1996
  • 본 논문에서는 인접블록들간의 높은 상관성을 이용한 동적 주소 사상에 의한 벡터 양자화 방법을 제안했다. 제안한 방법에서는 부호화할 입력블록에 대한 벡터 양자화의 주소를 사이드 메치 오차를 이용하여 재정렬된 부호책에서의 새로운 주소로 사상하는 주소 변환 함수를 저의하여 비트율을 효율적으로 감소하였다. 이러한 방법은 주소 변환 함수에 의한 새로운 주소가 주소 문턱값 이하인 낮은 주소로 사상된 경우에는 새롭게 사상된 주소를 부호화하고, 그렇지 않은 경우에는 재정립 되지않은 부호벡터 주소를 부호화하는 방법이다. 실험을 통하여, 제안한 방법에서의 복원영상의 화질은 일반적인 벡터 양자화 방법에서의 복원영상의 화질과 동일하고 비트율은 약 45∼50% 감소함을 확인하였다.

  • PDF

비트 플레인을 이용한 움직임 추정기 설계에 관한 연구 (A Study on Motion Estimator Design Using Bit Plane)

  • 박종진;이권철;김은원;조원경
    • 정보학연구
    • /
    • 제3권2호
    • /
    • pp.39-47
    • /
    • 2000
  • 영상처리분야는 많은 데이터를 포함하는 고화질의 동영상을 고속으로 전송하기 위하여 압축기법을 필수적으로 사용하고 있다. 동영상 정보의 압축기법 중에서 시간적 중복성을 제거하는데는 움직임 추정기법을 사용한다. 본 논문에서는 완전탐색 블록정합 움직임 추정기를 설계하는데 있어서 DCT DC 값을 이용하여 화면의 밝기를 판단하여 휘도 신호 8비트 모두를 사용하지 않고, 비트 플레인(bit Plane)을 이용하여 그 중에 3비트만 선택하는 비교선택기를 I-Picture에 적응적으로 적용하고, P와 B Picture에서도 같은 선택 비트를 사용하는 구조를 제안하였다. 이 제안된 구조를 기준블록 $8{\times}8$, 탐색영역 $23{\times}23$, $352{\times}288$ Grayscale 표준비디오영상에 C언어로 모델링하여 기존 완전탐색기법과 PSNR을 비교한 결과 사람의 시각으로 거의 구별할 수 없는 작은 차이가 나타남을 알 수 있었고, 이렇게 검증된 움직임 추정기를 VHDL으로 설계하였다. 합성한 결과 본 논문에서 제안한 방법이 크기에서 기존구조 I에서는 38.3%, 기존구조II에서는 30.7% 줄일 수 있었음을 보여주었고, 메모리에서 기존구조 I, II보다 31.3% 줄일 수 있었음을 보여주었다.

  • PDF

영상의 위상 차를 이용한 얼굴인식 (Face Recognition Using a Phase Difference for Images)

  • 김선종;구탁모;성효경;최흥문
    • 전자공학회논문지S
    • /
    • 제35S권6호
    • /
    • pp.81-87
    • /
    • 1998
  • 본 논문에서는 얼굴 영상간의 위상 차를 이용하여 얼굴을 인식하는 시스템을 제안하였다. 제안된 시스템에서는 KLT(Karhunen-Loeve transform)를 이용하여 복구가 가능하도록 영상을 압축하고, 계산량도 줄였다. 압축된 학습 대상 영상을 미리 제안된 시스템에서 학습시킨 후, 인식 대상 얼굴 영상을 압축시킨다. 압축된 영상과 기존의 학습된 얼굴영상들과의 위상차를 구하고 이 위상차에 여현 함수를 적용하여 그 값이 최대가 되는 얼굴로 인식하도록 하였다. 두 얼굴 영상의 위상차는 벡터 내적방법에 의해 구하여지며, 이를 이용하면 기존의 학습방법을 이용하는 시스템보다 계산이 간단하고 처리시간도 빠르다. 또한 영상간 규준화된 위상차는 조명 및 회전에 불변인식이 가능하고, 여현 함수의 적용으로 이동에도 어느정도 불변인식이 가능하다. 그리고 연결웨이트에는 영상에 대한 정보를 그대로 갖고 있어서, 기존의 신경망과 같은 전체적인 재학습을 하지 않고도 새로운 영상만을 추가학습이 가능하므로 확장학습이 용이하다. 각각 10가지 얼굴영상을 갖는 40 명의 ORL 얼굴영상에 실험한 결과, 인식률이 기존의 방법과 비슷한 8% 오차범위 내에서 학습시간이 PC에서도 수 분밖에 안 걸리는 빠른 얼굴인식이 가능함을 확인하였다.

  • PDF

BTC 파라메타를 이용한 고압축 영상부호화 (High Compression Image Coding with BTC Parameters)

  • 심영석;이학준
    • 대한전자공학회논문지
    • /
    • 제26권2호
    • /
    • pp.140-146
    • /
    • 1989
  • 본 논문에서는 4${\times}$4 블록 절단부호화를 근사화 파라메타 {($Y_{\alpha},\;Y_{\beta}),\;P_{{\beta}/{\beta}}$}에 의한 블록 근사화 및 그 파라메타 부호화의 두 과정으로 나누고, 각 과정에 대해 연구하였다. 제안된 방식은 일단 블록을 평탄 및 에지블록으로 분류하여 평탄 블록은 한개의 근사화 레벨 Y로만 근사화하도록 하였다. 에지블록의 라벨 평면 $P_{{\beta}/{\beta}}$는 준비된 32개의 표준 패턴을 이용하여 근사화하도록 노력하였고, 근사화가 어려운 것은 그대로 전송하였으며, 근사화 레벨 $Y_{\alpha},\;Y_{\beta}$는 이미 전송된 라벨 평면을 이용하여 예측 양자화한 후 Huffman 부호화하도록 하였다. 본 방식의 성능은 배경부분에서의 표현에는 약간의 문제가 있는 것으로 나타나지만 SNR 면에서는 복잡한 변환 부호화 방식보다도 좋은 결과를 보이며, 특히 에지가 잘 보존되었다.

  • PDF

한국인 척추 연구를 위한 형상 / 물성 정보 구축 (Geometry and Property Database for Korean Spine Research)

  • 이승복;이상호;한승호;곽대순
    • 한국콘텐츠학회논문지
    • /
    • 제11권10호
    • /
    • pp.488-493
    • /
    • 2011
  • 한국과학기술정보연구원과 가톨릭대학교 의과대학 가톨릭응용해부연구소에서는 척추 연구자들이 쉽게 사용할 수 있는 기초 자료를 구축하고 있다. 척추 형상 정보를 제공하기 위해 60-80대 기증시신 20여 표본을 활용하여 고해상도 척추 (whole spine) CT (pixel dimension : 0.4x mm, thickness: 0.6mm)를 촬영하고 이를 3차원 모델링 소프트웨어(Mimics, Ver.14, Materialise, Belgium)를 사용하여 3차원 형상 모델(shell model, STL format)로 구축하고, 목, 등, 허리 척추의 주요 부위를 계측하여 수치화 하였다. 시신기반 자료의 한계를 극복하기 위해 고령자 호발 질환을 중심으로 대상 환자를 선정하여 X-Ray, CT, BMD 자료를 구축하여 보강하고 있다. 물리적 성질 정보 구축은 기증시신 10여 표본을 활용하여 임상적, 물리적 골밀도를 측정하고, 목척추(cervical), 등척추(thoracic), 허리척추(lumbar) 부분의 굽힘-폄(flexion-extension), 가쪽 굽힘(lateral bending), 회전(torsion), 압축(body/disc compression) 시험을 수행하여 작용력과 굽힘량의 관계를 구축하고 있다. 구축된 물성 시험 결과는 형상 모델과 함께 제공되어 자료의 활용도를 높이고 있으며, 이를 이용하여 한국인 특성이 반영된 척추 관련 연구 및 제품 개발에 활용 될 수 있다.

다시점 비디오 부호화를 위한 시간적 예측 구조 (Temporal Prediction Structure for Multi-view Video Coding)

  • 윤효순;김미영
    • 한국멀티미디어학회논문지
    • /
    • 제15권9호
    • /
    • pp.1093-1101
    • /
    • 2012
  • 다시점 비디오는 3차원 정보를 표현하기 위한 영상으로 하나의 3차원 장면을 여러 시점에서 다수의 카메라로 촬영한 동영상이다. 영상들 사이에 존재하는 시간적 상관성과 화면간 상관성을 이용하는 다시점 비디오 부호화는 카메라의 수에 비례하여 데이터의 양이 늘어나기 때문에 계산량을 줄일 수 있는 다시점 비디오 부호화 기술이 필요하다. 본 논문에서는 다시점 비디오의 부호화 성능을 향상시키기 위한 효율적인 예측구조를 제안한다. 제안한 예측 구조는 다시점 비디오의 부호화 효율을 높이기 위하여 부호화되는 현재 화면과 현재 화면이 참조하는 참조 화면들과의 평균 거리, B계층 최대 인덱스 그리고 각 Bi 계층의 화면 수를 고려하였다. 제안한 예측 구조의 성능을 참조 예측 구조의 성능과 비교하였을 때 영상 화질 면에 있어서 제안한 예측 구조가 Fraunhofer-HHI의 계층적 B화면 구조보다 약 0.07~0.13 (dB) 성능 향상을 보였다. 발생되는 평균 초당 비트량에 있어서 제안한 예측 구조가 Fraunhofer-HHI의 계층적 B화면 구조보다 최대 6.5(Kbps) 감소하였다.

적응적 율-왜곡 최적 다중 루프 필터 기법 (Adaptive Rate-Distortion Optimized Multiple Loop Filtering Algorithm)

  • 홍순기;최윤식;김용구
    • 방송공학회논문지
    • /
    • 제15권5호
    • /
    • pp.617-630
    • /
    • 2010
  • 고해상도 비디오에 대한 압축 성능 향상을 위해 ITU-T VCEG에서는 H.264/AVC 표준을 근간으로 다양한 압축 성능 개선 기법들을 추가해 왔는데, 그중 ALF 기법은 양자화에 의해 발생한 오류를 제거할 수 있는 필터링 방법을 제공함으로써, 고해상도 영상에서 평균 9%의 매우 높은 성능 개선 능력을 보이는 핵심 기술이다. 하지만 기존의 ALF는 한 프레임 내에서 하나의 Wiener 필터만을 사용하므로, 다수의 서로 다른 통계적 특성을 가진 영역이 존재하는 경우에는 능률적인 오류 복원 성능을 제공하기 어려운 한계를 가지고 있다. 따라서 본 논문에서는 한 복호 프레임에 존재하는 다양한 영역 별 통계적 특성을 반영하여 보다 유연한 율-왜곡 관점에서의 ALF 선택이 가능할 수 있도록, 적응적 율-왜곡 최적 다중 루프 필터 기법을 제안한다. 제안 알고리즘을 통해 다양한 영상에 대하여 기존 알고리즘의 성능을 안정적으로 개선할 수 있었으며, 영상에 뚜렷한 특성 차이를 지닌 복수의 오브젝트가 존재할 경우에는 더욱 높은 비트율 감소 이득을 얻을 수 있었다.