• 제목/요약/키워드: 비디오 복원

검색결과 258건 처리시간 0.023초

영상의 불연속 특성을 이용한 손상된 움직임 벡터 복원 기법 (Recovering Corrupted Motion Vectors using Discontinuity Features of an Image)

  • 손남례;이귀상
    • 한국정보과학회논문지:정보통신
    • /
    • 제31권3호
    • /
    • pp.298-304
    • /
    • 2004
  • 이동 통신 채널과 같은 저대역 통신망에서는 비디오 전송을 위해서는 높은 압축율을 갖는 부호화 방법들이 사용된다. 본 논문에서는 저대역폭 통신을 위한 비디오 부호화 표준인 H.263 부호화를 기반으로 전송도중 손상된 움직임 벡터의 복원기법을 제안하고 실험하였다. 공간적으로 인접한 블록간에는 움직임 벡터의 상관성이 높기 때문에 손실블록 또한 이 블록들과 움직임이 비슷할 가능성이 높다. 이러한 특성을 이용하여 손실블록의 주변블록 중에서 같은 방향으로 움직임을 갖는 블록들로 구성된 동일 움직임 영역을 추출하고, 이 블록들을 이용하여 손실블록의 움직임벡터를 복구한다. 본 논문에서 제안한 알고리즘은 정확한 손실블록의 움직임 벡터를 찾아 거의 완벽하게 복원하기도 하지만 정확한 움직임벡터를 찾지 못한 경우에는 주변블록과 가장 비슷한 움직임벡터를 찾아서 에러를 복원하는 효과가 있다. 제안한 방법으로 복원한 영상은 전체적으로 눈에 거슬리는 오류가 생기지 않으므로 주관적인 화질이 좋았다. 또한 객관적인 척도인 PSNR 측면에서는 영상의 움직임 정도에 따라 기존 BMA 방법보다 약 0.5㏈∼1㏈ 정도 향상이 있었다.

반복적 2D 워핑을 이용한 효율적인 스테레오 비디오 데이터 압축 및 복원 (Efficient Data Compression and Decompression of Stereo Video by using Interative 2D Warping)

  • 박일권;변혜란
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2008년도 추계학술대회
    • /
    • pp.117-120
    • /
    • 2008
  • 본 논문은 스테레오 비디오 데이터 압축 및 복원을 위한 그리드(Grid) 기반 2D 워핑 방법을 제안한다. 스테레오 비디오에 대한 데이터 표현 방법으로 깊이지도 및 매쉬(mesh)를 이용한 방법이 주로 사용되어 왔으며 매쉬를 이용한 방법은 두 영상간의 매칭되는 노드를 이용하여 데이터 압축 효율을 높일 수 있다. 그러나, 두 영상에서 매칭되는 노드의 위치를 찾는 것은 매우 어려운 일일 뿐만 아니라 매쉬에 의해서 워핑된 영상과 목적이 되는 스테레오 영상의 좌측 또는 우측 영상간의 왜곡이 불가피하다. 따라서 이러한 왜곡을 보정하기 위하여 잔여영상(Residual image) 정보를 추가로 요구하게 된다.제안된 논문은 이러한 잔여영상 정보를 최소화 하기 위하여 반복적으로 2D워핑을 수행하며 최적화된 워핑 영상을 생성함으로써 목적영상과의 오차를 최소로 유지하여 추가정보인 잔여 영상의 데이터 용량을 최소화 한다. 전체영상에 대하여 2D워핑을 수행하며 각각의 노드를 변경하는 것은 많은 비용을 감수해야 하기 때문에 오차영역에 대하여 지역단위로 분할하고 단계적으로 최적화를 이루는 분할정복 방법을 사용하였다. 본 논문의 실험에서는 스테레오 영상에 대하여 각각의 신호대 잡음비(PSNR)를 통해 제안한 방법의 품질을 평가하였을 뿐만 아니라 기존의 메쉬 기반한 방법과 깊이지도를 이용한 방법과의 데이터량을 비교하였다. 실험결과를 통하여 제안한 방법의 데이터 압축의 효율성 및 품질의 우수성을 확인하였다.

  • PDF

동영상과 3차원 얼굴 모델이 자동 정합 (An Automatic Matching between Video Frames and 3D Facial Model)

  • 이정;김창헌
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.613-615
    • /
    • 2001
  • 본 논문은 동영상 내의 얼굴을 특정인 얼굴로 자동 변환 및 정합하는 기술을 제안한다. 얼굴에 나타난 동작이나 표정은 높은 자유도로 인하여 기존에 사용되어온 2차원적이고 고정된 물체 위주의 동영상 정합 기술로는 자연스러운 결과물을 얻기가 어렵다. 본 논문에서는 입력 받은 정면 유사방향의 사진으로부터 3차원 얼굴 모델을 복원한다. 각 프레임에 등장한 얼굴의 3차원 방향을 추출하여 복원한 3차원 얼굴 모델에 적용한 후 대체할 얼굴 영역에 저합시킨다. 정합 과정 시 비디오 프레임 내의 조명효과와 얼굴색 등을 분석하고 3차원 얼굴 모델에 블렌딩하여 비디오 프레임과 자연스럽게 정합할 수 있도록 한다.

  • PDF

Video Codec 화질 개선을 위한 순차적 적응형 칼만 필터링 연구 (A Sequencial Adaptive Kalman Filtering for Video Codec Image Enhancement)

  • 백원진;이종수;김수원;박진우
    • 한국통신학회논문지
    • /
    • 제15권12호
    • /
    • pp.1031-1043
    • /
    • 1990
  • 비디오 코덱의 입력 또는 출력 영상에 내재하는 여러 종류의 영상잡음을 제어하고 최적으로 영상을 복원시키고자 코우절 영상 모델이 적용된 실시간 응용의 칼만 필터링 방법을 제안하였다. 화질의 개선도를 향상시키고자 처리화소선 간의 평균화와 지역 분산치에 의한 적응형 칼만 알고리즘을 제안하였고 그에 따른 잡음 제어와 영상 정보 복원 효과를 NMSE, LOGMSE 측정과 실험 결과에서 관측함으로써, 비디오 코덱의 전, 후처리 과정에서의 칼만 필터 적용 가능성을 제시하였다.

  • PDF

화면 간 예측에서 인코딩 정보를 고려한 딥러닝 기반 인루프 필터 (Considering Encoding Information for CNN based In-loop Filter in Inter Video Coding)

  • 김양우;이영렬
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 추계학술대회
    • /
    • pp.143-144
    • /
    • 2020
  • VVC (Versatile Video Coding)는 HEVC이후 차세대 표준 비디오 코딩으로 JVET(Joint Video Exploration)에 의해 2018년 표준화를 시작하였다. VVC에는 복원픽쳐의 변환-양자화에러에 의해 발생한 블로어, 블로킹, 링잉 아티팩트를 감소시키기 위하여 deblocking filter (DF), sample adaptive offset (SAO), adaptive loop filter(ALF)와 같은 모듈을 사용한다. 한편 CNN (Convolutional Neural Network)은 최근 이미지와 비디오 복원에 높은 성능을 보이고 있다. VVC에서 픽쳐는 CTU (Coding Tree Unit)으로 분할되고 각 CTU는 다시 CU (Coding Unit)으로 분할된다. 그리고 인코딩을 위한 중요한 정보들이 Picture, CTU, CU단위로 디코더에 전송된다. 이 논문에서는 화면 간 예측으로 인코딩 된 픽처에서 블록과 픽처정보를 이용한 딥러닝 기반의 인루프 필터 모델을 제안한다. 제안하는 모델은 화면 간 예측에서 QP, 4×4 블록단위의 모션벡터, 참조블록과의 시간적거리, CU의 깊이를 모델에 추가적인 정보로 이용한다.

  • PDF

계층적 깊이 영상으로 표현된 다시점 영상에 대한 H.264/AVC 비디오 압축 표준에 관한 연구 (A Study on H.264/AVC Video Compression Standard of Multi-view Image Expressed by Layered Depth Image)

  • 지인호
    • 한국인터넷방송통신학회논문지
    • /
    • 제20권1호
    • /
    • pp.113-120
    • /
    • 2020
  • 다시점 비디오는 하나의 장면을 여러 대의 카메라를 이용하여 여러 시점에서 촬영한 것이다. 따라서 사용자의 요구에 의해서 원하는 시점의 비디오를 제공할 수 있는 장점을 갖는다. 본 논문에서는 보다 향상된 기법을 활용하여 계층적 깊이 영상 구조 표현의 압축 성능을 향상시켰다. 계층적 깊이 영상을 H.264 기술로 부호화시켜 압축된 데이터 크기를 확인하고, 복원된 각 영상의 품질 성능을 알아보았다. H.264/AVC 기술은 쉽게 비디오와 관련된 콘텐트에 대한 H.264 기술로 확장될 수 있다. 그래서 깊이 정보를 포함하는 다시점 영상을 효과적으로 압축할 수 있는 계층적 깊이 영상 구조라는 새로운 콘텐트에 적용하는 방법을 제안하였다. 다시점 비디오 영상의 막대한 데이터 양이 감소되며, 고품질의 영상을 제공되고, 에러 복원 기능이 강화하는 장점이 있는 것을 보여주었다.

H.263 비디오 통신을 위한 동일 움직임영역 기반 움직임벡터 복원 (Motion Vector Recovery Based on Homogeneous Motion Area for H.263 Video Communications)

  • 김정현;손남례;박성찬;황성운;윤기송;손덕주;이귀상
    • 정보처리학회논문지B
    • /
    • 제8B권1호
    • /
    • pp.43-49
    • /
    • 2001
  • 이동통신 채널과 같이 에러 발생율이 높은 환경에서 부호화된 비디오를 전송할 때 채널에어에 손상된 비트스트림은 복호되기 어려울 뿐만 아니라, 비트스트림의 다른 부분으로까지 에러를 전파시킨다. 한 프레임에 손실블록이 있을 때 기존방법에서는 주변블록들의 움직임벡터 평균을 구하거나 비슷한 예측을 통해 손실블록의 움직임벡터를 복원한다. 그러나 손실블록이 움직이는 객체의 경계부근에서 발생할 때 기존방법은 효율적이지 못한다. 따라서 제안 알고리즘은 기존방법보다 정확한 움직임벡터를 예측하기 위해 손실블록의 주변블록들 중세서 동일한 움직임을 갖는 블록들로 구성된 영역을 찾은 후, 동일움직임영역에 포함된 블록들의 움직임벡터를 이용하여 손실된 블록을 복원한다. 실험결과 제안방법이 기존방법에 비해 PSNR과 시각적인 화질면에서 우수한 성능을 보임을 알 수 있다.

  • PDF

증강현실 시스템 구현을 위한 단일 프레임에서의 고속 카메라 위치추정 (Fast Camera Pose Estimation from a Single Frame for Augmented Reality Applications)

  • 이범종;박종승;성미영;노성렬
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 1부
    • /
    • pp.7-14
    • /
    • 2006
  • 본 논문에서는 3D 복원과 카메라 측정과정 없이 정확하게 카메라 자세를 계산하고 가상객체를 비디오에 합성하기 위한 단일 프레임 기반의 고속 계산 기법을 제안한다. 객체의 로컬 좌표와 단일 이미지에서의 대응되는 이미지 좌표로부터 카메라 자세를 계산한다. 정사영 투영모델에서의 분해기법에 기반한 구조 계산 방법으로 카메라 자세의 고속 추정이 가능하다. 정사영 투영모델에 기반하기 때문에 참조점의 설정에 따라 정확도가 달라진다. 객체에 따라 참조점을 설정하여 정확한 카메라 자세를 계산하는 방법을 제안한다. 카메라 자세 및 물체의 형태는 단일 프레임 기반으로 수행되며 카메라 자세 추정 결과가 즉시 비디오 합성에 사용될 수 있도록 하였다. 제안하는 기법의 유효성 입증을 위해 실사 비디오에 기반한 증강현실시스템을 구현하고 카메라 자세 계산과 비디오 합성의 전체 과정을 단일 프레임에 기반하여 실험을 수행하고 제안 기법의 실용성을 보였다.

  • PDF

3DoF+ 비디오의 효율적인 부호화를 위한 패치 패킹 기법 (An Efficient Method of Patch Packing for 3DoF+ Video Coding)

  • 김용주;김현호;김재곤
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2019년도 추계학술대회
    • /
    • pp.206-207
    • /
    • 2019
  • MPEG 에서는 최대 6 자유도(6DoF)를 가지는 몰입형 미디어의 압축 표준화를 진행하고 있다. 360 비디오에 움직임 시차(parallax)를 추가한 것으로 정의되는 3DoF+의 가상 공간에서, 원하는 위치의 장면을 제공하려면 다른 위치에서 찍은 여러 비디오를 사용하여 임의의 원하는 시점의 뷰(view)를 렌더링 해야 한다. MPEG-I Visual 그룹에서는 이러한 3DoF+ 비디오의 효율적인 부호화 및 전송을 위한 표준화가 진행되고 있으며, 최근 시험모델(TMIV)을 개발하고 있다. 본 논문은 TMIV 에서 패치(patch)를 아틀라스(atlas)에 효율적으로 패킹하여 부호화 성능을 향상시킬 수 있는 패치 패킹 방법을 제안한다. 제안 방식은 패킹되는 패치들 간에 보호 대역(Guard Band)를 적용하여 패치간의 거리를 둠으로써 부호화로 인해 발생할 수 있는 아티팩트(artifact)를 줄여 최종 복원 뷰의 화질을 향상시킨다.

  • PDF