• 제목/요약/키워드: 키프레임

검색결과 316건 처리시간 0.026초

증강 책을 위한 적응형 키프레임 기반 트래킹 (Adaptive Keyframe-Based Tracking for Augmented Books)

  • 유재상;조규성;양현승
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권4호
    • /
    • pp.502-506
    • /
    • 2010
  • 증강 책(Augmented book)이란, 컴퓨터 그래픽 기술로 생성된 3D 물체, 동영상, 소리영상과 같은 멀티미디어 요소들을 증강현실 기술을 이용하여 실제 책에 증강시킨 책을 말한다. 증강 책은 책을 읽는 독자들에게 흥미를 유발시키고, 책에 좀 더 몰입할 수 있도록 하여, 교육 및 엔터테인먼트 효과를 증대시키는 것이 목적이다. 증강 책을 위한 기술은 크게 페이지 인식 그리고 페이지 트래킹으로 나눌 수 있는데, 본 논문에서는 페이지가 인식된 후, 정교한 페이지 트래킹을 위한 카메라의 6 자유도 자세를 추정하기 위해 적응형 키프레임 기반 페이지 트래킹 기술을 제안한다. 페이지가 인식된 이후에는 트래킹을 위해 가장 알맞은 키프레임을 선정한 후 coarse-to-fine의 두 단계에 걸쳐 트래킹을 수행하였다. 결과적으로 본 논문에서 제안된 트래킹 방법은 시점 변화와 조명 변화에 좀 더 강인하고 실시간성을 보장한다.

이용자 기반의 비디오 키프레임 자동 추출을 위한 뇌파측정기술(EEG) 적용 (Toward a Key-frame Extraction Framework for Video Storyboard Surrogates Based on Users' EEG Signals)

  • 김현희;김용호
    • 한국문헌정보학회지
    • /
    • 제49권1호
    • /
    • pp.443-464
    • /
    • 2015
  • 본 연구는 뇌파측정기술(EEG)과 사건관련유발전위 P3b를 활용하여 이용자의 인지적 반응을 측정한 후 비디오 키프레임을 자동으로 추출할 수 있는지의 가능성을 조사해 보았다. 20명의 피험자들을 대상으로 뇌파를 측정하고 분석한 결과, 적합 이미지 자극 시 좌측 두정엽 영역이 우측 두정엽 영역보다 더 활성화되며, 좌우측간 두정엽 영역의 활성화 정도가 유의한 차이를 보였다. 비적합 이미지 자극 시에는 좌측 두정엽 영역이 적합 이미지보다 덜 활성화되고, 두정엽 영역의 좌우간 활성화도 유의한 차이가 없는 것으로 나타났다. 이외에, 모든 채널의 평균값(MGFP1)의 잠재기, 채널 동시성 패턴 등에서도 두 자극간에 차이를 보여 뇌파측정기술에 기반한 키프레임 자동 추출이 가능한 것으로 확인되었다.

키 프레임 특징들에 적응적 가중치 부여를 이용한 검색 성능 개선 (Improvement of Retrieval Performance Using Adaptive Weighting of Key Frame Features)

  • 김강욱
    • 한국멀티미디어학회논문지
    • /
    • 제17권1호
    • /
    • pp.26-33
    • /
    • 2014
  • 비디오 검색 및 색인은 먼저 압축 비디오에서 장면전환을 검출하여 샷(shot)으로 분리한 후 샷 내에 키프레임 특징 정보들의 유사도 비교를 통해 이루어진다. 일반적으로 내용기반 영상 및 비디오 검색에서는 컬러, 형태, 질감의 세 가지 대표적인 영상 특징들이 주로 사용된다. 그러나 여러 특징들이 결합되어 사용되는 검색 시스템이라 할지라도 각 특징들에 대한 가중치가 적합하게 부여되지 않으면 검색되는 결과 영상의 순위가 크게 변하여 검색 성능이 떨어지게 된다. 이러한 문제점을 해결하기 위해 본 논문에서는 여러 특징들이 결합되어 사용될 때 각 특징에 대한 가중치를 적응적으로 부여해서 비디오 검색 성능을 개선하고자 한다. 제안한 방법을 3,200개 키 프레임으로 구성된 비디오 데이터베이스에서 실험을 하였고 다양한 성능평가 방법을 통해 제안한 방법이 기존 고정가중치 부여를 이용한 방법과 비교하여 검색 성능이 개선됨을 볼 수 있었다.

회전 영상에서 기본 행렬 추정 및 키 프레임 선택을 이용한 전방향 3차원 영상 재구성 (Fundamental Matrix Estimation and Key Frame Selection for Full 3D Reconstruction Under Circular Motion)

  • 김상훈;서융호;김태은;최종수
    • 대한전자공학회논문지SP
    • /
    • 제46권2호
    • /
    • pp.10-23
    • /
    • 2009
  • 본 논문은 회전 테이블에서 취득된 영상으로부터 카메라 교정을 위한 강건한 기본 행렬을 계산하기 위한 새로운 알고리즘과 적은 수의 영상만을 이용하는 키 프레임 선택 알고리즘을 통해서 전방향 3차원 영상 재구성 시스템을 구현하였다. 비 교정영상에서 3차원 영상 재구성을 위해서는 카메라 교정 작업이 필수이다. 카메라 교정 과정은 기본 행렬로부터 추정 할 수 있는데, 정확한 기본 행렬의 추정이 선행되어야 한다. 단일 축 회전 움직임은 몇 가지 고정된 특성을 가지고 있는데, 이러한 특성은 영상간의 아웃라이어를 제거하는데 이용되고, 기본 행렬을 구하기 위한 새로운 알고리즘을 제공한다. 또한 제안한 키 프레임 선택 알고리즘을 통해서 선택된 영상의 사영 행렬을 정렬 시킨 다음, 재구성된 3차원 데이터들을 정합시킴으로서 전방향 3차원 영상 재구성을 구현한다. 자체 제작한 영상 취득 시스템(Potonovo)을 통해서 취득한 실제 영상을 대상으로 기존의 기본 행렬 방법 및 키프레임 선택 방법들과 비교 실험을 통하여 제안된 방법들이 더 우수함을 확인하였다.

잡음 모델 선택을 이용한 Wyner-Ziv 비디오 압축 (Wyner-Ziv Video Compression using Noise Model Selection)

  • 박천호;심혁재;전병우
    • 대한전자공학회논문지SP
    • /
    • 제46권4호
    • /
    • pp.58-66
    • /
    • 2009
  • 최근 경량화 비디오 부호화를 위함 분산 비디오 부호화 기술 (DVC: Distributed Video Coding)에 대한 연구가 활발히 이루어지고 있으며, Wyner-Ziv 부호화 기술은 이의 대표적인 기술로써 각광받고 있다. Wyner-Ziv (WZ) 부호화기는, 영상을, 기존의 인트라 부호화기를 이용하는 키 (Key) 프레임과 WZ 부호화를 하는 WZ 프레임으로 나누어 독립적으로 부호화 한다. WZ 복호화기로 전송된 키 프레임은 복원된 뒤 키 프레임 사이의 WZ 프레임을 추정하는데 사용되며 추정된 WZ 프레임을 보조정보 (Side Information)라고 한다. 보조정보는 WZ 프레임에 대한 정보가 없는 상태에서 추정되므로 필연적으로 WZ 프레임과 다르며 WZ 복호화기에서는 보조정보와 WZ 프레임과의 차이를 가상의 채널 잡음으로 간주한다. WZ 복호화 과정은 가상의 채널잡음을 WZ 복호화기 내에 존재하는 채널코드를 이용하여 제거함으로써 이루어지므로 채널 정보를 정확히 아는 것은 채널코드의 에러정정능력에 큰 영향을 미친다. WZ 복호화기에서는 추정된 WZ 영상만이 존재하므로 정확한 잡음의 양을 알 수 없으며, 일반적으로 선형 움직임에 근거한 키 프레임 간의 차를 하나의 예측 수단으로 사용한다. 또한 이와 같이 예측이 갖는 불확실성으로 채널코드의 효율이 저하되는 것을 막기 위하여 주변의 잡음과 비교를 통한 잘못된 잡음을 정정하는 방법도 제안되었다. 하지만 이런 방법들이 모든 프레임이나 비트 플레인에 존재하는 잡음을 제대로 측정한다고 할 수는 없다. 따라서 본 논문에서는 여러 개의 후보 잡음 모델을 생성한 후, 복호화 과정에서 가장 효율적인 모델을 선택하는 방법을 제안한다. 제안 방법에 대한 실험결과는 최대 0.8 dB의 PSNR이득을 보여준다.

VILODE : 키 프레임 영상과 시각 단어들을 이용한 실시간 시각 루프 결합 탐지기 (VILODE : A Real-Time Visual Loop Closure Detector Using Key Frames and Bag of Words)

  • 김혜숙;김인철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권5호
    • /
    • pp.225-230
    • /
    • 2015
  • 본 논문에서는 키 프레임 영상과 SURF 특징점 기반의 시각 단어들을 이용한 효과적인 실시간 시각 루프 결합 탐지기 VILODE를 제안한다. 시각 루프 결합 탐지기는 과거에 지나온 위치들 중 하나를 다시 재방문하였는지를 판단하기 위해, 새로운 입력 영상을 이미 지나온 위치들에서 수집한 과거 영상들과 모두 비교해보아야 한다. 따라서 새로운 위치나 장소를 방문할수록 비교 대상 영상들이 계속해서 증가하기 때문에, 일반적으로 루프 결합 탐지기는 실시간 제약과 높은 탐지 정확도를 동시에 만족하기 어렵다. 이러한 문제점을 극복하기 위해, 본 시스템에서는 입력 영상들 중에서 의미 있는 것들만을 선택해 이들만을 비교하는 효과적인 키 프레임 선택 방법을 채택하였다. 따라서 루프 탐지에 필요한 영상 비교를 대폭 줄일 수 있다. 또한 본 시스템에서는 루프 결합 탐지의 정확도와 효율성을 높이기 위해, 키 프레임 영상들을 시각 단어들로 표현하고, DBoW 데이터베이스 시스템을 이용해 키 프레임 영상들에 대한 색인을 구성하였다. TUM 대학의 벤치마크 데이터들을 이용한 실험을 통해, 본 논문에서 제안한 시각 루프 결합 탐지기의 높은 성능을 확인할 수 있었다.

움직이는 B-Spline 곡면을 이용한 유체 흐름의 제어 (Fluid flow control using animated B-Spline surface)

  • 황철현;경민호
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제10권2호
    • /
    • pp.35-41
    • /
    • 2004
  • 유체 시뮬레이션은 Navier-Stoke 방정식의 해를 구하는 과정으로 볼 수 있는데, 이 방정식은 초기 조건 및 주변 환경에 따라 매우 민감하게 반응하기 때문에 사용자가 원하는 형태로 제어하는 것이 매우 어려운 일이다. 본 논문에서는 유체의 움직임을 실제 공간에 임베드된 smooth manifold 위로 제한하고, 유체의 움직임을 manifold의 모양에 의해 직관적으로 제어하는 방법을 제안한다. 제어 manifold 안의 유체의 흐름을 자연스럽게 유지하기 위하여 경계에 가상의 중력장을 설정하여 유체가 경계면에서 자연스럽게 내부로 유도되도록 하였다. 본 논문의 유체 제어 방법은 제어 manifold의 모양을 키프레임 보간함으로써 간접적으로 유체 애니메이션의 키프레임 애니메이션으로 만드는 것도 가능하다. 이 과정에서 제어 manifold의 변형에 의한 유체정보를 재구성이 필요한데, 본 연구에서는 그리드의 재샘플링을 통해 해결하는 방법을 제시하였다.

  • PDF

효과적인 분산 비디오 부호화를 위한 비대칭성 움직임 벡터 기반 보조정보 생성 방법 (Asymmetric Motion Vector-Based Side Information Generation for Efficient Distributed Video Coding)

  • 나태영;김문철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2010년도 추계학술대회
    • /
    • pp.129-131
    • /
    • 2010
  • 분산 비디오 부호화(distributed video coding)는 분산 소스 부호화의 대표적인 응용분야로서 부호화 복잡도가 부호화기에서 복호화기로 이동되어 저전력 부호화 환경에 매우 적합하다. 본 논문에서는 분산 비디오 부호화의 성능 향상에 있어 가장 중요한 보조 정보의 효과적인 생성 방법을 제안한다. 우선 보조 정보 생성을 위한 키 프레임들 간의 블록 움직임 추정에 있어 기존 방법들이 대체적으로 가정하고 있는 선형적인 움직임 이동에 따른 잘못된 예측을 해결하기 위해 두 장 이상의 키 프레임을 사용하여 블록 움직임을 추정한 후, 선형 회귀(linear regression)를 이용하여 보조 정보 상의 블록 움직임 궤적을 추정한다. 이때 움직임 추정을 위한 키 프레임 번호를 증가하며 선입선출(FIFO)형 버퍼에 저장 및 삭제하여 동일한 보조정보에 해당하는 여러 움직임 벡터 필드와, 기존의 선형적인 움직임이 가정된 움직임 벡터 필드를 동시에 생성한다. 다음으로 보간(interpolation)하려는 보조 정보 프레임 내의 임의의 블록에 가장 가깝게 통과하는 움직임 벡터 필드를 선택하여 해당하는 블록의 최종 움직임 벡터로 선택한다. 실험결과 제안하는 보조 정보 생성 방법은 기존의 방법과 비교했을 때 비대칭성 움직임 벡터 사용만으로 평균 PSNR이 0.216dB 만큼 증가하는 것을 확인할 수 있었다.

  • PDF

비디오 데이터의 색인과 검색 (Indexing and Retrieving of Video Data)

  • 허진용;박동원;안성옥
    • 공학논문집
    • /
    • 제3권1호
    • /
    • pp.107-116
    • /
    • 1998
  • 본 논문의 목적은 초고속 정보 통신망의 Client/Server 환경에서 MPEG 동영상을 멀티미디어 데이터베이스 관리 시스템에 저장하여 실시간 검색하고 이를 복원할 수 있는 환경을 개발하는 데 있다. 본 논문에서는 멀티미디어 데이터 전송에 필수적인 ATM 통신 환경 구축 및 MPEG-2 동영상과 ATM 망과의 연계동작 시스템을 구축하고, MPEG-2 TS 데이터를 분석하여 동영상 검색에 필수적인 I-프레임 및 키 프레임 추출 방법을 개발한다. 또한 추출한 키 프레임에 대한 색인을 부여할 수 있는 색인 편집기 및 색인을 통해 검색을 수행하는 동영상 검색기를 개발하며, 키 프레임 및 이와 관련된 색인을 관리할 수 있는 멀티미디어 데이터베이스 스키마를 설계 및 구축한다.

  • PDF

MPEG-2 압축 동영상 정보 관리 시스템의 설계 및 구현 (Design and Implementation of MPEG-2 Compressed Video Information Management System)

  • 허진용;김인홍;배종민;강현석
    • 한국정보처리학회논문지
    • /
    • 제5권6호
    • /
    • pp.1431-1440
    • /
    • 1998
  • 동영상 정보는 자료의 양이 방대하고 다양하여 압축된 형태로 저장하고 검색하는 것이 매우 중요하다. 본 논문에서는 동영상 문서의 구조를 추출하고 동영상 스트림의 인데싱에 대한 의미를 부여할 수 있는 일반적인 데이터 모델을 제시하고, 이 모델을 이용하여 MPEG-2로 압축된 동영상 자료를 데이터베이스에 저장하고 검색하는 MPEG-2 압축 동영상 정보 관리 시스템(CVIMS, Compressed Video Information Management System)을 제안한다. CVIMS는 MPEG-2 파일에서 I-프레임들을 추출하고, 그 중에서 키 프레임(대표 이미지)을 선택한 후, 선택된 키 프레임에 대한 축소그림(thumbnail)과 캡션 및 그림 설명 정보를 데이터베이스에 저장한다. 그리고 데이터베이스에 저장된 MPEG-2 동영상을 질의어나 키 프레임을 통해 검색한다.

  • PDF