• 제목/요약/키워드: 대표 프레임

검색결과 462건 처리시간 0.026초

딥러닝 기반 비디오 프레임 보간 기술 연구 동향

  • 허진강;윤기환;김성제;정진우
    • 방송과미디어
    • /
    • 제27권2호
    • /
    • pp.51-61
    • /
    • 2022
  • 비디오 프레임 보간 기술은 연속되어 있는 두 개의 프레임 사이의 중간 프레임을 생성하는 기술로 비디오의 프레임율을 늘리거나 슬로우 모션 영상을 생성 시 사용된다. 최근 딥러닝 기술의 발전에 따라 다양한 알고리즘의 비디오 프레임 보간 기술이 연구되고 있다. 본 고에서는 이러한 기알고리즘들을 커널 기반 방식과 플로우 기반 방식으로 분류하고, 각 범주에 속하는 대표적인 알고리즘들의 특징 및 한계점에 대해 살펴본다.

동영상 컨텐츠의 메타데이타에 기반한 효율적인 브라우징 기법 (Efficient Browsing Method based on Metadata of Video Contents)

  • 천수덕;신정훈;이상준
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권5호
    • /
    • pp.513-518
    • /
    • 2010
  • 정보기술은 통신 및 멀티미디어 기술의 발전에 힘입어 빠르게 발전하고 있으며, 이에 따른 디지털 콘텐츠에 대한 수요가 증가하였다. 디지털 콘텐츠 중 비디오 콘텐츠는 VOD, NOD, 디지털 도서관, IPTV, UCC 등 다양한 응용 분야에서 점점 확산되고 있다. 비디오 데이터는 순차적인 특성이 있으며, 시간과 공간정보가 결합한 3차원 데이터로서 계산 비용이 많이 드는 작업이기 때문에 검색이나 브라우징이 어렵다. 본 논문에서는 비디오 데이터를 구조화하는 동영상 내용 편집 도구(ATVC: Authoring Tool for Video Contents)를 제안한다. 동영상 내용 편집 도구는 비주얼 리듬을 이용하여 비디오 데이터에서 대표 프레임을 추출한 다음 XML을 이용한 태그 및 키워드 정보를 대표 프레임에 삽입하는 도구(Tool)이다. 비주얼 리듬은 3차원의 시공간적인 정보를 2차원으로 매핑한 정보로 IDCT과정 없이 픽셀 정보를 얻을 수 있어 처리속도가 빠르며 컷, 와이프, 디졸브 등의 편집 효과를 효과적으로 구분할 수 있다. 그리고 XML 데이터에는 태그 및 키워드 정보와 함께 대표 프레임의 정보까지 저장되므로 효율적인 브라우징을 제공할 수 있다.

압축영역에서의 대표프레임 추출 및 영역분할기반 비디오 검색 기법 (Key Frame Extraction and Region Segmentation-based Video Retrieval in Compressed Domain)

  • 강응관;김성주;송호근;최종수
    • 한국통신학회논문지
    • /
    • 제24권9B호
    • /
    • pp.1713-1720
    • /
    • 1999
  • 본 논문에서는 동영상 압축 부호화에 대한 표준안인 MPEG 기반의 압축 비디오 시퀀스로부터 DCT DC 계수를 추출하고, 이들로 구성된 DC 이미지로부터 AHIM (Accumulative Histogram Intersection Measure)을 이용하여 장면 전환 검출을 수행한 후 대표 프레임을 추출하는 방법을 제시한다. 또한, 추출된 대표 프레임을 두 단계를 거쳐 데이터베이스의 색인 정보로 저장한 후, 입력되는 질의 영상에 대해 사용자가 원하는 검색 결과를 제시하는 방법에 대해 제안한다. 즉 전처리 과정으로 추출된 대표 프레임에 대해 영역 분할을 한 후, 첫 번째 단계에서 수평 투영된 결과를 히스토그램 분포 특성으로 변환시켜 데이터베이스의 색인 정보로 저장한다. 두 번째 단계에서는 영상의 모멘트 특성을 거리함수 값으로 변환시킨다. 실험 결과 제안된 방법이 검색에 있어 우수한 성능을 갖추고 또한 상당한 양의 처리 시간과 메모리 공간을 줄일 수 있음을 확인하였다. 향후 제안한 방법은 색상과 같은 다른 색인 정보와 결합할 경우, 보다 나은 영상 색인과 검색 수단을 제공할 것이다.

  • PDF

가변 전송 Frame 길이를 갖는 저 전송속도 VQ 음성부호화 알고리즘에 대한 연구 (A Low Rate VQ Speech Coding Algorithm with Variable Transmission Frame Length)

  • 좌정우;이성로;이황수
    • The Journal of the Acoustical Society of Korea
    • /
    • 제12권1E호
    • /
    • pp.32-38
    • /
    • 1993
  • 본 논문에서는 저 전송속도의 음성 부호화기를 제안하였고 컴퓨터 시뮬레이션을 통하여 성능분석과 유연성을 입증하였다. 제안된 부호화 방식은 입력 음성신호의 Stationarity에 따라 전송 프레임의 길이를 가변하고, 전송 프레임의 대표적인 특징 벡터를 Vector Quatization으로 부호화하였다. 제안된 부호화 방식에서 특징 벡터열은 입력 음성신호를 샘플단위로 Prewindowed RLS Lattice 알고리즘을 통해 구한 PARCOR 계수로 구성된다. 입력 음성신호는 Subsegment로 분할되고, 각 Subsegment에서 대표적인 PARCOR 계수를 구한다. Likelihood Ratio Distortion Measure를 사용하여 유사도에 따라 Subsegment를 병합함으로써 전송프레임을 결정한다. 컴퓨터 시뮬레이션 결과로부터 제안된 VTEL 음성 부호화 방식은 좋은 음질을 유지하면서 전체 전송속도를 크게 줄일 수 있다.

  • PDF

영상의 한국적 감성 형용사 추출 및 감성 컨텐츠 프레임 워크 설계 (Extract korean sensitivity adjective from image and Design for sensitivity contents framework)

  • 백성은;신성윤;이양원
    • 한국컴퓨터정보학회지
    • /
    • 제15권1호
    • /
    • pp.191-195
    • /
    • 2007
  • 본 논문에서는 영상으로부터 한국적 감성 데이터를 추출하고 감성 컨텐츠 프레임워크(ISC) 구축을 통해 영상데이터를 다양한 멀티미디어 데이터와 함께 사용자에게 전달하는 시스템을 제안한다. 이를 위해 먼저 영상으로부터 객체를 분리해내고 각각의 특징벡터 모델을 구축한다. 특징벡터모델은 요소인자로써 벡터공간의 데이터로 입력되고, 정규화 된 한국어 형용사 데이터와의 근접도를 비교하여 대표 감성을 표현하게 된다. 또한 감성 컨텐츠 데이터의 3층 구조를 이용하여 멀티미디어 데이터를 분류하고 대표 감성형용사와의 인자사상을 통하여 다양한 영상-감성 컨텐츠를 제공하는 프레임워크를 설계한다. 이것은 다양한 영상의 추상데이터에 대응한 감성표현을 추출하여 영상에 내포되어 있는 정확한 의미를 관찰자에게 전달할 수 있다.

  • PDF

다중성 인스턴스 추상화에 기반한 통신망 관리 시스템 설계 모델 형식론 (The Formalism of Design Model of Network Management System based on Multiplicity Instance Abstraction)

  • 박수현
    • 한국시뮬레이션학회:학술대회논문집
    • /
    • 한국시뮬레이션학회 1999년도 춘계학술대회 논문집
    • /
    • pp.11-19
    • /
    • 1999
  • Farmer 모델은 시스템 개체구조(System Entity Structure)의 개념을 도입한 지식표현을 위해 사용되는 프레임 구조모델로서 다중성 추상화 개념(Multiplicity Instance Concept)은 하나의 개체를 구성하기 위하여 동일한 형태의 구성요소가 여러 번 발생하는 경우에 이의 대표적인 요소만을 표시하는 추상화 개념이다. 다중성 추상화 개념에서 정의된 대표개체는 자신의 인스턴스들을 가질수 있다. 이들 인스턴스들은 IM-컴포넌트 타입 개체노드 및 OM-컴포넌트 타입 개체노드이며 다중성 인스턴스 링크를 이용하여 대표개체와 연결된다.

  • PDF

온라인마켓 와이어 프레임에 대한 주시빈도 분석 (Analysis of the Visual Trajectory for Wire Frame of Online Markets)

  • 하종수;반재훈
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2016년도 추계학술대회
    • /
    • pp.454-457
    • /
    • 2016
  • 본 연구는 온라인마켓을 효율적이고 경험 디자인(User Experience Design : UX 디자인)적 설계가 가능하도록 제작하기 위하여 와이어 프레임에 대한 사용자의 주시빈도를 분석한다. 국내 대표적인 온라인마켓의 와이어 프레임을 제작하여 각 사이트의 화면분할과 정보영역을 분석한다. 주시빈도 확인을 위해 시선추적 장치를 사용하고 시선이 머무는 히트맵을 제시한다. 이를 통해 온라인마켓의 디자인 설계시 화면에 보이는 요소들의 효율적 배치를 위한 프레임 레이아웃 영역을 살펴본다.

  • PDF

인접한 동영상 프레임의 차영상을 이용한 디스플레이 주변 조명효과의 제어 (An Ambient Light Control System using The Image Difference between Video Frames)

  • 신수철;한순흥
    • 한국시뮬레이션학회논문지
    • /
    • 제19권3호
    • /
    • pp.7-16
    • /
    • 2010
  • 본 논문은 비디오 및 게임 영상에서 인접한 프레임의 차영상을 이용하여 디스플레이 주변의 조명 장치를 제어하는 방법을 제안한다. 제안된 방법은 현재 프레임의 대표 색상을 추출하는 단계, 이전 프레임과의 차영상으로부터 변화량을 측정하고 변화 색상을 추출하는 단계, 새로운 대표 색상을 생성하는 단계의 세 단계로 구성된다. 변화량을 측정하기 위해 이미지를 사람 지각 시스템에 가까운 YUV 색공간으로 변환하고 차영상을 구한 후, 각 화소별 색차의 합을 변화량으로 사용하였다. 새로운 대표색상은 변화량에 비례하여 변화색상을 반영한다. 제안한 방법의 성능을 평가하기 위해 동일한 동영상에 대하여 시간에 따른 조명 효과의 변화 양상을 비교하였다. 실험 결과 기존 방법보다 더 역동적인 조명효과를 보이는 것을 확인하였다.

외국인 운동선수 특별귀화 관련 언론보도 프레임 분석 (An Analysis on the Media Reports Frames regarding Special Naturalization of Foreign Athletes)

  • 이장원;임승엽
    • 한국융합학회논문지
    • /
    • 제8권3호
    • /
    • pp.295-306
    • /
    • 2017
  • 본 연구는 외국인 운동선수 귀화 현상이 언론보도를 통해 형성되는 프레임을 분석하는 데 목적이 있었다. 이를 위하여 한국언론진흥재단 'Korea Integrated Database System'(KINDS, http://www.bigkinds.or.kr)을 활용하여 경향신문, 세계일보, 한겨레신문, 한국일보, MBC, SBS, YTN의 2014년부터 2016년까지 3년간 외국인 운동선수의 특별귀화와 관련된 보도 총 101건을 분석하였다. 연구 결과, 단순 사실보도 프레임에서는 특정 선수의 귀화사실, 경기 출전 및 입상 관련 정보가 전달되었고, 경제성 프레임의 경우 외국인 특별귀화로 얻을 수 있는 이익을 통해 귀화의 정당성이 뒷받침되고 있었다. 인간적 흥미 프레임에서는 외국인 귀화 선수들의 성장과 귀화 과정, 삶과 애로 등이 보도되었으며, 갈등 프레임의 경우 파란눈 국가대표들의 대표성 문제, 국내 선수육성의 인과성, 국내 프로리그 복귀로 인한 리그 규정의 혼성 등이 주로 보도되었다. 도덕성 책임귀인 프레임은 주로 2016년 첼시 리의 특별귀화 서류조작 사건을 통한 귀화선수의 도덕성과 법적 후속조치 등이 보도되었다.

효율적인 브라우징 환경을 위한 비디오 색인 (Video Indexing for Efficient Browsing Environment)

  • 고병철;이해성;변혜란
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권1호
    • /
    • pp.74-83
    • /
    • 2000
  • 최근 멀티미디어에 대한 관심이 증가하면서 그에 따른 기술 또한 매우 빠른 속도로 증가하고 있다. 특히 비디오 영상 검색 기능에 대한 사용자들의 욕구는 비디오에 대한 수동적인 접근 방식에서, 자신이 원하는 부분만을 선택적으로 검색할 수 있는 보다 편리한 환경을 요구하고 있다. 이를 위해서는 대용량의 비디오 데이타를 의미 있는 단위로 나누기 위한 비디오 파싱(Parsing)과 클러스터링(Clustering), 브라우징(Browsing)등을 포함하는 비디오 인덱싱 시스템의 구현이 필요하다. 본 논문에서는 우선 비디오 시퀀스를 히스토그램과 화소단위 비교법을 혼합한 하이브리드 방법을 통해서 자동 인덱싱을 위한 기본 단위인 샷(shot)으로 나눈다. 비디오 분할 후에 각 샷들로부터 대표 프레임을 검출한다. 대표 프레임은 사용자로 하여금 비디오의 전체적인 내용을 이해할 수 있도록 도와줌으로써 그 중요성이 크다고 할 수 있다. 따라서 본 논문에서는 웨이블릿 변환을 이용하여 우선적으로 샷 내에 포함된 카메라의 움직임을 분석하고, 각 프레임들의 변화량을 측정하여 샷의 복잡성에 따라 각기 다른 수의 대표 프레임을 선출하도록 하였다. 마지막으로 카메라 움직임중 패닝, 혹은 틸팅이 포함된 샷에 대해서 파노라마 영상을 합성함으로써 사용자에게 보다 편리하고 이해하기 쉬운 브라우징 환경을 제공할 수 있도록 하였다.

  • PDF