• 제목/요약/키워드: 비디오 데이터의 표현

Search Result 158, Processing Time 0.033 seconds

Video Classification System Based on Similarity Representation Among Sequential Data (순차 데이터간의 유사도 표현에 의한 동영상 분류)

  • Lee, Hosuk;Yang, Jihoon
    • KIPS Transactions on Computer and Communication Systems
    • /
    • v.7 no.1
    • /
    • pp.1-8
    • /
    • 2018
  • It is not easy to learn simple expressions of moving picture data since it contains noise and a lot of information in addition to time-based information. In this study, we propose a similarity representation method and a deep learning method between sequential data which can express such video data abstractly and simpler. This is to learn and obtain a function that allow them to have maximum information when interpreting the degree of similarity between image data vectors constituting a moving picture. Through the actual data, it is confirmed that the proposed method shows better classification performance than the existing moving image classification methods.

Implementation of Validation Scheme in SMIL Authoring Tool (SMIL 저작도구의 검증 스킴 구현)

  • 김경일;김태현;이승원;정병달;이영진;이규철
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2000.04a
    • /
    • pp.441-444
    • /
    • 2000
  • Web의 등장은 텍스트위주의 단순한 미디어의 정보를 이미지, 오디오 , 비디오등의 멀티미디어 데이터로 변화시켰다. 여기에 한걸음 더 나아가 여러 종류의 미디어를 통합하여 표현하기 위한 요구가 확산되어 1998년에는 SMIL 이라는 멀티미디어 데이터를 통합하여 표현하기 위한 동기화 언어가 표준으로 채택되었다. 본 논문에서는 SMIL을 사용한 멀티미디어 동기화 문서를 기술함에 있어서 발생할 수 있는 다양한 오류에 대한 분류를 보여주며, 이러한 오류들을 검사하고, 제거할수 있는 SMIL 저작도구의 검증 스킴 개발에 대해서 기술하였다.

  • PDF

Efficient Data Compression and Decompression of Stereo Video by using Interative 2D Warping (반복적 2D 워핑을 이용한 효율적인 스테레오 비디오 데이터 압축 및 복원)

  • Park, Il-Kwon;Hye, Ran-Byun
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2008.11a
    • /
    • pp.117-120
    • /
    • 2008
  • 본 논문은 스테레오 비디오 데이터 압축 및 복원을 위한 그리드(Grid) 기반 2D 워핑 방법을 제안한다. 스테레오 비디오에 대한 데이터 표현 방법으로 깊이지도 및 매쉬(mesh)를 이용한 방법이 주로 사용되어 왔으며 매쉬를 이용한 방법은 두 영상간의 매칭되는 노드를 이용하여 데이터 압축 효율을 높일 수 있다. 그러나, 두 영상에서 매칭되는 노드의 위치를 찾는 것은 매우 어려운 일일 뿐만 아니라 매쉬에 의해서 워핑된 영상과 목적이 되는 스테레오 영상의 좌측 또는 우측 영상간의 왜곡이 불가피하다. 따라서 이러한 왜곡을 보정하기 위하여 잔여영상(Residual image) 정보를 추가로 요구하게 된다.제안된 논문은 이러한 잔여영상 정보를 최소화 하기 위하여 반복적으로 2D워핑을 수행하며 최적화된 워핑 영상을 생성함으로써 목적영상과의 오차를 최소로 유지하여 추가정보인 잔여 영상의 데이터 용량을 최소화 한다. 전체영상에 대하여 2D워핑을 수행하며 각각의 노드를 변경하는 것은 많은 비용을 감수해야 하기 때문에 오차영역에 대하여 지역단위로 분할하고 단계적으로 최적화를 이루는 분할정복 방법을 사용하였다. 본 논문의 실험에서는 스테레오 영상에 대하여 각각의 신호대 잡음비(PSNR)를 통해 제안한 방법의 품질을 평가하였을 뿐만 아니라 기존의 메쉬 기반한 방법과 깊이지도를 이용한 방법과의 데이터량을 비교하였다. 실험결과를 통하여 제안한 방법의 데이터 압축의 효율성 및 품질의 우수성을 확인하였다.

  • PDF

BoF based Action Recognition using Spatio-Temporal 2D Descriptor (시공간 2D 특징 설명자를 사용한 BOF 방식의 동작인식)

  • KIM, JinOk
    • Journal of Internet Computing and Services
    • /
    • v.16 no.3
    • /
    • pp.21-32
    • /
    • 2015
  • Since spatio-temporal local features for video representation have become an important issue of modeless bottom-up approaches in action recognition, various methods for feature extraction and description have been proposed in many papers. In particular, BoF(bag of features) has been promised coherent recognition results. The most important part for BoF is how to represent dynamic information of actions in videos. Most of existing BoF methods consider the video as a spatio-temporal volume and describe neighboring 3D interest points as complex volumetric patches. To simplify these complex 3D methods, this paper proposes a novel method that builds BoF representation as a way to learn 2D interest points directly from video data. The basic idea of proposed method is to gather feature points not only from 2D xy spatial planes of traditional frames, but from the 2D time axis called spatio-temporal frame as well. Such spatial-temporal features are able to capture dynamic information from the action videos and are well-suited to recognize human actions without need of 3D extensions for the feature descriptors. The spatio-temporal BoF approach using SIFT and SURF feature descriptors obtains good recognition rates on a well-known actions recognition dataset. Compared with more sophisticated scheme of 3D based HoG/HoF descriptors, proposed method is easier to compute and simpler to understand.

A Proposal of Multimedia Retrieval System and XML Meta-data Modeling Techniques (XML 메타데이터 모델링기법과 멀티미디어 검색시스템의 제안)

  • 윤미희;조동욱
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2003.05a
    • /
    • pp.393-398
    • /
    • 2003
  • Video which contains the multiple data such as text, images, audio and motion of objects is typical multimedia data. Multimedia retrieval system using XML is essential for efficient rep. of multimedia data. Therefore, multimedia retrieval system for retrieval and structural understanding is needed to retrieve the multimedia data. This Paper Proposes the multimedia retrieval system based on XML Meta-data modeling techniques.

  • PDF

Digital Video Post-production Process with Synchronous FX System on Audio and Video (영상/음향 동시 FX 시스템을 이용한 포스트프로덕션 과정에서의 디지털 영상표현)

  • Jeong Min-Chan
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2005.11a
    • /
    • pp.453-455
    • /
    • 2005
  • This paper suggests a technically advanced way of associating video with audio artistically, the synchronous FX system using its digital data information. And usages of this system are described with introducing processes to extract useful informations from digital audio/video data and methods for sharing these informations with other media.

  • PDF

A Study on Design of Multimedia Retrieval System based on XML (XML 기반 멀티미디어 검색시스템의 설계에 관한 연구)

  • Yoon, Mi-Hee;Cho, Dong-Uk
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.05a
    • /
    • pp.103-106
    • /
    • 2003
  • 비디오는 멀티미디어 데이터의 가장 대표적인 형태로, 텍스트나, 이미지. 오디오와 객체의 움직임 같은 풍부한 정보를 담고 있다. 비정형의 멀티미디어 데이터를 다양하고 효율적으로 표현하기 위해서는 XML(extensible Markup Language)을 사용하여 저장하고 검색하는 멀티미디어 검색시스템이 필수적이다. 그러므로 멀티미디어 데이터에 대한 검색을 위해서는 멀티미디어 데이터의 내용을 구조적으로 설명하는 메타데이터가 필요하고 이 메타데이터를 XML을 사용하여 표현하며 저장하고 검색하기 위한 멀티미디어 검색시스템이 요구된다. 본 논문에서는 XML 메타데이터 모델링 기법과 이 모델링 기법을 기반으로 한 멀티미디어 검색시스템을 제안한다.

  • PDF

Design and Implementation of Multimedia Data Retrieval System using Image Caption Information (영상 캡션 정보를 이용한 멀티미디어 데이터 검색 시스템의 설계 및 구현)

  • 이현창;배상현
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.8 no.3
    • /
    • pp.630-636
    • /
    • 2004
  • According to the increase of audio and video data utilization, the presentation of multimedia data contents and the work of retrieving, storing and manipulating a multimedia data have been the focus of recent work. The display for multimedia data should retrieve and access the contents easily that users want to present. This study is about the design and implementation of a system to retrieve multimedia data based on the contents of documentation or the caption information of a multimedia data for retrieving documentation including multimedia data. It intends to develop an filtering step to retrieve all of keyword within the caption information of multimedia data and text of a documentation. Also, the system is designed to retrieve a large amount of data quickly using an inverted file structure available for B+ tree.

Interactive System for Efficient Video Cartooning (효율적인 비디오 카투닝을 위한 인터랙티브 시스템)

  • Hong, Sung-Soo;Yoon, Jong-Chul;Lee, In-Kwon
    • 한국HCI학회:학술대회논문집
    • /
    • 2006.02a
    • /
    • pp.859-864
    • /
    • 2006
  • Mean shift 는 데이터의 특징을 잘 살려내는 None-parametric 방법으로, 특히 영상처리분야에서 많은 각광을 받아왔다. 하지만 좋은 결과를 보장하는 뛰어난 성능에도 불구하고, 높은 메모리소요와 긴 처리시간에 기인하여, 비디오처리 등의 분야에 적용하기엔 현실적인 제약점이 있다. 상기한 제약점을 극복하기 위해, 본 시스템은 비디오를 분석하여 전경과 후경으로 나눈다. 본 논문은 전경으로 분류된 부분에 대해 각 분리된 개체를구분하고, 좌표변환(coordinate shift)을 실행하여 연산을 할 비디오의 연산의 규모를 줄이는 방법론을 제시한다. 이러한 처리로 매우 많은 처리시간이 단축됨을 실험을 통해 알 수 있었다. 다음으로, 나뉘어진 전경에 3D mean shift를 적용하여 생성된 결과물에 대하여 3D cluster data structure 를 생성하고, 이를 이동하여 인터랙티브 에디팅이 가능하도록 하였다. 후경으로 나뉜 데이터는 이미지 한 장으로 축약이 되며, 2D mean shift 기반의 interactive cartooning system 을 통하여 만화화가 된다. 본 논문은 만화 특유의 단순한 톤을 표현하기 위해, 세밀한 분할이 필요한 부분과 그렇지 않은 부분을 따로 구분하여 처리하는 레이어처리방법을 제안한다. 위의 과정을 여러 실사이미지에 적용, 실험해본 결과 기존의 연구결과에 비해 매우 짧은 시간 내에 대상의 특징이 잘 나타낸 양질의 결과물이 생성되었다. 이러한 결과물은 출판, 영상편집분야 등 여러 분야에서 요긴하고 간편하게 사용될 수 있을 것으로 생각된다.

  • PDF

Automated Video Clip Creation Using Time-based Social Bookmark Clustering (소셜 북마크의 시간 정보 클러스터링을 이용한 비디오 클립 생성 자동화)

  • Han, Sung-Hee;Lee, Jae-Ho;Kang, Dae-Kap
    • Journal of Broadcast Engineering
    • /
    • v.15 no.1
    • /
    • pp.144-147
    • /
    • 2010
  • Recently the change of content consumption trend activated the social video sharing platform and the video clip itself. There have been intensive interests and efforts to automatically abstract compact and meaningful video clips. In this paper, we propose a method which use the clustering of the bookmark data created by collective intelligence instead of using the video content analysis. The partitional clustering of points in 2-dimensional space derived from the bookmark data make it possible to abstract highlights effectively. The method is enhanced by the 1-dimensional accumulated bookmark count graph. Experiments on the real data from KBS internet service show the effectiveness of the proposed method.