• 제목/요약/키워드: Video representation

검색결과 194건 처리시간 0.021초

MPEG-7을 기반으로 한 뉴스 동영상 스키마 및 샷 종류별 키프레임을 이용한 요약 생성 방법 (A Scheme for News Videos based on MPEG-7 and Its Summarization Mechanism by using the Key-Frames of Selected Shot Types)

  • 정진국;심진선;낭종호;김경수;하명환;정병희
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제8권5호
    • /
    • pp.530-539
    • /
    • 2002
  • 최근 정형화된 구조를 갖는 뉴스 동영상 비디오에 대한 아카이브 시스템을 구축하기 위한 많은 연구가 진행되어 왔다. 그러나 기존의 시스템에서는 기사에 대한 메타 데이타를 저장하는 방법이 서로 다르기 때문에 이런 데이타 사이의 호환성이 없다는 문제점을 가지고 있다. 본 논문에서는 이런 문제점을 해결하기 위하여 멀티미디어 내용 정보를 표현하기 위한 표준인 MPEC-7 MDS에 바탕을 둔 뉴스 동영상 스키마를 제안하였으며, 또한 기사를 이루는 각 샷들의 특징을 반영한 기사 요약 방법을 설계하고 구현하였다. 본 논문에서 제안한 뉴스 동영상을 위한 스키마는 뉴스 구조의 특성을 반영하여 MPEG-7 MDS의 VideoSegment, TextAnnotation 등과 같은 스키마를 이용하여 설계하였고, 요약 방법에서는 요약 비디오 데이타의 크기를 줄이기 위하여 샷들의 키프레임들만을 해당 오디오와 함께 상영하는 슬라이스 쇼 방법을 사용하였다.

Post-Processing for JPEG-Coded Image Deblocking via Sparse Representation and Adaptive Residual Threshold

  • Wang, Liping;Zhou, Xiao;Wang, Chengyou;Jiang, Baochen
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권3호
    • /
    • pp.1700-1721
    • /
    • 2017
  • The problem of blocking artifacts is very common in block-based image and video compression, especially at very low bit rates. In this paper, we propose a post-processing method for JPEG-coded image deblocking via sparse representation and adaptive residual threshold. This method includes three steps. First, we obtain the dictionary by online dictionary learning and the compressed images. The dictionary is then modified by the histogram of oriented gradient (HOG) feature descriptor and K-means cluster. Second, an adaptive residual threshold for orthogonal matching pursuit (OMP) is proposed and used for sparse coding by combining blind image blocking assessment. At last, to take advantage of human visual system (HVS), the edge regions of the obtained deblocked image can be further modified by the edge regions of the compressed image. The experimental results show that our proposed method can keep the image more texture and edge information while reducing the image blocking artifacts.

Person Re-identification using Sparse Representation with a Saliency-weighted Dictionary

  • Kim, Miri;Jang, Jinbeum;Paik, Joonki
    • IEIE Transactions on Smart Processing and Computing
    • /
    • 제6권4호
    • /
    • pp.262-268
    • /
    • 2017
  • Intelligent video surveillance systems have been developed to monitor global areas and find specific target objects using a large-scale database. However, person re-identification presents some challenges, such as pose change and occlusions. To solve the problems, this paper presents an improved person re-identification method using sparse representation and saliency-based dictionary construction. The proposed method consists of three parts: i) feature description based on salient colors and textures for dictionary elements, ii) orthogonal atom selection using cosine similarity to deal with pose and viewpoint change, and iii) measurement of reconstruction error to rank the gallery corresponding a probe object. The proposed method provides good performance, since robust descriptors used as a dictionary atom are generated by weighting some salient features, and dictionary atoms are selected by reducing excessive redundancy causing low accuracy. Therefore, the proposed method can be applied in a large scale-database surveillance system to search for a specific object.

A robust Correlation Filter based tracker with rich representation and a relocation component

  • Jin, Menglei;Liu, Weibin;Xing, Weiwei
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권10호
    • /
    • pp.5161-5178
    • /
    • 2019
  • Correlation Filter was recently demonstrated to have good characteristics in the field of video object tracking. The advantages of Correlation Filter based trackers are reflected in the high accuracy and robustness it provides while maintaining a high speed. However, there are still some necessary improvements that should be made. First, most trackers cannot handle multi-scale problems. To solve this problem, our algorithm combines position estimation with scale estimation. The difference from the traditional method in regard to the scale estimation is that, the proposed method can track the scale of the object more quickly and effective. Additionally, in the feature extraction module, the feature representation of traditional algorithms is relatively simple, and furthermore, the tracking performance is easily affected in complex scenarios. In this paper, we design a novel and powerful feature that can significantly improve the tracking performance. Finally, traditional trackers often suffer from model drift, which is caused by occlusion and other complex scenarios. We introduce a relocation component to detect object at other locations such as the secondary peak of the response map. It partly alleviates the model drift problem.

Dumb Ways to Die에서 재현된 행위소의 의미해석작용 분석 - A.J . 그레마스의 기호학을 중심으로 (Analysis on Signification of Actant for Representation in Dumb Ways to Die - as the Centre Semiotic Analysis of A. J. Greimas)

  • 권상우
    • 한국멀티미디어학회논문지
    • /
    • 제19권6호
    • /
    • pp.1095-1105
    • /
    • 2016
  • This study is semiotic analysis about 'dumb ways to die' that is produced by Melbourne Railway of Australia in 2012. By analyzing the symbolic representations through 'Actants model' of A.J. Greimas, extract the relationship between signification of the represented object in 'dumb ways to die'. Greimas' model helps to analyze the semiotic interpretation action that occurs above a layer of discourse. In addition, this study is to compare the property to distinguish the Semiotic 'Actants' to cause the behavior of the recipient by represented in the same ideological situation. This can determine the properties of the signification and gauge the level of symbolic images that are reproduced in the discourse process. Accordingly, guidance to become a developer by extracting the reproduction principle of the video that causes a user's action.

컷 검출을 위한 블록별 히스토그램 비교에 관한 연구 (A Study on block histogram's comparison for cut detection)

  • 고석만;김형균;오무송
    • 한국정보통신학회논문지
    • /
    • 제5권7호
    • /
    • pp.1301-1307
    • /
    • 2001
  • 동영상 검색 시스템에서는 사용자가 전체 동영상 정보를 한눈에 파악하고, 필요한 경우 동영상의 원하는 지점부터 직접 재생할 수 있도록 하기 위하여 전체 동영상의 내용을 요약해 놓은 대표 프레임 리스트를 제공하며 대표 프레임 리스트를 작성하기 위하여 장면전환을 정확하게 검출할 필요성이 발생한다. 본 논문에서는 장면전환 지점을 추출하기 위하여 프레임을 일정한 블록으로 분할하고 다음 프레임의 동일 블록에서의 히스토그램 값을 비교하여 임계값을 넘지 못하면 다음 프레임을 컷으로 추출하였다.

  • PDF

3D 애니메이션의 배경 표현에 관한 분석 (Analysis on the Backgrounds Expression for 3D Animation)

  • 박성대;정예지;김치용
    • 한국멀티미디어학회논문지
    • /
    • 제18권2호
    • /
    • pp.268-276
    • /
    • 2015
  • This article analyzes the background representation of 3D animation and look at what its proper background expression. With the development of computer graphics technology, the background of the 3D animations can be expressed as The actual background. In contrast, "The Smurfs" which was released recently was created to take the actual background. However, 3D animation with real background is not appropriate in terms of creative expression space in the main role of the animation. In this Study, we analyze the character and background of the animation made in 3D graphics. Based on this, we propose a correct representation of 3D animation background.

Exploiting Chaotic Feature Vector for Dynamic Textures Recognition

  • Wang, Yong;Hu, Shiqiang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제8권11호
    • /
    • pp.4137-4152
    • /
    • 2014
  • This paper investigates the description ability of chaotic feature vector to dynamic textures. First a chaotic feature and other features are calculated from each pixel intensity series. Then these features are combined to a chaotic feature vector. Therefore a video is modeled as a feature vector matrix. Next by the aid of bag of words framework, we explore the representation ability of the proposed chaotic feature vector. Finally we investigate recognition rate between different combinations of chaotic features. Experimental results show the merit of chaotic feature vector for pixel intensity series representation.

압축 영역에서의 양방향 예측 구조를 이용한 움직임 흐름 분석 (Motion Flow Analysis using Bi-directional Prediction-Independent Framework in MPEG Compressed Domain)

  • 김낙우;김태용;최종수
    • 대한전자공학회논문지SP
    • /
    • 제41권5호
    • /
    • pp.13-22
    • /
    • 2004
  • 비디오 시퀀스는 일반적으로 다양한 움직임을 가지는 객체들로 구성되어 있기 때문에, 움직임 특징은 비디오 검색 등에서 매우 중요한 역할을 한다. 본 논문에서는 MPEG 압축 영상에서의 움직임 벡터를 비디오 영상의 움직임 표현 서술자로 활용하는 새로운 방법이 제안된다. 즉, 압축 영상에서의 다양한 움직임 벡터를 프레임이나 매크로블록 예측 구조에 관계없이 단일 움직임 방향만을 갖도록 하여, 이것을 해당 영상의 서술자로 활용한다. 이를 위하여, 본 논문에서는 양방향 예측 구조를 이용한 벡터 재해석 기법을 제안한다. 보통, 압축 영역에서의 각 프레임 움직임 해석 시, 움직임 벡터가 없는 I 프레임과 그 외 프레임들의 직접 비교는 불가능하지만, 제안 기법은 1, B, p 프레임 등의 모든 프레임에서 동등하게 벡터 해석을 할 수 있게 한다. 제안된 알고리즘은 압축 영상의 전체 복원과정 없이 매크로 블록 영역 상에서 처리함으로써 시간 손실을 줄이고 있으며, 실험 결과는 제안된 방법의 높은 성능을 잘 나타내어 주고 있다.

MPEG Immersive Video를 위한 그룹 기반 적응적 스트리밍 (Towards Group-based Adaptive Streaming for MPEG Immersive Video)

  • 정종범;이순빈;최재열;이광순;곽상운;정원식;이봉호;류은석
    • 방송공학회논문지
    • /
    • 제28권2호
    • /
    • pp.194-212
    • /
    • 2023
  • 다수의 색상 및 거리 순서쌍으로 구성된 몰입형 영상 압축을 위한 MPEG immersive video (MIV) 표준은 시점 간 중복 영역 제거 후 잔여 영상을 병합하여 높은 압축률을 확보하였다. 비슷한 영역을 표현하는 시점 간 그룹화를 통해 품질 향상 및 선택적 스트리밍 구현이 가능하나, 최근 그룹 기반 MIV 부호화 기술은 활발히 논의되고 있지 않다. 본 논문은 최신 MIV 참조 소프트웨어에서 그룹 기반 부호화 기술을 이식하고, 최적의 그룹 별 시점 및 영상 개수 산출을 위한 실험을 진행하였으며, 출력 영상 내 잔여 영상의 비율을 기반으로 전역적 영상 표현을 위한 최적의 출력 영상 수를 결정하는 기법을 제안한다.