• 제목/요약/키워드: video information extraction

검색결과 345건 처리시간 0.031초

Fast Extraction of Objects of Interest from Images with Low Depth of Field

  • Kim, Chang-Ick;Park, Jung-Woo;Lee, Jae-Ho;Hwang, Jenq-Neng
    • ETRI Journal
    • /
    • 제29권3호
    • /
    • pp.353-362
    • /
    • 2007
  • In this paper, we propose a novel unsupervised video object extraction algorithm for individual images or image sequences with low depth of field (DOF). Low DOF is a popular photographic technique which enables the representation of the photographer's intention by giving a clear focus only on an object of interest (OOI). We first describe a fast and efficient scheme for extracting OOIs from individual low-DOF images and then extend it to deal with image sequences with low DOF in the next part. The basic algorithm unfolds into three modules. In the first module, a higher-order statistics map, which represents the spatial distribution of the high-frequency components, is obtained from an input low-DOF image. The second module locates the block-based OOI for further processing. Using the block-based OOI, the final OOI is obtained with pixel-level accuracy. We also present an algorithm to extend the extraction scheme to image sequences with low DOF. The proposed system does not require any user assistance to determine the initial OOI. This is possible due to the use of low-DOF images. The experimental results indicate that the proposed algorithm can serve as an effective tool for applications, such as 2D to 3D and photo-realistic video scene generation.

  • PDF

해리스 코너 검출기를 이용한 비디오 자막 영역 추출 (Text Region Extraction from Videos using the Harris Corner Detector)

  • 김원준;김창익
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권7호
    • /
    • pp.646-654
    • /
    • 2007
  • 최근 많은 TV 영상에서 시청자의 시각적 편의와 이해를 고려하여 자막을 삽입하는 경우가 늘어나고 있다. 본 논문에서는 자막을 비디오 내 하단부에 위치하는 인위적으로 추가된 글자 영역으로 정의한다. 이러한 자막 영역의 추출은 비디오 정보 검색(video information retrieval)이나 비디오 색인(video indexing)과 같은 응용에서 글자 추출을 위한 첫 단계로 널리 쓰인다. 기존의 자막 영역 추출은 자막의 색, 자막과 배경의 자기 대비, 에지(edge), 글자 필터 등을 이용한 방법을 사용하였다. 그러나 비디오 영상내 자막이 갖는 낮은 해상도와 복잡한 배경으로 인해 자막 추출에 어려움이 있다. 이에 본 논문은 코너검출기(corner detector)를 이용한 효율적인 비디오 자막 영역 추출 방법을 제안하고자 한다. 제안하는 알고리즘은 해리스 코너 검출기를 이용한 코너 맵 생성, 코너 밀도를 이용한 자막 영역 후보군 추출, 레이블링(labeling)을 이용한 최종 자막 영역 결정, 노이즈(noise) 제거 및 영역 채우기의 네 단계로 구성된다. 제안하는 알고리즘은 색 정보를 이용하지 않기 때문에 여러 가지 색으로 표현되는 자막 영역 추출에 적용가능하며 글자 모양이 아닌 글자의 코너를 이용하기 때문에 언어의 종류에 관계없이 사용 될 수 있다. 또한 프레임간 자막 영역 업데이트를 통해 자막 영역 추출의 효율을 높였다. 다양한 영상에 대한 실험을 통해 제안하는 알고리즘이 효율적인 비디오 자막 영역 추출 방법임을 보이고자 한다.

An Efficient Video Retrieval Algorithm Using Luminance Projection

  • Kim, Sang-Hyun
    • Journal of the Korean Data and Information Science Society
    • /
    • 제15권4호
    • /
    • pp.891-898
    • /
    • 2004
  • An effective video indexing is required to manipulate large video databases. Most algorithms for video indexing have been commonly used histograms, edges, or motion features. In this paper, we propose an efficient algorithm using the luminance projection for video retrieval. To effectively index the video sequences and to reduce the computational complexity, we use the key frames extracted by the cumulative measure, and compare the set of key frames using the modified Hausdorff distance. Experimental results show that the proposed video indexing and video retrieval algorithm yields the higher accuracy and performance than the conventional algorithm.

  • PDF

은닉 마르코브 모델을 이용한 비디오 요약 시스템 (Video Summarization Using Hidden Markov Model)

  • 박호식;배철수
    • 한국정보통신학회논문지
    • /
    • 제8권6호
    • /
    • pp.1175-1181
    • /
    • 2004
  • 본 논문에서는 비디오 검색을 위한 비디오 사진 분류 시스템을 제안하였다. 제안된 시스템은 3개의 모듈인 특징 추출, 은닉 마르코브 모델 생성, 그리고 비디오 사진 분류로 구성되어 있다. 같은 등급에 속한 비디오 화면들이 반드시 유사하지 않으므로 견실한 Hidden Markov Model을 구성하기 위해서 는 충분한 학습이 필요하였다. 제안된 시스템은 텔레비전 야구 중계 방송의 비디오 화면을 15가지 등급으로 분류하여 분석 및 하는 실험을 한 결과 평균 84.72%의 인식률을 얻을 수 있었다.

사용자 시점 기반 360 영상을 위한 렌더러 구현 (Implementing Renderer for Viewport Dependent 360 Video)

  • 장동민;손장우;정종범;류은석
    • 방송공학회논문지
    • /
    • 제23권6호
    • /
    • pp.747-759
    • /
    • 2018
  • 본 논문에서는 실시간 고화질 360 영상 전송을 위해 사용자 시점에 기반한 타일 분할 기법을 적용하고 화질 평가를 위해 360 영상을 가상현실 기기 화면에 표현하는 구현을 설명한다. 사용자 시점에 기반한 고화질 360 영상 전송을 위한 방안으로, 움직임 참조 문제를 해결하기 위한 MCTS (Motion Constrained Tile Sets) 기술과 미리 구성된 타일 정보들을 포함하는 EIS (Extraction Information Sets) SEI (Supplemental Enhancement Information), 타일 정보를 추출해내고 영상을 분할 및 추출해주는 추출기(extractor)를 구현한다. 또한 사용자 시점에 기반한 타일 추출 방법과 추출된 영상을 이용해 가상현실 기기 화면에 표현하는 방법에 대한 구현 내용을 설명한다. 따라서, 제안된 구현물을 기반으로 영상 전송을 수행하면, 사용자 시점 영역의 영상만 전송하여 불필요한 영상 전송을 하지않게 되어 화질 대비 낮은 대역폭의 향상된 영상을 표현할 수 있다.

웹 페이지 구조 분석을 통한 효과적인 동영상 검색용 키워드 추출 방법 (An Effective Keyword Extraction Method Based on Web Page Structure Analysis for Video Retrieval in WWW)

  • 이종원;최기석;장주연;낭종호
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제35권3호
    • /
    • pp.103-110
    • /
    • 2008
  • 본 논문에서는 웹 동영상 페이지의 구조를 바탕으로 하여, 웹 동영상의 관리 및 검색을 위한 주석용 키워드를 자동 추출하는 방법을 제안한다. 제안 방법은 웹 동영상 페이지의 구조를 포함된 동영상의 개수와 주변 텍스트 구성의 복잡도를 기준으로 4가지 타입으로 구분하고, 타입 별로 키워드를 추출하는 방법을 달리한다. 1,087개의 웹 동영상 페이지(2,462개의 동영상)를 바탕으로 실험한 결과에 의하면 본 논문에서 제안하는 방법은 기존 웹 이미지 검색 시스템을 위한 추출 방법보다 재현율 면에서 18%의 성능 향상을 보였다. 따라서 논문에서 제안하는 방법은 일반적인 웹 동영상 검색 시스템을 위한 키워드 추출에 널리 적용 될 수 있다.

동영상에서 배경프레임을 이용한 차량 프레임 검출 (Car Frame Extraction using Background Frame in Video)

  • 남석우;오해석
    • 정보처리학회논문지B
    • /
    • 제10B권6호
    • /
    • pp.705-710
    • /
    • 2003
  • 본 연구는 동영상으로부터 내용기반 검색을 위하여 동영상의 연속된 프레임간의 영상의 내용 변화를 찾아내어 프레임의 시간정보와 번호판 프레임 영상을 통하여 얻어진 정보를 데이터베이스화하여 검색하는 시스템을 제안한다. 얻어진 동영상을 배경프레임과 처리프레임의 비교영역의 영상의 특징정보를 비교하여 원하는 프레임을 찾는다. 차량의 통과 시간과 차량의 번호판 프레임을 자동으로 추출하여 동영상을 내용과 함께 저장하여 원하는 차량의 동영상 부분을 보여주는 웹에서의 검색시스템이다. 이는 교통정보를 구축 동영상이 포함하고 있는 내용 즉 통과 차량의 정보를 제공할 수 있게 된다.

A network-adaptive SVC Streaming Architecture

  • ;임정연;이범식;김문철;함상진;김병선;이근식;박근수
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2006년도 학술대회
    • /
    • pp.257-260
    • /
    • 2006
  • In Video streaming environment, we must consider terminal and network characteristics, such as display resolution, frame rate, computational resource, network bandwidth, etc. The JVT (Joint Video Team) by ISO/IEC MPEG and ITU-TVCEG is currently standardizing Scalable Video Coding (SVC). This can represent video bitstreams in different sealable layers for flexible adaptation to terminal and network characteristics. This characteristic is very useful in video streaming applications. One fully scalable video can be extracted with specific target spatial resolution, temporal frame rate and quality level to match the requirements of terminals and networks. Besides, the extraction process is fast and consumes little computational resource, so it is possible to extract the partial video bitstream online to accommodate with changing network conditions etc. With all the advantages of SVC, we design and implement a network-adaptive SVC streaming system with an SVC extractor and a streamer to extract appropriate amounts of bitstreams to meet the required target bitrates and spatial resolutions. The proposed SVC extraction is designed to allow for flexible switching from layer to layer in SVC bitstreams online to cope with the change in network bandwidth. The extraction is made in every GOP unit. We present the implementation of our SVC streaming system with experimental results.

  • PDF

Implementation and Evaluation of Harmful-Media Filtering Techniques using Multimodal-Information Extraction

  • Yeon-Ji, Lee;Ye-Sol, Oh;Na-Eun, Park;Il-Gu, Lee
    • Journal of information and communication convergence engineering
    • /
    • 제21권1호
    • /
    • pp.75-81
    • /
    • 2023
  • Video platforms, including YouTube, have a structure in which the number of video views is directly related to the publisher's profits. Therefore, video publishers induce viewers by using provocative titles and thumbnails to garner more views. The conventional technique used to limit such harmful videos has low detection accuracy and relies on follow-up measures based on user reports. To address these problems, this study proposes a technique to improve the accuracy of filtering harmful media using thumbnails, titles, and audio data from videos. This study analyzed these three pieces of multimodal information; if the number of harmful determinations was greater than the set threshold, the video was deemed to be harmful, and its upload was restricted. The experimental results showed that the proposed multimodal information extraction technique used for harmfulvideo filtering achieved a 9% better performance than YouTube's Restricted Mode with regard to detection accuracy and a 41% better performance than the YouTube automation system.

벡터 미디언을 이용한 비디오 영상의 온라인 배경 추출 (On-line Background Extraction in Video Image Using Vector Median)

  • 김준철;박은종;이준환
    • 정보처리학회논문지B
    • /
    • 제13B권5호
    • /
    • pp.515-524
    • /
    • 2006
  • 배경추출은 비디오 감시 시스템에서 움직이는 물체를 찾는데 중요한 기술이다. 본 논문에서는 벡터 정렬을 이용한 새로운 온라인 컬러 배경 추출 방법을 제안한다. 제안된 방법에서 배경은 물체보다 발생빈도가 높다는 사실을 이용하여, 연속된 프레임의 컬러화소 값들의 벡터 미디언을 그 화소에서의 배경이라 간주한다. 본 알고리즘에서 현재 프레임의 물체는 얻어진 배경과의 거리가 문턱치보다 큰 화소들의 집합으로 구성된다. 알고리즘의 성능을 평가하기 위하여 온라인 가우시안 혼합 모델(Gaussian Mixture Model)을 이용한 다중 배경추출 방법과 비교하였으며, 비교결과 유사 또는 우월한 실험 결과를 확인하였다.