• 제목/요약/키워드: Video extraction

검색결과 464건 처리시간 0.029초

동영상 카투닝 시스템을 위한 자동 프레임 추출 기법 (Auto Frame Extraction Method for Video Cartooning System)

  • 김대진;구떠올라
    • 한국콘텐츠학회논문지
    • /
    • 제11권12호
    • /
    • pp.28-39
    • /
    • 2011
  • 멀티미디어 산업의 발달과 함께 디지털 콘텐츠 시장의 확산을 가져오고 있다. 그 중 인터넷 만화와 같은 디지털 만화 시장의 확장은 급속하게 커지고 있어서, 콘텐츠의 부족과 다양성 때문에 동영상 카투닝에 대한 연구가 계속되고 있다. 지금까지는 동영상 카투닝은 비사실적 렌더링과 말풍선에 초점이 맞추어졌으나, 이러한 것들을 적용하기 위해서는 카투닝 서비스에 적합한 프레임 추출이 우선시 되어야만 한다. 기존의 방법으로는 동영상의 장면전환이 일어나는 샷(shot)안의 프레임을 추출하여, 사용자가 지정한 영역을 임의의 색상으로 렌더링(Rendering)하는 시스템이 있다. 하지만 이러한 방법은 사람의 손을 거치는 반자동적인 방법으로서 정확한 프레임 추출을 위해 사람의 손을 거쳐야하는 단점이 있다. 따라서 본 논문에서는 이러한 문제점을 해결하고, 보다 정확한 카투닝에 적용할 프레임을 추출하기 위해 오디오 및 비디오 분리를 통한 방법을 제안한다. 먼저 동영상으로부터 오디오와 비디오를 분리한다. 오디오는 먼저 MFCC와 영교차율의 특징을 추출하고, 이 특징 정보를 미리 학습된 데이터와 GMM 분류기를 통하여 음악, 음성, 음악+음성으로 분류한 후 음성 영역을 설정한다. 비디오는 히스토그램을 이용한 방법과 같은 일반적인 장면전환 프레임을 추출 후 얼굴 검색을 통해서 만화에서 의미가 있는 프레임을 추출한다. 그 후 음성 영역내에 얼굴이 존재하는 장면전환 프레임이나 일정 시간동안 음성이 지속되는 영역 중 장면전환 프레임을 추출하여 동영상 카투닝에 적합한 프레임을 자동으로 추출한다.

MPEG 비디오 시퀀스에서 비디오 요약을 위한 장면 전환 검출 및 대표 프레임 추출 알고리즘 (Scene Change Detection and Representative Frame Extraction Algorithm for Video Abstract on MPEG Video Sequence)

  • 강응관
    • 한국멀티미디어학회논문지
    • /
    • 제6권5호
    • /
    • pp.797-804
    • /
    • 2003
  • 장면 전환검출 (scene change detection)은 영상 정보의 색인 (indexing) 및 검색을 위한 전처리로서 비디오 검색 시스템의 전체 성능을 좌우하는 중요한 기술로 현재 많은 연구가 진행되고 있다. 본 논문에서는 급격한 움직임 및 조명 변화, 빠르게 연속적으로 등장하는 장면 전환에 강건한 급격한 장면 전환 검출 기법과 디졸브, 페이드 등의 장면 전환을 보다 효과적으로 검출할 수 있는 점진적인 장면 전환 검출 기법 및 추출된 셧 (shot)의 내용을 DCT DC 이미지 버퍼링과 누적 히스토그램 교차 함수 (accumulative histogram intersection measure)에 의해 대표 프레임으로 추출하는 새로운 알고리즘을 제안하고, 모의 실험 결과 기존 방식에 비해 보다 우수한 성능을 보임을 입증하였다.

  • PDF

비디오객체의 경계향상을 위한 VLSI 구조 (VLSI Architecture for Video Object Boundary Enhancement)

  • 김진상
    • 한국통신학회논문지
    • /
    • 제30권11A호
    • /
    • pp.1098-1103
    • /
    • 2005
  • 에지나 윤곽 정보는 인간의 시각 시스템에 의하여 가장 잘 인식되며 객체의 인식과 지각에 사용되는 중요한 정보이다. 그러므로 비디오내의 객체간의 상호작용, 객체기반 코딩과 표현과 같은 응용을 위하여, 비디오객체의 추출과정에 에지정보를 적용하면 인간의 시각 시스템과 근접한 객체 경계를 얻을 수 있다. 대부분의 객체추출 방식은 연산량이 많고 반복적인 연산을 수행하므로 실시간 처리가 어렵다. 본 논문에서는 비디오객체 분할 과정에 에지 정보를 적용하여 정확한 객체 경계를 추출하는 VLSI 구조를 제안한다. 제안된 하드웨어 구조는 연산방식이 간단하므로 하드웨어로 쉽게 구현될 수 있으며, 제안된 VLSI 하드웨어 구조를 이용하면 객체기반 멀티미디어 응용을 위하여 실시간으로 비디오객체를 분할할 수 있다.

Implementation and Evaluation of Harmful-Media Filtering Techniques using Multimodal-Information Extraction

  • Yeon-Ji, Lee;Ye-Sol, Oh;Na-Eun, Park;Il-Gu, Lee
    • Journal of information and communication convergence engineering
    • /
    • 제21권1호
    • /
    • pp.75-81
    • /
    • 2023
  • Video platforms, including YouTube, have a structure in which the number of video views is directly related to the publisher's profits. Therefore, video publishers induce viewers by using provocative titles and thumbnails to garner more views. The conventional technique used to limit such harmful videos has low detection accuracy and relies on follow-up measures based on user reports. To address these problems, this study proposes a technique to improve the accuracy of filtering harmful media using thumbnails, titles, and audio data from videos. This study analyzed these three pieces of multimodal information; if the number of harmful determinations was greater than the set threshold, the video was deemed to be harmful, and its upload was restricted. The experimental results showed that the proposed multimodal information extraction technique used for harmfulvideo filtering achieved a 9% better performance than YouTube's Restricted Mode with regard to detection accuracy and a 41% better performance than the YouTube automation system.

HEVC Coding Unit Mode Based Motion Frame Analysis

  • Jia, Qiong;Dong, Tianyu;Jang, Euee S.
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 하계학술대회
    • /
    • pp.52-54
    • /
    • 2021
  • In this paper we propose a method predict whether a video frame contains motion according to the invoking situation of the coding unit mode in HEVC. The motion prediction of video frames is conducive for use in video compression and video data extraction. In the existing technology, motion prediction is usually performed by high complexity computer vision technology. However, we proposed to analyze the motion frame based on HEVC coding unit mode which does not need to use the static background frame. And the prediction accuracy rate of motion frame analysis by our method has exceeded 80%.

  • PDF

비디오의 오디오 정보 요약 기법에 관한 연구 (Investigating the Efficient Method for Constructing Audio Surrogates of Digital Video Data)

  • 김현희
    • 정보관리학회지
    • /
    • 제26권3호
    • /
    • pp.169-188
    • /
    • 2009
  • 본 연구는 비디오의 오디오 정보를 추출하여 자동으로 요약하는 알고리즘을 설계하고, 제안된 알고리즘에 의해서 구성한 오디오 요약의 품질을 평가하여 효율적인 비디오 요약의 구현 방안을 제안하였다. 구체적인 연구 결과를 살펴보면 다음과 같다. 먼저, 제안 오디오 요약의 품질이 위치 기반 오디오 요약의 품질 보다 내재적 평가에서 더 우수하게 나타났다. 이용자 평가(외재적 평가)의 요약문 정확도에서는 제안 요약문이 위치 기반 요약문 보다 더 우수한 것으로 나타났지만, 항목 선택에서는 이 두 요약문간의 성능 차이는 없는 것으로 나타났다. 이외에 비디오 브라우징을 위한 오디오 요약에 대한 이용자 만족도를 조사하였다. 끝으로 이러한 조사 결과를 기초로 하여 제안된 오디오 요약 기법을 인터넷이나 디지털 도서관에 활용하는 방안들을 제시하였다.

DMB를 위한 요약영상 추출 알고리듬 (A Thumbnail Extraction Algorithm for DMB)

  • 권용광;원치선
    • 방송공학회논문지
    • /
    • 제12권5호
    • /
    • pp.525-534
    • /
    • 2007
  • DMB에서 사용되는 H.264/AVC (이하 H.264)는 새로운 기술들의 적용으로 높은 압축율과 화질을 제공하는 가장 앞선 동영상 압축 표준이다. 그러나 그 기술들로 인해 기존의 압축 표준에서 적용되던 알고리듬들이 H.264에 그대로 적용되지 않은 문제를 가지고 있다. 그 중 한가지로 압축 비트열에서 영상의 축소와 확대에 대한 새로운 연구가 필요하며, 본 연구에서는 그 문제의 해결방법으로 영상을 추출하는 방법을 제안한다. 제안된 방법들은 기존의 H.264 복호과정을 최대한 이용하면서도 연산량을 50%와 70%를 줄이면서 1/16 크기의 요약영상을 추출함을 보인다.

Sensorial Information Extraction and Mapping to Generate Temperature Sensory Effects

  • Kim, Sang-Kyun;Yang, Seung-Jun;Ahn, Chung Hyun;Joo, Yong Soo
    • ETRI Journal
    • /
    • 제36권2호
    • /
    • pp.224-231
    • /
    • 2014
  • In this paper, a method to extract temperature effect information using the color temperatures of video scenes with mapping to temperature effects is proposed to author temperature effects of multiple sensorial media content automatically. An authoring tool to apply the proposed method is also introduced. The temperature effects generated by the proposed method are evaluated by a subjective test to measure the level of satisfaction. The mean opinion score results show that most of the test video sequences receive an average of approximately four points (in a five-point scale), indicating that test video sequences (with the temperature effects generated by the proposed method) enhance levels of satisfaction.

특징점 추출에 의한 비디오 영상등록 (Video Sequences Registration by using Interested Points Extraction)

  • 김성삼;이혜숙;김의명;유환희
    • 한국측량학회:학술대회논문집
    • /
    • 한국측량학회 2007년도 춘계학술발표회 논문집
    • /
    • pp.127-130
    • /
    • 2007
  • The increased availability of portable, low-cost, high resolution video devices has resulted in a rapid growth of the applications for video sequences. These video devices can be mounted in handhold unit, mobile unit and airborne platforms like maned or unmaned helicopter, plane, airship, etc. A core technique in use of video sequences is to align neighborhood video frames to each other or to reference images. For video sequences registration, we extracted interested points from aerial video sequences using Harris, $F{\square}rstner$, and KLT operators and implemented image matching using these points. As the result, we analysed image matching results for each operators and evaluated accuracy of aerial video registration.

  • PDF

H.264 SVC에서 비트 스트림 추출을 위한 공간과 시간 해상도 선택 기법 (Spatial and Temporal Resolution Selection for Bit Stream Extraction in H.264 Scalable Video Coding)

  • 김남윤;황호영
    • 한국멀티미디어학회논문지
    • /
    • 제13권1호
    • /
    • pp.102-110
    • /
    • 2010
  • H.264 SVC(Scalable Video Coding)는 디스크 저장 공간 효율성과 높은 확장성을 제공할 수 있는 장점이 있다. 그러나 스트리밍 서버나 단말기는 비트 스트림을 효율적으로 추출해야 한다. 본 논문에서는 네트워크 가용 대역폭을 넘지 않으면서 최대의 PSNR을 얻기 위한 SVC 비트 스트림 추출 기법을 제공한다. 이를 위하여 오프라인시에 최대의 PSNR을 얻기 위한 추출 지점에 대한 정보를 획득한 후, 온라인시에 네트워크 가용 대역폭을 만족하는 비트 스트림의 공간/시간 해상도를 결정한다. 이러한 공간/시간 해상도 정보는 네트워크 가용 대역폭과 함께 비트 스트림 추출기의 입력 파라미터로 사용된다. JSVM 참조 소프트웨어를 활용한 실험을 통하여 본 논문에서 제시한 추출 기법이 높은 PSNR을 제공함을 증명하였다.