• 제목/요약/키워드: Video Analysis

검색결과 2,500건 처리시간 0.03초

시각적 특징을 기반한 샷 클러스터링을 통한 비디오 씬 탐지 기법 (Video Scene Detection using Shot Clustering based on Visual Features)

  • 신동욱;김태환;최중민
    • 지능정보연구
    • /
    • 제18권2호
    • /
    • pp.47-60
    • /
    • 2012
  • 비디오 데이터는 구조화되지 않은 복합 데이터의 형태를 지닌다. 이러한 비디오 데이터의 효율적인 관리 및 검색을 위한 비디오 데이터 구조화의 중요성이 대두되면서 콘텐츠 내 시각적 특징을 기반으로 비디오 씬(scene)을 탐지하고자 하는 연구가 활발히 진행되었다. 기존의 연구들은 주로 색상 정보만을 이용하여 샷(shot) 간의 유사도 평가를 기반한 클러스터링(clustering)을 통해 비디오 씬을 탐지하고자 하였다. 하지만 비디오 데이터의 색상 정보는 노이즈(noise)를 포함하고, 특정 사물의 개입 등으로 인해 급격하게 변화하기 때문에 색상만을 특징으로 고려할 경우, 비디오 샷 혹은 씬에 대한 올바른 식별과 디졸브(dissolve), 페이드(fade), 와이프(wipe)와 같은 화면의 점진적인 전환(gradual transitions) 탐지는 어렵다. 이러한 문제점을 해결하기 위해, 본 논문에서는 프레임(frame)의 컬러 히스토그램과 코너 에지, 그리고 객체 컬러 히스토그램에 해당하는 시각적 특징을 기반으로 동일한 이벤트를 구성하는 의미적으로 유사한 샷의 클러스터링을 통해 비디오 씬을 탐지하는 방법(Scene Detector by using Color histogram, corner Edge and Object color histogram, SDCEO)을 제안한다. SDCEO는 샷 바운더리 식별을 위해 컬러 히스토그램 분석 단계에서 각 프레임의 컬러 히스토그램 정보를 이용하여 1차적으로 연관성 있는 연속된 프레임을 샷 바운더리로 병합한 후, 코너 에지 분석 단계에서 병합된 샷 내 처음과 마지막 프레임의 코너 에지 특징 비교를 통하여 샷 바운더리를 정제하여 최종 샷을 식별한다. 키프레임 추출 단계에서는 샷 내 프레임간 유사도 비교를 통해 모든 프레임과 가장 유사한 프레임을 각 샷을 대표하는 키프레임으로 추출한다. 그 후, 비디오 씬 탐지를 위해, 컬러 히스토그램과 객체 컬러 히스토 그램에 해당하는 프레임의 시각적 특징을 기반으로 상향식 계층 클러스터링 방법을 이용하여 의미적인 연관성을 지니는 샷의 군집화를 통해 비디오 씬을 탐지하는 방법이다. 본 논문에서는 SDCEO의 프로토 타입을 구축하고 3개의 비디오 데이터를 이용한 실험을 통하여 SDCEO의 효율성을 평가하였고 샷 바운더리 식별의 성능의 정확도는 평균 93.3%, 비디오 씬 탐지 성능의 정확도는 평균 83.3%로 만족할만한 성능을 보였다.

DACUM 기법에 의한 영상편집자의 직무분석 (Job Analysis of Video Editors Based on the DACUM Method)

  • 송화선
    • 한국콘텐츠학회논문지
    • /
    • 제7권12호
    • /
    • pp.95-104
    • /
    • 2007
  • 방송환경이 HD 콘텐츠 제작 환경으로 변화되어 감에 따라 방송영상 콘텐츠 제작 전문 인력 양성과 새로이 요구되는 전문적인 능력 향상을 위한 교육 프로그램에 대한 수요가 증대되고 있다. 본 연구에서는 DACUM 기법에 의해 영상편집자의 직무를 분석하고 그 결과를 토대로 방송영상분야 영상편집자의 직무모형을 제시하고자 한다. 직무분석에서는 영상편집자의 직무를 구성하는 9개의 임무와 각 임무영역을 구성하는 71개의 작업이 도출되었으며, 교육 요구도 분석을 위해 각 작업에 대한 중요도, 난이도, 수행 빈도를 조사하고 입직초기에 갖추어야 할 핵심 작업이 분석되었다. 또한 이러한 직무분석 내용을 구조화하여 데이컴 리서치 차트를 완성함으로써 방송영상분야 영상편집자의 직무모형을 완성하였다. 본 연구에서 제시된 영상편집자의 직무 모형은 방송 영상분야 영상편집 교육과정 개발 및 직무 연수 내용의 우선순위를 정하는데 기초 자료로 활용될 것이다.

보안 감시를 위한 심층학습 기반 다채널 영상 분석 (Multi-channel Video Analysis Based on Deep Learning for Video Surveillance)

  • 박장식;마르셀 위라네가라;손금영
    • 한국전자통신학회논문지
    • /
    • 제13권6호
    • /
    • pp.1263-1268
    • /
    • 2018
  • 본 논문에서는 영상 보안 감시를 위한 심층학습 객체 검출과 다중 객체 추적을 위한 확률적 데이터연관 필터를 연계한 영상분석 기법을 제안하고, GPU를 이용하여 구현하는 방안을 제시한다. 제안하는 영상분석 기법은 객체 검출과 추적으로 순차적으로 수행한다. 객체 검출을 위한 심층학습은 ResNet을 이용하고, 다중 객체 추적을 위하여 확률적 데이터 연관 필터를 적용한다. 제안하는 영상분석 기법은 임의의 영역으로 불법으로 침입하는 사람을 검출하거나 특정 공간에 출입하는 사람을 계수하는데 응용할 수 있다. 시뮬레이션을 통하여 약 25fps의 속도로 48채널의 영상을 분석할 수 있음을 보이고, RTSP 프로토콜을 통하여 실시간 영상분석이 가능함을 보인다.

AnoVid: 비디오 주석을 위한 심층 신경망 기반의 도구 (AnoVid: A Deep Neural Network-based Tool for Video Annotation)

  • 황지수;김인철
    • 한국멀티미디어학회논문지
    • /
    • 제23권8호
    • /
    • pp.986-1005
    • /
    • 2020
  • In this paper, we propose AnoVid, an automated video annotation tool based on deep neural networks, that automatically generates various meta data for each scene or shot in a long drama video containing rich elements. To this end, a novel meta data schema for drama video is designed. Based on this schema, the AnoVid video annotation tool has a total of six deep neural network models for object detection, place recognition, time zone recognition, person recognition, activity detection, and description generation. Using these models, the AnoVid can generate rich video annotation data. In addition, AnoVid provides not only the ability to automatically generate a JSON-type video annotation data file, but also provides various visualization facilities to check the video content analysis results. Through experiments using a real drama video, "Misaeing", we show the practical effectiveness and performance of the proposed video annotation tool, AnoVid.

A Flow Analysis Framework for Traffic Video

  • Bai, Lu-Shuang;Xia, Ying;Lee, Sang-Chul
    • 한국공간정보시스템학회 논문지
    • /
    • 제11권2호
    • /
    • pp.45-53
    • /
    • 2009
  • The fast progress on multimedia data acquisition technologies has enabled collecting vast amount of videos in real time. Although the amount of information gathered from these videos could be high in terms of quantity and quality, the use of the collected data is very limited typically by human-centric monitoring systems. In this paper, we propose a framework for analyzing long traffic video using series of content-based analyses tools. Our framework suggests a method to integrate theses analyses tools to extract highly informative features specific to a traffic video analysis. Our analytical framework provides (1) re-sampling tools for efficient and precise analysis, (2) foreground extraction methods for unbiased traffic flow analysis, (3) frame property analyses tools using variety of frame characteristics including brightness, entropy, Harris corners, and variance of traffic flow, and (4) a visualization tool that summarizes the entire video sequence and automatically highlight a collection of frames based on some metrics defined by semi-automated or fully automated techniques. Based on the proposed framework, we developed an automated traffic flow analysis system, and in our experiments, we show results from two example traffic videos taken from different monitoring angles.

  • PDF

해외 의료케어 전문 영상과 국내 의료케어 영상 비교분석에 관한 연구 (A Study on the Comparative Analysis of Overseas Medical Care Video and Domestic Medical Care Video)

  • 조현경
    • 문화기술의 융합
    • /
    • 제7권4호
    • /
    • pp.415-420
    • /
    • 2021
  • 의료 케어 분야가 다각도로 발전되어가고 있는 상황에서 의료 홍보 영상분석은 중요한 의미를 지닌다. 경쟁력 향상의 문제로 중요성을 있으며 AI 시스템의 가속화 시대는 의료 케어가 가장 선두에 있는 분야이기도 하다. 이에 따른 홍보와 광고 및 설명에 대한 영상의 중요성은 매우 중요하며 기업의 이미지를 전환 시킬 수 있는 중요한 방향이기도 하다. 본 연구에서는 AI 의료 브랜드들의 전문 영상에 대한 비교분석을 중심으로 해외 메이져 회사 2개, 스트라이커와 힐롬 (Stryker, Hill-rom)의 회사와 국내 선두기업 1개(나인벨)의 영상을 중심으로 영상에서의 디자인 특징과 차이점 등을 비교하였고, 그에 따른 세부 파트 분석과 섹션 분석을 하였다. 영상 편집의 기술적 부분 분석으로, 트렌제이션 방식 및 인포 그래픽들을 고찰하였다. 심층 비교는 AI 의료 영상의 영상 색상 톤과 영상 배색 관계에 대한 차이점과 같은점들을 비교 분석하였다. 영상 이미지 결정 부분에 있어서 구체적인 분석은 각 영상들의 영상 인트로 부분과 제품 설명 영상 부분들의 구체적 장면을 가지고, 홍보 디자인에서 나타나고 있는 차별화된 요소들을 비교 연구하였다.

Object Motion Analysis and Interpretation in Video

  • Song, Dan;Cho, Mi-Young;Kim, Pan-Koo
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.694-696
    • /
    • 2004
  • With the more sophisticated abilities development of video, object motion analysis and interpretation has become the fundamental task for the computer vision understanding. For that understanding, firstly, we seek a sum of absolute difference algorithm to apply to the motion detection, which was based on the scene. Then we will focus on the moving objects representation in the scene using spatio-temporal relations. The video can be explained comprehensively from the both aspects : moving objects relations and video events intervals.

  • PDF

HEVC Coding Unit Mode Based Motion Frame Analysis

  • Jia, Qiong;Dong, Tianyu;Jang, Euee S.
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 하계학술대회
    • /
    • pp.52-54
    • /
    • 2021
  • In this paper we propose a method predict whether a video frame contains motion according to the invoking situation of the coding unit mode in HEVC. The motion prediction of video frames is conducive for use in video compression and video data extraction. In the existing technology, motion prediction is usually performed by high complexity computer vision technology. However, we proposed to analyze the motion frame based on HEVC coding unit mode which does not need to use the static background frame. And the prediction accuracy rate of motion frame analysis by our method has exceeded 80%.

  • PDF

요약 비디오 영상과 PCA를 이용한 유사비디오 검출 기법 (Similar Video Detection Method with Summarized Video Image and PCA)

  • 유재만;김우생
    • 한국멀티미디어학회논문지
    • /
    • 제8권8호
    • /
    • pp.1134-1141
    • /
    • 2005
  • 웹 상의 출판이 보편화 될수록 많은 데이터의 내용물들이 압축, 포맷, 편집 등 변형된 상태로 중복해서 존재하게 된다. 이러한 유사한 데이터들은 검색 시 속도나 검색률 등에 문제를 야기 시킬 수도 있으며, 반면에 특정 사이트에 문제가 발생할 경우 다른 사이트의 중복된 데이터를 제공해 줄 수도 있게 된다. 따라서 본 논문에서는 대규모 데이터베이스 상에 존재하는 비디오들 중에서 유사한 데이터들에 대한 정보를 사전에 감지할 수 있는 효율적인 방법을 제안한다. 본 연구에서는 비디오들을 직접 비교하는 대신 비디오를 대표하는 요약 비디오 영상을 만들고, 주성분 분석(PCA-principle component analysis) 기법을 적용하여 저차원 특징벡터 상에 군집화를 통해 유사 비디오들을 검출하였다. 실험을 통하여 제안하는 방법의 효율성과 정확성이 우수함을 보였다.

  • PDF

MPEG 몰입형 비디오 기반 6DoF 영상 스트리밍 성능 분석 (Performance Analysis of 6DoF Video Streaming Based on MPEG Immersive Video)

  • 정종범;이순빈;김인애;류은석
    • 방송공학회논문지
    • /
    • 제27권5호
    • /
    • pp.773-793
    • /
    • 2022
  • 다수의 고품질 몰입형 영상 전송을 통해 가상 현실에서 six degrees of freedom(6DoF)를 지원하기 위해 the moving picture experts group (MPEG) immersive video (MIV) 압축 표준이 설립되었다. MIV는 비트율과 연산 복잡도 간 상충관계를 고려하여 1) 시점 간 연관성 제거 또는 2) 대표 시점을 선택하여 전송하는 2가지 압축 방식을 제공한다. 본 논문은 전술한 두 가지 방식에 대해 high-efficiency video coding (HEVC), versatile video coding (VVC) 기반 성능 분석 결과를 입력 영상 위치에 합성한 가상 영상 및 사용자 시점 영상 중심으로 제시한다.