• 제목/요약/키워드: automatic shot

검색결과 53건 처리시간 0.027초

효율적인 브라우징 환경을 위한 비디오 색인 (Video Indexing for Efficient Browsing Environment)

  • 고병철;이해성;변혜란
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권1호
    • /
    • pp.74-83
    • /
    • 2000
  • 최근 멀티미디어에 대한 관심이 증가하면서 그에 따른 기술 또한 매우 빠른 속도로 증가하고 있다. 특히 비디오 영상 검색 기능에 대한 사용자들의 욕구는 비디오에 대한 수동적인 접근 방식에서, 자신이 원하는 부분만을 선택적으로 검색할 수 있는 보다 편리한 환경을 요구하고 있다. 이를 위해서는 대용량의 비디오 데이타를 의미 있는 단위로 나누기 위한 비디오 파싱(Parsing)과 클러스터링(Clustering), 브라우징(Browsing)등을 포함하는 비디오 인덱싱 시스템의 구현이 필요하다. 본 논문에서는 우선 비디오 시퀀스를 히스토그램과 화소단위 비교법을 혼합한 하이브리드 방법을 통해서 자동 인덱싱을 위한 기본 단위인 샷(shot)으로 나눈다. 비디오 분할 후에 각 샷들로부터 대표 프레임을 검출한다. 대표 프레임은 사용자로 하여금 비디오의 전체적인 내용을 이해할 수 있도록 도와줌으로써 그 중요성이 크다고 할 수 있다. 따라서 본 논문에서는 웨이블릿 변환을 이용하여 우선적으로 샷 내에 포함된 카메라의 움직임을 분석하고, 각 프레임들의 변화량을 측정하여 샷의 복잡성에 따라 각기 다른 수의 대표 프레임을 선출하도록 하였다. 마지막으로 카메라 움직임중 패닝, 혹은 틸팅이 포함된 샷에 대해서 파노라마 영상을 합성함으로써 사용자에게 보다 편리하고 이해하기 쉬운 브라우징 환경을 제공할 수 있도록 하였다.

  • PDF

유도형 전력선 통신과 연동된 SSD 기반 화재인식 및 알림 시스템 (SSD-based Fire Recognition and Notification System Linked with Power Line Communication)

  • 양승호;손경락;정재환;김현식
    • 전기전자학회논문지
    • /
    • 제23권3호
    • /
    • pp.777-784
    • /
    • 2019
  • 인적이 드문 한적한 곳이나 산악 지역에서 화재가 발생 하였을 때 화재 상황을 정확하게 파악하고 적절한 초동 대처를 한다면 피해를 최소화할 수 있으므로 사전 화재인지시스템과 자동알림시스템이 요구된다. 본 연구에서는 객체인식을 위한 딥러닝 알고리즘 중 Faster-RCNN 및 SSD(single shot multibox detecter)을 사용한 화재 인식시스템을 전력선 통신과 연동하여 자동알림시스템을 시연하였으며 향 후 고압송전망을 이용한 산불화재 감시에 응용 가능함을 제시하였다. 학습된 모델을 장착한 라즈베리파이에 파이카메라를 설치하여 화재 영상인식을 수행하였으며, 검출된 화재영상은 유도형 전력선 통신망을 통하여 모니터링 PC로 전송하였다. 학습 모델별 라즈베리파이에서의 초당 프레임 율은 Faster-RCNN의 경우 0.05 fps, SSD의 경우 1.4 fps로 SSD의 처리속도가 Faster-RCNN 보다 28배 정도 빨랐다.

다중 비주얼 특징을 이용한 어학 교육 비디오의 자동 요약 방법 (Automatic Summary Method of Linguistic Educational Video Using Multiple Visual Features)

  • 한희준;김천석;추진호;노용만
    • 한국멀티미디어학회논문지
    • /
    • 제7권10호
    • /
    • pp.1452-1463
    • /
    • 2004
  • 양방향 방송 서비스로의 전환을 맞아 다양한 사용자 요구 및 기호에 적합한 컨텐츠를 제공하고, 증가하는 방송 컨텐츠를 효율적으로 관리, 이용하기 위해 비디오의 자동 에 대한 요구가 증가하고 있다. 본 논문에서는 내용 구성이 잘 갖추어진 어학 교육 비디오의 자동 에 대한 방법을 제안한다. 내용 기반을 자동으로 생성하기 위해 먼저 디지털 비디오로부터 샷 경계를 검출한 후, 각 샷을 대표하는 키프레임으로부터 비주얼 특징들을 추출한다. 그리고 추출된 다중 비주얼 특징을 이용해 어학 교육 비디오의 세분화된 내용 정보를 결정한다. 마지막으로, 결정된 내용 정보를 기술하는 요약문을 MPEG-7 MDS(Multimedia Description cheme)에 정의된 계층적 (Hierarchical Summary) 구조에 맞추어 XML 문서로 생성한다. 외국어 회화 비디오에 대해 실험하여 제안한 자동 방법의 효율성을 검증하였으며, 제안한 방법이 교육 방송용 컨텐츠의 다양한 서비스 제공 및 관리를 위한 비디오 요약 시스템에 효율적으로 적용 가능함을 확인하였다.

  • PDF

장르 특성 패턴을 활용한 매칭시스템 기반의 자동영상편집 기술 (Automatic Video Editing Technology based on Matching System using Genre Characteristic Patterns)

  • 문혜준;임양미
    • 방송공학회논문지
    • /
    • 제25권6호
    • /
    • pp.861-869
    • /
    • 2020
  • 본 논문은 영화 장르마다 나타나는 클라이맥스 패턴이 다름을 활용하여 사용자의 디바이스 내에 저장되어 있는 이미지들을 하나의 영상으로 자동생성해주는 애플리케이션 개발을 소개한다. 영화의 장르 특성 분류는 국내 영화 드라마, 액션, 공포와 국외 영화 드라마, 액션, 공포 장르를 분석하여 클라맥스 패턴 모델형을 만들었다. 클라이맥스 패턴은 영화의 특정 씬 부분에서 샷사이즈의 변화, 샷의 길이, 인서트샷 사용의 빈도를 특성 요소로 하였고, 결과를 시각화하였다. 장르별 시각화된 모델을 Firebase DB를 활용하는 템플릿으로 개발하였다. 사용자의 디바이스에 저장된 이미지를 선택하여 장르별 템플릿으로 개발된 클라이맥스 패턴 모델과 매칭하였다. 짧은 영상이지만 장르의 특성이 반영되어 감성스토리 영상을 자동생성할 수 있는 것이 본 애플리케이션의 특징이다. 최근 유튜브, 네이버와 같은 플랫폼 사업자들은 사용자가 스마트폰으로 직접 촬영한 사진이나 영상을 활용하여 자동으로 영상을 생성해주는 애플리케이션들을 매년 업그래이드하고 있으나, 영화와 같이 장르 특성을 갖는다거나, 스토리가 보이는 영상생성 기술을 포함한 애플리케이션은 아직 미흡하다. 제안한 자동영상편집은 감성전달이 가능한 영상편집 애플리케이션으로써의 발전 가능성이 있다고 예측한다.

형태학적 연산과 뇌종양 평균 크기를 이용한 감마나이프 치료 범위 자동 검출 알고리즘 (Automatic Detection Algorithm of Radiation Surgery Area using Morphological Operation and Average of Brain Tumor Size)

  • 나승대;이기현;김명남
    • 한국멀티미디어학회논문지
    • /
    • 제18권10호
    • /
    • pp.1189-1196
    • /
    • 2015
  • In this paper, we proposed automatic extraction of brain tumor using morphological operation and statistical tumors size in MR images. Neurosurgery have used gamma-knife therapy by MR images. However, the gamma-knife plan systems needs the brain tumor regions, because gamma-ray should intensively radiate to the brain tumor except for normal cells. Therefore, gamma-knife plan systems spend too much time on designating the tumor regions. In order to reduce the time of designation of tumors, we progress the automatical extraction of tumors using proposed method. The proposed method consist of two steps. First, the information of skull at MRI slices remove using statistical tumors size. Second, the ROI is extracted by tumor feature and average of tumors size. The detection of tumor is progressed using proposed and threshold method. Moreover, in order to compare the effeminacy of proposed method, we compared snap-shot and results of proposed method.

실시간 동영상 시청시 주제탐색조건과 주제관련성이 내재적 유발전위 활성에 미치는 영향 (The Influence of Topic Exploration and Topic Relevance On Amplitudes of Endogenous ERP Components in Real-Time Video Watching)

  • 김용호;김현희
    • 한국멀티미디어학회논문지
    • /
    • 제22권8호
    • /
    • pp.874-886
    • /
    • 2019
  • To delve into the semantic gap problem of the automatic video summarization, we focused on an endogenous ERP responses at around 400ms and 600ms after the on-set of audio-visual stimulus. Our experiment included two factors: the topic exploration of experimental conditions (Topic Given vs. Topic Exploring) as a between-subject factor and the topic relevance of the shots (Topic-Relevant vs. Topic-Irrelevant) as a within-subject factor. For the Topic Given condition of 22 subjects, 6 short historical documentaries were shown with their video titles and written summaries, while in the Topic Exploring condition of 25 subjects, they were asked instead to explore topics of the same videos with no given information. EEG data were gathered while they were watching videos in real time. It was hypothesized that the cognitive activities to explore topics of videos while watching individual shots increase the amplitude of endogenous ERP at around 600 ms after the onset of topic relevant shots. The amplitude of endogenous ERP at around 400ms after the onset of topic-irrelevant shots was hypothesized to be lower in the Topic Given condition than that in the Topic Exploring condition. The repeated measure MANOVA test revealed that two hypotheses were acceptable.

온톨로지를 이용한 뉴스 비디오의 자동 분류 기법 (Full-automatic Classification Technique of News Video using Domain Ontologies)

  • 김하은;이동호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.193-195
    • /
    • 2005
  • 본 논문은 온톨로지를 이용하여 뉴스 비디오를 분야별로 자동으로 분류하는 효율적인 기법을 제안한다. 이를 위해서 뉴스 비디오를 파싱하여 키프레임(Key frame), 샷(Shot), 씬(Scene)으로 나누고 키프레임과 샷에서 특징 정보를 추출한다. 추출된 특징 정보를 이용하여 샷의 키워드 집합을 만들고 이를 이용하여 씬의 키워드 집합을 만든다. 그리고 씬의 키워드 집합을 어휘 온톨로지와 뉴스 온톨로지에 매칭(추론)하여, 씬의 분야를 결정한다. 또한 이렇게 결정된 분야를 기반으로 서로 유사한 씬들을 자동으로 그룹화하는 방법을 제안한다.

  • PDF

자동 촬영에 의한 파노라마 생성 (Panorama Construction By Automatic Shot)

  • 김태우
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2007년도 추계학술발표논문집
    • /
    • pp.215-217
    • /
    • 2007
  • 본 논문에서는 자동 촬영 파노라마 생성 방법을 제안한다. 기존에는 두 장의 파노라마 멤버들을 수동으로 촬영하여 파노라마 영상을 만드는 반면, 제안한 방법은 이동되는 카메라에서 파노라마 멤버들을 자동으로 촬영하여 파노라마 영상을 생성한다. 파노라마 멤버들은 카메라로부터 들어오는 영상 스트림에서 추적 영역을 자동으로 추적하여 촬영된다. 촬영된 멤버들은 추적 영역을 포함하는 정합 영역에 대해 불변 특징 방법을 적용한다. 이 방법은 파노라마 멤버들을 자동으로 촬영할 수 있고 파노라마 생성 속도가 빠른 장점이 있다. 실험에서 $320{\times}240$ 크기의 칼라 영상에 대해 제안한 방법의 처리 시간이 약 0.89초로 기존의 특징 기반 방법[2]에 비해 처리 속도가 약 2배 빠른 결과를 보였다.

  • PDF

필드와 모션벡터의 특징정보를 이용한 스포츠 뉴스 비디오의 장르 분류 (Automatic Genre Classification of Sports News Video Using Features of Playfield and Motion Vector)

  • 송미영;장상현;조형제
    • 정보처리학회논문지B
    • /
    • 제14B권2호
    • /
    • pp.89-98
    • /
    • 2007
  • 비디오와 브라우징, 검색, 조작을 위해서 비디오 내용을 기술하는 색인이 요구된다. 지금까지 색인의 구성은 대부분 비디오 내용에 제한된 키워드를 수작업으로 할당하는 전문가에 의해 수행되었는데 이는 비용과 시간을 소비하는 사업이므로 비디오 내용을 자동으로 분류하는 것이 필요하다. 이 연구는 축구, 골프, 야구, 농구, 배구 등 5종의 스포츠 뉴스 비디오의 분석과 요약을 위해서 자동적이고 효율적인 방법을 제안한다. 우선, 스포츠 뉴스 비디오를 앵커 장면과 스포츠 기사 장면으로 분류한다. 장면 분류는 앵커 장면의 영상 전처리와 색상 특정을 기반으로 한다. 그리고 필드의 우세색상과 모션 방향을 특징으로 이용하여 스포츠 장면을 5개의 장르로 분류한다. 241개의 스포츠 뉴스 장면에 대한 실험에서 75%의 정확도를 얻었다. 따라서 제안된 기법은 향후 개별 스포츠 뉴스와 스포츠 하이라이트를 위한 뉴스 비디오를 검색하는데 이용될 수 있을 것이다.