• 제목/요약/키워드: 영상 요약

검색결과 230건 처리시간 0.023초

ChatGPT 를 활용한 영상 요약 모델에 관한 연구 (Video Summarization with ChatGPT)

  • 이원호;강준규 ;성나영 ;조수현 ;김영종
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.694-695
    • /
    • 2023
  • 최근 ChatGPT 를 각 분야에 활용하는 연구가 활발하게 이루어지고 있다. ChatGPT 는 최신 자연어 처리 모델로, 텍스트를 통해 입출력을 진행한다. 본 논문에서는 이러한 ChatGPT 를 활용하여 영상을 효과적으로 요약할 수 있는 새로운 접근 방식을 제시한다. STT 기술을 사용하여 영상의 자막에 대한 텍스트 파일을 추출하고 이를 ChatGPT 로 요약한다. 최종적으로 기존 텍스트와의 유사도 분석을 통해 유사도가 높은 부분을 선택하여 영상을 편집하고 요약한다.

시니어 라이프 로깅을 위한 심미적 특징 기반의 행동 요약 시스템 (Aesthetic Feature-based Activity Summarization for Senior Life Logging)

  • 김선대;류일웅;유재성;굴람 무즈타바;박은수;김승환;류은석
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2019년도 하계학술대회
    • /
    • pp.25-28
    • /
    • 2019
  • 본 논문은 시니어 라이프 로깅을 위한 데이터베이스를 효과적으로 구축하기 위해 영상의 심미적 특징을 통한 행동 별 영상 요약을 소개한다. 실내의 TV 앞에서 오랜 시간을 보내는 시니어의 상태를 체크하기 위해 일반 카메라 또는 360 카메라를 통해 HD 급 화질 이상의 영상을 주기적으로 수집하고, 이를 머신러닝 또는 딥러닝 기반의 행동인식 시스템에 이용하기 위한 전처리 단계에 응용할 수 있는 방법을 서술한다. 이 연구에서는 영상 데이터에서 얻을 수 있는 색상을 이용한 HSV 히스토그램, 영상신호의 Jitter 를 줄이는 고정도, 움직임 에너지 등을 이용하여 짧은 시간 내에 행동별로 구분된 영상(샷, shot)을 자르고 요약하는 방법을 서술한다.

  • PDF

시선추적-뇌파 기반의 비디오 요약 생성 방안 연구 (Video Summarization Using Eye Tracking and Electroencephalogram (EEG) Data)

  • 김현희;김용호
    • 한국문헌정보학회지
    • /
    • 제56권1호
    • /
    • pp.95-117
    • /
    • 2022
  • 본 연구는 시선 및 뇌파 정보를 이용하여 오디오-비주얼(audio-visual, AV) 시맨틱스 기반의 동영상 요약 방법들을 개발하고 평가해 보았다. 이를 위해서 27명의 대학생들을 대상으로 시선추적과 뇌파 실험을 수행하였다. 평가 결과, 뇌파와 동공크기 데이터를 함께 사용한 방법의 평균 재현율(0.73)이 뇌파 또는 동공크기 데이터만을 사용한 방법의 평균 재현율(뇌파: 0.50, 동공크기: 0.68)보다 높게 나타났다. 또한 AV 시맨틱스 기반의 개인화된 동영상 요약의 평균 재현율(0.57)이 AV 시맨틱스 기반의 일반적인 동영상 요약의 평균 재현율(0.69)보다 낮게 나타난 원인들을 분석하였다. 끝으로, AV 시맨틱스 기반 동영상 요약 방법과 텍스트 시맨틱스 기반 동영상 요약 방법 간의 차이 및 특성도 비교분석해 보았다.

스마트폰에서의 시공간적 중요도기반 비디오 요약 (Spatiotemporal Saliency-Based Video Abstract on a Smartphone)

  • 이원범;박인규
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2012년도 하계학술대회
    • /
    • pp.388-389
    • /
    • 2012
  • 본 논문에서는 동영상을 시공간적 중요도 기반으로 요약하는 기법을 제안한다. 동영상 내에서 각 프레임의 중요도를 평가하여 높은 우선순위를 가지는 구간들의 집합으로 요약을 수행한다. 화면내의 얼굴면적의 비율, 영상의 복잡도를 통하여 각 프레임이 가지는 공간적 중요도를 분석하고 인접한 프레임간의 비교를 통해 밝기 히스토그램과 움직임(motion)의 양을 추정함으로써 시간적 중요도를 구한다. 에지 보존 스무딩 필터를 밝기 히스토그램에 적용하여 장면 전환을 검출한다. 분리된 장면들로 과분할 구조를 가지는 계층적 트리를 생성하여 사용자가 요구한 재생길이를 가지는 동영상을 자동으로 저작한다. 본 논문에서는 동영상 분석 및 저작을 제한적인 환경인 스마트폰에서 효과적으로 작동하도록 구현 및 최적화를 수행하였다.

  • PDF

디지털 영상 초록의 설계와 평가에 관한 연구 (Designing and Evaluating Digital Video Storyboard Surrogates)

  • 김현희;김용호;고수현
    • 한국도서관정보학회지
    • /
    • 제38권4호
    • /
    • pp.463-480
    • /
    • 2007
  • 본 연구에서는 먼저 영상 초록의 배열 모형을 영상물의 소통 구조 이론, FRBR 모형 및 용어간의 구문적 및 어의적 관계를 고려하는 PRECIS 색인 이론 등을 이용하여 설계하고 이 모형에 따라서 영상 초록을 구성한 후 순차적 영상 초록과 요약문과 색인어 추출의 정확도 측면에서 어떤 차이를 보이는지 6개의 표본 비디오와 26명의 피조사자를 이용하여 실험을 통해서 조사해 보았다. 조사 결과, 배열 모형 기반 영상 초록이 순차적 영상 보다 더 정확한 요약문을 추출하는 것으로 나타났고 색인어 추출의 정확도는 큰 차이가 없는 것으로 나타났다. 또한 영상 초록의 반복 보기의 효과를 측정한 결과 순차적 영상 초록을 먼저 보고 배열 모형 영상초록을 반복해서 본 경우에 요약문의 정확도가 크게 증가하는 것으로 나타났다. 이러한 실험 결과에 기초하여 디지털 비디오 도서관 환경에서 영상 초록의 두 가지 활용 방안 즉, OPAC 환경에서 영상 초록의 초기값으로 순차적 영상 초록을 제시하고 선택을 통해서 배열 모형 기반 영상 초록이 함께 출력되는 비디오 브라우징 인터페이스를 구성하는 것과 제안된 배열 모형 기반 영상 초록을 영상 질의의 구조화된 매칭 자료로 활용하는 것에 대해서 제안하였다.

  • PDF

멀티 모달 정보 분석을 이용한 TV 골프 방송 프로그램에서의 이벤트 검출 및 요약 (Event Detection and Summarization of TV Golf Broadcasting Program using Analyzed Multi-modal Information)

  • 남상순;김형국
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2009년도 추계학술대회
    • /
    • pp.173-176
    • /
    • 2009
  • 본 논문에서는 영상 정보와 오디오 정보 분석을 이용하여 TV 골프 방송 프로그램에서 중요 이벤트 구간을 검출하고 요약 하는 알고리즘을 제안한다. 제안하는 알고리즘에서는 입력되는 TV 골프 동영상을 영상 신호와 오디오 신호로 분리한 후에, 연속적인 오디오 스트림을 내용 기반의 오디오 구간으로 분류한 뒤 오디오 이벤트 구간을 검출하고, 이와 병렬적으로 영상정보에서 선수들의 플레이 장면을 검출한다. 플레이 장면 검출에 있어서는 방송 환경이나 날씨 등의 변화하는 다양한 조건에 대해 플레이 장면에 대한 오프라인 모델과 함께 경기 내에서 발생한 온라인 모델에 대한 학습을 혼합 적용함으로써 검출 성능을 높였다. 오디오 신호로부터 관중들의 박수소리와 스윙 사운드를 통해 검출된 오디오 이벤트와 플레이 장면은 이벤트 장면 검출 및 요약본 생성을 위해 사용된다. 제안된 알고리즘은 멀티 모달 정보를 이용하여 이벤트 구간 검출을 수행함으로써 중요 이벤트 구간 검출의 정확도를 높일 수 있었고, 검출된 이벤트 구간에 대한 요약본 생성을 통해 골프 경기를 시청하는 사용자가 원하는 부분을 빠르게 브라우징하여 시청하는 것이 가능하여 높은 사용자 만족도를 얻을 수 있었다.

  • PDF

비디오자료의 의미추출을 위한 영상초록의 효용성에 관한 실험적 연구 (An Experimental Study on the Effectiveness of Storyboard Surrogates in the Meanings Extraction of Digital Videos)

  • 김현희
    • 정보관리학회지
    • /
    • 제24권4호
    • /
    • pp.53-72
    • /
    • 2007
  • 본 연구에서는 12개의 표본 비디오 집단과 14명의 피조사자들을 이용하여 영상 초록 및 전체 클립 보기를 통한 색인어 및 요약문 추출의 정확도를 측정해 보았다. 측정결과 첫째, 비디오 유형에 따라 정확도가 차이가 있는 것으로 나타났으며 이는 이미지에 주로 의존하여 정보를 표출하는 비디오의 경우 텍스트 초록만으로 의미 파악을 하기에는 한계가 있으며 텍스트 초록이 영상 초록과 함께 사용되었을 때 시너지 효과를 낼 수 있음을 보여주고 있다. 둘째, 영상초록의 색인어 및 요약문 정확도가 전체 클립의 정확도 보다 떨어지지만 절반치에 근접한 것으로 나타나 영상 초록이 비디오 의미 추출에 효율적으로 활용될 수 있음을 확인하였다. 또한 영상 초록의 색인어 정확도(0.45)가 요약문 정확도(0.40) 보다더 높게 나타나 영상초록을 통해서 색인어 추출 작업을 더 효율적으로 할 수 있음을 확인할 수 있었다. 이러한 실험결과에 기초하여 영상 초록이 색인어 또는 요약문 추출 작업에 활용될 수 있을 뿐만 아니라, 디지털도서관 환경에서 텍스트 초록과 같은 다른 메타데이터 요소들과 함께 사용된다면 이용자의 적합성 판정을 좀 더 용이하게 할 것이며, 더 나아가 영상 질의의 매칭 자료로도 이용될 수 있음을 제안하였다. 끝으로 영상 초록의 품질을 높이기 위한 키프레임 추출 알고리즘 및 키프레임 배열 모형 설계 등 후속 연구에 대해서 제언하였다.

영상의 특정 의미를 반영하는 Key Frame의 추출 방법 (Finding focused key frames of a given meaning on video data)

  • 하종우;노정담;윤성웅;김민수;안창원
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제65차 동계학술대회논문집 30권1호
    • /
    • pp.85-88
    • /
    • 2022
  • 영상을 구성하는 프레임 중에 키프레임은 일반적으로 영상 정보를 효과적으로 요약하거나 용이한 분석을 위해 선정된다. 화상이 가진 의미는 인물/사물 등의 객체탐지를 통해 추출되는데, 기존의 키프레임 관련 연구는 영상이 가지는 의미를 반영하는 키프레임을 찾아내기 어렵다. 본 논문에서는 영상이 가지는 특정 의미가 있다고 할 때 이를 반영하는 키프레임을 효과적으로 추출하는 방법을 실험적으로 탐구하였다. 구체적으로 영상을 통할하는 의미를 피로라고 가정하고 영상의 졸음 인식 관련 연구에 사용되는 DDD 데이터셋을 이용하여 효과적인 키프레임 추출 기법을 적용해 보았으며, 실험 결과 졸음이라는 특정 정보에 대한 해석을 도울 수 있는 의미 있는 요약을 제공하는 키프레임들을 효과적으로 추출하는 분석 기법을 찾아낼 수 있었다.

  • PDF

동영상 요약 시퀀스 생성을 위한 하이브리드 유사 프레임 비교 기법 (A Hybrid Comparing Method of a Similar Frame for Generating Video Summarization Sequences)

  • 옥창석;권대건;조환규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 춘계학술발표대회
    • /
    • pp.394-397
    • /
    • 2012
  • 멀티미디어의 규모가 급격하게 늘어나고 있는 현재, 영화와 같은 동영상은 용량에 있어 사진과 비교했을 때 상당한 크기를 가지고 있고 그만큼 많은 정보를 담고 있다. 이렇게 많은 정보를 얻기 위해 사용자들은 많은 시간을 소비해야 한다. 이러한 비효율적인 측면의 보완을 위해 동영상의 각 프레임의 유사도를 판단하여 유사한 프레임들은 하나로 모으고, 유사하지 않은 프레임들은 구분하여 요약된 시퀀스로 보여줄 수 있는 방법이 필요하다. 이러한 관점에서 봤을 때 동영상은 시간적 순서에 따라 프레임이 배열되어 있고 인근 프레임 간에는 Coherence가 존재한다는 장점이 있다. 따라서 우리는 이러한 장점을 최대한 이용하여 동영상의 요약 시퀀스를 생성하기 위해 일차적으로 필요한 유사 프레임을 비교할 수 있는 기법을 제안한다. 제안하는 기법은 각 프레임의 공간적인 정보를 활용 할 수 있는 특징점 기반의 기법과, 각 프레임의 색 분포 정보를 활용 할 수 있는 히스토그램 기반의 기법을 Hybrid하게 적용하여 유사 프레임을 판단한다. 제안한 기법을 통해 도출한 결과를 통계학적으로 검증을 위해 널리 사용되는 Precision과 Recall을 이용하여 검증한다.

MPEG-7을 기반으로 한 뉴스 동영상 스키마와 요약 생성 방법의 설계 및 구현 (A Design and Implementation of Scheme and Summary Generation Mechanism for News Video based on MPEG-7 MDS)

  • 심진선;정진국;낭종호;김경수;하명환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.577-579
    • /
    • 2002
  • 최근 디지털 동명상의 사용이 증가하면서 자동으로 구조를 분석하는 기술이 필요하게 되었다. 특히 뉴스 동영상은 다른 동영상에 비해 그 구조가 비교적 정명화 되어 있다는 특징 때문에 많은 연구에서 이용되어졌다. 뉴스 동영상을 이용하는 이전의 연구에서 문제점으로 제시될 수 있는 사항은 서로 다른 자료 구조와 시스템 구조로 인 딴 호환성의 부족을 들 수 있다. 본 논문에서 는 이와 같은 호환성 부족을 해결하기 위해 멀티미디어 데이터를 기술하는 표준인 MPEG-7을 기반으로 한 뉴스 동영상 스키마를 제안하였다 특히 전제 뉴스를 보지 않고 효율적으로 뉴스 동영상을 이해할 수 있도록 요약하는 방법을 제시하였으며 MPEG-7의 HDS를 이용하여 기술하였다. 본 논문에서 제안한 방법은 디지털 비디오 라이브러리와 같은 응용 분야에서 유용하게 이용될 수 있을 것이다.

  • PDF