• 제목/요약/키워드: Video Extraction

검색결과 466건 처리시간 0.029초

머신러닝 기반의 영상 자동 편집 방법 및 시스템 (Video Automatic Editing Method and System based on Machine Learning)

  • 이승환;박대우
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.235-237
    • /
    • 2022
  • 영상 콘텐츠는, 길이에 따라 롱폼 영상 콘텐츠와 숏폼 영상 콘텐츠로 구분된다. 롱폼 영상 콘텐츠는 15분 이상 길이로 생성되며, 편집 없이 촬영 영상의 모든 프레임들이 포함되도록 한다. 숏폼 영상 콘텐츠는 1분이상 15분 이내로, 촬영 영상의 프레임들로부터 일부 프레임만 짧은 길이로 편집할 수 있다. 최근 1인 방송 시장의 성장으로 인하여, 시청자들을 늘리기 위한 숏폼 영상 콘텐츠에 대한 수요가 확대되고 있다. 따라서, 숏폼 영상 콘텐츠를 편집하여 생성하는 콘텐츠 편집 기술에 대한 연구가 필요하다. 본 연구는 영상, 음성, 동작을 포착하여 주요 장면의 숏폼 동영상을 생성하는 기술을 연구한다. 주요 장면의 숏폼 동영상은 머신 러닝을 통해 미리 학습된 하이라이트 추출 모델을 이용한다. 하이라이트 영상을 자동으로 생성하는 영상 자동 편집 시스템 및 방법은 숏폼 영상 콘텐츠의 핵심 기술이다. 머신러닝 기반의 영상 자동 편집 방법 및 시스템 연구는 1인 크리에이터들의 영상 편집에 투입되는 노력과 비용시간을 감소시켜, 경쟁력있는 콘텐츠 활동을 할 수 있도록 기여할 것이다.

  • PDF

영상 초록 구현을 위한 키프레임 추출 알고리즘의 설계와 성능 평가 (Design and Evaluation of the Key-Frame Extraction Algorithm for Constructing the Virtual Storyboard Surrogates)

  • 김현희
    • 정보관리학회지
    • /
    • 제25권4호
    • /
    • pp.131-148
    • /
    • 2008
  • 본 연구에서는 비디오의 의미를 잘 표현하고 있는 키프레임들을 추출하는 알고리즘을 설계하고 평가하였다. 구체적으로 영상 초록의 키프레임 선정을 위한 이론 체계를 수립하기 위해서 선행 연구와 이용자들의 키프레임 인식 패턴을 조사하여 분석해 보았다. 그런 다음 이러한 이론 체계를 기초로 하여 하이브리드 방식으로 비디오에서 키프레임을 추출하는 알고리즘을 설계한 후 실험을 통해서 그 효율성을 평가해 보았다. 끝으로 이러한 실험 결과를 디지털 도서관과 인터넷 환경의 비디오 검색과 브라우징에 활용할 수 있는 방안을 제안하였다.

모바일 얼굴 비디오로부터 심박 신호의 강건한 추출 (Robust Extraction of Heartbeat Signals from Mobile Facial Videos)

  • 로말리자쟝피에르;박한훈
    • 융합신호처리학회논문지
    • /
    • 제20권1호
    • /
    • pp.51-56
    • /
    • 2019
  • 본 논문은 모바일 환경에서의 BCG기반 심박 수 측정을 위한 향상된 심박 신호 추출 방법을 제안한다. 우선, 모바일 카메라를 이용하여 사용자의 얼굴을 촬영한 비디오로부터 얼굴 특징과 배경 특징을 동시에 추적함으로써 손 떨림에 의한 영향을 제거한 머리 움직임 신호를 추출한다. 그리고 머리 움직임 신호로부터 심박 신호를 정확하게 분리해내기 위해 신호의 주기성을 계산하는 새로운 방법을 제안한다. 제안 방법은 모바일 얼굴 비디오로부터 강건하게 심박 신호를 추출할 수 있으며, 기존 방법에 비해 보다 정확하게 심박 수 측정(측정 오차가 3-4 bpm 감소)을 할 수 있다.

Estimation of Automatic Video Captioning in Real Applications using Machine Learning Techniques and Convolutional Neural Network

  • Vaishnavi, J;Narmatha, V
    • International Journal of Computer Science & Network Security
    • /
    • 제22권9호
    • /
    • pp.316-326
    • /
    • 2022
  • The prompt development in the field of video is the outbreak of online services which replaces the television media within a shorter period in gaining popularity. The online videos are encouraged more in use due to the captions displayed along with the scenes for better understandability. Not only entertainment media but other marketing companies and organizations are utilizing videos along with captions for their product promotions. The need for captions is enabled for its usage in many ways for hearing impaired and non-native people. Research is continued in an automatic display of the appropriate messages for the videos uploaded in shows, movies, educational videos, online classes, websites, etc. This paper focuses on two concerns namely the first part dealing with the machine learning method for preprocessing the videos into frames and resizing, the resized frames are classified into multiple actions after feature extraction. For the feature extraction statistical method, GLCM and Hu moments are used. The second part deals with the deep learning method where the CNN architecture is used to acquire the results. Finally both the results are compared to find the best accuracy where CNN proves to give top accuracy of 96.10% in classification.

이동형 단말기 사용자를 위한 축구경기 비디오의 시청경험 향상 방법 (Raising Visual Experience of Soccer Video for Mobile Viewers)

  • 안일구;고재승;김원준;김창익
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제13권3호
    • /
    • pp.165-178
    • /
    • 2007
  • 최근 멀티미디어 신호처리 및 통신 기술의 발전에 힘입어 작은 LCD 패널을 통한 스포츠경기 시청이 증가하고 있다. 하지만 멀티미디어 단말에 방송되는 대부분의 영상들은 주로 경제적인 이유로 일반 TV나 HDTV 용으로 제작되어 단순히 크기만을 변환하거나 추가적인 편집 없이 녹화되고 있는 실정이다. 이는 작은 이동형 단말 사용자들이 경기화면 내의 상황을 인식하는데 있어서 많은 불편함을 겪는다. 예를 들어, 원거리 샷 카메라 기법으로 찍힌 축구 경기 동영상의 경우, 운동장 내의 공과 선수들은 매우 작아서 알아보기가 힘든 경우가 발생한다. 또한 경기 진행 시간이나 점수를 포함하는 점수상자(scorebox)의 내용 역시 시청자가 쉽게 알아보기 힘들다. 따라서 소형 디스플레이 시청자들의 원활한 이해를 위한 지능형 디스플레이 기술이 필요하다. 이를 위한 핵심기술의 하나가 관심 영역을 자동으로 결정하고 확대하여 보여주는 일이다. 여기서 관심영역이란 시청자들이 화면 내에서 다른 부분에 비해 더욱 관심을 갖게 되는 영역을 말하며 축구경기 비디오의 경우, 주로 상단 모서리에 존재하는 점수상자나 원거리 샷에서의 공을 둘러싼 주변영역 등이 해당된다. 본 논문에서 우리는 이동형 단말기 시청자들을 위한 시청경험 향상을 위한 방법을 제안한다. 경기장면에서 관심영역의 추출을 위해 화면 내에서 시각적으로 현저한 부분의 검출에 관심을 갖는 방법 대신, 축구 경기 비디오 고유의 특징을 이용하는 도메인 한정적인 접근법을 이용한다. 제안된 시스템은 크게 두 가지 모듈 관심영역 결정, 점수상자 추출로 구성된다. 실험 결과를 통해 제안된 알고리즘이 이동형 단말기상에서 지능형 디스플레이를 위한 좋은 해결책임을 보이고자 한다.

클라우드 컴퓨팅 환경에서의 네트워크 적응적 N-스크린 게임 시스템 (Network-Adaptive N-Screen Game System on Cloud Computing Environment)

  • 류은석;강신진
    • 한국게임학회 논문지
    • /
    • 제12권3호
    • /
    • pp.59-68
    • /
    • 2012
  • 본 논문은 클라우드 컴퓨팅 환경에서 새로운 네트워크 적응적 N-스크린 게임 시스템을 설계 및 구현하였다. 목표하는 시스템은 클라우드 서버에서 연산된 게임 화면을 가정에 설치된 게임서버를 통해 한대 이상의 게임 단말로 전송해야 한다. 하지만, 하나의 게임 영상을 가지고 서로 다른 해상도를 가진 N-스크린을 지원하는 것은 어렵고, 무선 네트워크에서의 게임 사용자 이동은 영상 화질을 저하시킨다. 따라서, 본 논문은 스케일러블 비디오 코딩 기술과 채널 코드 기술인 랩터 코드를 이용하여 네트워크 적응적 게임 영상 추출 및 전송 기술을 개발하였다. 실제 게임 영상을 이용한 시뮬레이션 결과는 제안하는 영상 기술의 효율성을 입증한다.

Extraction of User Preference for Video Stimuli Using EEG-Based User Responses

  • Moon, Jinyoung;Kim, Youngrae;Lee, Hyungjik;Bae, Changseok;Yoon, Wan Chul
    • ETRI Journal
    • /
    • 제35권6호
    • /
    • pp.1105-1114
    • /
    • 2013
  • Owing to the large number of video programs available, a method for accessing preferred videos efficiently through personalized video summaries and clips is needed. The automatic recognition of user states when viewing a video is essential for extracting meaningful video segments. Although there have been many studies on emotion recognition using various user responses, electroencephalogram (EEG)-based research on preference recognition of videos is at its very early stages. This paper proposes classification models based on linear and nonlinear classifiers using EEG features of band power (BP) values and asymmetry scores for four preference classes. As a result, the quadratic-discriminant-analysis-based model using BP features achieves a classification accuracy of 97.39% (${\pm}0.73%$), and the models based on the other nonlinear classifiers using the BP features achieve an accuracy of over 96%, which is superior to that of previous work only for binary preference classification. The result proves that the proposed approach is sufficient for employment in personalized video segmentation with high accuracy and classification power.

커쉬함수를 이용한 효율적인 비디오 클립 정합 알고리즘 (An Efficient Video Clip Matching Algorithm Using the Cauchy Function)

  • 김상현
    • 융합신호처리학회논문지
    • /
    • 제5권4호
    • /
    • pp.294-300
    • /
    • 2004
  • 디지털 미디어의 증가로 비디오 클립을 효율적으로 정합하기 위한 다양한 알고리즘이 제안되었다. 기존의 비디오 검색 알고리즘에서는 주로 프레임 단위의 질의에 관한 검색 알고리즘이 연구되었으나 비디오 클립 단위의 질의에 관한 정합 알고리즘 연구는 미진하였다. 본 논문에서는 비디오 클립 질의에 관한 효율적인 비디오 색인과 검색 알고리즘을 제안한다. 시퀀스 정합의 정확도와 성능 향상을 위하여 연속되는 프레임의 히스토그램간의 유사도 함수로 커쉬함수를 사용하였으며 기존의 방법에 비해 높은 성능을 나타내었다. 비디오 샷들로부터 추출된 키프레임들은 샷묶음 뿐만 아니라 비디오 시퀀스 정합이나 브라우징에도 사용되며 여기서 키프레임은 이전 프레임들과 중요한 차이를 보이는 프레임을 나타낸다. 실험 영상을 이용한 실험결과 제안한 방법은 기존의 방법에 비해 적은 계산량으로 높은 정합 성능을 보였다.

  • PDF

관성 센서 데이터를 활용한 3 DoF 이미지 스티칭 향상 (Enhancement on 3 DoF Image Stitching Using Inertia Sensor Data)

  • 김민우;김상균
    • 방송공학회논문지
    • /
    • 제22권1호
    • /
    • pp.51-61
    • /
    • 2017
  • 본 논문은 수평을 유지하여 촬영해야 한다는 기존 이미지 스티칭을 이용한 영상 정합 과정의 단점을 극복하기 위하여, 스마트폰의 가속도 센서와 자기장 센서 데이터를 사용하여 3가지 자유도(3 DoF)에 강인한 이미지 스티칭 방법을 제안한다. 이미지를 붙이는 작업인 이미지 스티칭은 크게 이미지 특징점 추출, 추출된 특징점에서 매칭에 필요한 참인 점(inlier)을 선별, 참인 점을 호모그래피(homography) 행렬로 변환, 호모그래피 행렬을 사용하여 이미지를 왜곡(warping), 왜곡된 이미지와 다른 이미지를 합하는 과정으로 이루어져 있다. 본 논문에서는 일반적으로 사용하는 SIFT, SURF 등의 알고리즘뿐만 아니라 MPEG에서 표준화한 MPEG-7 CDVS(Compact Descriptor for Visual Search) 표준의 특징점 추출 알고리즘을 사용하여 이미지의 특징점을 추출한다. 또한 각 알고리즘의 특징점 추출시간, 추출된 특징점 개수, 선별된 참인 점의 개수를 비교하고, 스티칭 정확도를 판단하여 본 연구에서 활용한 데이터에 어느 알고리즘이 효율적인지 살펴본다.

디지털 비디오를 위한 획기반 자막 추출 알고리즘 (A Stroke-Based Text Extraction Algorithm for Digital Videos)

  • 정종면;차지훈;김규헌
    • 한국지능시스템학회논문지
    • /
    • 제17권3호
    • /
    • pp.297-303
    • /
    • 2007
  • 본 논문에서는 디지털 비디오를 위한 획기반 자막 추출 알고리즘을 제안한다. 제안된 알고리즘은 자막 탐지, 자막 위치 찾기 자막 분리 단계와 분리된 자막에 대한 기하학적 검증 과정으로 구성된다. 자막 탐지 단계는 연속적으로 입력되는 프레임 중 자막이 존재하는 프레임을 찾는 단계로써, 주어진 프레임으로부터 자막이 될 가능성이 높은 점, 즉 씨앗점을 추출한 다음 씨앗점에 대하여 모폴로지 연산을 수행한다. 자막 위치 찾기 단계는 자막이 존재하는 프레임에서 자막의 위치를 찾는 단계로써, 씨앗점을 포함하는 에지에 대한 모폴로지 연산과 프로젝션을 통해 수행된다. 자막 분리 단계에서는 자막과 배경의 색상 분포와 복잡한 배경을 고려하여 자막을 강건하게 분리한다. 마지막으로 자막에 대한 사전 정보를 이용하여 분리된 자막에 대한 기하학적 검증 과정을 수행하여 최종 결과를 얻는다.