• 제목/요약/키워드: Even-based Video Retrieval

검색결과 8건 처리시간 0.021초

폐쇄자막을 기반한 자막기반 동영상 검색 시스템 (Video retrieval system based on closed caption)

  • 김효진;황인정;이은주;이응혁;민홍기
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2000년도 추계종합학술대회논문집
    • /
    • pp.57-60
    • /
    • 2000
  • 동영상 데이터와 같은 영상자료는 많은 활용분야를 가지고 있지만, 비정형성과 구조의 복잡성으로 인하여 손쉽게 검색을 하거나 재사용하는 데 있어서 많은 어려움을 가지고 있다. 본 논문에서는 동영상과 같은 멀티미디어 데이터를 구조적이고 체계화된 형태로 기술한 언어인 SMIL과 SAMI를 사용하여 동영상과 동기화 되어있는 폐쇄자막을 기반으로 동영상을 검색하는 시스템을 구현하였다. 사용자의 검색어를 입력받아 자막파일에서 검색어를 가지고 있는 문자열에서 시간 요소를 추출하여 해당하는 동영상 화면을 보여주는 구조를 가지고 있다.

  • PDF

KFD 웹 데이터베이스 시스템을 위한 동영상 이벤트 분석 및 검색 시스템 (Video Event Analysis and Retrieval System for the KFD Web Database System)

  • 오승근;임영희;정용화;장진경;박대희
    • 한국콘텐츠학회논문지
    • /
    • 제10권11호
    • /
    • pp.20-29
    • /
    • 2010
  • KFD 웹 데이터베이스 시스템은 가족미술치료사들의 요구사항을 반영하여, 방대한 평가 자료의 관리 및 효율적인 사정평가 과정의 지원을 위해 개발된 프로토타입 시스템이다. 그러나 KFD 웹 데이터베이스 시스템은 내담자가 그림을 그리는 동안의 행동패턴, 얼굴 표정, 그리고 음성 정보등과 같은 중요한 관찰요소들에 관한 정보는 얻을 수 없다는 문제점이 있다. 따라서 본 논문에서는 웹 카메라와 그림판 툴을 이용하여 내담자의 KFD 작업 과정을 녹화하고, 녹화된 영상 내의 주요 이벤트들을 인덱싱하여 가족미술치료사가 KFD 동영상을 분석하고 검색할 수 있도록 온톨로지 기반의 이벤트 분석 및 검색 시스템을 제안한다. 즉 새롭게 제안된 시스템에서는 가족 구성원에 관한 내담자의 이벤트 및 행동분석에 관한 요약 보고서와 함께 비디오 검색 서비스가 제공된다. 제안된 KFD 동영상 내의 이벤트 분석 및 검색 시스템은 가족치료사에게 내담자의 작업태도 및 행동, 그리고 KFD 작성과정에 대한 정량적이고, 객관적인 정보를 제공함으로써 보다 강화된 KFD 사정 평가를 지원할 수 있다.

시각 미디어 온톨로지에 기반한 서비스 제공자 랭킹 (Service Provider Ranking Based on Visual Media Ontology)

  • 민영근;이복주
    • 정보처리학회논문지B
    • /
    • 제15B권4호
    • /
    • pp.315-322
    • /
    • 2008
  • 인터넷 상에 산재해 있는 사진이나 비디오 등 시각 미디어 데이터를 효과적으로 검색하는 것은 전자 미술 박물관, 전자상거래, 전자 쇼핑몰 등 여러 응용 분야에서 중요한 일이다. 이러한 분야에서는 단순한 키워드 검색이 아닌 내용 기반 또는 의미 기반의 멀티미디어 검색을 필요로 한다. 인터넷 상의 시각 미디어를 효과적으로 검색하기 위해 제안된 선행 연구에서는 시각 미디어의 메타데이터와 온톨로지를 이용하고 또한 웹서비스를 이용하여 의미 기반의 검색을 수행한다. 본 연구에서는 인터넷 상에서 여러 시각 미디어 제공자와 이 제공자들의 정보를 가지고 있는 하나의 중계자가 존재하는 상황에서 시각 미디어를 효율적으로 검색하기 위한 전 단계로 적합한 서비스 제공자를 찾는 방법을 제안한다. 제안된 방법은 사용자의 질의에 적합한 제공자들과 그 순위를 효율적으로 얻기 위하여 온톨로지의 트리 구조를 이용한다. 온톨로지 트리에서 하위 노드의 크기와 자식 노드의 크기에 기반한 이 방법은 기존의 방법에 비해 효과적으로 제공자들간의 순위를 측정한다. 실험 결과 이 방법이 속도는 비슷하게 유지하면서 정확한 결과를 도출함을 보인다.

MF sampler: 동영상 기반 패션 검색 모델의 성능 향상을 위한 샘플링 방법 (MF sampler: Sampling method for improving the performance of a video based fashion retrieval model)

  • 백상훈;박종혁
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.329-346
    • /
    • 2022
  • 최근 소셜 미디어의 숏폼(Short form) 동영상(인스타그램, 틱톡, 유튜브) 시장이 점차 증가하면서 인공지능 영역에서는 이를 활용한 연구가 활발히 진행되고 있다. 대표적인 연구분야로 동영상 내의 패션 상품을 탐지하고 상품 이미지를 검색하는 Video to shop 을 들 수 있다. 이와 같은 동영상 기반 인공지능 모델에서는 Convolution 연산을 사용하여 상품의 특징을 추출한다. 하지만 연산 자원의 제한으로 인해, 동영상의 모든 프레임을 사용하여 특징을 추출하는 것은 현실적으로 불가능하다. 이로 인해, 기존 연구에서는 전체 프레임 중 일부만 샘플링해서 사용하거나, 주제의 특성을 활용한 샘플링 방법을 개발하여 이를 통해 위 문제점을 개선하고, 모델의 성능도 향상시켰다. 기존의 Video to shop 연구에서는 프레임을 샘플링 할 때, 무작위로 일부분의 프레임을 샘플링하거나 균등한 간격으로 샘플링 한다. 하지만 이러한 샘플링 방법은 상품이 존재하지 않는 노이즈 프레임을 샘플링 하면서 패션 상품 검색 모델의 성능을 저하시킨다. 이에 본 연구는 노이즈 프레임을 제거하고 검색 모델의 성능을 향상시키는 샘플링 방법 MF(Missing Fashion items on frame) sampler를 제안한다. MF sampler는 키 프레임 메커니즘(Mechanism)을 발전시켜 자원 한계의 문제점을 개선했다. 또한, 노이즈 탐지 모델을 활용한 노이즈 프레임 제거를 통해 검색 모델의 성능을 향상시켰다. 이와 같은 결과는 실험을 통해 확인되었고, Video to shop 패션 상품 검색에 있어 성능 향상과 효과적인 학습이 가능하다는 것을 확인할 수 있었다.

비디오 데이타를 위한 그리드 기반의 유사 부분 궤적 검색 기법 (Similar sub-Trajectory Retrieval Technique based on Grid for Video Data)

  • 이기영;임명재;김규호;김정준
    • 한국인터넷방송통신학회논문지
    • /
    • 제9권5호
    • /
    • pp.183-189
    • /
    • 2009
  • 최근, PCS, PDA와 같은 이동기기 보급의 확산, GPS(Global Positioning System)의 활용, 유무선 네트워크의 급속한 발전 등으로 일반 사용자들조차 이미지, 오디오, 비디오 등과 같은 멀티미디어 데이타에 대한 활용이 증가하고 있다. 특히, 멀티미디어 데이타 중에서도 비디오 데이타는 텍스트나 이미지 데이타와는 달리 이동 객체에 대한 움직임 정보를 포함하고 있고 시간의 변화에 따라 공간의 변화를 가지는 시공간적 특성을 가진다. 객체의 공간적 위치가 시간의 흐름에 따라 계속 변하는 이동객체(Moving Object)들의 연속적인 움직임들의 모임을 궤적이라 하며, 데이타베이스에서 사용자로부터 주어진 질의 궤적과 유사한 궤적을 포함하는 데이타를 찾는 것을 유사 부분궤적 검색(Similar Sub-trajectory Retrieval)이라 한다. 그리고 이러한 유사 부분궤적 검색을 하기 위해선 사용자 질의 궤적과 주어진 유사정도(Tolerance) 내에서 유사한 데이타 궤적을 검색 할 수 있는 근사 매칭(Approximate Matching)이 가능해야 한다. 또한, 방대한 멀티미디어 데이타베이스에서 사용자가 원하는 데이타 만을 보다 빠른 시간 내에 찾을 수 있도록 기존 연구와는 다른 효과적인 검색방법이 요구된다. 이를 위해, 본 논문에서는 효과적인 검색을 위해 궤적을 그리드로 분할하여 이동 객체의 궤적에 대한 효율적인 유사 부분궤적 검색을 지원하는 새로운 그리드 기반 검색 기법을 제안한다.

  • PDF

오디오의 Peak 특징을 이용한 동일 영화 콘텐츠 검색 (Similar Movie Contents Retrieval Using Peak Features from Audio)

  • 정명범;성보경;고일주
    • 한국멀티미디어학회논문지
    • /
    • 제12권11호
    • /
    • pp.1572-1580
    • /
    • 2009
  • 검색을 위해 동영상 데이터 전체를 이용하면 많은 시간과 저장 공간이 필요하다. 이를 보완하고자 기존의 동일 영화 검색은 영상 정보의 일부를 이용하여 동일한 영상 검색에 사용해 왔다. 그러나 이 방법은 같은 영상임에도 비디오 부호화기이나 해상도가 다른 경우 전혀 다른 영상으로 인식한다. 따라서 본 논문에서는 동영상의 오디오 정보를 이용하여 동일한 동영상을 찾는 알고리즘을 제안한다. 제안 방법은 부호화율, 부호화기, 샘플링 수의 변화에도 유사한 파형을 형성하는 Peak 정보를 바탕으로 데이터베이스에 색인하고, 검색한다. 논문에서는 제안 방법의 성능을 확인하기 위해 1,000개의 동영상 데이터를 검색 실험하였으며, 92.1%의 성공률을 나타내었다.

  • PDF

HEVC 스트림 상에서의 객체 추적 방법 (Object Tracking in HEVC Bitstreams)

  • 박동민;이동규;오승준
    • 방송공학회논문지
    • /
    • 제20권3호
    • /
    • pp.449-463
    • /
    • 2015
  • 동영상에서의 객체 추적은 보안, 색인 및 검색, 감시, 통신, 압축 등 다양한 분야에서 중요하다. 본 논문은 HEVC 비트스트림 상에서의 객체 추적 방법을 제안한다. 복호화를 수행하지 않고, 비트스트림 상에 존재하는 움직임 벡터(MV : Motion Vector)와 부호화 크기 정보를 Spatio-Temporal Markov Random Fields (ST-MRF) 모델에 적용해 객체 움직임의 공간적 및 시간적 특성을 반영한다. 변환계수를 특징점으로 활용하는 객체형태 조정 알고리즘을 적용해 ST-MRF 모델 기반 객체 추적방법에서 나타나는 과분할에 의한 오차전파 문제를 해결한다. 제안하는 방법의 추적성능은 정확도 86.4%, 재현율 79.8%, F-measure 81.1%로 기존방법 대비 평균 F-measure는 약 0.2% 향상하지만 기존방법에서 과분할 및 오차전파가 두드러지는 영상에 대해서는 최대 9% 정도의 성능향상을 보인다. 전체 수행시간은 프레임 당 평균 5.4ms이며 실시간 추적이 가능하다.

영화 비디오 자막 추출 및 추출된 자막 이미지 향상 방법 (Methods for Video Caption Extraction and Extracted Caption Image Enhancement)

  • 김소명;곽상신;최영우;정규식
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권4호
    • /
    • pp.235-247
    • /
    • 2002
  • 디지털 비디오 영상을 효과적으로 색인하고 검색하기 위해서 비디오의 내용을 함축적으로 표현하고 있는 비디오 자막을 추출하여 인식하는 연구가 필요하다. 본 논문에서는 압축되지 않은 비디오 영화 영상에 인위적으로 삽입한 한글 및 영어 자막을 대상으로 자막 영역을 추출하고, 추출된 자막 이미지를 향상시키는 방법을 제안한다. 제안한 방법의 특징은 동일한 내용의 자막을 갖는 프레임들의 위치를 자동으로 찾아서 동일 자막 프레임들을 다중 결합하여 배경에 포함되어 있는 잡영의 일부 또는 전부를 우선 제거한다. 또한, 이 결과 이미지에 해상도 중대, 히스토그램 평활화, 획 기반 이진화, 스무딩의 이미지 향상 방법을 단계적으로 적용하여 인식 가능한 수준의 이미지로 향상시킨다. 제안한 방법을 비디오 영상에 적용하여 동일한 내용의 자막 그룹 단위로 자막 이미지를 추출하는 것이 가능해졌으며, 잡영이 제거되고 복잡한 자소의 획이 보존된 자막 이미지를 추출할 수 있었다. 동일한 내용의 자막 프레임의 시작 및 글위치를 파악하는 것은 비디오 영상의 색인과 검색에 유용하게 활용될 수 있다. 한글 및 영어 비디오 영화 자막에 제안한 방법을 적용하여 향상된 문자 인식 결과를 얻었다.