• 제목/요약/키워드: 비디오 색인 및 검색

검색결과 55건 처리시간 0.025초

키 프레임 특징들에 적응적 가중치 부여를 이용한 검색 성능 개선 (Improvement of Retrieval Performance Using Adaptive Weighting of Key Frame Features)

  • 김강욱
    • 한국멀티미디어학회논문지
    • /
    • 제17권1호
    • /
    • pp.26-33
    • /
    • 2014
  • 비디오 검색 및 색인은 먼저 압축 비디오에서 장면전환을 검출하여 샷(shot)으로 분리한 후 샷 내에 키프레임 특징 정보들의 유사도 비교를 통해 이루어진다. 일반적으로 내용기반 영상 및 비디오 검색에서는 컬러, 형태, 질감의 세 가지 대표적인 영상 특징들이 주로 사용된다. 그러나 여러 특징들이 결합되어 사용되는 검색 시스템이라 할지라도 각 특징들에 대한 가중치가 적합하게 부여되지 않으면 검색되는 결과 영상의 순위가 크게 변하여 검색 성능이 떨어지게 된다. 이러한 문제점을 해결하기 위해 본 논문에서는 여러 특징들이 결합되어 사용될 때 각 특징에 대한 가중치를 적응적으로 부여해서 비디오 검색 성능을 개선하고자 한다. 제안한 방법을 3,200개 키 프레임으로 구성된 비디오 데이터베이스에서 실험을 하였고 다양한 성능평가 방법을 통해 제안한 방법이 기존 고정가중치 부여를 이용한 방법과 비교하여 검색 성능이 개선됨을 볼 수 있었다.

비디오 자막 추출 및 이미지 향상에 관한 연구 (Video Caption Extraction and Image Enhancement)

  • 김소명;최영우;정규식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.359-361
    • /
    • 2000
  • 본 논문에서는 비디오 자막 이미지를 인식하기 위해 필요한 영상 향상의 단계로서 다중 결합을 적용한다. 또한 다중 결합을 위한 동일한 자막의 판단 및 결합된 결과를 재평가하기 위한 방법을 제안한다. 입력된 칼라 이미지로부터 RLS(Run Length Smearing)가 적용된 에지 이미지를 얻고, 수직 및 수평 히스토그램 분포를 이용하여 자막과 자막 영역에 대한 정보를 추출한다. 프레임 내의 자막 영역의 중첩 정도를 이용하여 동일 자막을 판단하고, 동일한 자막을 갖는 프레임들끼리 다중 결합을 수행함으로써 향상된 이미지를 얻는다. 끝으로 결합된 영상에 대한 평가를 수행하여 잘못 결합된 이미지들로 인한 오류를 해결하고 재평가한다. 제안한 방법을 통해, 배경 부분의 잡영이 완화된 자막 이미지를 추출하여 인식의 정확성과 신뢰성을 높일 수 있었다. 또한 동일한 자막의 시작 프레임과 끝 프레임의 위치 파악은 디지털 비디오의 색인 및 검색에 효과적으로 이용될 수 있을 것이다.

  • PDF

통계적 특성을 이용한 비디오의 분할 및 대표 프레임의 추출방법

  • 조완현;박순영;박종현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.295-297
    • /
    • 2003
  • 본 논문에서는 각 프레임으로부터 추출된 통계적 특성을 이용하여 동영상의 분할방법과 분할된 각 장면에 대한 대표프레임을 추출하는 방법을 제안한다. 제안된 방법은 동영상의 각 프레임에 대하여 다해상도 분석을 실시하여 저주파 부 밴드로부터 히스토그램 특징을 추출하여 급격한 장면전환을 분할하는데 이용하였으며 또한 점진적인 장면전환을 검출하기 위해서는 고주파 부 밴드로부터 계산되는 화소의 분산치를 계산하여 특징벡터로 사용하였다. 실험의 결과를 통하여 제안된 동영상의 분할방법과 대표프레임 추출에 대한 알고리즘들이 동영상 자료의 분석 및 색인을 위한 효율적인 동영상 분할을 가능하게 하며, 차후 내용기반 영상과 비디오의 색인 및 검색을 위한 전처리의 단계로 사용되어질 수 있는 매우 유용한 방법임을 보였다.

  • PDF

이동 객체의 내용 및 개념 기반 검색을 위한 시공간 모델링에 근거한 시그니쳐 기반 비디오 색인 기법 (A Signature-based Video Indexing Scheme using Spatio-Temporal Modeling for Content-based and Concept-based Retrieval on Moving Objects)

  • 심춘보;장재우
    • 정보처리학회논문지D
    • /
    • 제9D권1호
    • /
    • pp.31-42
    • /
    • 2002
  • 본 논문에서는 비디오 데이터가 지니는 이동 객체의 궤적(Moving Object's Trajectory)을 효과적으로 모델링할 수 있는 시공간 표현 기법(Spatio-Temporal Representation Scheme)과 궤적을 이용한 사용자 질의에 대해 효율적인 검색을 위한 새로운 시그니쳐 기반 접근 기법을 제안한다. 제안하는 시공간 표현 기법은 궤적을 기반으로 하는 내용 기반 검색(Content-based Retrieval)과 궤적에서 일어나는 위치 정보를 통해 얻어진 개념(의미)을 이용한 개념 기반 검색(Concept-based Retrieval)을 지원한다. 아울러, 제안하는 시그니쳐 기반 접근 기법은 데이터 파일을 직접 접근하기 전에 전체 시그니쳐들은 탐색하여 필터링을 수행한 후, 검색된 후보 시그니쳐들에 대해서만 디스크를 접근하기 때문에 순차 탐색에 비해 많은 수의 디스크 접근 횟수를 감소시킴으로써 검색 성능을 향상시킨다. 마지막으로, 성능 평가를 통해 제안하는 방법이 검색 효과(Retrieval Effectiveness) 및 효율(Retrieval Efficiency) 측면에서 기존의 방법인 Li나 Shan의 방법에 비해 우수함을 보인다.

효율적인 브라우징 환경을 위한 비디오 색인 (Video Indexing for Efficient Browsing Environment)

  • 고병철;이해성;변혜란
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권1호
    • /
    • pp.74-83
    • /
    • 2000
  • 최근 멀티미디어에 대한 관심이 증가하면서 그에 따른 기술 또한 매우 빠른 속도로 증가하고 있다. 특히 비디오 영상 검색 기능에 대한 사용자들의 욕구는 비디오에 대한 수동적인 접근 방식에서, 자신이 원하는 부분만을 선택적으로 검색할 수 있는 보다 편리한 환경을 요구하고 있다. 이를 위해서는 대용량의 비디오 데이타를 의미 있는 단위로 나누기 위한 비디오 파싱(Parsing)과 클러스터링(Clustering), 브라우징(Browsing)등을 포함하는 비디오 인덱싱 시스템의 구현이 필요하다. 본 논문에서는 우선 비디오 시퀀스를 히스토그램과 화소단위 비교법을 혼합한 하이브리드 방법을 통해서 자동 인덱싱을 위한 기본 단위인 샷(shot)으로 나눈다. 비디오 분할 후에 각 샷들로부터 대표 프레임을 검출한다. 대표 프레임은 사용자로 하여금 비디오의 전체적인 내용을 이해할 수 있도록 도와줌으로써 그 중요성이 크다고 할 수 있다. 따라서 본 논문에서는 웨이블릿 변환을 이용하여 우선적으로 샷 내에 포함된 카메라의 움직임을 분석하고, 각 프레임들의 변화량을 측정하여 샷의 복잡성에 따라 각기 다른 수의 대표 프레임을 선출하도록 하였다. 마지막으로 카메라 움직임중 패닝, 혹은 틸팅이 포함된 샷에 대해서 파노라마 영상을 합성함으로써 사용자에게 보다 편리하고 이해하기 쉬운 브라우징 환경을 제공할 수 있도록 하였다.

  • PDF

비디오 콘텐츠를 위한 색인 온톨로지 저장소 (Index Ontology Repository for Video Contents)

  • 황우연;양정진
    • 한국멀티미디어학회논문지
    • /
    • 제12권10호
    • /
    • pp.1499-1507
    • /
    • 2009
  • 나날이 방대해지는 디지털 콘텐츠들의 홍수 속에서 원하는 정보를 찾아내는 데 필요한 정밀한 색인 기술의 필요성은 날로 증대되어 가고 있다. 이러한 요구 수용을 위해서는 지능형 개체가 정보의 검색 주체가 되어야 하며, 지능형 개체간의 상호 운용성이 뒷받침되어져야 한다. 본 논문에서는 Snoek, Worring들이 제안한 다중 형상 색인을 위한 통합 기반구조를 분석하고 콘텐츠 기반의 자동화된 색인 기법에서 색인정보의 신뢰성을 높이기 위한 방법을 살펴본다. 그리고 이를 통해 시맨틱 웹 기술의 온톨로지 개념을 적용하여 추상화된 색인 정보의 생성과 제어를 지원하고 사람과 기계간, 기계와 기계간의 의미적 상호 운용성이 보장되는 기반 모델을 제시하고자 한다. 온톨로지의 메모리 상주 모델 처리 방식은 방대한 색인 정보를 수용하기에 부적절하기 때문에 온톨로지 저장소의 사용을 필요로 하며, 논리적으로 표현된 지식의 일관성과 추론을 위해 추론엔진의 사용이 요구된다. 본 논문에서는 온톨로지 저장소의 기능 및 성능적인 요구사항을 모두 만족시키는 Minerva 온톨로지 저장소를 이용하여 비디오 콘텐츠를 표현한 설계 지식을 저장하고 회수하는 실험을 하였다. 또한 마지막으로는 다른 연구과제들과 연계한 효율적인 색인 가능성에 대해 고찰해 본다.

  • PDF

COSMIC : 영역지식과 시각정보를 이용한 내용기반 멀티미디어 검색 시스템의 설계 및 구현 (COSMIC : Design and Implementation of a Content-Based Multimedia Retrieval System using Domain Knowledge and Visual Information)

  • 김덕환;김시우;박광순;이병구;차광호;정진완
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제5권1호
    • /
    • pp.14-28
    • /
    • 1999
  • 최근 멀티미디어 데이터로부터 내용에 대한 정보를 추출하여 데이터베이스에 저장하고 내용에 기반한 질의를 수행하도록 하는 내용 기반 검색 시스템이 중요한 핵심 기술로 대두되고 있다. 본 논문에서는 내용 기반 멀티미디어 검색 시스템인 COSMIC(Content Based Multimedia Information Processor)의 설계 및 구현에 관하여 기술한다. COSMIC은 대용량 이미지 데이터로부터 자동으로 추출된 시각적 특징 데이터들을 다차원 점접근 방법(Point Access Method)인 HG-트리를 이용하여 색인하고 예제 이미지와 사용자가 그린 스케치에 의한 시각적 질의를 제공한다. 또한 COSMIC은 비디오 데이터로부터 추출된 다양한 의미 정보를 이용하여 의미 질의를 제공한다. COSMIC의 유효성을 입증하기 위해서 다양한 시각적 질의와 이미 질의를 이용한 실험을 수행하였다.

MSE를 이용한 비디오의 장면전환 검색에 관한 연구 (A Study on the Scene Chang Detection Retrieval of Video Using MSE)

  • 김단환;김형균;고석만;오무송
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 춘계학술발표논문집(하)
    • /
    • pp.1052-1055
    • /
    • 2002
  • 동영상 정보는 영상정보뿐만이 아니라 음성정보, 문자정보 및 각종 의미있는 정보들을 포함하고 있어서 기존의 검색 방법으로는 사용자가 원하는 이미지를 찾는데 어려움이 따른다. 따라서, 본 연구에서는 동영상 정보의 효율적인 활용을 위한 색인 방법으로 MSE(Mean Square Error) 도입하여 동영상의 장면전환 검색하는 방법을 제안한다. 이것은 영상 데이터를 대각선 방향으로 일정픽셀의 칼라 값을 추출하여 행렬A에 i×j행렬로 i는 프레임 수, j는 프레임의 영상 높이로 저장하고 동영상의 전체 구조를 파악할 수 있도록 정지영상으로 샘플링 하였다. 샘플링 된 데이터는 대용량 동영상 데이터 이용에 있어서 사용자가 전체 동영상의 장면전환점을 한눈으로 파악할 수 있고, 각 프레임의 MSE와 임계값을 초과하면 그 프레임이 장면전환점으로 검색한다.

  • PDF

장면 전환 기법을 이용한 동영상 검색 시스템 설계 (Design of Moving Picture Retrieval System using Scene Change Technique)

  • 김장희;강대성
    • 대한전자공학회논문지SP
    • /
    • 제44권3호
    • /
    • pp.8-15
    • /
    • 2007
  • 최근 멀티미디어 데이터를 효율적으로 전송, 저장 관리 및 검색하는 기술이 중요한 핵심 기술로 대두되고 있다. 그 중에서 멀티미디어 정보 검색의 경우 사용자가 원하는 정보를 표현할 수 있는 사용자 인터페이스 기술과 원하는 정보를 사용자에게 신속하고 정확하게 보여주는 기술의 필요성이 증대하고 있다. 본 논문에서는 MPEG으로 압축된 영상 정보에서 장면의 전환점인 컷을 효과적으로 검출하여 동영상을 분할하는 기법을 제안한다. 컷 검출(Cut detection)은 MPEG 비디오 시퀀스에서 동영상을 분할하는 가장 기본적이면서 중요한 기초 작업이며, 비디오 색인 및 검색을 위한 첫 번째 단계이다. 기존의 방법들은 프레임간을 비교하기 때문에 물체의 빠른 움직임이나 카메라의 움직임, 후레쉬의 섬광 등 화면 변화에 따라 오검출이 생기는 단점이 있다. 제안하는 컷 검출 기법은 먼저 입력영상을 DCT의 DC를 이용하여 샷을 검출한다. 이렇게 검출된 샷으로 데이터베이스를 구성하고, MPEG-7의 시각 기술자 중 HMMD 컬러 모델과 에지 히스토그램을 사용하여 영상에서 특징을 추출하였다. 그리고 제안하는 매칭 기법에 따라 단계별 검색을 수행하였다. 이 실험을 통해서 기존 방법들보다 높은 검색률을 보이는 개선된 동영상 분할 시스템을 설계하였다.

자막의 구조적 특징을 이용한 축구 비디오 하이라이트 생성 (Creation of Soccer Video Highlight Using The Structural Features of Caption)

  • 허문행;신성윤;이양원;류근호
    • 정보처리학회논문지D
    • /
    • 제10D권4호
    • /
    • pp.671-678
    • /
    • 2003
  • 디지털 비디오는 대용량의 저장 공간을 필요로 하는 시간적으로 매우 긴 데이터이다. 따라서 사용자들은 대용량의 긴 비디오를 시청하기 전에 사전에 제작된 요약된 비디오를 시청하고 싶어 한다. 특히, 스포츠 비디오 분야에서는 하이라이트 비디오를 시청하고자 한다. 결과적으로 하이라이트 비디오는 사용자들이 비디오를 시청하고자 할 경우 그 비디오가 시청할 가치가 있는지를 결정하는데 사용된다. 본 논문에서는 자막의 구조적 특징을 이용하여 축구 비디오 하이라이트를 생성하는 방법을 제시한다. 자막의 구조적 특징은 자막이 갖는 시간적 특징과 공간적 특징으로서 이러한 구조적 특징을 이용하여 자막 프레임 구간과 자막 키 프레임을 추출한다. 그리고 하이라이트 비디오는 자막 키 프레임들에 대한 장면 재설정과 논리적 색인화 및 하이라이트 생성 규칙을 이용하여 생성한다. 마지막으로, 브라우저를 통한 사용자의 항목 선택에 의하여 하이라이트 비디오와 비디오 세그먼트에 대한 검색과 브라우징을 수행할 수 있다.