• 제목/요약/키워드: 비디오 색인 및 검색

검색결과 55건 처리시간 0.02초

캡션정보 및 음성인식을 이용한 내용기반 비디오 정보 색인 및 검색에 관한 연구 (A Study on the Content-Based Video Information Indexing and Retrieval Using Closed Caption and Speech Recognition)

  • 손종목;김진웅;배건성
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1999년도 학술대회
    • /
    • pp.141-145
    • /
    • 1999
  • 뉴스나 드라마, 영화 등의 비디오에 대한 검색 시 일반 사용자의 요구에 가장 잘 부합되는 결과를 얻기 위해 비디오 데이터의 의미적 분석과 색인을 만드는 것이 필요하다. 일반적으로 음성신호가 비디오 데이터의 내용을 잘 나타내고 비디오와 동기가 이루어져 있으므로, 내용기반 검색을 위한 비디오 데이터 분할에 효율적으로 이용될 수 있다 본 논문에서는 캡션 정보가 주어지는 방송뉴스 프로그램을 대상으로 효율적인 검색, 색인을 위한 비디오 데이터의 분할에 음성인식기술을 적용하는 방법을 제안하고 그에 따른 실험결과를 제시한다.

  • PDF

내용기반 비디오 색인 및 검색을 위한 음성인식기술 이용에 관한 연구 (A Study on the Use of Speech Recognition Technology for Content-based Video Indexing and Retrieval)

  • 손종목;배건성;강경옥;김재곤
    • 한국음향학회지
    • /
    • 제20권2호
    • /
    • pp.16-20
    • /
    • 2001
  • 비디오 프로그램 색인 및 검색에 있어서 비디오 프로그램을 의미 있는 부분으로 분할하는 것, 즉 내용기반 비디오 프로그램 분할은 중요하다. 본 논문에서는 내용기반 비디오 프로그램 분할을 위해 음성인식기술을 이용하는 새로운 방법을 제안한다. 제안한 방법은 음성신호와 캡션 (Closed Caption)의 정확한 동기를 위해 음성인식 기법을 사용한다. 실험을 통하여 내용기반 비디오 프로그램 분할을 위해 제안한 방법의 가능성을 확인하였다.

  • PDF

내용 및 개념 기반 비디오 검색을 지원하는 시공간 표현 기법 (A Spatio-temporal Representation Scheme for supporting Content- and Concept-based Video Retrieval)

  • 심춘보;장재우
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.64-66
    • /
    • 2001
  • 비디오 데이터는 미디어의 특성상 시간의 흐름에 따라 객체의 위치가 변하는 움직임 객체(Moving Object)를 가지며, 움직임 객체를 기반으로 비디오 데이트를 색인 및 검색하기 위해서는 적합한 시공간 표현 기법이 요구된다. 따라서 본 논문에서는 비디오 데이터가 지니는 움직임 객체의 움직임 경로(Trajectory)를 효율적으로 모델링하고 사용자에게 빠른 검색 결과를 제공할수 있는 근사 탐색(Approximation Search)이 가능한 새로운 시공간 표현 기법을 제안한다. 이는 사용자가 직접 스케치한 움직임 경로를 토대로 검색을 수행하는 내용 기반 검색과 움직임 객체의 일련의 움직임 경로들과 움직임 경로가 일어나는 위치 정보를 통해 얻어진 개념(의미)을 이용한 개념 기반 검색을 지원한다.

  • PDF

구조화된 비디오 문서의 데이터 모델 및 질의어와 색인 기법 (Data Model, Query Language, and Indexing Scheme for Structured Video Documents)

  • 류은숙;이규철
    • 한국멀티미디어학회논문지
    • /
    • 제1권1호
    • /
    • pp.1-17
    • /
    • 1998
  • 비디오 정보는 전자 도서관이나 WWW 및 주문형 비디오 (VOD) 시스템과 같은 다양한 응용분야에서 중요한 요소로 부각되고 있다. 비디오 정보는 특성상 계층적으로 구조화된 문서 형태를 가지기 때문에 본 논문에서는 이를 “구조화된 비디오 문서”라 부른다. 본 논문에서는 구조화된 비디오 문서를 데이터베이스에 효율적으로 저장하고, 검색하기 위한 데이터 모델과 질의어 및 색인 기법을 제안한다. 구조화된 비디오 문서는 논리적인 계층 구조 특성을 지니기 때문에, 본 논문에서는 객체 지향 데이터 모델을 이용하여 비디오 문서를 복합 객체로 모델링하고, 이를 저장하기 위한 객체 타입들을 정의한다. 또한 본 논문에서는 비디오 데이터의 캡션이나 주석을 기반으로 한 내용 기반 검색과 비디오 문서의 논리적 구조를 기반으로 한 구조 기반 검색을 제공하며, 비디오 문서의 시공간 관계 연산을 이용한 검색도 지원한다. 그리고, 구조화된 비디오 문서의 효율적인 질의와 색인 공간의 오버헤드를 줄이기 위해 최적화된 역 색인 기법을 제시한다.

  • PDF

물체의 움직임 궤적에 기반한 감시 비디오의 검색 (Surveillance Video Retrieval based on Object Motion Trajectory)

  • 정영기;이규원;호요성
    • 방송공학회논문지
    • /
    • 제5권1호
    • /
    • pp.41-49
    • /
    • 2000
  • 본 논문에서는 감시 비디오의 검색을 위해 객체 단위의 특징을 이용한 새로운 비디오 색인 및 탐색 방법을 제안한다. 의미론적인 레벨에서 각각의 객체에 접근하기 위해 객체의 움직임 궤적 모델을 색인 인자(Key)로 이용하였다. 객체 움직임 궤적을 이용한 내용 기반의 비디오 색인을 위해 비디오 시퀀스에서 움직임 분할에 의해 객체를 검지한 다음, 분할된 객체를 추적하여 움직임 궤적을 생성하고 이를 기호적인 표현으로 모델링한다. 제안된 검색 시스템은 query by example, query by sketch 및 query on weighting parameters 등의 사건 기반의 비디오 검색을 위한 다양한 질의 유형을 지원할 수 있도록 설계되었다. 관심있는 비디오 클립(clip)을 검색했을 때, 제안된 시스템은 유사도에 따라 순서대로 정합된 사건들을 결과로 출력한다.

  • PDF

멀티미디어 정보의 색인 및 검색을 위한 핵심 사운드 검출 (Detection of Keysound for Indexing ana Retrieval of Multimedia information)

  • 이용주;배건성
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.759-762
    • /
    • 2000
  • 멀티미디어 정보의 보다 효율적인 검색을 위해서는 비디오 요약정보의 생성 및 색인 작업이 필요하며, 이러한 요약정보를 만들기 위해서는 많은 시간과 비용이 소요된다. 스포츠 비디오 프로그램의 요약정보를 만들 때 오디오 신호를 이용하여 주요 장면을 검출할 경우 이러한 시간과 비용을 줄일 수 있다. 본 연구에서는 축구경기 비디오에서 주요장면을 나타내는 핵심 사운드로 주심의 호르라기 소리 및 아나운서의 "슛" 음성을 정의하고 이를 오디오 신호에서 검출하는 방법에 대해 연구하였다.

  • PDF

MPEG 비디오 시퀀스에서 비디오 요약을 위한 장면 전환 검출 및 대표 프레임 추출 알고리즘 (Scene Change Detection and Representative Frame Extraction Algorithm for Video Abstract on MPEG Video Sequence)

  • 강응관
    • 한국멀티미디어학회논문지
    • /
    • 제6권5호
    • /
    • pp.797-804
    • /
    • 2003
  • 장면 전환검출 (scene change detection)은 영상 정보의 색인 (indexing) 및 검색을 위한 전처리로서 비디오 검색 시스템의 전체 성능을 좌우하는 중요한 기술로 현재 많은 연구가 진행되고 있다. 본 논문에서는 급격한 움직임 및 조명 변화, 빠르게 연속적으로 등장하는 장면 전환에 강건한 급격한 장면 전환 검출 기법과 디졸브, 페이드 등의 장면 전환을 보다 효과적으로 검출할 수 있는 점진적인 장면 전환 검출 기법 및 추출된 셧 (shot)의 내용을 DCT DC 이미지 버퍼링과 누적 히스토그램 교차 함수 (accumulative histogram intersection measure)에 의해 대표 프레임으로 추출하는 새로운 알고리즘을 제안하고, 모의 실험 결과 기존 방식에 비해 보다 우수한 성능을 보임을 입증하였다.

  • PDF

문자정보 기반 비디오 분할에서 성능 향상을 위한 음성신호처리 (Speech Signal Processing for Performance Improvement of Text-Based Video Segmentation)

  • 이용주;손종목;강경옥;배건성
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1999년도 학술대회
    • /
    • pp.187-191
    • /
    • 1999
  • 비디오 프로그램에서 영상 내에 포함되어 있는 문자정보는 동영상의 내용 검색 및 색인을 위한 비디오 분할에 사용될 수 있다. 일반적으로 장면 내에 포함되어 있는 문자들은 해상도가 낮고 글자 크기와 형태가 다양하기 때문에 추출과 인식이 어려울 뿐만 아니라 의도하지 않은 배경화면의 문자인 경우도 많기 때문에 내용기반 검색에는 사용되기가 어렵다. 그러나 비디오 내에 포함된 문자정보가 나타나는 시작 프레임과 끝나는 프레임을 검출하여 비디오 프로그램을 분할함으로써 내용기반요약정보를 만들 수 있으며, 동영상의 내용 검색 및 색인에 사용할 수 있다. 일반적으로 문자정보의 추출에 의해서 비디오를 분할할 때 음성정보는 전혀 고려되지 않으므로 분할된 비디오 정보를 재생할 경우음성신호가 단어 또는 어절/음절의 임의의 점에서 시작되고 끝나게 되어 듣기에 부자연스럽게 된다 따라서 본 논문에서는 뉴스방송의 비디오 프로그램에서 문자정보가 포함되어 는 비디오의 시작 프레임과 끝 프레임을 중심으로 그에 대응되는 구간의 음성신호를 검출한 후 이를 적절히 처리하여 분할 된 비디오를 재생할 때 음성신호가 보다 자연스럽게 들릴 수 있도록 하는 방법에 대해 연구하였다.

  • PDF

프레임 특징 비교를 이용한 압축비디오 분할 (MPEG Video Segmentation Using Frame Feature Comparison)

  • 김영호;강대성
    • 융합신호처리학회논문지
    • /
    • 제4권2호
    • /
    • pp.25-30
    • /
    • 2003
  • 최근 들어 디지털 기술의 발전은 문자, 음성, 화상, 비디오 등과 같은 멀티미디어 정보가 매우 큰 비중을 차지하고 있다 이들 중에서 비디오와 관련된 연구로는 비디오 색인 및 검색에 관한 연구가 많이 진행되고 있다. 본 논문에서는 MPEG으로 압축된 비디오 분할을 위한 새로운 알고리즘을 제안한다. Shot 검출 즉 장면전환 검출은 MPEG 비디오 시퀀스에서 분할하는 가장 기본적이면서 중요한 작업이며 비디오 색인 및 검색을 위한 첫 번째 단계이다. 일반적으로 많이 사용되는 분할 알고리즘은 이전 프레임과 현재 프레임을 비교하기 때문에 물체의 빠른 움직임이나 카메라의 움직임, 카메라 후레쉬의 섬광 등 화면 변화에 따라 오검출이 생기는 단점이 있었다 따라서 본 논문에서는 기존 알고리즘에 검출한 장면전환 지점을 사용하여 이웃 프레임들과의 특징차 비교를 통하여 한번 더 판별하였다. 실험 결과 기존 알고리즘 보다 정확한 장면전환 검출을 할 수 있었다.

  • PDF

NoD 서비스를 위한 하부 저장 구조의 설계 (Design of a Low-level Storage Structure for News-on-Demand Service)

  • 정재욱;이정재;송광택;심춘보;장재우
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (1)
    • /
    • pp.277-279
    • /
    • 1998
  • 비디오와 같은 매체가 결합된 대용량의 멀티미디어 데이터를 보다 효율적으로 저장 및 검색하기 위한 연구가 다양한 분야에 걸쳐 진행중이다. 본 논문에서는 NoD 서비스용 내용-기반 비디오 정보검색을 위해, 미국의 Wisconsin 대학에서 개발한 SHORE(Scalable Heterogeneous Object Repository) 객체-재향 저장 시스템을 이용하여, 멀티미디어 객체 자체의 비디오 스트림 데이터와 그에 따르는 부가적인 색인 정보를 효율적으로 저장하고 관리하기 위한 하부 저장 구조를 설계한다.