• 제목/요약/키워드: 내용기반 동영상 검색

검색결과 98건 처리시간 0.025초

문자정보 기반 비디오 분할에서 성능 향상을 위한 음성신호처리 (Speech Signal Processing for Performance Improvement of Text-Based Video Segmentation)

  • 이용주;손종목;강경옥;배건성
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1999년도 학술대회
    • /
    • pp.187-191
    • /
    • 1999
  • 비디오 프로그램에서 영상 내에 포함되어 있는 문자정보는 동영상의 내용 검색 및 색인을 위한 비디오 분할에 사용될 수 있다. 일반적으로 장면 내에 포함되어 있는 문자들은 해상도가 낮고 글자 크기와 형태가 다양하기 때문에 추출과 인식이 어려울 뿐만 아니라 의도하지 않은 배경화면의 문자인 경우도 많기 때문에 내용기반 검색에는 사용되기가 어렵다. 그러나 비디오 내에 포함된 문자정보가 나타나는 시작 프레임과 끝나는 프레임을 검출하여 비디오 프로그램을 분할함으로써 내용기반요약정보를 만들 수 있으며, 동영상의 내용 검색 및 색인에 사용할 수 있다. 일반적으로 문자정보의 추출에 의해서 비디오를 분할할 때 음성정보는 전혀 고려되지 않으므로 분할된 비디오 정보를 재생할 경우음성신호가 단어 또는 어절/음절의 임의의 점에서 시작되고 끝나게 되어 듣기에 부자연스럽게 된다 따라서 본 논문에서는 뉴스방송의 비디오 프로그램에서 문자정보가 포함되어 는 비디오의 시작 프레임과 끝 프레임을 중심으로 그에 대응되는 구간의 음성신호를 검출한 후 이를 적절히 처리하여 분할 된 비디오를 재생할 때 음성신호가 보다 자연스럽게 들릴 수 있도록 하는 방법에 대해 연구하였다.

  • PDF

자동 주석 갱신 및 카테고라이징 기법을 이용한 의미기반 동영상 검색 시스템 (A Semantic-based Video Retrieval System using Design of Automatic Annotation Update and Categorizing)

  • 김정재;이창수;이종희;전문석
    • 한국컴퓨터산업학회논문지
    • /
    • 제5권2호
    • /
    • pp.203-216
    • /
    • 2004
  • 비디오 데이터를 효율적으로 처리하기 위해서는 비디오 데이터가 가지고 있는 내용에 대한 정보를 데이터 베이스에 저장하고 사용자들의 다양한 질의를 처리할 수 있는 의미기반 검색 기법이 요구된다. 기존의 내용기반 비디오 검색 시스템들은 주석기반 검색 또는 특징기반 검색과 같은 단일 방식으로만 검색을 하므로 검색 효율이 낮을 뿐 아니라 완전한 자동 처리가 되지 않아 시스템 관리자나 주석자의 많은 노력을 요구한다. 본 논문에서는 주석기반 검색과 특징기반 검색을 이용하여 대용량의 비디오 데이터에 대한 사용자의 다양한 의미검색을 지원하는 에이전트 기반에서의 자동화되고 통합된 비디오 의미기반 검색 시스템을 제안한다. 사용자의 기본적인 질의와 질의에 의해 추출된 키 프레임의 이미지를 선택함으로써 에이전트는 추출된 키 프레임의 주석에 대한 의미를 더욱 구체화시킨다 또한. 사용자에 의해 선택된 키 프레임은 질의 이미지가 되어 제안하는 특징기반 검색기법을 통해 가장 유사한 키 프레임을 검색한다. 따라서 의미기반 검색을 통해 비디오 데이터의 검색의 효율을 높일 수 있도록 시스템을 설계한다.

  • PDF

색상분할영역에서 거리히스토그램을 이용한 영상검색 (Image Retrieval Using Distance Histogram of Clustered Color Region)

  • 장정동;이태홍
    • 한국통신학회논문지
    • /
    • 제26권7B호
    • /
    • pp.968-974
    • /
    • 2001
  • 최근 정보통신기술의 발전과 함께 영상매체의 급속한 증가로 영상의 효율적인 관리와 검색의 필요성이 요구되면서 내용기반 영상검색이 핵심기술로 대두되고 있다. 내용기반 영상검색에서 영상의 특징을 표현하기 위해 색상 히스토그램을 많이 사용하고 있으나, 색상만을 고려하는 것은 많은 단점을 지니고 있으므로 본 논문에서는 먼저 순차영역분할(sequential clustering)기법을 도입하여 영역을 분할하며, 분할된 영역의 색상평균값과 영역의 중심점으로부터의 거리 히스토그램을 영상의 특징으로 구하여 이를 비교함으로써 색상과 공간정보를 함께 고려하는 방법을 제안한다. 제안된 방법의 특성의 수가 18개로 타 방법보다 매우 작은 저장공간을 가지면서도 동시에 검색효율이 8.5% 이상 개선되었다. Precision 대 Recall에서도 각 질의영상에서 대부분의 Recall 값에서 제안한 방법의 우수함이 확인되었으며, 시각적으로도 양호한 검색결과를 얻을 수 있었다.

  • PDF

히스토그램 특징과 영역기반의 에지 특징에 의한 장면 전환 검출에 관한 연구 (A study on Scene-Change Detection Using Histogram Characteristic and Region-based Edge Characteristic)

  • 이득재;최기호
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 추계학술발표논문집
    • /
    • pp.110-113
    • /
    • 2002
  • 통신과 멀티미디어 기술의 발전으로 대용량의 멀티미디어 자료에 대한 효율적인 검색 방법이 대두되고 있다. 본 논문에서 다루고자 하는 동영상 장면전환 검출 연구는 멀티미디어 데이터베이스의 내용기반 비디오 정보검색 및 비디오 데이터 인덱싱 구현의 기반이 되는 첫번째 단계의 핵심적인 분야에 속한다. 비디오 데이터를 내용기반으로 처리 하기 위해서는 우선 비디오데이터를 연속성에 의한 유사 영역으로 분할하여야 한다. 동영상을 분할하기 위한 방법으로 비디오의 불연속점을 찾아내는 장면전환 검출이 널리 사용되어 이에 관한 연구가 활발하게 진행되고 있다. 본 논문에서는 기존의 방법인 히스토그램 방식과 에지검출 방식의 장단점을 비교하고 두 알고리즘의 장점을 혼합한 방식을 제안하였다. 영상을 1차로 히스토그램의 피크값과 계곡특징값을 이용하고 2차로 에지검출 방식으로 두 단계로 나누어 처리하여 속도향상과 정확도를 높이고자 하는 방법을 제안하였다. 그리고 실험을 통하여 기존의 방법들과의 비교 분석을 통하여 성능평가를 하고자 한다.

  • PDF

음성정보 내용분석을 통한 골프 동영상에서의 선수별 이벤트 구간 검색 (Retrieval of Player Event in Golf Videos Using Spoken Content Analysis)

  • 김형국
    • 한국음향학회지
    • /
    • 제28권7호
    • /
    • pp.674-679
    • /
    • 2009
  • 본 논문은 골프 동영상에 포함된 오디오 정보로부터 검출된 이벤트 사운드 구간과 골프 선수이름이 포함된 음성구간을 결합하여 선수별 이벤트 구간을 검색하는 방식을 제안한다. 전체적인 시스템은 동영상으로부터 분할된 오디오 스트림으로부터 잡음제거, 오디오 구간분할, 음성 인식 등의 과정을 통한 자동색인 모듈과 사용자가 텍스트로 입력한 선수 이름을 발음열로 변환하고, 색인된 데이터베이스에서 질의된 선수 이름과 상응하는 음성구간과 연결되는 이벤트 구간을 찾아주는 검색 모듈로 구성된다. 선수이름 검색을 위해서 본 논문에서는 음소 기반, 단어 기반, 단어와 음소를 결합한 하이브리드 방식을 적용한 선수별 이벤트 구간 검색결과를 비교하였다.

시공간 영상을 이용한 계층적인 장면 전환 검출 (Hierarchical shot Boundary Detection Using Time-Space Image)

  • 홍기진;김영봉
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.496-498
    • /
    • 2000
  • 동영상 비디오 시퀸스에서 필요로 하는 장면을 빠르고 쉽게 찾을 수 있도록 해주는 내용 기반 검색에 대한 연구가 활발히 이루어져 오고 있다. 특히, 내용 기반 검색 시스템의 기초 기술인 비디오 데이터의 샷(shot)에 따른 분할 연구는 다양한 방법으로 소개되었으나 정확도가 높은 분할 알고리즘이 아직 개발되지 않고 있는 실정이다. 본 논문에서는 비압축 비디오에서 컷(cut) 검출의 효율성을 향상시키기 위해 기존의 히스토그램 비교법과 시공간 영상을 활용하는 계층적인(hierarchical) 방법을 제안한다. 이를 위해 먼저 동영상의 각 프레임에서 한 행(row)씩 추출하여 동영상 전체를 대표하도록 시공간 영상을 생성하고, 생성된 시공간 영상에서 수평 에지(edge)를 이용한 프레임(frame) 특징값으로 장면 전화의 후보 영역을 선택하였다. 그리고 선택된 후보 영역을 히스토그램 비교법으로 분석하게 된다.

  • PDF

문맥을 고려한 예제 기반 동영상 검색 알고리즘 (Content Based Video Retrieval by Example Considering Context)

  • 박주현;낭종호;김경수;하명환;정병희
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제30권12호
    • /
    • pp.756-771
    • /
    • 2003
  • 효율적인 동영상 검색 방법은 많은 양의 동영상 데이터를 관리하는 디지털 비디오 라이브러리 시스템에서 필수적으로 요구되는 기능이다. 본 논문에서는 샷 단위 동영상을 문맥, 전경, 배경, 오디오로 나누어 비교하여 질의 동영상과 비슷한 동영상을 찾아내는 예제 기반 동영상 검색 알고리즘을 제안하였고, 제안한 알고리즘에 따라서 저작 및 검색도구를 구현하였다. 샷간의 관계 정보 즉, 문맥을 고려한다는 것은 인접한 샷들 간의 오디오, 움직임 정보들과 같은 저급 수준 내용 정보 간에 변화 패턴을 비교한다는 것이다. 두 번째 비교 요소인 전경은 움직이는 객체들의 집합을 의미하고, 세 번째 비교 요소인 배경은 전경을 제외한 나머지 비디오 정보를 의미한다. 이러한 비교 방법은 동영상 제작 과정에 근거한 것으로써 사용자로 하여금 직관적인 비교를 할 수 있게 한다. 또한 질의 신을 직접 구성할 수 있게 하였고, 각각의 비교요소에 가중치를 부여할 수 있도록 하여서 사용자의 검색의도를 자유롭게 반영할 수 있도록 하였다. 본 논문에서는 동영상이 가지고 있는 의미 정보를 검색에 완전히 반영하지는 못하지만, 문맥을 통해서 부분적인 의미 정보를 사용할 수 있도록 하였으며, 질의 신 구성과 직관적인 비교 요소를 사용함으로써 사용자의 검색 의도를 최대한 반영하고자 하였다.

MPEG-7 기반 웹 이미지 색인 및 검색 (MPEG-7 Based Web Image Indexing and Searching)

  • 임재형;김문철;김진웅;현순주
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (하)
    • /
    • pp.1285-1288
    • /
    • 2000
  • 인터넷의 양적 질적 성장을 통해 인터넷상에 존재하는 웹 문서의 숫자는 엄청난 속도로 증가하여 왔다. 이러한 방대한 웹 문서를 대상으로 한 검색 방법은, 지금까지 일반적으로 텍스트 기반의 방법이 주류를 이루어 왔다. 그러나 웹 문서는 멀티미디어 형태로 존재하며 텍스트, 이미지, 동영상, 컴퓨터 그래픽 둥 다양한 미디어들로 구성되어 있다. 본 논문에서는 인터넷에 존재하는 웹 문서를 대상으로 내용 기반 이미지 검색방법을 제시한다. 내용기반 웹 이미지 검색 시스템은 웹 상의 텍스트 기반의 기존 상용 검색엔진을 이용하여 주요 검색어에 대한 이미지를 수집하는 웹 이미지 수집기와 수집된 이미지에 대해 MPEG-7 비주얼 기술자를 이용하여 데이터베이스에 색인하는 데이터베이스 불리기(population), 그리고 내용 기반 이미지 검색엔진으로 구성된다. 사용자는 장르, 주제 및 주요단어에 의해 분류되어 데이터베이스에 색인된 웹 이미지를 대상으로 검색이 가능하다. 이는 웹 문서를 직접 대상으로 한 특정 단어에 대한 내용 기반 이미지 검색이 가능하며 검색이 데이터베이스를 대상으로 이루어지기 때문에 빠른 검색 속도를 얻을 수 있으며, 또한 기존 웹에서 제공되는 텍스트 기반의 상용 검색엔진을 이용하여 주요단어에 대한 웹 이미지를 수집하여 색인하기 때문에 별도의 텍스트 검색엔진 구현을 필요로 하지 않는다.

  • PDF

영상의 에지 특징정보를 이용한 주석기반 및 내용기반 영상 검색 시스템의 구현 (Implementation of Annotation-Based and Content-Based Image Retrieval System using)

  • 이태동;김민구
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제7권5호
    • /
    • pp.510-521
    • /
    • 2001
  • 영상은 대용량적인 특성과 비정형적인 특성을 가지고 있으므로 신속하고 효율적으로 영상을 검색하기 위해 영상의 정확한 특징정보를 추출하여 검색 시스템을 구축하여야 한다. 영상 검색 시스템은 텍스트 기반의 전통 데이타베이스와는 다른 모델링 방법과 검색방법을 사용한다. 따라서, 영상 검색 시스템에서의 검색속도와 정확도를 향상시키기 위해서는 새로운 영상 데이타베이스 생성기법과 효율적인 검색 기법이 필요하다. 본 논문에서는 입력 영상으로부터 검색에 상용되는 에지 특징정보 추출을 위해 라플라시 안마스크와 입력 영상을 컨벌루션하여 에지의 외곽선 데이타를 추출하였으며, 그리고 추출한 에지 특징정보와 메타데이타로 영상 데이타베이스를 생성하여 신속하고 효율적으로 영상을 검색할 수 있도록 주석기반 및 내용기반 영상 검색 시스템을 구현하였다. 주석기반 및 내용기반 영상 검색 시스템은 영상의 하위 레벨에 표현된 내용기반 에지 특징정보와 특징정보 추출이 어려운 상위레벨에 표현된 주석기반 에지 특징 정보를 영상의 색인으로 구성하여 사용하기 때문에 영상 컨텐츠 검색의 성능을 향상시킬 수 있다. 마지막으로 본 논문에서 제시한 영상 검색 시스템은 메타데이타에 의해 영상 데이타베이스를 구축하므로 정확한 영상 컨텐츠 정보의 축적관리와 영상의 정보공유 및 재이용이 가능하다.

  • PDF

멀티미디어 통신을 이용한 내용기반 이미지 추출 알고리즘 설계 및 구현 (A Design and Implementation of algorithm choosing Context-based Image used Multimedia Communication)

  • 안병규
    • 한국컴퓨터산업학회논문지
    • /
    • 제2권11호
    • /
    • pp.1421-1426
    • /
    • 2001
  • 오늘날 멀티미디어 정보의 양이 매우 빠른 속도로 증가함에 따라 멀티미디어에 대한 효율적인 관리가 더욱 중요하게 되었다. 특히 동영상과 같은 이미지에서는 특정 이미지를 추출하여 필요한 이미지를 관리하고자 하는 욕구가 증가되어가고 있다. 본 논문에서는 멀티미디어 자료의 효과적인 색인화 및 검색을 위한 동영상 처리를 위한 여러 멀티미디어 의미정보 추출 방법 중 내용 기반 의미 정보 추출 방법을 이용하여 특정 이미지를 검색하고 추출된 이미지만 저장하는 알고리즘을 설계하였다. 입력 영상에서 RGB 정보를 추출한 후 동영상의 모든 프레임을 순차적으로 검사하면서 주 RGB 범위 군집화 방법을 통하여 구성 내용의 위치와 분포를 참조하여 일치여부를 파악하여 입력 영상과 일치하는 동영상을 저장하도록 하였다.

  • PDF