• 제목/요약/키워드: 프레임 기반 색인

검색결과 59건 처리시간 0.023초

내용기반 검색을 위한 뉴스 비디오 인덱싱의 자동화 (Automation of News Video Indexing for Content-Based Retrieval)

  • 이동섭;이지연;신성윤;전근환;배석찬;이양원
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 1998년도 추계종합학술대회
    • /
    • pp.507-510
    • /
    • 1998
  • 다양한 분야에서 중요하게 사용될 수 있는 뉴스 비디오 데이터베이스를 구축하기 위해서는 비디오 색인의 자동화에 관한 연구가 필연적이다. 본 논문에서는 뉴스 비디오 색인을 자동화하는 방법으로, 이전에 제안한 컷 추출 방법을 이용하였다. 컷에 의해 추출된 키 프레임에서 앵커 인식 알고리즘으로 앵커 프레임을 자동으로 추출하여 색인을 부여하는 방법으로 비디오 스트림에 대한 색인을 자동화하였다. 구성되는 색인 구조의 형태는 앵커 프레임들이 시간에 따른 사건의 연결이 되고, 앵커 프레임 내에서는 종속되는 키 프레임들을 중심으로 원형을 형성한다. 이들 각각을 논리적으로 통합하면 사용자의 관점에 따라 여러 가지 방법으로 브라우징되며, 사용자가 원하는 뉴스 비디오 씬들을 쉽게 선택하여 볼 수 있는 특징을 제공하는 장점을 부여한다. 또한, 색인화 된 비디오 스트림을 이용하면 자동적으로 비디오 편집을 수행 할 수 있는 비디오 저작도구의 기반을 제공할 수 있다.

  • PDF

영역 정보를 이용한 비디오 데이터의 카메라 모션 검출 및 대표 프레임 선택 방법 (Camera Motion Detection and Key-Frame Selection from Region-Based Video Data)

  • 이용현;강행봉;박용진
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.315-317
    • /
    • 1998
  • 많은 양의 비디오 데이터가 디지털화 되면서 사용자가 쉽게 자신이 원하는 비디오 데이터를 검색할 수 있는 내용 기반 검색이 필요하게 되었다. 내용 기반 검색을 위해서는 비디오 데이터를 연속된 카메라 모션으로 구성된 셧으로 나누고, 셧의 내용을 대표 할 수 있는 대표 프레임을 찾아야 한다. 대표 프레임은 비디오 데이터의 요약과 색인의 중요한 수단이다. 본 논문에서는 셧의 내용 기반으로 대표 프레임을 찾기 위해서 프레임에 존재하는 영역 정보를 바탕으로 셧의 내용을 알 수 있는 핵심 정보인 카메라 모션을 검출 하고, 이를 기반으로 대표 프레임을 선택하는 방법을 제안한다.

  • PDF

문자정보 기반 비디오 분할에서 성능 향상을 위한 음성신호처리 (Speech Signal Processing for Performance Improvement of Text-Based Video Segmentation)

  • 이용주;손종목;강경옥;배건성
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1999년도 학술대회
    • /
    • pp.187-191
    • /
    • 1999
  • 비디오 프로그램에서 영상 내에 포함되어 있는 문자정보는 동영상의 내용 검색 및 색인을 위한 비디오 분할에 사용될 수 있다. 일반적으로 장면 내에 포함되어 있는 문자들은 해상도가 낮고 글자 크기와 형태가 다양하기 때문에 추출과 인식이 어려울 뿐만 아니라 의도하지 않은 배경화면의 문자인 경우도 많기 때문에 내용기반 검색에는 사용되기가 어렵다. 그러나 비디오 내에 포함된 문자정보가 나타나는 시작 프레임과 끝나는 프레임을 검출하여 비디오 프로그램을 분할함으로써 내용기반요약정보를 만들 수 있으며, 동영상의 내용 검색 및 색인에 사용할 수 있다. 일반적으로 문자정보의 추출에 의해서 비디오를 분할할 때 음성정보는 전혀 고려되지 않으므로 분할된 비디오 정보를 재생할 경우음성신호가 단어 또는 어절/음절의 임의의 점에서 시작되고 끝나게 되어 듣기에 부자연스럽게 된다 따라서 본 논문에서는 뉴스방송의 비디오 프로그램에서 문자정보가 포함되어 는 비디오의 시작 프레임과 끝 프레임을 중심으로 그에 대응되는 구간의 음성신호를 검출한 후 이를 적절히 처리하여 분할 된 비디오를 재생할 때 음성신호가 보다 자연스럽게 들릴 수 있도록 하는 방법에 대해 연구하였다.

  • PDF

압축영역에서의 대표프레임 추출 및 영역분할기반 비디오 검색 기법 (Key Frame Extraction and Region Segmentation-based Video Retrieval in Compressed Domain)

  • 강응관;김성주;송호근;최종수
    • 한국통신학회논문지
    • /
    • 제24권9B호
    • /
    • pp.1713-1720
    • /
    • 1999
  • 본 논문에서는 동영상 압축 부호화에 대한 표준안인 MPEG 기반의 압축 비디오 시퀀스로부터 DCT DC 계수를 추출하고, 이들로 구성된 DC 이미지로부터 AHIM (Accumulative Histogram Intersection Measure)을 이용하여 장면 전환 검출을 수행한 후 대표 프레임을 추출하는 방법을 제시한다. 또한, 추출된 대표 프레임을 두 단계를 거쳐 데이터베이스의 색인 정보로 저장한 후, 입력되는 질의 영상에 대해 사용자가 원하는 검색 결과를 제시하는 방법에 대해 제안한다. 즉 전처리 과정으로 추출된 대표 프레임에 대해 영역 분할을 한 후, 첫 번째 단계에서 수평 투영된 결과를 히스토그램 분포 특성으로 변환시켜 데이터베이스의 색인 정보로 저장한다. 두 번째 단계에서는 영상의 모멘트 특성을 거리함수 값으로 변환시킨다. 실험 결과 제안된 방법이 검색에 있어 우수한 성능을 갖추고 또한 상당한 양의 처리 시간과 메모리 공간을 줄일 수 있음을 확인하였다. 향후 제안한 방법은 색상과 같은 다른 색인 정보와 결합할 경우, 보다 나은 영상 색인과 검색 수단을 제공할 것이다.

  • PDF

PCA에 기반한 압축영역에서의 MPEG Video 검색기법 (PCA-Based MPEG Video Retrieval in Compressed Domain)

  • 이경화;강대성
    • 대한전자공학회논문지SP
    • /
    • 제40권1호
    • /
    • pp.28-33
    • /
    • 2003
  • 본 논문에서는 동영상 압축 부호화에 대한 표준안인 MPEG 기반의 압축 비디오 스트림으로부터 DCT DC 계수를 추출하구 이들로 구성된 DE 영상으로부터 장면 전환 검출을 수행한 후 대표 프레임을 추출한다. 또한 추출된 대표 프레임을 PCA(Principal Component Analysis) 방법을 이용하여 데이터베이스의 색인 정보로 저장한 후 입력된 질의 영상과 가장 유사한 대표 영상들을 검색하는 방법에 대해 제안한다. 즉, 추출된 대표 프레임에 대해 주성분해석 기법을 적용하여 통계적인 특성을 가진 데이터를 특징으로 추출함으로써 코드워드의 수에 따른 코드북을 생성하고 이를 데이터베이스의 색인 정보로 저장한다. 실험 결과 제안된 방법이 검색에 있어 우수한 성능을 나타내고 또한 통계적인 데이터의 특성을 이용하기 때문에 처리 시간과 상당한 양의 메모리 공간을 줄일 수 있음을 확인하였다.

통계적 특성을 이용한 비디오의 분할 및 대표 프레임의 추출방법

  • 조완현;박순영;박종현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.295-297
    • /
    • 2003
  • 본 논문에서는 각 프레임으로부터 추출된 통계적 특성을 이용하여 동영상의 분할방법과 분할된 각 장면에 대한 대표프레임을 추출하는 방법을 제안한다. 제안된 방법은 동영상의 각 프레임에 대하여 다해상도 분석을 실시하여 저주파 부 밴드로부터 히스토그램 특징을 추출하여 급격한 장면전환을 분할하는데 이용하였으며 또한 점진적인 장면전환을 검출하기 위해서는 고주파 부 밴드로부터 계산되는 화소의 분산치를 계산하여 특징벡터로 사용하였다. 실험의 결과를 통하여 제안된 동영상의 분할방법과 대표프레임 추출에 대한 알고리즘들이 동영상 자료의 분석 및 색인을 위한 효율적인 동영상 분할을 가능하게 하며, 차후 내용기반 영상과 비디오의 색인 및 검색을 위한 전처리의 단계로 사용되어질 수 있는 매우 유용한 방법임을 보였다.

  • PDF

비-파라미터 기반의 움직임 분류를 통한 비디오 검색 기법 (Video retrieval method using non-parametric based motion classification)

  • 김낙우;최종수
    • 대한전자공학회논문지SP
    • /
    • 제43권2호
    • /
    • pp.1-11
    • /
    • 2006
  • 본 논문에서는 샷(shot) 기반 비디오 색인 구조에서 비-파라미터(non-parametric) 기반의 움직임 분류를 통한 비디오 영상 검색 기법을 제안한다. 본 논문에서 제안하는 비디오 검색 시스템은 장면 전환 기법을 통해 얻은 샷 단위의 짧은 비디오로부터 대표 프레임과 움직임 정보를 취득한 후, 이를 통해 시각적 특징과 움직임 특징을 추출하여 유사도를 비교함으로써 시-공간적 특징을 이용한 실시간 검색이 가능하도록 구현되었다. 비-파라미터 기반의 움직임 특징의 추출은 MPEG 압축 스트림으로부터 정규화된 움직임 벡터계(界)를 추출한 후, 각각의 정규화된 움직임 벡터를 여러 개의 각도 빈(bin)으로 양자화하고 이의 평균과 분산, 방향 등을 고려함으로써 효과적으로 이루어진다. 대표 프레임에서의 시각 특징 검출을 위해서는 에지 기반의 공간 기술자를 이용하였다. 실험 결과는 영상 색인 및 검색에 있어서 제안된 시스템이 매우 효과적임을 잘 나타내고 있다. 데이터베이스 내 영상의 색인을 위해서는 R*-tree 구조를 이용한다.

조도 변화를 고려한 동영상 색 유동성 저감 알고리즘 (Temporal Color Rolling Suppression Algorithm Considering Time-varying Illuminant)

  • 오현묵;강문기
    • 대한전자공학회논문지SP
    • /
    • 제48권5호
    • /
    • pp.55-62
    • /
    • 2011
  • 본 논문은 조도 변화에 의해 동영상 시퀀스에서 발생하는 주기적인 색상 및 밝기 변화를 저감하기 위한 알고리즘을 제안한다. 밝기 변화가 주기적으로 일어나는 광원 환경에서 동영상을 촬영하는 경우, 노출 시간이 짧아짐에 따라 색상 및 밝기가 주기적으로 변하는 색 유동성 현상, 즉 컬러 롤링 현상(color rolling phenomenon)이 발생한다. 색 유동성 현상이 발생하는 경우 화이트 밸런스 알고리즘을 적용함으로써 개별 프레임의 색상을 보정할 수 있지만, 프레임 간에 발생하는 밝기 차이를 고려하지 않기 때문에 동영상의 밝기가 주기적으로 변하는 문제가 남게 된다. 제안하는 방법에서는 프레임 간에 발생하는 밝기 변화를 추정함으로써 색 유동성 현상으로 인해 나타나는 밝기 및 색상 변화를 보정하는 알고리즘을 제안한다. 이 때, 움직이는 물체에 의해 발생하는 밝기 변화 추정 에러를 줄이기 위해 움직임 검출(motion detection) 방법에 기반하여 색 유동성에 의한 밝기 변화만을 선택적으로 검출하여 보상한다. 또한 이전 밝기 정보를 이용하여 색 유동성에 의한 밝기 변화량을 예측함으로써 실시간 영상 처리에 적합하도록 하였다. 실험 결과를 통해 제안하는 방법을 사용하는 경우 조도 변화에 의한 밝기 변화를 보상함으로써 동영상의 프레임 간 밝기 및 색상의 항상성을 유지하는 것을 확인할 수 있다.

비디오 감시 데이터로부터 사람의 자동 인식을 통한 비디오 주석 시스템 (A Video Annotation System with Automatic Human Detection from Video Surveillance Data)

  • 김주성;김학일;김유성
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(A)
    • /
    • pp.340-342
    • /
    • 2012
  • 사람관련 사건을 실시간으로 인지하거나 빠르게 사건 관련 증거를 확보하기 위해서는 대량의 비디오 감시 데이터로부터 사람 관련 정보를 빠르게 찾을 수 있어야 하는데 기존의 시스템에서는 모든 프레임으로부터 주석 편집자가 수작업으로 관련 정보를 추출하여 색인해야 하기 때문에 많은 주석 시간을 필요로 하는 문제를 갖고 있었다. 본 논문에서는 대량의 방범용 비디오 감시 데이터로부터 사람 관련 사건 정보를 빠르게 찾을 수 있도록 지원하기 위해 전체 비디오 데이터 중에서 사람의 출현과 퇴장을 기준으로 키 프레임 구간을 추출하고, 키 프레임에서만 사람 관련 정보를 추출하여 사람 관련 주요 정보를 자동으로 추출하여 XML 스키마 형식으로 색인하는 비디오 주석 시스템을 개발하였다. 또한, 색인된 XML 데이터에 대해 구조 및 내용 기반 질의를 이용하여 쉽고 빠르게 검색할 수 있도록 하기 위해 XPATH 질의 인터페이스를 구현 하였다.

동영상 등장인물의 자동색인을 위한 효율적인 저장과 검색 방법 (Efficient Storage and Retrieval for Automatic Indexing of Persons in Videos)

  • 김진승;한용구;이영구
    • 한국멀티미디어학회논문지
    • /
    • 제14권8호
    • /
    • pp.1050-1060
    • /
    • 2011
  • 대용량 동영상을 대상으로 한 등장인물 색인에 대한 수요가 증가함에 따라, 많은 시간과 비용이 소요되는 수동 태깅의 단점을 보완할 수 있는 자동 태깅을 이용한 자동 색인이 연구되고 있다. 하지만, 자동 색인은 인물을 100% 정확하게 검출하지 못하므로 검출된 인물에 대해 정확도를 함께 표현해야 한다. 본 논문에서는 이러한 정보를 포스팅 리스트에 효율적으로 저장하는 방법과 등장인물의 검색시 관련 동영상들을 효율적으로 찾기 위한 순위 결정 방법을 제안한다. 실험을 통하여 제안하는 색인 정보 저장 방법이 포스팅 리스트의 압축에 효과적임을 입증하였다. 또한 제안한 순위 결정 방법이 관련 동영상을 찾는데 효과적임을 입증하였다.