• 제목/요약/키워드: key frame extraction

검색결과 65건 처리시간 0.02초

비디오 분석을 위한 자막프레임구간과 자막영역 추출 (Extraction of Superimposed-Caption Frame Scopes and Its Regions for Analyzing Digital Video)

  • 임문철;김우생
    • 한국정보처리학회논문지
    • /
    • 제7권11호
    • /
    • pp.3333-3340
    • /
    • 2000
  • 최근 하드웨어와 압축기술의 발달로 비디오 데이터에 대한 요구가 급증하고 있다. 비디오 데이터는 비정형으로 되어있고 용량이 커서 내용기반 등 다양한 검색 기법이 요구된다. 비디오에 인위적으로 추가된 자막(Superimposed caption)은 비디오 내용을 분석하는데 중요한 역할을 하며 다양한 검색을 위한 색인 정보로 사용될 수 있다. 본 연구에서는 비디오 프레임 내의 자막영역이 가지고 있는 텍스처 특성을 분석하여 자막영역을 분할하고 프레임들 간에 자막영역의 연속성을 이용하여 정확한 자막프레임구간과 대표자막영역 및 색상을 추출하는 방법을 기술한다.

  • PDF

SURF 알고리즘 기반 특징점 추출기의 FPGA 설계 (FPGA Design of a SURF-based Feature Extractor)

  • 류재경;이수현;정용진
    • 한국멀티미디어학회논문지
    • /
    • 제14권3호
    • /
    • pp.368-377
    • /
    • 2011
  • 본 논문에서는 특징점 정합을 통한 객체인식, 파노라마 이미지 생성, 3차원 영상 복원 등에 사용될 수 있는 알고리즘 중 대표적인 SURF 알고리즘 기반 특징점 추출기의 하드웨어 구조 설계 및 FPGA 검증 결과에 대해 기술한다. SURF 알고리즘은 크기와 회전변화에 강한 특징점과 서술자를 생성함으로써 객체인식, 파노라마 이미지 생성, 3차원 영상 복원 등에 활용될 수 있다. 하지만 ARMl1(667Mhz) 프로세서와 128Mbytes의 DDR 메모리를 사용하는 임베디드 환경에서 실험결과 VGA($640{\times}480$) 해상도 C영상의 특정점 추출 처리 시약 7,200msec의 시간이 걸려 실시간 동작이 불가능한 것으로 파악되었다. 본 논문에서는 SURF 알고리즘의 핵심 요소인 적분 이미지 메모리 접근 패턴을 분석하여 메모리 접근 횟수와 메모리 사용량을 줄이는 방법을 이용해 실시간 동작이 가능하도록 하드웨어로 설계하였다. 설계된 하드웨어를 Xilinx(社)의 Vertex-5 FPGA 를 이용하여 검증한 결과 l00Mhz 클록에서 VGA 영상의 특징점 추출시 약 60frame/sec로 동작하여 실시간 응용으로 충분함을 알 수 있다.

내용 기반 검색을 위한 뉴스 비디오 키 프레임의 특징 정보 추출 (Extraction of Features in key frames of News Video for Content-based Retrieval)

  • 정영은;이동섭;전근환;이양원
    • 한국정보처리학회논문지
    • /
    • 제5권9호
    • /
    • pp.2294-2301
    • /
    • 1998
  • 본 논문은 방송사별 각 장면의 중요한 내용의 성격을 갖고 있는 특징을 방송사별 뉴스 비디오에서 추출하기 위한 것이다. 추출하고자 하는 특징의 요소는 방송사 구별을 위한 방송사 아이콘과 각 장면의 대표적 성격을 갖고 있는 아이콘, 각 장면내의 주요 내용을 대표하는 정보인 자막의 문장 추출이다. 본 논문에서 제안하는 방법은, 비디오 프레임으로 입력되는 영상을 YIQ칼라 공간으로 전환한 뒤 히스토그램 평활화 방법을 이용하여 입력 영상의 영역 구분을 명확하게 한 후에, 영상의 에지를 추출하고 수직과 수평선에 기반한 에지 히스토그램의 비교에 의하여 원하는 특징을 추출하는 것이다. 또한 히스토그램 차이값에 의해서 선택된 키 프레임들 중에서 뉴스 아이콘을 추출하고 아이콘에 의하여 각 장면을 분할 할 수 있는 방법을 제안하였다. 본 논문에서는 칼라 히스토그램이나 웨이블릿, 또는 객체의 움직임에 기반한 복잡한 방법대신 에지 히스토그램 비교 방법을 사용하여, 알고리즘을 간소화함으로써 계산 시간을 단축하였으며 특징 추출에도 좋은 결과를 나타냈다.

  • PDF

비-파라미터 기반의 움직임 분류를 통한 비디오 검색 기법 (Video retrieval method using non-parametric based motion classification)

  • 김낙우;최종수
    • 대한전자공학회논문지SP
    • /
    • 제43권2호
    • /
    • pp.1-11
    • /
    • 2006
  • 본 논문에서는 샷(shot) 기반 비디오 색인 구조에서 비-파라미터(non-parametric) 기반의 움직임 분류를 통한 비디오 영상 검색 기법을 제안한다. 본 논문에서 제안하는 비디오 검색 시스템은 장면 전환 기법을 통해 얻은 샷 단위의 짧은 비디오로부터 대표 프레임과 움직임 정보를 취득한 후, 이를 통해 시각적 특징과 움직임 특징을 추출하여 유사도를 비교함으로써 시-공간적 특징을 이용한 실시간 검색이 가능하도록 구현되었다. 비-파라미터 기반의 움직임 특징의 추출은 MPEG 압축 스트림으로부터 정규화된 움직임 벡터계(界)를 추출한 후, 각각의 정규화된 움직임 벡터를 여러 개의 각도 빈(bin)으로 양자화하고 이의 평균과 분산, 방향 등을 고려함으로써 효과적으로 이루어진다. 대표 프레임에서의 시각 특징 검출을 위해서는 에지 기반의 공간 기술자를 이용하였다. 실험 결과는 영상 색인 및 검색에 있어서 제안된 시스템이 매우 효과적임을 잘 나타내고 있다. 데이터베이스 내 영상의 색인을 위해서는 R*-tree 구조를 이용한다.

세선화 알고리즘 기반의 에지검출을 이용한 멀티센서 영상의 자동매칭 (Automatic Matching of Multi-Sensor Images Using Edge Detection Based on Thinning Algorithm)

  • 신성웅;김준철;오금희;이영란
    • 한국측량학회지
    • /
    • 제26권4호
    • /
    • pp.407-414
    • /
    • 2008
  • 본 논문은 항공사진과 위성영상의 서로 다른 해상도를 지닌 이종센서 영상들에 대한 효율적인 특이점 자동 매칭 기법에 대한 알고리즘에 관한 연구이다. 본 연구의 자동 매칭 알고리즘은 매칭 정확도 및 속도를 향상시키기 위해 다양한 영상 처리 방법을 적용하였다. 특이점을 추출하기 위하여 전처리 과정, 필터링, 세선화, 특이점 추출 방법을 사용하였으며, 특이점에 대한 키서술자(Key-descriptor)를 비교하여 매칭의 정확도를 향상시켰다. 특히 본 연구에서 제안된 이종센서간의 정확도 높은 자동 영상 매칭을 위해 센서마다 지닌 기하학적 및 방사학적인 영상의 특징을 활용하였다. 아울러 매칭 속도를 높이기 위해 센서 모델을 이용하여 탐색 영역을 최소화 하고 매칭이 잘못된 특이점을 제거할 수 있는 방법을 제시하고 있다.

효율적인 비디오 유사도 측정을 위한 휘도 투영모델 (Luminance Projection Model for Efficient Video Similarity Measure)

  • 김상현
    • 융합신호처리학회논문지
    • /
    • 제10권2호
    • /
    • pp.132-135
    • /
    • 2009
  • 비디오 데이터들의 효율적 색인과 검색을 위해서는 비디오 시퀀스의 유사도 측정방법이 매우 중요한 요소이다. 본 논문은 비디오 시퀀스에 대한 효율적인 유사도 측정을 위해 휘도 성분 투사법을 제안한다. 기존의 알고리즘들이 히스토그램, 윤곽선, 움직임등과 같은 특성을 사용한 반면 본 논문에서 제안한 알고리즘은 휘도 성분을 투사하는 방법을 사용하여 비디오 유사도 특성을 효율적으로 나타낼 수 있다. 비디오 데이터의 효율적인 색인과 계산량 감소를 위해 누적된 유사도에 의해 추출된 키프레임들을 이용하여 비디오 시퀀스의 유사도를 구하고 수정된 하우스도르프 거리를 사용하여 키프레임 묶음들의 유사도를 측정하였다. 실험결과 제안한 휘도투시법을 사용한 비디오 색인 기법이 유사도 특성에서 기존의 특성을 사용한 방법에 비해 확연한 정확도 및 성능 차이를 보였다.

  • PDF

SURF 기반 특징점 추출 및 서술자 생성의 FPGA 구현 (FPGA Implementation of SURF-based Feature extraction and Descriptor generation)

  • 나은수;정용진
    • 한국멀티미디어학회논문지
    • /
    • 제16권4호
    • /
    • pp.483-492
    • /
    • 2013
  • SURF는 영상의 특징점을 추출하고 서술자를 생성하는 알고리즘으로 객체인식 및 추적, 파노라마 이미지 생성 등 여러 영상처리 시스템에 응용되고 있다. SURF 알고리즘은 영상의 크기, 회전, 시점 등의 변화에 강인한 특징을 갖지만 복잡하고 반복적인 연산이 많아 실시간 처리가 어렵다. 실제 PC(Pentium, 3.3GHz) 환경에서 1000개 정도의 특징점이 추출되는 VGA($640{\times}480$) 해상도의 영상을 이용하여 실험한 결과 특징점 추출 및 서술자 생성에 총 240ms 이상이 걸려 약 4frame/sec로 실시간 처리가 불가능한 것을 확인하였다. 본 논문에서는 SURF 알고리즘의 메모리 접근 패턴을 분석하여 라인 메모리를 효율적으로 구성해 메모리 사용을 최소화하고 반복적으로 수행되는 연산을 병렬처리 하는 방법으로 하드웨어를 설계하였다. 하드웨어 설계 검증 결과 Xilinx사의 Virtex5LX330 FPGA를 타겟으로 합성 시 101,348LUTs(66%)와 1,367KB의 내부 메모리를 사용하고, 100MHz 동작 클록에서 30 frame/sec로 실시간 처리가 가능함을 볼 수 있었다.

시각적 특징을 기반한 샷 클러스터링을 통한 비디오 씬 탐지 기법 (Video Scene Detection using Shot Clustering based on Visual Features)

  • 신동욱;김태환;최중민
    • 지능정보연구
    • /
    • 제18권2호
    • /
    • pp.47-60
    • /
    • 2012
  • 비디오 데이터는 구조화되지 않은 복합 데이터의 형태를 지닌다. 이러한 비디오 데이터의 효율적인 관리 및 검색을 위한 비디오 데이터 구조화의 중요성이 대두되면서 콘텐츠 내 시각적 특징을 기반으로 비디오 씬(scene)을 탐지하고자 하는 연구가 활발히 진행되었다. 기존의 연구들은 주로 색상 정보만을 이용하여 샷(shot) 간의 유사도 평가를 기반한 클러스터링(clustering)을 통해 비디오 씬을 탐지하고자 하였다. 하지만 비디오 데이터의 색상 정보는 노이즈(noise)를 포함하고, 특정 사물의 개입 등으로 인해 급격하게 변화하기 때문에 색상만을 특징으로 고려할 경우, 비디오 샷 혹은 씬에 대한 올바른 식별과 디졸브(dissolve), 페이드(fade), 와이프(wipe)와 같은 화면의 점진적인 전환(gradual transitions) 탐지는 어렵다. 이러한 문제점을 해결하기 위해, 본 논문에서는 프레임(frame)의 컬러 히스토그램과 코너 에지, 그리고 객체 컬러 히스토그램에 해당하는 시각적 특징을 기반으로 동일한 이벤트를 구성하는 의미적으로 유사한 샷의 클러스터링을 통해 비디오 씬을 탐지하는 방법(Scene Detector by using Color histogram, corner Edge and Object color histogram, SDCEO)을 제안한다. SDCEO는 샷 바운더리 식별을 위해 컬러 히스토그램 분석 단계에서 각 프레임의 컬러 히스토그램 정보를 이용하여 1차적으로 연관성 있는 연속된 프레임을 샷 바운더리로 병합한 후, 코너 에지 분석 단계에서 병합된 샷 내 처음과 마지막 프레임의 코너 에지 특징 비교를 통하여 샷 바운더리를 정제하여 최종 샷을 식별한다. 키프레임 추출 단계에서는 샷 내 프레임간 유사도 비교를 통해 모든 프레임과 가장 유사한 프레임을 각 샷을 대표하는 키프레임으로 추출한다. 그 후, 비디오 씬 탐지를 위해, 컬러 히스토그램과 객체 컬러 히스토 그램에 해당하는 프레임의 시각적 특징을 기반으로 상향식 계층 클러스터링 방법을 이용하여 의미적인 연관성을 지니는 샷의 군집화를 통해 비디오 씬을 탐지하는 방법이다. 본 논문에서는 SDCEO의 프로토 타입을 구축하고 3개의 비디오 데이터를 이용한 실험을 통하여 SDCEO의 효율성을 평가하였고 샷 바운더리 식별의 성능의 정확도는 평균 93.3%, 비디오 씬 탐지 성능의 정확도는 평균 83.3%로 만족할만한 성능을 보였다.

Smoke detection in video sequences based on dynamic texture using volume local binary patterns

  • Lin, Gaohua;Zhang, Yongming;Zhang, Qixing;Jia, Yang;Xu, Gao;Wang, Jinjun
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권11호
    • /
    • pp.5522-5536
    • /
    • 2017
  • In this paper, a video based smoke detection method using dynamic texture feature extraction with volume local binary patterns is studied. Block based method was used to distinguish smoke frames in high definition videos obtained by experiments firstly. Then we propose a method that directly extracts dynamic texture features based on irregular motion regions to reduce adverse impacts of block size and motion area ratio threshold. Several general volume local binary patterns were used to extract dynamic texture, including LBPTOP, VLBP, CLBPTOP and CVLBP, to study the effect of the number of sample points, frame interval and modes of the operator on smoke detection. Support vector machine was used as the classifier for dynamic texture features. The results show that dynamic texture is a reliable clue for video based smoke detection. It is generally conducive to reducing the false alarm rate by increasing the dimension of the feature vector. However, it does not always contribute to the improvement of the detection rate. Additionally, it is found that the feature computing time is not directly related to the vector dimension in our experiments, which is important for the realization of real-time detection.

효율적인 장면전환 검출을 이용한 비디오 브라우징 서비스 (Video Browsing Service Using An Efficient Scene Change Detection)

  • Seong-Yoon Shin;Yang-Won Rhee
    • 인터넷정보학회논문지
    • /
    • 제3권2호
    • /
    • pp.69-77
    • /
    • 2002
  • 최근 디지털 비디오는 인터넷을 통해 제공되는 매우 중요한 정보 미디어의 하나이며 멀티미디어 분야에서 매우 중요한 역할을 수행하고 있다. 본 논문에서는 웹 상에서 실시간 사용자 인터페이스를 통해 비디오 내용 검색과 브라우징을 제공하는 비디오 브라우징 서비스를 제시한다. 비디오 시퀀스의 장면 분할과 키 프레임 추출을 위해서 RGB 컬러 히스토그램과 $x^2$(카이 스퀘어) 히스토그램을 합성한 효율적인 장면 전환 검출 방법을 제안한다. 이렇게 추출된 키 프레임들은 물리적인 방법과 논리적인 방법에 따라 색인 화된다. 이 시스템은 또한 비디오카세트리코더(VCR)가 갖고 있는 비디오 편집과 검색 기능을 포함한다. 비디오 브라우징을 위하여 날짜, 분야, 그리고 주제의 세 가지 요소가 사용되며, 비디오 브라우징 서비스는 아파치 웹서버에서 MySQL, PHP, 그리고 JMF를 이용하여 구현된다.

  • PDF