• Title/Summary/Keyword: Scene Change Detection

검색결과 225건 처리시간 0.024초

시공간 순차 정보를 이용한 내용기반 복사 동영상 검출 (Content based Video Copy Detection Using Spatio-Temporal Ordinal Measure)

  • 정재협;김태왕;양훈준;진주경;정동석
    • 대한전자공학회논문지SP
    • /
    • 제49권2호
    • /
    • pp.113-121
    • /
    • 2012
  • 본 논문은 대용량 동영상을 관리하기 위한 빠르고 효율적인 내용기반 중복 동영상 검출 알고리즘을 제안한다. 효율적인 중복 동영상 검출을 위해 대용량의 동영상을 처리하기 쉬운 작은 단위로 나누는 동영상 장면 전환 기반 분할 기술을 적용하였다. 동영상 서비스 및 저작권 보호 관련 사업모델의 경우, 필요한 기술은 아주 작은 구간의 동영상이나 한 장의 영상 을 검색하기보다는 상당한 길이 이상 일치하는 동영상을 파악하는 기술이 필요하다. 이러한 중복 동영상 검출을 위해 본 논문에서 동영상을 장면 전환을 기준으로 분할하여, 나누어진 장면 내에서 움직임 분포 서술자와 대표 프레임을 선택하여 프레임 서술자를 추출한다. 움직임 분포 서술자는 동영상 디코딩 과정에서 얻어지는 매크로 블록의 움직임 벡터를 이용한 장면 내 움직임 분포 히스토그램을 구성하였다. 움직임 분포 서술자는 정합시 고속 정합이 가능하도록 필터링 역할을 한다. 반면 움직임 정보만는 낮은 변별력을 가진다. 이를 높이기 위해 움직임 분포 서술자를 이용하여 정합된 장면 간에 선택된 대표 프레임의 패턴 서술자를 이용하여 동영상의 중복 여부를 최종 판단한다. 제안된 방법은 실제 동영상 서비스 환경에서 우수한 인식률과 낮은 오인식률을 가질 뿐만아니라 실제 적용이 가능할 정도의 빠른 정합 속도를 얻을 수 있었다.

스토리텔링 콘텐츠의 효과적인 관리를 위한 영화 스토리 발단부의 자동 경계 추출 (Extracting Beginning Boundaries for Efficient Management of Movie Storytelling Contents)

  • 박승보;유은순;정재은
    • 지능정보연구
    • /
    • 제17권4호
    • /
    • pp.279-292
    • /
    • 2011
  • 영화는 스토리를 전달하는 대표적인 매체 중의 하나이며 영화 속 스토리는 인물, 사건, 배경의 유기적인 연결을 통해 진행된다. 소설과 같이 스토리를 지닌 다른 매체와 마찬가지로 영화 역시 서사 구조를 갖고 있다. 즉 등장인물 간의 갈등과 해결이 인과 관계에 따라 전개된다. 영화의 서사구조는 아리스토텔레스의 3막 구조를 가지며 6단계로 세분화 될 수 있다. 전통적인 3막 구조는 발단부, 중반부, 결말부로 구성된다. 발단부는 영화에 등장하는 인물이나 배경을 소개하고 사건의 실마리와 갈등을 암시하는 장치들을 제시한다. 중반부는 내외적인 요인들에 의해 사건이 발전하고 갈등과 긴장을 고조시키는 부분이다. 결말부에서는 사건이 해결되면서 스토리의 주제 및 작가의 메시지가 전달된다. 특히 발단부는 스토리 진행을 위해 등장인물의 성격을 설정하고 배경을 지시하는 등의 다양한 정보가 노출되는 부분이기 때문에 영화의 축약이나 등장인물들의 중요한 정보를 추출할 수 있는 중요한 부분이다. 따라서 영화의 스토리를 추출할 경우 서사구조에 따라 가중치를 다르게 부여할 필요가 있다. 본 논문에서는 등장인물 수를 누적한 그래프를 이용하여 발단부와 중반부의 경계를 추출하는 방법을 제시한다. 발단부에서는 주요 등장인물이 소개되고 이들 간의 갈등이 암시되거나 사건의 실마리가 제시된다. 따라서 주요 등장인물의 등장이 마무리되는 장면에서 일정 장면이 진행된 이후의 장면이 발단부와 중반부의 경계가 된다. 주요 등장인물은 주인공과 적대자, 그리고 주인공과 적대자를 보조해 주는 각각의 보조자(조연)로 구성되기 때문에 등장인물 수 누적 그래프에서 주요 등장인물의 등장이 마무리되는 장면을 찾기 위해서는 단역을 제거하여야 한다. 또한 주요 등장인물이 더 이상 등장하지 않는 변곡점을 찾는 방법이 필요하다. 이를 위해 본 논문에서는 단역이 제거된 등장인물 수 누적 그래프를 그린 후 변곡점을 찾는 방법을 제안한다. 실제 발단부와 중반부의 경계는 주요 등장인물의 출현이 마무리 된 후 갈등과 사건의 실마리가 암시되는 추가적인 장면이 진행된 후에 나타난다. 따라서 다수의 영화를 통해 추가적인 장면의 개수를 설정하는 실험을 진행할 것이다.

인공위성 영상의 객체인식을 위한 영상 특징 분석 (Feature-based Image Analysis for Object Recognition on Satellite Photograph)

  • 이석준;정순기
    • 한국HCI학회논문지
    • /
    • 제2권2호
    • /
    • pp.35-43
    • /
    • 2007
  • 본 논문은 특징검출(feature detection)과 특징해석(feature description) 기법을 이용하여, 영상 매칭 (matching)과 인식(recognition)에 필요한 다양한 파라미터의 변화에 따른 인식률의 차이를 분석하기 위한 실험 내용을 다룬다. 본 논문에서는 영상의 특징분석과 매칭프로세스를 위해, Lowe의 SIFT(Scale-Invariant Transform Feature)를 이용하며, 영상에서 나타나는 특징을 검출하고 해석하여 특징 데이터베이스로 구축한다. 특징 데이터베이스는 구글 어스를 통해 획득한 위성영상으로부터 50여개 건물에 대해 구축되는데, 이는 각 건물 영상으로부터 추출된 특징 점들의 좌표와 128차원의 벡터의 값으로 이루어진 특징 해석데이터로 저장된다. 구축된 데이터베이스는 각 건물에 대한 정보가 태그의 형식으로 함께 저장되는데, 이는 카메라로부터 획득한 입력영상과의 비교를 통해 입력영상이 가리키는 지역 내에 존재하는 건물에 대한 정보를 제공하는 역할을 한다. 실험은 영상 매칭과 인식과정에서 작용하는 내-외부적 요소들을 제시하고, 각 요소의 상태변화에 따라 인식률의 차이를 비교하는 방법으로 진행되었으며, 본 연구의 최종적인 시스템은 모바일기기의 카메라를 이용하여 카메라가 촬영하고 있는 지도상의 객체를 인식하고, 해당 객체에 대한 기본적인 정보를 제공할 수 있다.

  • PDF

차선검출 기반 카메라 포즈 추정 (Lane Detection-based Camera Pose Estimation)

  • 정호기;서재규
    • 한국자동차공학회논문집
    • /
    • 제23권5호
    • /
    • pp.463-470
    • /
    • 2015
  • When a camera installed on a vehicle is used, estimation of the camera pose including tilt, roll, and pan angle with respect to the world coordinate system is important to associate camera coordinates with world coordinates. Previous approaches using huge calibration patterns have the disadvantage that the calibration patterns are costly to make and install. And, previous approaches exploiting multiple vanishing points detected in a single image are not suitable for automotive applications as a scene where multiple vanishing points can be captured by a front camera is hard to find in our daily environment. This paper proposes a camera pose estimation method. It collects multiple images of lane markings while changing the horizontal angle with respect to the markings. One vanishing point, the cross point of the left and right lane marking, is detected in each image, and vanishing line is estimated based on the detected vanishing points. Finally, camera pose is estimated from the vanishing line. The proposed method is based on the fact that planar motion does not change the vanishing line of the plane and the normal vector of the plane can be estimated by the vanishing line. Experiments with large and small tilt and roll angle show that the proposed method outputs accurate estimation results respectively. It is verified by checking the lane markings are up right in the bird's eye view image when the pan angle is compensated.

LMS algorithm을 이용한 배경분리 알고리즘 구현 및 성능 비교에 관한 연구 (A study on implementation of background subtraction algorithm using LMS algorithm and performance comparative analysis)

  • 김현준;권택구;주양익;서동환
    • Journal of Advanced Marine Engineering and Technology
    • /
    • 제39권1호
    • /
    • pp.94-98
    • /
    • 2015
  • 최근 정보화 및 컴퓨터 비전 기술의 발전과 함께 객체의 인식 및 추적 기능을 가진 CCTV시스템이 다양한 분야에서 연구되고 있다. 하지만 실외환경에서 발생할 수 있는 그림자의 변화, 조명의 변화, 움직이는 요소들과 같은 배경의 변화는 객체 인지성능에 영향을 주게 된다. 따라서 실외환경에서 배경의 변화를 실시간으로 갱신하기 위해 본 논문에서는 다양한 배경 모델링 기법들을 분석하고, 가중치를 기반으로 한 배경 갱신 알고리즘을 제안한다. 실험을 통해 제안한 알고리즘의 객체 검출 성능은 이전 연구의 객체 검출 성능을 유지하며, 오인식 된 객체 수가 이전 연구에 비해 감소됨을 확인하였다.

컬러 영상의 조명성분 분석을 통한 문자인식 성능 향상 (Improved Text Recognition using Analysis of Illumination Component in Color Images)

  • 치미영;김계영;최형일
    • 한국컴퓨터정보학회논문지
    • /
    • 제12권3호
    • /
    • pp.131-136
    • /
    • 2007
  • 본 논문에서는 컬러영상에 존재하는 문자들을 효율적으로 추출하기 위한 새로운 접근 방법을 제안한다. 빛 또는 조명성분의 영향에 의해 획득된 영상 내에 존재하는 반사성분은 문자 또는 관심객체들의 경계가 모호해 지거나 관심객체와 배경이 서로 혼합 되었을 경우, 문자추출 및 인식을 함에 있어서 오류를 포함시킬 수 있다. 따라서 영상 내에 존재하는 반사성분을 제거하기 위해 먼저. 컬러영상으로부터 Red컬러 성분에 해당하는 히스토그램에서 두개의 pick점을 검출한다. 이후 검출된 두 개의 pick점들 간의 분포를 사용하여 노말 또는 편광 영상에 해당하는지를 판별한다. 노말 영상의 경우 부가적인 처리를 거치지 않고 문자에 해당하는 영역을 검출하며, 편광 영상에 해당하는 경우 반사성분을 제거하기 위해 호모모픽필터링 방법을 적용하여 반사성분에 해당하는 영역을 제거한다. 이후 문자영역을 검출하기 위해 최적전역임계화방식을 적용하여 전경과 배경을 분리하였으며 문자영역 추출 및 인식의 성능을 향상시켰다. 널리 사용되고 있는 문자 인식기를 사용하여 제안한 방식 적용 전과 후의 인식결과를 비교하였다. 편광영상에서 제안된 방법 적용 후, 문자인식을 한 경우 인식률이 향상되었다.

  • PDF

드 브루인 수열을 이용한 효과적인 위치 인식 마커 구성 (Effective Marker Placement Method By De Bruijn Sequence for Corresponding Points Matching)

  • 박경미;김성환;조환규
    • 한국콘텐츠학회논문지
    • /
    • 제12권6호
    • /
    • pp.9-20
    • /
    • 2012
  • 컴퓨터비전에서 안정적으로 대응점을 획득하는 것은 매우 중요한 일이다. 그러나 이들은 스케일, 조명, 시점 등이 변하는 환경에서 정확한 대응점을 찾는 과정은 쉽지 않다. SIFT 알고리즘은 객체의 모서리나 꼭지점으로부터 추출한 특징벡터를 사용하므로 스케일링, 회전, 조명변화를 가지는 영상에서도 뛰어난 매칭을 수행한다. 그러나 SIFT는 엣지에 의해 특징점을 추출하므로 엣지가 존재하지 않는 영역에서는 원하는 대응점을 찾을 수 없다. 본 연구는 SIFT에 의한 대응 특징점 추출과 매칭 성능을 향상시키기 위한 마커 모양 및 배치 방법을 제안한다. 제안 방법에서 사용한 마커의 모양은 부착 방향에 따라 SIFT 알고리즘에 의해 한 방향으로 우세한 벡터를 검출할 수 있는 반원형(SemiCircle)으로 구성한다. 그리고 대응점 매칭의 성능을 향상시키기 위하여 마커의 방향 배치는 드 브루인 수열(De Bruijn Sequence)을 이용한다. 실험을 통해 제안한 방법이 기존의 방법보다 더 정확한 특징점 검출과 매칭에 효과적임을 증명하였다.

장면 전환 기법을 이용한 동영상 검색 시스템의 하드웨어 구현 (Hardware Implementation of Moving Picture Retrieval System Using Scene Change Technique)

  • 김장희;강대성
    • 대한전자공학회논문지SP
    • /
    • 제45권3호
    • /
    • pp.30-36
    • /
    • 2008
  • 멀티미디어 정보는 다매체, 다특징, 다표현, 대용량성의 특징과 함께 그 양 또한 급속도로 증가하고 있다. 따라서 급격히 늘어난 방대한 정보로부터 필요한 정보를 검색하는 검색 시스템이 요구되고 있으며, 이러한 색인 및 검색 시스템이 실시간으로 처리되는 것이 필요하다. 동영상의 내용 기반 검색을 위하여 가장 일반적으로 사용할 수 있는 정보는 영상정보이다. 영상정보는 주로 비디오를 장면 분할할 때에 사용되며 이를 통하여 구조적인 비디오 브라우징을 할 수 있다. 비디오를 샷으로 구분하는 작업을 비디오 분할(video segmentation)이라고 하며, 비디오 분할을 위해 장면의 전환점인 컷을 검출하는 작업을 컷 검출(cut detection)이라고 한다. 본 연구에서는 MPEG-7 시각 기술자인 HMMD 컬러 모델과 에지 히스토그램 기술자를 사용하여 동영상 분할을 하였다. HMMD 컬러 공간은 다른 공간에 비해 인간의 색 지각에 매우 밀접한 것으로 나타난다. 본 논문에서는 이러한 검색 시스템을 하드웨어로 구현하였다.

계층적 은닉 마코프 모델을 이용한 비디오 시퀀스의 셧 경계 검출 (Shot Boundary Detection of Video Sequence Using Hierarchical Hidden Markov Models)

  • 박종현;조완현;박순영
    • 한국통신학회논문지
    • /
    • 제27권8A호
    • /
    • pp.786-795
    • /
    • 2002
  • 본 논문에서는 계층적 은닉 마코프 모델을 이용한 히스토그램과 모우멘트 기반의 동영상 장면전환 검출 방법을 제안한다. 제안된 방법은 웨이블릿 변환된 영상의 저주파 부 밴드로부터 히스토그램을 추출하며, 고주파 부 밴드로부터는 방향성 모우멘트를 추출한다. 그리고 수동적으로 분할된 비디오로부터 추출한 히스토그램 차와 모우멘트 차를 관측값으로 사용하여 은닉 마코프 모델을 학습한다. 비디오 분할 과정은 두 단계로 구성되는데, 먼저 히스토그램 기반의 은닉 마코프 모델은 입력된 비디오에 대하여 셧, 컷, 그리고 점진적인 장면전환의 3개의 범주로 분할한다. 그리고 두 번째 단계에서는 모우멘트 기반의 은닉 마코프 모델을 사용하여 점진적인 장면 전환을 더 세밀하게 페이드와 디졸브로 분할한다. 실험결과 제안된 방법은 기존의 경계값 기반의 방법보다 더 효율적으로 동영상의 셧 경계를 분할하였음을 볼 수 있었다.

블록 정합을 이용한 비디오 자막 영역의 원 영상 복원 방법 (A Method for Reconstructing Original Images for Captions Areas in Videos Using Block Matching Algorithm)

  • 전병태;이재연;배영래
    • 방송공학회논문지
    • /
    • 제5권1호
    • /
    • pp.113-122
    • /
    • 2000
  • 이미 방송된 비디오 영상으로부터 자막 영역을 제거하고 원 영상으로 복원할 필요가 종종 발생한다. 복원될 영상의 량이 적을 경우 수 작업에 의한 복원이 가능하나, 비디오 영상과 같이 복원할 영상이 많아질 경우에는 수 작업에 복원은 어렵다고 볼 수 있다. 따라서 자동으로 자막 영역을 원 영상으로 복원할 수 있는 방법이 필요하게 된다. 기존의 영상 복원에 관한 연구는 주로 블러링(blurring)된 영상을 주파수 필터를 사용하여 선명하게 복원하거나, 영상 통신을 위한 비디오 코딩 방법에 대한 연구가 많이 이루어졌다. 본 논문에서는 블록 정합 알고리즘(Block Matching Algorithm)을 이용하여 자막 영역을 복원하는 방법을 제안하고자한다. 자막 복원을 위한 사전 정보로 자막 영역 정보와 장면 전환 정보를 추출한다. 추출된 자막 정보로부터 자막의 시작 프레임, 끝 프레임, 자막 문자의 구성 요소 정보를 얻을 수 있다. 자막 정보(자막의 시작 프레임, 끝 프레임)와 장면 전환 정보를 이용하여 복원의 방향성 및 복원의 종점을 결정한다. 복원의 방향성에 따라 각 프레임마다 문자의 구성 요소에 대한 블록 정합을 수행하여 원 영상을 복원한다. 실험결과 비교적 움직임이 적은 영상에서는 복원이 잘 됨을 볼 수 있었으며, 복잡한 배경을 갖고 있는 영상의 경우도 복원됨을 볼 수 있었다.

  • PDF