• 제목/요약/키워드: Video Object Detection

검색결과 354건 처리시간 0.029초

미디어 편집을 위한 인물 식별 및 검색 기법 (Character Recognition and Search for Media Editing)

  • 박용석;김현식
    • 방송공학회논문지
    • /
    • 제27권4호
    • /
    • pp.519-526
    • /
    • 2022
  • 동영상 콘텐츠 편집 시 등장인물을 구분하고 식별하는 작업은 많은 시간과 노력이 요구되는 작업이다. 노동 집약적 특성이 있는 미디어 편집 작업 시 인공지능 기술을 활용하면 미디어 제작 시간을 획기적으로 줄일 수 있어 창작과정의 효율성 향상에 도움을 줄 수 있다. 본 논문에서는 동영상 편집을 위한 인물 식별 및 검색 작업을 자동화하기 위해 다수의 인공지능 기술을 혼합하여 활용하는 기법을 제안한다. 객체 검출, 얼굴 검출, 자세 예측 기법을 사용하여 인물 객체에 대한 특징 정보를 수집하고, 수집된 정보를 바탕으로 얼굴 인식, 색 공간 분석 기법 등을 활용하여 인물 객체 식별 정보를 생성한다. 인물 특징 및 식별 정보는 편집 대상 영상의 각 프레임에 대해서 수집되며 영상 편집을 위한 프레임 단위 검색을 위한 메타데이터로 사용된다.

앵커 객체 추출을 이용한 앵커 프레임 검출 (Anchor Frame Detection Using Anchor Object Extraction)

  • 박기태;황두선;문영식
    • 대한전자공학회논문지SP
    • /
    • 제43권3호
    • /
    • pp.17-24
    • /
    • 2006
  • 본 논문에서는 뉴스 비디오에서 앵커 프레임 검출을 위한 알고리즘을 제안한다. 제안된 알고리즘은 다음과 같이 4단계로 구성된다. 첫 번째 단계에서, 뉴스 비디오를 비디오 샷들로 분할하기 위해 누적 히스토그램(cumulative histogram) 기법을 이용하여 샷 경계(shot boundary)를 검출한다. 두 번째 단계에서는 각 비디오 샷 경계에서 얼굴 영역들을 찾기 위해서 피부 컬러(skin color) 정보를 이용하고, 세 번째 단계에서는, 앵커 객체를 추출하기 위해서 사람의 상체 부분의 컬러 정보를 이용하여 앵커 후보 프레임을 검출하며, 마지막 단계에서, 후보 프레임들에 대해서 앵커 프레임과 비앵커 프레임을 분류하기 위해서 그래프 이론을 이용한 클러스터 분석 알고리즘을 적용한다. 실험 결과를 통해서 제안한 알고리즘이 효과적으로 앵커 프레임을 검출하는 것을 보여준다.

영상디지털도어록용 단일 사람 검출 알고리즘 구현 (Implementation of a Single Human Detection Algorithm for Video Digital Door Lock)

  • 신성환;이상락;최한고
    • 정보처리학회논문지B
    • /
    • 제19B권2호
    • /
    • pp.127-134
    • /
    • 2012
  • 영상디지털도어록(Video digital door lock, VDDL) 시스템은 문으로 출입하는 사람을 검출하고 사람 영상을 획득한다. 도어록 설계 시 고려할 사항은 배터리 기반으로 동작하므로 속도가 빠른 사람 검출 알고리즘을 적용하여 전류소모를 최소화해야 한다. 그리고 도어록은 고정된 카메라에서 영상을 촬영하므로 배경영상을 이용한 사람 검출이 높은 신뢰성을 얻을 수 있다. 본 논문에서는 이러한 요구조건에 충족하며 VDDL에 적합한 단일 사람검출 알고리즘을 다루고 있는데, 획득한 영상에서 이동하는 물체를 감지하고 영상처리를 통해 물체가 사람인지를 판별한다. 제안된 영상처리 알고리즘은 두 단계로 이루어져 있다. 첫째, 배경영상과 피부색 정보를 통해 사람 이미지 영역을 구한다. 둘째, 인체비례 정보를 기반으로 폴라 히스토그램을 이용하여 사람 유무를 판단한다. 개발된 알고리즘은 도어록에 설치하고 실험을 통해 성능을 확인하였다.

Context-aware Video Surveillance System

  • An, Tae-Ki;Kim, Moon-Hyun
    • Journal of Electrical Engineering and Technology
    • /
    • 제7권1호
    • /
    • pp.115-123
    • /
    • 2012
  • A video analysis system used to detect events in video streams generally has several processes, including object detection, object trajectories analysis, and recognition of the trajectories by comparison with an a priori trained model. However, these processes do not work well in a complex environment that has many occlusions, mirror effects, and/or shadow effects. We propose a new approach to a context-aware video surveillance system to detect predefined contexts in video streams. The proposed system consists of two modules: a feature extractor and a context recognizer. The feature extractor calculates the moving energy that represents the amount of moving objects in a video stream and the stationary energy that represents the amount of still objects in a video stream. We represent situations and events as motion changes and stationary energy in video streams. The context recognizer determines whether predefined contexts are included in video streams using the extracted moving and stationary energies from a feature extractor. To train each context model and recognize predefined contexts in video streams, we propose and use a new ensemble classifier based on the AdaBoost algorithm, DAdaBoost, which is one of the most famous ensemble classifier algorithms. Our proposed approach is expected to be a robust method in more complex environments that have a mirror effect and/or a shadow effect.

확률기반 배경제거 기법의 향상을 위한 밝기 사영 및 변환에너지 기반 그림자 영역 제거 방법 (A Shadow Region Suppression Method using Intensity Projection and Converting Energy to Improve the Performance of Probabilistic Background Subtraction)

  • 황숭민;강동중
    • 제어로봇시스템학회논문지
    • /
    • 제16권1호
    • /
    • pp.69-76
    • /
    • 2010
  • The segmentation of moving object in video sequence is a core technique of intelligent image processing system such as video surveillance, traffic monitoring and human tracking. A typical method to segment a moving region from the background is the background subtraction. The steps of background subtraction involve calculating a reference image, subtracting new frame from reference image and then thresholding the subtracted result. One of famous background modeling is Gaussian mixture model (GMM). Even though the method is known efficient and exact, GMM suffers from a problem that includes false pixels in ROI (region of interest), specifically shadow pixels. These false pixels cause fail of the post-processing tasks such as tracking and object recognition. This paper presents a method for removing false pixels included in ROT. First, we subdivide a ROI by using shape characteristics of detected objects. Then, a method is proposed to classify pixels from using histogram characteristic and comparing difference of energy that converts the color value of pixel into grayscale value, in order to estimate whether the pixels belong to moving object area or shadow area. The method is applied to real video sequence and the performance is verified.

Comparison of Two Methods for Stationary Incident Detection Based on Background Image

  • Ghimire, Deepak;Lee, Joonwhoan
    • 스마트미디어저널
    • /
    • 제1권3호
    • /
    • pp.48-55
    • /
    • 2012
  • In general, background subtraction based methods are used to detect the moving objects in visual tracking applications. In this paper we employed background subtraction based scheme to detect the temporarily stationary objects. We proposed two schemes for stationary object detection and we compare those in terms of detection performance and computational complexity. In the first approach we used single background and in the second approach we used dual backgrounds, generated with different learning rates, in order to detect temporarily stopped object. Finally, we used normalized cross correlation (NCC) based image comparison to monitor and track the detected stationary object in a video scene. The proposed method is robust with partial occlusion, short time fully occlusion and illumination changes, as well as it can operate in real time.

  • PDF

Efficient Swimmer Detection Algorithm using CNN-based SVM

  • Hong, Dasol;Kim, Yoon
    • 한국컴퓨터정보학회논문지
    • /
    • 제22권12호
    • /
    • pp.79-85
    • /
    • 2017
  • In this paper, we propose a CNN-based swimmer detection algorithm. Every year, water safety accidents have been occurred frequently, and accordingly, intelligent video surveillance systems are being developed to prevent accidents. Intelligent video surveillance system is a real-time system that detects objects which users want to do. It classifies or detects objects in real-time using algorithms such as GMM (Gaussian Mixture Model), HOG (Histogram of Oriented Gradients), and SVM (Support Vector Machine). However, HOG has a problem that it cannot accurately detect the swimmer in a complex and dynamic environment such as a beach. In other words, there are many false positives that detect swimmers as waves and false negatives that detect waves as swimmers. To solve this problem, in this paper, we propose a swimmer detection algorithm using CNN (Convolutional Neural Network), specialized for small object sizes, in order to detect dynamic objects and swimmers more accurately and efficiently in complex environment. The proposed CNN sets the size of the input image and the size of the filter used in the convolution operation according to the size of objects. In addition, the aspect ratio of the input is adjusted according to the ratio of detected objects. As a result, experimental results show that the proposed CNN-based swimmer detection method performs better than conventional techniques.

Emergency Detection Method using Motion History Image for a Video-based Intelligent Security System

  • Lee, Jun;Lee, Se-Jong;Park, Jeong-Sik;Seo, Yong-Ho
    • International journal of advanced smart convergence
    • /
    • 제1권2호
    • /
    • pp.39-42
    • /
    • 2012
  • This paper proposed a method that detects emergency situations in a video stream using MHI (Motion History Image) and template matching for a video-based intelligent security system. The proposed method creates a MHI of each human object through image processing technique such as background removing based on GMM (Gaussian Mixture Model), labeling and accumulating the foreground images, then the obtained MHI is compared with the existing MHI templates for detecting an emergency situation. To evaluate the proposed emergency detection method, a set of experiments on the dataset of video clips captured from a security camera has been conducted. And we successfully detected emergency situations using the proposed method. In addition, the implemented system also provides MMS (Multimedia Message Service) so that a security manager can deal with the emergency situation appropriately.

화소 밝기와 객체 이동을 이용한 비디오 샷 경계 탐지 알고리즘 (Shot Boundary Detection Algorithm by Compensating Pixel Brightness and Object Movement)

  • 이준구;한기선;유병문;황두성
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권5호
    • /
    • pp.35-42
    • /
    • 2013
  • 비디오 데이터를 효율적으로 검색, 정렬, 탐색, 분류하기 위해서는 프레임 간의 샷 전환 탐지가 선행되어야 한다. 프레임 간 화소 밝기와 객체 이동은 높은 탐지율을 보장하는 샷 탐지 알고리즘이 극복해야할 문제이다. 본 논문에서는 프레임의 블록화 및 객체의 이동과 프레임의 밝기를 고려하는 샷 탐지 방법을 제안한다. 먼저 연속하는 두 프레임 사이에서 발생할 수 있는 객체의 이동을 고려하여 계산된 히스토그램과 밝기 차이를 반영하는 모폴러지 팽창 연산을 이용하는 알고리즘을 제안한다. 다음으로 화소 밝기 차를 보상한 프레임 블록의 화소정보와 프레임의 전역적인 밝기 히스토그램의 변화를 함께 이용하는 샷 탐지 방법을 제안한다. 제안된 방법들은 국가기록원 소장 비디오 데이터에 대한 실험에서 화소 또는 히스토그램 기반 알고리즘에 비해 높은 샷 탐지율을 보였다.

복층터널 영상유고감지시스템의 화재 감지 알고리즘 개발 (Development of Fire Detection Algorithm for Video Incident Detection System of Double Deck Tunnel)

  • 김태복
    • 한국정보통신학회논문지
    • /
    • 제23권9호
    • /
    • pp.1082-1087
    • /
    • 2019
  • 영상유고감지시스템은 터널 내 보행자, 낙하물, 정지 차량, 역주행, 화재(화염 및 연기) 등 돌발상황 시에 초동 감지 목적의 시스템으로 최근 도심지의 대심도 지하도로 건설에 따라 중요성이 부각되고 있다. 그러므로 영상유고감지시스템을 대심도 복층터널에 적용하기 위하여 복층터널의 설계 특성을 반영하여 개발하였고, 본 논문에서는 특히 기존 영상유고감지시스템에서는 지원되지 않거나 또는 오감지가 많아 복층터널 환경에 그대로 적용하기 어려웠던 화재 감지를 색 영상 분포, 실루엣 확산 및 통계적 특성 분석을 복합적으로 사용하는 방법을 제안하고, 이를 복층터널 테스트베드 환경에서 차량 실물화재 실험을 통하여 검증하였다.