• 제목/요약/키워드: Scene Change Detection

검색결과 225건 처리시간 0.024초

SURF 기반의 장면 전환 검출 방법 (Scene Change Detection Based on SURF)

  • 오현주;박지용;홍석민;강현민
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.637-639
    • /
    • 2022
  • 장면 전환 검출을 위해 히스토그램 등 단일 특성만 고려할 경우 움직임이 많은 영상과 조명의 변화가 다양하거나 단조로운 색상으로의 장면 전환이 일어나는 영상에 검출이 어렵다는 단점이 있다. 이를 개선하기 위해 프레임 간 색상 히스토그램을 비교 후, SURF를 적용하는 방법을 제안한다.

Parallel Multi-task Cascade Convolution Neural Network Optimization Algorithm for Real-time Dynamic Face Recognition

  • Jiang, Bin;Ren, Qiang;Dai, Fei;Zhou, Tian;Gui, Guan
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권10호
    • /
    • pp.4117-4135
    • /
    • 2020
  • Due to the angle of view, illumination and scene diversity, real-time dynamic face detection and recognition is no small difficulty in those unrestricted environments. In this study, we used the intrinsic correlation between detection and calibration, using a multi-task cascaded convolutional neural network(MTCNN) to improve the efficiency of face recognition, and the output of each core network is mapped in parallel to a compact Euclidean space, where distance represents the similarity of facial features, so that the target face can be identified as quickly as possible, without waiting for all network iteration calculations to complete the recognition results. And after the angle of the target face and the illumination change, the correlation between the recognition results can be well obtained. In the actual application scenario, we use a multi-camera real-time monitoring system to perform face matching and recognition using successive frames acquired from different angles. The effectiveness of the method was verified by several real-time monitoring experiments, and good results were obtained.

Specified Object Tracking Problem in an Environment of Multiple Moving Objects

  • Park, Seung-Min;Park, Jun-Heong;Kim, Hyung-Bok;Sim, Kwee-Bo
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제11권2호
    • /
    • pp.118-123
    • /
    • 2011
  • Video based object tracking normally deals with non-stationary image streams that change over time. Robust and real time moving object tracking is considered to be a problematic issue in computer vision. Multiple object tracking has many practical applications in scene analysis for automated surveillance. In this paper, we introduce a specified object tracking based particle filter used in an environment of multiple moving objects. A differential image region based tracking method for the detection of multiple moving objects is used. In order to ensure accurate object detection in an unconstrained environment, a background image update method is used. In addition, there exist problems in tracking a particular object through a video sequence, which cannot rely only on image processing techniques. For this, a probabilistic framework is used. Our proposed particle filter has been proved to be robust in dealing with nonlinear and non-Gaussian problems. The particle filter provides a robust object tracking framework under ambiguity conditions and greatly improves the estimation accuracy for complicated tracking problems.

자가학습과 지식증류 방법을 활용한 LiDAR 3차원 물체 탐지에서의 준지도 도메인 적응 (Semi-Supervised Domain Adaptation on LiDAR 3D Object Detection with Self-Training and Knowledge Distillation)

  • 우정완;김재열;임성훈
    • 로봇학회논문지
    • /
    • 제18권3호
    • /
    • pp.346-351
    • /
    • 2023
  • With the release of numerous open driving datasets, the demand for domain adaptation in perception tasks has increased, particularly when transferring knowledge from rich datasets to novel domains. However, it is difficult to solve the change 1) in the sensor domain caused by heterogeneous LiDAR sensors and 2) in the environmental domain caused by different environmental factors. We overcome domain differences in the semi-supervised setting with 3-stage model parameter training. First, we pre-train the model with the source dataset with object scaling based on statistics of the object size. Then we fine-tine the partially frozen model weights with copy-and-paste augmentation. The 3D points in the box labels are copied from one scene and pasted to the other scenes. Finally, we use the knowledge distillation method to update the student network with a moving average from the teacher network along with a self-training method with pseudo labels. Test-Time Augmentation with varying z values is employed to predict the final results. Our method achieved 3rd place in ECCV 2022 workshop on the 3D Perception for Autonomous Driving challenge.

조망 높이의 차이가 초래한 감각적 간섭이 시각단기기억 수행에 미치는 영향 (The Influence of Sensory Interference Arising from View-Height Differences on Visual Short-Term Memory Performance)

  • 가야금;현주석
    • 감성과학
    • /
    • 제23권1호
    • /
    • pp.17-28
    • /
    • 2020
  • 관찰자의 조망 높이의 감소는 시각장면 내의 사물들 간 중첩의 증가를 초래해 해당 사물들의 정체 파악을 어렵게 만들 가능성이 있다. 본 연구는 이러한 가능성에 기초해 조망 높이를 달리한 시야 상에 기억이 요구되는 자극들을 제시하고 해당 자극에 대한 시각단기기억 수행을 조사했다. 실험 1에서는 관찰자의 조망 높이(고, 중, 저) 차이를 반영한 격자무늬 배경과 기억 자극을 구성해 해당 자극들의 위치와 색상을 파지하는 단기기억 과제가 실시되었다. 기억 자극의 개수 증감(3 vs. 6)을 통해 기억부담의 수준을 달리해 가면서 기억 수행을 조사한 결과, 조망 높이가 가장 낮은 경우 기억부담의 증가에 따른 기억수행의 저하가 가장 분명한 것이 관찰되었다. 실험 2에서는 선형조망을 제공하는 격자무늬 배경의 유무에 따른 기억 수행을 관찰한 결과 실험 1과 동일하게 조망 높이가 가장 낮은 경우 수행이 역시 저하되는 것이 관찰되었다. 이러한 결과는 조망 높이의 차이가 시야 상의 사물들 간 중첩 단서량의 변화를 초래하며 더 나아가 이러한 변화가 초래하는 감각적 간섭이 시각단기기억 수행에 영향을 줄 가능성을 시사한다.

장면 전환 기법을 이용한 동영상 검색 시스템 설계 (Design of Moving Picture Retrieval System using Scene Change Technique)

  • 김장희;강대성
    • 대한전자공학회논문지SP
    • /
    • 제44권3호
    • /
    • pp.8-15
    • /
    • 2007
  • 최근 멀티미디어 데이터를 효율적으로 전송, 저장 관리 및 검색하는 기술이 중요한 핵심 기술로 대두되고 있다. 그 중에서 멀티미디어 정보 검색의 경우 사용자가 원하는 정보를 표현할 수 있는 사용자 인터페이스 기술과 원하는 정보를 사용자에게 신속하고 정확하게 보여주는 기술의 필요성이 증대하고 있다. 본 논문에서는 MPEG으로 압축된 영상 정보에서 장면의 전환점인 컷을 효과적으로 검출하여 동영상을 분할하는 기법을 제안한다. 컷 검출(Cut detection)은 MPEG 비디오 시퀀스에서 동영상을 분할하는 가장 기본적이면서 중요한 기초 작업이며, 비디오 색인 및 검색을 위한 첫 번째 단계이다. 기존의 방법들은 프레임간을 비교하기 때문에 물체의 빠른 움직임이나 카메라의 움직임, 후레쉬의 섬광 등 화면 변화에 따라 오검출이 생기는 단점이 있다. 제안하는 컷 검출 기법은 먼저 입력영상을 DCT의 DC를 이용하여 샷을 검출한다. 이렇게 검출된 샷으로 데이터베이스를 구성하고, MPEG-7의 시각 기술자 중 HMMD 컬러 모델과 에지 히스토그램을 사용하여 영상에서 특징을 추출하였다. 그리고 제안하는 매칭 기법에 따라 단계별 검색을 수행하였다. 이 실험을 통해서 기존 방법들보다 높은 검색률을 보이는 개선된 동영상 분할 시스템을 설계하였다.

Reproducing Summarized Video Contents based on Camera Framing and Focus

  • Hyung Lee;E-Jung Choi
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권10호
    • /
    • pp.85-92
    • /
    • 2023
  • 본 논문에서는 장편의 드라마나 영화에서 스토리 기반의 축약된 요약본을 자동으로 제작하기 위한 방법을 제안한다. 촬영 단계에서 황금분할을 고려한 공간감 있는 프레임 구성과 내용 전달 차원에서 시청자들의 시선을 집중시키기 위한 관심 대상에 대한 초점을 기본 전제로 했다. 이에 적정한 프레임들을 추출하기 위한 방법을 고려하기 위해서 기존의 씬(scene) 및 숏(shot) 검출에 대한 연구, 초점과 관련된 블러 정도를 파악하는 연구들에서 활용되었던 요소 기술들을 활용했다. 유튜브에서 공유되는 영상을 프레임 단위로 변환한 후 프레임별로 특징을 추출하기 위한 영역으로 프레임 전체 영역과 3개의 부분 영역으로 구분했고, 해당 영역별로 각각 라플라시안 연산자와 FFT를 적용한 결과들을 비교하여 상대적으로 일관성 있고 강건한 FFT를 선택했다. 프레임 전체에 대한 계산값과 3개 영역의 계산값들을 비교하여 상대적으로 선명한 영역을 확인할 수 있는 조건을 기반으로 대상 프레임을 선별했다. 이렇게 선별된 결과를 토대로 숏 내에서 프레임들의 연속성을 확보하기 위해 오프라인 변화점 탐지기법을 적용한 결과와 접목시켜 최종 프레임들을 추출했고, 이를 기반으로 편집결정리스트를 구성하였으며, F1-스코어 75.9%를 갖는 62.77%로 축약된 요약본을 제작했다.

Non-stationary VBR 트래픽을 위한 동적 데이타 크기 예측 알고리즘 (On-line Prediction Algorithm for Non-stationary VBR Traffic)

  • 강성주;원유집;성병찬
    • 한국정보과학회논문지:정보통신
    • /
    • 제34권3호
    • /
    • pp.156-167
    • /
    • 2007
  • 본 논문에서는 VBR(Variable-Bit-Rate) 트래픽의 비선형적이고 버스티한 특성을 모델화 한 GOP ARIMA(ARIMA for Group Of Pictures) 모델을 칼만 필터 알고리즘을 이용하여 실시간으로 예측하는 기법을 제안한다. 칼만 필터를 이용한 예측 기법은 GOP ARIMA의 상태공간 모델링 과정과 향후 N초 간의 트래픽을 예측하는 과정으로 구성된다. 실험을 위해 GOP의 크기가 각각 15인 세 가지 종류의 MPEG VBR 트래픽(뉴스, 드라마, 스포츠)을 제작하였고, 칼만 필터를 이용한 세 가지 종류의 트래픽의 예측 결과를 선형 예측법과 이중 지수 평활법을 이용해 예측한 결과와 비교해 예측 성능이 상대적으로 우수함을 확인할 수 있었다. 또한 예측값에 신뢰 구간을 설정하는 신뢰 구간 분석법을 통해 트래픽 관점에서 장면 변화를 예측하는 방법을 제시하였다. 본 논문의 칼만 필터 기반의 예측 알고리즘은 MPEG 기반 VBR 트래픽을 비롯한 기타 인터넷 트래픽을 실시간으로 예측하는 방법과 이를 이용해 인터넷 서버의 설계 및 자원 할당 정책 등을 위한 트래픽 엔지니어링 연구에 기여할 수 있을 것이다.

장면전환검출과 사용자 프로파일을 이용한 비디오 학습 평가 시스템 (Video Evaluation System Using Scene Change Detection and User Profile)

  • 신성윤
    • 정보처리학회논문지D
    • /
    • 제11D권1호
    • /
    • pp.95-104
    • /
    • 2004
  • 본 논문에서는 사용자 프로파일을 기반으로 한 정보 필터링을 사용하여 학생 개인의 특성에 맞는 효율적인 원격 비디오 학습 평가 시스템을 제안한다. 비디오를 이용한 문제 출제를 위하여 위치, 크기, 그리고 컬러 정보를 기반으로 키 프레임을 추출하고 그레이 레벨 히스토그램 차이와 시간 윈도우를 이용하여 문제 출제 추간을 추출한다. 또한 효율적인 평가를 위하여 카테고리 기반 시스템과 키워드 기반 시스템을 합성하여 문제를 출제하도록 한다. 따라서 학생들은 부족한 영역을 보충하고 관심 있는 영역을 유지하면서 학업 성취도를 향상시킬 수 있다.

움직이는 카메라에 의한 변화하는 환경하의 강인한 배경 획득 및 유동체 검출 (Robust background acquisition and moving object detection from dynamic scene caused by a moving camera)

  • 김태호;조강현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (C)
    • /
    • pp.477-481
    • /
    • 2007
  • A background is a part where do not vary too much or frequently change in an image sequence. Using this assumption, it is presented a background acquisition algorithm for not only static but also dynamic view in this paper. For generating background, we detect a region, where has high correlation rate compared within selected region in the prior pyramid image, from the searching region in the current image. Between a detected region in the current image and a selected region in the prior image, we calculate movement vector for each regions in time sequence. After we calculate whole movement vectors for two successive images, vector histogram is used to determine the camera movement. The vector which has the highest density in the histogram is determined a camera movement. Using determined camera movement, we classify clusters based on pixel intensities which pixels are matched with prior pixels following camera movement. Finally we eliminate clusters which have lower weight than threshold, and combine remained clusters for each pixel to generate multiple background clusters. Experimental results show that we can automatically detect background whether camera move or not.

  • PDF