• 제목/요약/키워드: Scene Number Detection

검색결과 35건 처리시간 0.022초

MPEG 비디오의 특성 추출을 이용한 효과적인 장면 전환 검출 기법 (Effective scene change detection methods using characteristics of MPEG video)

  • 곽영경;최윤석;고성제
    • 한국통신학회논문지
    • /
    • 제24권8B호
    • /
    • pp.1567-1576
    • /
    • 1999
  • 본 논문에서는 압축되어 있는 MPEG 비디오 시퀀스로부터 DCT의 AC 계수를 이용한 에지 영상을 구하여 급격한 장면의 전환을 검출하는 방법과 매크로블록 타입 정보를 이용하여 점진적 장면 전환인 디졸브(dissolve) 구간을 검출하는 기법을 제안하였다. 에지 추출에 기반한 장면 전환 검출 기법은 밝기의 변화에 덜 민감하며, AC 성분을 이용하면 DC 성분을 이용한 경우보다 원영상을 더욱 잘 표현하는 에지를 추출할 수 있으므로, 보다 정확한 장면 전환을 검출할 수 있다. 제안한 디졸브 검출 기법에서는 영상을 복원하지 않고, MPEG 비트스트림 내의 매크로블록 타입 정보로부터 계산된 인트라 매크로 블록의 개수를 이용하기 때문에 적은 계산량으로 디졸브를 검출할 수 있다. 제안한 장면 전환 검출 방법은 기존의 방법들에 비해서 성능이 우수함을 실험을 통해 입증하였다.

  • PDF

영상의 통계적 특성을 이용한 급격한 장면전화 검출 알고리즘 (Detection of Fast Scene Changes Using a Statistical Technique)

  • 곽대호;박성준;이건호;최유태;송문호
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 추계종합학술대회 논문집(4)
    • /
    • pp.151-154
    • /
    • 2000
  • We propose a statically motivated scene change detection algorithm. As the difference between the neighboring frames will generate peaks at scene boundaries, the problem of detecting fast scene changes is equivalent to detecting peaks in a given sequence. In this paper, the peak detection is performed via several statistics, namely the sample means and variances. For eliminating flash lights as well as detecting fast scene changes within a small number of frames, we have opted to use a two-stage process for computing the necessary statistics. The results indicate superiority of necessary statistics. The results indicate superiority of the proposed algorithm over the previously reported algorithm.

  • PDF

수평과 수직 블록을 이용한 MPEG-1 비디오 장면전환 검출 (MPEG-1 Video Scene Change Detection Using Horizontal and Vertical Blocks)

  • 이민섭;안병철
    • 한국정보처리학회논문지
    • /
    • 제7권2S호
    • /
    • pp.629-637
    • /
    • 2000
  • The content-based information retrieval for a multimedia database uses feature information extracted from the compressed videos. This paper presents an effective method to detect scene changes from compressed videos. Scene changes are detected with DC values of DCT coefficients in MPEG-1 encoded video sequences. Instead of decoding full frames. partial macroblocks of each frame, horizontal and vertical macroblocks, are decoded to detect scene changes. This method detects abrupt scene changes by decoding minimal number of blocks and saves a lot of computation time. The performance of the proposed algorithm is analyzed based on the precision and the recall. The experimental results show the effectiveness in computation time and detection rate to detect scene changes of various MPEG-1 video streams.

  • PDF

강건한 장면 전환 검출 기법을 이용한 엘리베이터 내의 흡연 추출 (Extraction of Smocking in Elevator Using Robust Scene Change Detection Method)

  • 이강호;신성윤;이양원
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권10호
    • /
    • pp.89-95
    • /
    • 2013
  • 엘리베이터 내의 흡연은 경범죄에 속하는 범죄 행위이다. 엘리베이터 내의 흡연은 커가는 우리 아이들과 약한 여성들에게 매우 치명적일 수 있기 때문이다. 본 논문에서는 엘리베이터 내에서 이러한 범죄 행위인 흡연을 범하는 범죄자를 추출하고자 한다. 추출 방법은 변형된 컬러-X2-test를 이용하여 차이값을 추출하고, 이를 정규화 한다. 다음으로, 4-단계의 장면 전환 검출 알고리즘을 이용하여 연속적인 프레임들에서 장면 전환이 발생한 지점을 찾아 낸다. 마지막으로, 비디오에 저장된 대량의 영상에서 흡연 영상의 검색 및 추출을 위한 방법을 제시한다. 실험에서는 장면 전환 검출 과정과 검출 수와 검색 시간별 검색된 비디오의 수가 나타나 있다. 추출된 흡연 영상은 경찰서나 법원에 증거 자료로 제출하고자 한다.

시간축 서브밴드 해석을 이용한 적응적 움직임 추정에 관한 연구 (An adaptive motion estimation based on the temporal subband analysis)

  • 임중곤;정재호
    • 한국통신학회논문지
    • /
    • 제21권6호
    • /
    • pp.1361-1369
    • /
    • 1996
  • Motion estimation is one of the key components for high quality video coding. In this paper, a new motion estimation scheme for MPEG-like video coder is suggested. The proposed temporally adaptive motion estimation scheme consists of five functional blocks: Temporal subband analysis (TSBA), extraction of temporal information, scene change detection (SCD), picture type replacement (PTR), and temporally adapted block matching algorithm (TABMA). Here all the functional components are based on the temporal subband analysis. In this papre, we applied the analysis part of subband decompostion to the temporal axis of moving picture sequence, newly defined the temporal activity distribution (TAD) and average TAD, and proposed the temporally adapted block matching algorithm, the scene change detection algorithm and picture type replacement algorithm which employed the results of the temporal subband analysis. A new block matching algorithm TABMA is capable of controlling the block matching area. According to the temporal activity distribution of objects, it allocates the search areas nonuniformly. The proposed SCD and PTR can prevent unavailable motion prediction for abrupt scene changes. Computer simulation results show that the proposed motion estimation scheme improve the quality of reconstructed sequence and reduces the number of block matching trials to 40% of the numbers of trials in conventional methods. The TSBA based scene change detection algorithm can detect the abruptly changed scenes in the intentionally combined sequence of this experiment without additional computations.

  • PDF

장면 전환점 검출을 위한 프레임의 평균오차 비교에 관한 연구 (A Study on Frame of MSE Comparison for Scene Chang Detection Retrieval)

  • 김단환;김형균;오무송
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2002년도 춘계종합학술대회
    • /
    • pp.638-642
    • /
    • 2002
  • 대용량의 동영상 데이터 이용에 있어 사용자가 전체 동영상 데이터를 한눈에 파악할 수 있고, 필요한 경우 원하는 지점부터 동영상을 재생할 수 있도록 하기 위하여 동영상 데이터의 정보를 요약해 놓은 프레임 리스트를 제공하며, 효과적인 동영상 검색을 위해서는 동영상 데이터의 색인과정이 필요하다. 본 논문은 내용기반 색인에 기초가 될 동영상의 장면 전환점 검출에 관한 효과적인 방법을.제안하고자 한다. 제안된 방법은 동영상 데이터를 대각선 방향으로 일정 픽셀의 칼라 값을 추출하여 동영상의 전체 구조를 파악할 수 있도록 정지영상으로 샘플링 하였으며, 샘플링 된 데이터는 장면전환점을 한눈으로 파악할 수 있었다. 각각의 프레임에서 추출한 픽셀의 칼라 값은 행렬A에 i$\times$j 행렬로 i는 프레임 수, j는 프레임의 영상 높이로 저장하고 MSE(Mean Square Error) 도입하여 각 프레임의 평균 오차를 계산한다. 평균오차와 일정 임계값을 초과하면 그 프레임을 장면 전환점으로 검출하고자 한다.

  • PDF

Shot Group and Representative Shot Frame Detection using Similarity-based Clustering

  • Lee, Gye-Sung
    • 한국컴퓨터정보학회논문지
    • /
    • 제21권9호
    • /
    • pp.37-43
    • /
    • 2016
  • This paper introduces a method for video shot group detection needed for efficient management and summary of video. The proposed method detects shots based on low-level visual properties and performs temporal and spatial clustering based on visual similarity of neighboring shots. Shot groups created from temporal clustering are further clustered into small groups with respect to visual similarity. A set of representative shot frames are selected from each cluster of the smaller groups representing a scene. Shots excluded from temporal clustering are also clustered into groups from which representative shot frames are selected. A number of video clips are collected and applied to the method for accuracy of shot group detection. We achieved 91% of accuracy of the method for shot group detection. The number of representative shot frames is reduced to 1/3 of the total shot frames. The experiment also shows the inverse relationship between accuracy and compression rate.

Adaptive Face Mask Detection System based on Scene Complexity Analysis

  • Kang, Jaeyong;Gwak, Jeonghwan
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권5호
    • /
    • pp.1-8
    • /
    • 2021
  • 코로나바이러스-19(COVID-19)의 대유행에 따라 전 세계 수많은 확진자가 발생하고 있으며 국민을 불안에 떨게 하고 있다. 바이러스 감염 확산을 방지하기 위해서는 마스크를 제대로 착용하는 것이 필수적이지만 몇몇 사람들은 마스크를 쓰지 않거나 제대로 착용하지 않고 있다. 본 논문에서는 영상 이미지에서의 효율적인 마스크 감지 시스템을 제안한다. 제안 방법은 우선 입력 이미지의 모든 얼굴의 영역을 YOLOv5를 사용하여 감지하고 감지된 얼굴의 수에 따라 3가지의 장면 복잡도(Simple, Moderate, Complex) 중 하나로 분류한다. 그 후 장면 복잡도에 따라 3가지 ResNet(ResNet-18, 50, 101) 중 하나를 기반으로 한 Faster-RCNN을 사용하여 얼굴 부위를 감지하고 마스크를 제대로 착용하였는지 식별한다. 공개 마스크 감지 데이터셋을 활용하여 실험한 결과 제안한 장면 복잡도 기반 적응적인 모델이 다른 모델에 비해 가장 성능이 뛰어남을 확인하였다.

프레임간 상관관계를 고려한 장면기반 MPEG 비디오 트래픽 모델링 (Scen based MPEG video traffic modeling considering the correlations between frames)

  • 유상조;김성대;최재각
    • 한국통신학회논문지
    • /
    • 제23권9A호
    • /
    • pp.2289-2304
    • /
    • 1998
  • For the performance analysis and traffic control of ATM networks carrying video sequences, need an appropriate video traffic model. In this paper, we propose a new traffic model for MPEG compressed videos which are widely used for any type of video applications at th emoment. The proposed modeling scheme uses scene-based traffic characteristics and considers the correlation between frames of consecutiv GOPs. Using a simple scene detection algorithm, scene changes are modeled by state transitions and the number of GOPs of a scene state is modeled by a geometric distirbution. Frames of a scene stte are modeled by mean I, P, and B frame size. For more accurate traffic modeling, quantization errors (residual bits) that the state transition model using mean values has are compensated by autoregressive processes. We show that our model very well captures the traffic chracteristics of the original videos by performance analysis in terms of autocorrelation, histogram of frame bits genrated by the model, and cell loss rate in the ATM multiplexer with limited buffers. Our model is able to perrorm translations between levels (i.e., GOP, frame, and cell levels) and to estimate very accurately the stochastic characteristics of the original videos by each level.

  • PDF

Comparisons of Object Recognition Performance with 3D Photon Counting & Gray Scale Images

  • Lee, Chung-Ghiu;Moon, In-Kyu
    • Journal of the Optical Society of Korea
    • /
    • 제14권4호
    • /
    • pp.388-394
    • /
    • 2010
  • In this paper the object recognition performance of a photon counting integral imaging system is quantitatively compared with that of a conventional gray scale imaging system. For 3D imaging of objects with a small number of photons, the elemental image set of a 3D scene is obtained using the integral imaging set up. We assume that the elemental image detection follows a Poisson distribution. Computational geometrical ray back propagation algorithm and parametric maximum likelihood estimator are applied to the photon counting elemental image set in order to reconstruct the original 3D scene. To evaluate the photon counting object recognition performance, the normalized correlation peaks between the reconstructed 3D scenes are calculated for the varied and fixed total number of photons in the reconstructed sectional image changing the total number of image channels in the integral imaging system. It is quantitatively illustrated that the recognition performance of the photon counting integral imaging system can be similar to that of a conventional gray scale imaging system as the number of image viewing channels in the photon counting integral imaging (PCII) system is increased up to the threshold point. Also, we present experiments to find the threshold point on the total number of image channels in the PCII system which can guarantee a comparable recognition performance with a gray scale imaging system. To the best of our knowledge, this is the first report on comparisons of object recognition performance with 3D photon counting & gray scale images.