• Title/Summary/Keyword: Shot Detection

Search Result 212, Processing Time 0.025 seconds

Shot Boundary Detection Algorithm By Using Pixel and Histogram Information (화소와 히스토그램 정보를 이용한 샷 전환 탐지 알고리즘)

  • Lee, Joon-Goo;Han, Ki-Sun;You, Byoung-Moon;Hwang, Doo-Sung
    • Annual Conference of KIPS
    • /
    • 2012.11a
    • /
    • pp.527-530
    • /
    • 2012
  • 비디오 데이터를 효율적으로 검색, 정렬, 탐색, 분류하기 위해서는 프레임 간의 샷 전환 탐지가 선행되어야 한다. 본 논문에서는 디지털 비디오 데이터의 샷 전환 탐지를 위해 비디오 스트림을 구성하고 있는 각 프레임들 간의 화소 밝기 차이와 히스토그램의 변화를 이용하였다. 플래쉬 등과 같은 인위적이고 급격한 화소 밝기변화에 의한 오류를 최소화하기 위해 샷 전환 탐지 이전에 각 프레임 간의 밝기 보상을 적용하였다. 밝기 보정 된 프레임으로부터 프레임의 서브 블록 간의 지역적 화소 밝기 정보, 그리고 프레임의 화소 밝기 값 히스토그램을 비교하여 샷 전환을 탐지한다. 실험에서 제안된 알고리즘은 국가기록원 소장 비디오에 적용하여 효과가 있음을 보였다.

Shot Detection robust to object movement and brightness changes (객체이동 및 밝기변화를 고려한 샷 전환 탐지 알고리즘)

  • Lee, Joon-Goo;Han, Ki-Sun;You, Byoung-Moon;Hwang, Doo-Sung
    • Annual Conference of KIPS
    • /
    • 2012.11a
    • /
    • pp.531-534
    • /
    • 2012
  • 기존의 히스토그램을 이용한 샷 전환 탐지 방법은 연속적인 두 프레임의 전체 또는 대응되는 동일한 크기의 소 영역의 히스토그램을 사용하며, 객체의 이동이나, 프레임의 밝기 변화에 취약한 문제점이 있다. 본 논문에서는 이 문제점들을 해결하기 위하여 연속적인 두 프레임(현재와 참조 프레임)을 소영역으로 분할한 후, 현재 프레임의 소 영역과 두 프레임사이에서 발생할 수 있는 객체의 이동을 고려한 참조 프레임에서의 소 영역의 비교, 그리고 참조 프레임의 소 영역에서 얻은 화소 밝기 히스토그램에 밝기 변화를 보상한 후, 현재 프레임의 소 영역에서 얻은 화소 밝기 히스토그램과 비교하는 방법을 제안한다. 제안한 방법은 영화와 뉴스 같은 비디오 데이터에 좋은 결과를 보였다.

SSD Based Face Detection using Residual Connections (SSD 기반의 잔차 학습 신경망을 이용한 얼굴 검출)

  • Lee, Seok Hee;Jang, Young Kyun;Cho, Nam Ik
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2019.06a
    • /
    • pp.252-254
    • /
    • 2019
  • 본 논문은 합성곱 기반의 Single Shot Multibox Detector(SSD) [1] 의 구조를 이용하여 다양한 스케일의 얼굴들을 잘 검출하도록 하였다. 얼굴 검출은 물체 검출과는 다르게 얼굴의 높이와 너비의 비율이 다소 일정하고 크기가 작은 경우가 많은데, 이에 맞게 얼굴 검출이 용이하도록 anchor의 스케일, 비율, 크기를 변경하였다. 특징점 추출 네트워크는 깊은 네트워크의 최적화를 용이하게 하는 skip connection을 이용한 ResNet-50 [2] 기반을 사용하였다. 다양한 크기, 조명, 환경, 각도의 얼굴들을 포함하는 영상들로 이뤄진 Wider Face[3] 데이터 셋의 easy validation set으로 실험한 결과 0.782과 hard validation set에서 0.611의 average precision을 보였다.

  • PDF

Handheld Shot Detection Technique based on LSTM (LSTM 기반의 Handheld 샷 검출)

  • Park, Se-Hee;Park, Ji-Young;Son, Jung-Eui;Park, Seung-Bo
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2021.07a
    • /
    • pp.193-194
    • /
    • 2021
  • 영화, 드라마 등과 같은 콘텐츠에서 표현되는 감정은 등장인물의 대화와 표정뿐만이 아니라, 영상이 표현하는 다양한 정보 중 하나인 촬영기법, 장면의 배경 등을 통해서도 표현된다. 특히 핸드헬드 샷은 불안정하지만 현장감과 자유분방한 감정을 관객에게 전달하며 긴장감, 공포 등 배우들의 감정선을 따라가게 하는 효과가 있다. 따라서 영상 콘텐츠에서 감정 정보를 분석하기 위해서는 핸드헬드 샷을 검출하는 것은 기초적인 작업에 해당한다. 본 논문에서는 핸드헬드 샷을 양방향 LSTM을 활용하여 구별하는 방법을 제안한다. 제안된 방법으로 인식한 핸드헬드의 인식 정확도는 97%였다.

  • PDF

Shot Change Detection Algorithm Using Minimum Pixels of Video Frame (비디오 프레임의 최소 화소를 이용한 장면 전환 검출 기술)

  • Won-Hee Kim;Kwang-Seok Moon;Jong-Nam Kim
    • Annual Conference of KIPS
    • /
    • 2008.11a
    • /
    • pp.145-148
    • /
    • 2008
  • 장면 전환 검출은 대용량 비디오 데이터의 효과적인 관리를 위해서 사용되는 기술로서 현재까지 비디오 프레임의 크기를 대폭 축소시킨 환경에서의 연구는 미미하다. 따라서 본 논문에서는 비디오 프레임의 최소 화소를 이용한 장면 전환 검출 기술을 제안한다. 장면 전환 검출을 위한 특징값 추출 요소로 가중치 분산을 사용하였고, 가변 구간 참조를 통한 적응적인 임계값을 설정하였다. 실험을 통해서 기존의 방법들보다 precision에서 2~20.4%, recall에서 3~18.2%, F1에서 1.1~19.3% 향상된 것을 확인하였고, 비디오 데이터 화소수를 1/256로 축소하여 실험한 결과 기존의 방법들보다 검출률이 월등하게 향상된 것을 알 수 있었다. 제안하는 방법은 계산량 감소를 통한 고속 처리를 가능하게 하여 다양한 소프트웨어 및 하드웨어 플랫폼에서의 고속 장면 전환 검출에 유용하게 사용될 수 있다.

Segmentation-Based Depth Map Adjustment for Improved Grasping Pose Detection (물체 파지점 검출 향상을 위한 분할 기반 깊이 지도 조정)

  • Hyunsoo Shin;Muhammad Raheel Afzal;Sungon Lee
    • The Journal of Korea Robotics Society
    • /
    • v.19 no.1
    • /
    • pp.16-22
    • /
    • 2024
  • Robotic grasping in unstructured environments poses a significant challenge, demanding precise estimation of gripping positions for diverse and unknown objects. Generative Grasping Convolution Neural Network (GG-CNN) can estimate the position and direction that can be gripped by a robot gripper for an unknown object based on a three-dimensional depth map. Since GG-CNN uses only a depth map as an input, the precision of the depth map is the most critical factor affecting the result. To address the challenge of depth map precision, we integrate the Segment Anything Model renowned for its robust zero-shot performance across various segmentation tasks. We adjust the components corresponding to the segmented areas in the depth map aligned through external calibration. The proposed method was validated on the Cornell dataset and SurgicalKit dataset. Quantitative analysis compared to existing methods showed a 49.8% improvement with the dataset including surgical instruments. The results highlight the practical importance of our approach, especially in scenarios involving thin and metallic objects.

An Efficient Video Sequence Matching Algorithm (효율적인 비디오 시퀀스 정합 알고리즘)

  • 김상현;박래홍
    • Journal of the Institute of Electronics Engineers of Korea SP
    • /
    • v.41 no.5
    • /
    • pp.45-52
    • /
    • 2004
  • According tothe development of digital media technologies various algorithms for video sequence matching have been proposed to match the video sequences efficiently. A large number of video sequence matching methods have focused on frame-wise query, whereas a relatively few algorithms have been presented for video sequence matching or video shot matching. In this paper, we propose an efficientalgorithm to index the video sequences and to retrieve the sequences for video sequence query. To improve the accuracy and performance of video sequence matching, we employ the Cauchy function as a similarity measure between histograms of consecutive frames, which yields a high performance compared with conventional measures. The key frames extracted from segmented video shots can be used not only for video shot clustering but also for video sequence matching or browsing, where the key frame is defined by the frame that is significantly different from the previous fames. Several key frame extraction algorithms have been proposed, in which similar methods used for shot boundary detection were employed with proper similarity measures. In this paper, we propose the efficient algorithm to extract key frames using the cumulative Cauchy function measure and. compare its performance with that of conventional algorithms. Video sequence matching can be performed by evaluating the similarity between data sets of key frames. To improve the matching efficiency with the set of extracted key frames we employ the Cauchy function and the modified Hausdorff distance. Experimental results with several color video sequences show that the proposed method yields the high matching performance and accuracy with a low computational load compared with conventional algorithms.

Fast Scene Change Detection Using Macro Block Information and Spatio-temporal Histogram (매크로 블록 정보와 시공간 히스토그램을 이용한 빠른 장면전환검출)

  • Jin, Ju-Kyong;Cho, Ju-Hee;Jeong, Jae-Hyup;Jeong, Dong-Suk
    • Journal of the Institute of Electronics Engineers of Korea SP
    • /
    • v.48 no.1
    • /
    • pp.141-148
    • /
    • 2011
  • Most of the previous works on scene change detection algorithm focus on the detection of abrupt rather than gradual changes. In general, gradual scene change detection algorithms require heavy computation. Some of those approaches don't consider the error factors such as flashlights, camera or object movements, and special effects. Many scenes change detection algorithms based on the histogram show better performances than other approaches, but they have computation load problem. In this paper, we proposed a scene change detection algorithm with fast and accurate performance using the vertical and horizontal blocked slice images and their macro block informations. We apply graph cut partitioning algorithm for clustering and partitioning of video sequence using generated spatio-temporal histogram. When making spatio-temporal histogram, we only use the central block on vertical and horizontal direction for performance improvement. To detect camera and object movement as well as various special effects accurately, we utilize the motion vector and type information of the macro block.

Detecting Dissolve Cut for Multidimensional Analysis in an MPEG compressed domain : Using DCT-R of I, P Frames (MPEG의 다차원 분석을 통한 디졸브 구간 검출 : I, P프레임의 DCT-R값을 이용)

  • Heo, Jung;Park, Sang-Sung;Jang, Dong-Sik
    • Journal of the Institute of Convergence Signal Processing
    • /
    • v.4 no.3
    • /
    • pp.34-40
    • /
    • 2003
  • The paper presents a method to detect dissolve shots of video scene change detections in an MPEG compressed domain. The proposed algorithm uses color-R DCT coefficients of Ⅰ, P-frames for a fast operation and accurate detection and a minimum decoding process in MPEG sequences. The paper presents a method to detect dissolve shot for three-dimensional visualization and analysis of Image in order to recognize easily in computer as a human detects accurately shots of scene change. First, Color-R DCT coefficients for 8*8 units are obtained and the features are summed in a row. Second, Four-step analysis are Performed for differences of the sum in the frame sequences. The experimental results showed that the algorithm has better detection performance, such as precision and recall rate, than the existing method using an average for all DC image by performing four step analysis. The algorithm has the advantage of speed, simplicity and accuracy. In addition. it requires less amount of storage.

  • PDF

In-situ measurement of Ce concentration in high-temperature molten salts using acoustic-assisted laser-induced breakdown spectroscopy with gas protective layer

  • Yunu Lee;Seokjoo Yoon;Nayoung Kim;Dokyu Kang;Hyeongbin Kim;Wonseok Yang;Milos Burger;Igor Jovanovic;Sungyeol Choi
    • Nuclear Engineering and Technology
    • /
    • v.54 no.12
    • /
    • pp.4431-4440
    • /
    • 2022
  • An advanced nuclear reactor based on molten salts including a molten salt reactor and pyroprocessing needs a sensitive monitoring system suitable for operation in harsh environments with limited access. Multi-element detection is challenging with the conventional technologies that are compatible with the in-situ operation; hence laser-induced breakdown spectroscopy (LIBS) has been investigated as a potential alternative. However, limited precision is a chronic problem with LIBS. We increased the precision of LIBS under high temperature by protecting optics using a gas protective layer and correcting for shotto-shot variance and lens-to-sample distance using a laser-induced acoustic signal. This study investigates cerium as a surrogate for uranium and corrosion products for simulating corrosive environments in LiCl-KCl. While the un-corrected limit of detection (LOD) range is 425-513 ppm, the acoustic-corrected LOD range is 360-397 ppm. The typical cerium concentrations in pyroprocessing are about two orders of magnitude higher than the LOD found in this study. A LIBS monitoring system that adopts these methods could have a significant impact on the ability to monitor and provide early detection of the transient behavior of salt composition in advanced molten salt-based nuclear reactors.