• 제목/요약/키워드: Scene Analysis Method

검색결과 221건 처리시간 0.028초

A Comparison of Scene Change Localization Methods over the Open Video Scene Detection Dataset

  • Panchenko, Taras;Bieda, Igor
    • International Journal of Computer Science & Network Security
    • /
    • 제22권6호
    • /
    • pp.1-6
    • /
    • 2022
  • Scene change detection is an important topic because of the wide and growing range of its applications. Streaming services from many providers are increasing their capacity which causes the industry growth. The method for the scene change detection is described here and compared with the State-of-the-Art methods over the Open Video Scene Detection (OVSD) - an open dataset of Creative Commons licensed videos freely available for download and use to evaluate video scene detection algorithms. The proposed method is based on scene analysis using threshold values and smooth scene changes. A comparison of the presented method was conducted in this research. The obtained results demonstrated the high efficiency of the scene cut localization method proposed by authors, because its efficiency measured in terms of precision, recall, accuracy, and F-metrics score exceeds the best previously known results.

Video Segmentation and Key frame Extraction using Multi-resolution Analysis and Statistical Characteristic

  • Cho, Wan-Hyun;Park, Soon-Young;Park, Jong-Hyun
    • Communications for Statistical Applications and Methods
    • /
    • 제10권2호
    • /
    • pp.457-469
    • /
    • 2003
  • In this paper, we have proposed the efficient algorithm that can segment the video scene change using a various statistical characteristics obtained from by applying the wavelet transformation for each frames. Our method firstly extracts the histogram features from low frequency subband of wavelet-transformed image and then uses these features to detect the abrupt scene change. Second, it extracts the edge information from applying the mesh method to the high frequency subband of transformed image. We quantify the extracted edge information as the values of variance characteristic of each pixel and use these values to detect the gradual scene change. And we have also proposed an algorithm how extract the proper key frame from segmented video scene. Experiment results show that the proposed method is both very efficient algorithm in segmenting video frames and also is to become the appropriate key frame extraction method.

HEVC 부호화 부가정보를 이용한 장면전환 검출 연구 (An analysis of Scene Change Detection using HEVC coding additional information)

  • 엄유미;박상일;정창우
    • 방송공학회논문지
    • /
    • 제20권6호
    • /
    • pp.871-879
    • /
    • 2015
  • 대용량 컨텐츠 수요와 공급의 증가에 따라 UHD 비디오의 분석, 색인, 편집 등을 위한 장면전환을 검출하는 방법이 요구되고 있다. 이전까지 많은 연구자들이 다양한 장면전환 검출 방법을 연구해왔지만 카메라의 다양한 움직임과 장면의 변화를 정확하게 검출하기는 어려웠다. 또한, 4K (3820x2160) 해상도 이상의 UHD 비디오들은 데이터 량을 더욱더 증가시키기 때문에 이전의 장면전환 검출 방법은 UHD 비디오 컨텐츠에 적용하기에는 너무 많은 시간이 걸리는 문제점이 발생한다. 따라서, 압축률이 높은 차세대 고효율 코덱 HEVC를 이용하여 장면전환을 검출하는 방법이 요구되고 있다. 본 논문에서는 차세대 고효율 코덱 HEVC의 부호화 부가정보를 이용한 4가지 장면전환 검출 방법을 제안하며, 대용량 비디오의 장면전환 검출을 위한 픽셀 기반의 새로운 장면전환 검출 시스템 구조를 제안한다. 연산량을 줄이기 위해 프레임 특징에 따른 방법을 각각 제시하며, 실험 결과를 통해 HEVC로 부호화 된 UHD 컨텐츠들의 장면전환 검출 가능성을 확인한다.

장면전환 발생시 예상 비트 조정을 통한 MPEG-2 비디오 부호화 비트율 제어 알고리즘 (A Rate Control Algorithm of MPEG-2 Video Encoding Based Target Bit Matching at Scene Changes)

  • 문호석;박상성;손명호;장동식
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권12호
    • /
    • pp.1621-1627
    • /
    • 2004
  • 장면전환에 따른 화질열화는 예상 비트량과 실제 부호화량의 차이가 많을 때 발생한다. 특히 장면전환이 P화면에서 발생된 경우에는 장면전환이 발생된 P화면뿐만 아니라, P화면을 참조하는 화면들의 화질에 심각한 열화가 발생한다. 본 논문에서는 장면전환이 발생했을 때 부적절한 비트율 제어의 원인을 토대로 장면전환 화면과 이후 화면들의 화질을 개선하는 방법을 제시하였다. 장면전환 화면에는 추가비트를 할당하는 기존 방법과 예상 비트를 인트라 화면의 부호화 수준으로 할당하는 새로운 방법을 적용하였다. 그리고 장면전환 이후 화면들에는 예상 비트 할당을 장면전환 발생이전 화면의 부호화 수준으로 할당하는 방법을 제안하여 화질을 개선시켰다. 실험 결과 제안하는 알고리즘이 기존 알고리즘보다 화질향상이 있었고, TM5와 비교해서는 0.5∼1.2dB의 PSNR 향상을 보였다.

명도 정보와 분할/합병 방법을 이용한 자연 영상에서의 텍스트 영역 추출 (Text Region Extraction of Natural Scene Images using Gray-level Information and Split/Merge Method)

  • 김지수;김수형;최영우
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권6호
    • /
    • pp.502-511
    • /
    • 2005
  • 본 논문에서는 자연 이미지에 포함되어 있는 텍스트를 추출하기 위해 명도 정보를 사용한 하이브리드 분석 방법(HAM)을 제안하였다. 즉, 제안한 방법은 명도 정보 분석(Gray-intensity Information Analysis)과 분할/합병 분석(Split/Merge Analysis)을 결합하였다. 제안한 방법의 추출 결과를 보면 단순한 영상과 복잡한 영상 모두에서 기존의 연구 결과보다 우수한 성능을 보임을 알 수 있었다.

고속도로 비탈면 경관의 법면공법에 따른 시각적 이미지와 조화성 분석 - 대전${\~}$진주간 고속도로를 대상으로 - (An Analysis on the Visual Image and Harmony of the Construction Method in the Slope Scene -A Case on the Daejeon${\~}$Jinju Highway-)

  • 이정
    • 한국조경학회지
    • /
    • 제33권1호
    • /
    • pp.33-48
    • /
    • 2005
  • The purpose of this study was to discover the landscape visual image of the slope scene and their harmony with surrounding sceneries. This research utilized the basic study tool of psycho-physics and processed the case study of ten types of slope construction scene along the highway. The analysis was performed by the data obtained from the questionnaires and the photos for the slope construction scene. The questionnaires for analysis the image of the slope construction scene and their harmony with surrounding sceneries were designed using semantic differential scale and 5 point Likert-scale. The major findings were as follows. 1. At the part of the visual preferences analysis, the slope revegetation methods showed high level of preferences generally than on the slope structure methods. While the slope revegetation methods were estimated friendly, continuity, harmonious, soft, light and wide, the slope revegetation methods were estimated unstable, female, static, simple, omnipresent, appeared as policeman of weak inclination. Also the slope structure methods were estimated stable, manly, complicated, steep and healthy but rough, unharmonious, unfamiliar and heavy. 2. Psychological factors, related to the satisfaction for the slope revegetation methods were composed of three factors, aesthetic, individuality and physical character. And the slope structure methods were composed of five factors, aesthetic, individuality, stability, physical character, and complexity. 3. At the part of harmony with surrounding landscapes, the slope revegetation methods were evaluated highly but the slope structure methods received the lowest evaluation. Also the harmony analysis with surrounding view on the slope revegetation methods showed degree of high more than average in all texture, form, color and scale but the slope structure methods showed degree of fewer than average degree in form, scale, color and texture.

동적 임계값과 컷 프레임 차를 이용한 점진적 전환 검출 기법 (Gradual scene change detection using Cut frame difference and Dynamic threshold)

  • 염성주;김우생
    • 정보처리학회논문지B
    • /
    • 제9B권3호
    • /
    • pp.293-302
    • /
    • 2002
  • 내용기반 검색을 위한 비디오 데이터 장면전환 검출에서 점진적인 전환을 검출하는 것은 갑작스런 전환을 검출하는 것에 비해 일반적으로 어려운 문제로 알려져 있다. 본 논문에서는 가변형 동적 임계값과 가장 최근에 검출된 컷 프레임과 현재 프레임간의 특징값 차이인 컷 프레임 차를 이용하여 갑작스런 전환과 점진적인 전환을 찾아내는 기법을 제안한다. 이를 위하여 본 논문에서는 점진적인 전환이 갖는 특성과 수학적 모델을 제시하고 컷 프레임 차를 이용하여 점진적인 전환을 검출할 수 있음을 보인다. 그리고 이를 바탕으로 갑작스런 전환과 점진적인 전환을 함께 검출할 수 있는 방법을 제시한다. 실세계 동영상 데이터를 대상으로 한 실험을 통해 제안하는 기법이 점진적인 전환 효과의 종류에 종속적이지 않으며 적은 연산 비용으로 쉽게 점진적인 전환 유무를 검출 할 수 있음을 보인다.

Haze Scene Detection based on Hue, Saturation, and Dark Channel Distributions

  • Lee, Y.;Yang, Seungjoon
    • International Journal of Advanced Culture Technology
    • /
    • 제8권4호
    • /
    • pp.229-234
    • /
    • 2020
  • Dehazing significantly improves image quality by restoring the loss of contrast and color saturation for images taken in the presence. However, when applied to images not taken according to the prior information, dehazing can cause unintended degradation of image quality. To avoid unintended degradations, we present a hazy scene detection algorithm using a single image based on the distributions of hue, saturation, and dark channel. Through a heuristic approach, we find out statistical characteristics of the distribution of hue, saturation, and dark channels in the hazy scene and make a detection model using them. The proposed method can precede the dehazing to prevent unintended degradation. The detection performance evaluated with a set of test images shows a high hit rate with a low false alarm ratio. Ultimately the proposed method can be used to control the effect of dehazing so that the dehazing can be applied to wide variety of images without unintended degradation of image quality.

사전 지식을 이용한 축구 경기장면 분석 및 좌표 변환 (Soccer Scene Analysis and Coordinate Transformation using a priori Knowledge)

  • 윤호섭;소정;민병우;양영규
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1999년도 추계종합학술대회 논문집
    • /
    • pp.1085-1088
    • /
    • 1999
  • This paper presents a method for soccer scene analysis and coordinate transformation from scene to ground model using a priori knowledge. First, the ground and spectator regions are separated, and various objects are extracted from the separated ground region. Second, an affine model is used for mapping the object positions on the soccer image into the position on the ground model. Problems regarding holes arising from mapping processing are solved using inverse mapping instead of a usual interpolation method. Experiments are performed on a PC using about 100 RGB images acquired at 240*640 resolution and 3∼5 frames per second.

  • PDF

CASA 기반 음성분리 성능 향상을 위한 형태 분석 기술의 응용 (Application of Shape Analysis Techniques for Improved CASA-Based Speech Separation)

  • 이윤경;권오욱
    • 대한음성학회지:말소리
    • /
    • 제65호
    • /
    • pp.153-168
    • /
    • 2008
  • We propose a new method to apply shape analysis techniques to a computational auditory scene analysis (CASA)-based speech separation system. The conventional CASA-based speech separation system extracts speech signals from a mixture of speech and noise signals. In the proposed method, we complement the missing speech signals by applying the shape analysis techniques such as labelling and distance function. In the speech separation experiment, the proposed method improves signal-to-noise ratio by 6.6 dB. When the proposed method is used as a front-end of speech recognizers, it improves recognition accuracy by 22% for the speech-shaped stationary noise condition and 7.2% for the two-talker noise condition at the target-to-masker ratio than or equal to -3 dB.

  • PDF