• 제목/요약/키워드: Shot Detection

검색결과 212건 처리시간 0.024초

감정에 관련된 비디오 셧의 특징 표현 및 검출 (Representation and Detection of Video Shot s Features for Emotional Events)

  • 강행봉;박현재
    • 정보처리학회논문지B
    • /
    • 제11B권1호
    • /
    • pp.53-62
    • /
    • 2004
  • 인간과 컴퓨터간의 상호작용에 있어서 감정처리는 매우 중요한 부결이다. 특히, 비디오 정보처리에 있어서 사용자의 감정을 처리할 수 있다면 비디오 검색이나 요약본 추출 등 다양한 응용분야에 활용이 가능하다. 비디오 데이터로부터 이러한 감정 처리를 하기 위해서는 감정에 관련된 특징들을 표현하고, 검출하는 것이 필요하다. 쉽게 추출이 가능한 색상이나 모션 등의 저급 특징들로부터 고급 개념인 감정을 검출하는 것은 매우 어려운 일이지만, 감정에 관련된 여러 장면으로부터 LDA(Linear Discriminant Analysis)와 같은 통계적인 분석을 통해 감정에 관련된 특징들을 검출하는 것은 가능하다. 본 논문에서는 색상, 모션 및 셧 길이 정보로부터 감정과의 관련된 특징을 표현하고 검출하는 방법을 제안한다. 제안된 특징을 사용하여 감정 검출에 관련된 실험을 한 결과 바람직한 결과를 얻었다.

MPEG 영상에서의 점진적 장면전환에 대한 효과적인 검출 기법 (Effective Detection Techniques for Gradual Scene Changes on MPEG Video)

  • 윤석중;지은석;김영로;고성제
    • 한국통신학회논문지
    • /
    • 제24권8B호
    • /
    • pp.1577-1585
    • /
    • 1999
  • 점진적인 장면전환 종류로는 비디오 편집 과정에서 삽입되는 디졸브(dissolve), 페이드인/아웃(fade-in/out), 와이프(wipe) 등과, 카메라 움직임에 의한 팬(pan), 줌(zoom), 스크롤(scroll) 등이 있다. 본 논문에서는 점진적 장면전환 종류 중 편집과정에서 사용되는 디졸브, 그리고 카메라 움직임에 의한 팬과 줌의 검출을 위한 효과적인 방법을 제안하였다. 디졸브 구간의 검출을 위하여 각 프레임에 대한 공간적 영역 분할을 하고, 영역별 화소값의 평균치를 제곱하여 전환 프레임의 특징 요소로 사용하였다. 팬과 줌의 검출을 위하여 배경화면을 대표할 수 있는 4개의 국부 영역으로 선정하여 각 국부 영역의 움직임 벡터로부터 대표 움직임 벡터를 결정하고, 이들의 방향 성분을 사용하였다. 제안된 방식들은 검출의 정확도를 향상시키기 위해 모든 프레임(I, P, B)을 사용하였으며 아울러 검출 속도를 높이기 위해 완전 복원된 영상을 사용하는 대신 DCT DC 계수와 움직임 벡터를 이용한 축소영상을 사용하였다. 실제 MPEG 비디오에 적용하여 기존의 방법들에 비해 우수한 검출 결과를 확인하였다.

  • PDF

화살의 이동궤적을 위한 하드웨어 구성 및 패러독스 측정 (Hardware Configuration and Paradox Measurement for the Determination of Arrow Trajectory)

  • 정영상;유정원;이한수;김성신
    • 한국생산제조학회지
    • /
    • 제21권3호
    • /
    • pp.459-464
    • /
    • 2012
  • The point of impact, the shot group, and the flight traces depend on the combination of unique features which decide moving traces of the arrow (paradox of the archer, length of the arrow shaft, weight, angle of the feather, and spline of the arrow shaft). The more dense the impact points in the shot group and the earlier elimination of paradox of the archer, the higher assessment is given for the product. However, there is no way to objectively assess the efficiency and quality of the arrow, and there is no numeric data to be used as the basis for comparison with other products. Although capturing the images of flying arrow using a high-speed motion picture camera is possible, we are limited to observation from specific view angle only. Hence, the criteria for efficiency and quality assessment are mostly based on subjective opinions of experts or hunters, or review on consumers' remarks. In this paper, we propose a hardware composition that are based on three detection frames consisting of line lasers and photo diode arrays without the high-speed motion picture camera. Predicated on measured coordinates data, a nobel method for the archer's paradox measurement, a key parameter that determine the arrow's trajectory, and corresponding numerical analysis model is proposed.

Customizing Ground Color to Deliver Better Viewing Experience of Soccer Video

  • Ahn, Il-Koo;Kim, Young-Woo;Kim, Chang-Ick
    • ETRI Journal
    • /
    • 제30권1호
    • /
    • pp.101-112
    • /
    • 2008
  • In this paper, we present a method to customize the ground color in outdoor sports video to provide TV viewers with a better viewing experience or subjective satisfaction. This issue, related to content personalization, is becoming critical with the advent of mobile TV and interactive TV. In outdoor sports video, such as soccer video, it is sometimes observed that the ground color is not satisfactory to viewers. In this work, the proposed algorithm is focused on customizing the ground color to deliver a better viewing experience for viewers. The algorithm comprises three modules: ground detection, shot classification, and ground color customization. We customize the ground color by considering the difference between ground colors from both input video and the target ground patch. Experimental results show that the proposed scheme offers useful tools to provide a more comfortable viewing experience and that it is amenable to real-time performance, even in a software-based implementation.

  • PDF

웨이블렛 변환을 적용한 장면전환의 cut과 fade검출 (Cut and Fade Detection of Scene Change Using Wavelet transform)

  • 이명은;박종현;박순영;방만원;조완현
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.207-210
    • /
    • 2000
  • 본 논문에서는 신호를 해석하는데 유용한 웨이블렛 변환을 적용하여 장면전환 요소 중 cut과 fade를 검출하는 알고리즘을 제안한다. 제안된 방법은 웨이블렛 저대역 부밴드로부터 각 프레임의 히스토그램을 구한 후 이전 프레임과 현재 프레임사이의 히스토그램 차를 구하여 이 값이 임계값 이상이면 급격한 장면전환(abrut shot transition)인 cut으로 분류한다. 다음으로 페이드인(fade in)이나 페이드 아웃(fade out)등 컷의 지점이 불분명한 점진적 장면전환(gradual scene transition)을 검출하기 위하여 고대역 부밴드에서 추출한 에지성분에 모멘트를 계산하여 인접한 프레임 사이의 변동율을 분석하여 값이 증가하면 페이드 인을 검출하고 반면에 감소하면 페이드 아웃을 검출하게된다. 성능평가를 위하여 실제의 비디오 분할에 적용한 결과 웨이블렛 적용 방법론이 매우 높은 Precision을 갖는다는 것을 알 수 있으며 윤곽정보에 모멘트 정보를 더함으로써 기존의 방법보다 정확한 페이드(fade) 구간을 검출할 수 있었다.

  • PDF

MPEG-7 기술자를 이용한 디지털 비디오 카메라 기반 실시간 샷 경계 검출 (Real-time Shot Boundary Detection Based On Digital Video Camera Using The MPEG-7 Descriptor)

  • 심상흔;양승지;윤정현;노용만
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2001년도 정기총회 및 학술대회
    • /
    • pp.193-198
    • /
    • 2001
  • 최근 대용량 디지털 비디오의 효율적인 이용 및 관리를 위한 데이터 베이스 구축이 절실히 요구되고 있다. 이를 위해서 , 디지털 비디오의 내용 기반 요약이 필요하며, 선행 기술로서 비디오의 샷 경계 검출이 이루어져야 한다. 기존의 샷 경계 검출 방법들은 압축 파일로 저장된 비디오 데이터에 대해 샷 경계 검출을 수행한다. 이러한 기존 방법과 달리, 본 논문에서는 디지털 비디오 카메라로부터 비디오 데이터를 얻어 저장하면서, 실시간으로 샷 경계 검출을 수행하고자 한다. 그리고, 실시간 샷 경계 검출에 있어서 본 논문은 MPEG-7의 Homogeneous Texture와 Edge Histogram 기술자를 적용하여 추출된 각 비디오 프레임의 질감과 에지 정보를 이용한다 이 방법은 비디오의 샷 경계 검출에 있어서 시간적으로 기존 방법들보다 효율적이고, 내용 기반 검색에 유용하다.

  • PDF

MPEG 비디오 스트림에서 줄거리 특성에 기초한 장면 경계 검출 방법 (A Scene Boundary Detection Scheme based on Story Line for MPEG Video Streams)

  • 이숙경;낭종호
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제27권1호
    • /
    • pp.1-12
    • /
    • 2000
  • 비디오 데이타 스트림을 tit (shot) 혹은 장면 (scene) 단위로 나누는 자동 비디오 인덱싱 기법은 VoD나 디지털 비디오 라이브러리와 같이 비디오 데이타를 이용하는 응용 분야를 개발하기 위하여 꼭 필요한 기능이다. 본 논문에서는 줄거리(stary line)를 갖는 영화나 드라마와 같은 비디오 데이타에서의 장면 단위 인덱싱을 위해 장면의 경계를 자동으로 검출하는 방법을 제안한다. 일반적으로 영화에서 시간적으로 인접한 두 샷이 유사할 때 샷의 중간 부분은 움직임에 따라 변하는데 똑같은 움직임이 반복되지 않는다는 특성을 가진다. 제안한 검출 방법에서는 이러한 특성을 이용하여 각 샷의 처음과 마지막 프레임을 대표 프레임으로 선택하고 이들의 칼라 히스토그램으로 샷을 추상화한다. 이렇게 추상화한 샷에 대하여 영화에서의 장면은 일반적으로 비슷한 내용의 샷이 반복된다는 특성을 이용하여 장면의 경계를 검출하였는데, 하나의 장면에 해당하는 샷들을 묶어줄 때 시간적으로 인접한 이전 샷들과의 유사도만 측정하는 간단한 방법을 사용하였다. 본 논문에서 제안한 영화나 드라마에 대한 장면 경계 검출 방법은 MPEG 형식의 비디오 데이타를 이용한 디지털 라이브러리 등의 구축에 유용하게 사용될 수 있을 것이다.

  • PDF

휴대형 DMB 단말 환경에서의 시나리오 기반 데이터 방송 부가콘텐츠 제작 모델 연구 (A Study about Data Broadcasting Sub-Content Architecture Model Using Scenario in Mobile DMB Device Environment)

  • 오정민;김경록;문남미
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (C)
    • /
    • pp.139-143
    • /
    • 2007
  • 양방향 데이터 방송 기술이 급속도로 발전하고 전세계적으로 표준화가 진행되고 있는 가운데 데이터 방송 콘텐츠에 대한 수요는 제자리를 맴돌고 있다. 이는 특화된 데이터 방송 콘텐츠에 대한 필요성을 의미하는 것으로 본 논문에서는 시나리오를 기반으로 기존 방송 콘텐츠를 활용하여 데이터 방송 부가 콘텐츠를 제작하는 모델안을 제안한다. 연구 모델은 1)시나리오 기반으로 기존 데이터 방송 콘텐츠 분석, 2)분석된 객체 아이템 메타데이터 스키마 설계 3)부가 콘텐츠 화면 구현의 단계로 구성한다. DMB 단말환경에서 가볍게 움직이는 콘텐츠 제작을 위해 메타데이터를 25개로 제한하고 이 안에서 Content Description, Shot Detection, Object Tracking로 메타데이터를 구분하여 스키마 다이어그램을 설계한다. 본 논문은 기존의 익숙한 콘텐츠를 재가공하여 제공함으로 DMB 수요 활성화 측면과 CP의 제작 비용감소 측면에서 긍정적인 영향을 끼칠 것으로 예상된다.

  • PDF

Improving visual relationship detection using linguistic and spatial cues

  • Jung, Jaewon;Park, Jongyoul
    • ETRI Journal
    • /
    • 제42권3호
    • /
    • pp.399-410
    • /
    • 2020
  • Detecting visual relationships in an image is important in an image understanding task. It enables higher image understanding tasks, that is, predicting the next scene and understanding what occurs in an image. A visual relationship comprises of a subject, a predicate, and an object, and is related to visual, language, and spatial cues. The predicate explains the relationship between the subject and object and can be categorized into different categories such as prepositions and verbs. A large visual gap exists although the visual relationship is included in the same predicate. This study improves upon a previous study (that uses language cues using two losses) and a spatial cue (that only includes individual information) by adding relative information on the subject and object of the extant study. The architectural limitation is demonstrated and is overcome to detect all zero-shot visual relationships. A new problem is discovered, and an explanation of how it decreases performance is provided. The experiment is conducted on the VRD and VG datasets and a significant improvement over previous results is obtained.

KD-Trees구조를 이용한MPEG 비디오 검색 (MPEG Video Retrieval Using U-Trees Construction)

  • Kim, Daeil;Hong, Jong-Sun;Jang, Hye-Kyoung;Kim, Young-Ho;Kang, Dae-Seong
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅳ
    • /
    • pp.1855-1858
    • /
    • 2003
  • In this paper, we propose image retrieval method more accurate and efficient than the conventional one. First of ail, we perform a shot detection and key frame extraction from the DC image constructed by DCT DC coefficients in the compressed video stream that is video compression standard such as MPEG[I][2]. We get principal axis applying PCA(Principal Component Analysis) to key frames for obtaining indexing information, and divide a domain. Video retrieval uses indexing information of high dimension. We apply KD-Trees(K Dimensional-Trees)[3] which shows efficient retrieval in data set of high dimension to video retrieval method. The proposed method can represent property of images more efficiently and property of domains more accurately using KD-Trees.

  • PDF