• Title/Summary/Keyword: Video Parsing

검색결과 34건 처리시간 0.026초

샷 경계 검출을 이용한 영상 클립 생성 (Generation of Video Clips Utilizing Shot Boundary Detection)

  • 김혁만;조성길
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제7권6호
    • /
    • pp.582-592
    • /
    • 2001
  • 대용량 영상을 다루는 디지털 비디오 라이브러리나 웹 방송에서는 영상 색인이 매우 중요한 역할을 하며, 이는 영상을 내용 단위로 분할하는 알고리즘에 기반한다. 본 논문에서 구현된 V2Web Studio는 영상 색인을 지원하는 시스템으로서, 샷 경계 검출 알고리즘을 이용한 영상 클립 생성 시스템이다. V2Web Studio는 영상 클립 생성 과정을 1) 영상 신호를 분석하여 샷 경계를 자동 검출하는 단계, 2) 검출된 결과에 포함될 수 있는 오류를 수작업으로 제거하는 단계, 3) 물리적인 샷 경계를 논리적인 계층구조로 모델링하는 단계, 4) 계층구조로 모델링된 각 모델링 인스턴스를 다양한 표준 압축 포맷으로 생성하는 단계로 구분하고, 각 단계에 해당하는 작업은 샷 검출기, 샷 검증기, 영상 모델기, 클립 생성기라는 독립적인 소프트웨어 도구로 구현하였다.

  • PDF

움직임 벡터의 1차원 히스토그램을 이용한 비디오 화질 평가 척도 (Video Quality Metric Using One-Dimensional Histograms of Motion Vectors)

  • 한호성;김동오;박래홍;심동규
    • 대한전자공학회논문지SP
    • /
    • 제45권2호
    • /
    • pp.21-28
    • /
    • 2008
  • 본 논문에서는 비디오 화질 평가를 위해 움직임 벡터의 1차원 히스토그램을 비디오의 특징으로 이용하는 새로운 reduced-reference (RR) 평가 방법을 제안하였다. 제안한 화질 평가 방법은 수신단에서 열화 비디오를 재구성하는 대신 비디오 스트림 (video stream)의 파싱 (parsing) 과정에서 움직임 벡터를 직접 얻을 수 있기 때문에 수행시간 면에서 기존의 방법들에 비해 효율적이다. 또한 송신단에서는 입력 비디오 영상 전체에 대해 누적된 움직임 벡터의 1차원 히스토그램을 보내기 때문에 데이터량 측면에서도 효율적이다. 여기서, 기존의 방법들이 영상 한 장씩에 대해서 평가를 했던 것과 달리 제안한 방법에서는 전체 영상에 대해 누적된 움직임 벡터의 1차원 히스토그램을 사용하였다. 히스토그램의 유사도를 측정하기 위해 히스토그램 인터섹션 (histogram intersection)과 히스토그램 파이 (histogram difference)을 사용하였다. 여러 가지 비트율 (bit rate), 영상크기, 프레임율 (frame rate)로 코딩된 비디오 클립 52개에 대해 제안한 방법과 기존의 방법들을 비교하였고, 제안한 방법의 효율성을 기존 방법들과의 비교 실험을 통해 보였으며, 실험 결과를 통해, 제안한 방법이 기존의 방법들보다 mean opinion score (MOS)와 유사함을 보였다.

A Practical RTP Packetization Scheme for SVC Video Transport over IP Networks

  • Seo, Kwang-Deok;Kim, Jin-Soo;Jung, Soon-Heung;Yoo, Jeong-Ju
    • ETRI Journal
    • /
    • 제32권2호
    • /
    • pp.281-291
    • /
    • 2010
  • Scalable video coding (SVC) has been standardized as an extension of the H.264/AVC standard. This paper proposes a practical real-time transport protocol (RTP) packetization scheme to transport SVC video over IP networks. In combined scalability of SVC, a coded picture of a base or scalable enhancement layer is produced as one or more video layers consisting of network abstraction layer (NAL) units. The SVC NAL unit header contains a (DID, TID, QID) field to identify the association of each SVC NAL unit with its scalable enhancement layer without parsing the payload part of the SVC NAL unit. In this paper, we utilize the (DID, TID, QID) information to derive hierarchical spatio-temporal relationship of the SVC NAL units. Based on the derivation using the (DID, TID, QID) field, we propose a practical RTP packetization scheme for generating single RTP sessions in unicast and multicast transport of SVC video. The experimental results indicate that the proposed packetization scheme can be efficiently applied to transport SVC video over IP networks with little induced delay, jitter, and computational load.

Implementation of AR Remote Rendering Techniques for Real-time Volumetric 3D Video

  • Lee, Daehyeon;Lee, Munyong;Lee, Sang-ha;Lee, Jaehyun;Kwon, Soonchul
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제12권2호
    • /
    • pp.90-97
    • /
    • 2020
  • Recently, with the growth of mixed reality industrial infrastructure, relevant convergence research has been proposed. For real-time mixed reality services such as remote video conferencing, the research on real-time acquisition-process-transfer methods is required. This paper aims to implement an AR remote rendering method of volumetric 3D video data. We have proposed and implemented two modules; one, the parsing module of the volumetric 3D video to a game engine, and two, the server rendering module. The result of the experiment showed that the volumetric 3D video sequence data of about 15 MB was compressed by 6-7%. The remote module was streamed at 27 fps at a 1200 by 1200 resolution. The results of this paper are expected to be applied to an AR cloud service.

스포츠 장르 분석을 위한 스포츠 뉴스 비디오의 의미적 장면 분류 (Semantic Scenes Classification of Sports News Video for Sports Genre Analysis)

  • 송미영
    • 한국멀티미디어학회논문지
    • /
    • 제10권5호
    • /
    • pp.559-568
    • /
    • 2007
  • 앵커 장면 검출은 내용기반 뉴스 비디오 색인과 검색 시스템에서 비디오 장면의 의미적 파싱과 색인을 추출하는데 중요한 역할을 한다. 이 논문은 스포츠 뉴스의 단위 구조화를 위해서 뉴스 동영상에 존재하는 앵커 구간을 구분해내는 효율적인 알고리즘을 제안한다. 앵커 장면을 검출하기 위해서, 우선 MPEG4 압축 비디오에서 DCT 계수치와 모션 방향성 정보를 이용하여 앵커 후보 장면을 결정한다. 그리고 검출된 후보앵커 장면으로부터 영상처리 방법을 활용하여 뉴스 비디오를 앵커 장면과 비앵커(스포츠) 장면으로 분류한다. 제안된 방법은 앵커 장면 검출 실험에서 평균적으로 98%의 정확도와 재현율을 얻었다.

  • PDF

Cross Layer 기반의 무선랜 채널 모니터링을 적용한 네트워크 적응형 HD 비디오 스트리밍 (Network-Adaptive HD Video Streaming with Cross-Layered WLAM Channel Monitoring)

  • 박상훈;윤하영;김종원;조창식
    • 한국통신학회논문지
    • /
    • 제31권4A호
    • /
    • pp.421-430
    • /
    • 2006
  • 본 논문에서는 IEEE 802.11a 무선랜(WLAN) 환경에서 Cross Layer 기반의 채널 모니터링(Cross-Layered Monitoring: CLM)을 이용한 네트워크 적응형 고선명(high definition: HD) MPEG-2 TS 비디오 스트리밍 시스템을 제안한다. 무선 채널 모니터링을 위해 AE(access point)는 MAC(medium access control) 계층의 전송 상태를 주기적으로 측정하고 응용 계층의 스트리밍 서버로 전달한다. 이것은 비디오 스트리밍 응용 프로그램이 피드백 기반의 종단간 모니터링(End-to-End Monitoring: E2EM) 기법을 적용할 때보다 가변적인 무선 채널 상태에 좀 더 빠르고 효과적으로 적응할 수 있게 한다. 스트리밍 서버는 네트워크에 적응적인 전송을 위해 측정된 무선 채널 상태에 따라 우선순위 기반의 프레임 폐기(priority-based frame dropping)를 수행한다. 이를 위해 스트리밍 서버는 실시간 파싱(real-time parsing)과 프레임 기반의 패킷 우선순위화(frame-based prioritized packetization) 기능을 제공한다. 성능 평가를 위해 IEEE 802.11a 무선랜 환경에서의 다양한 스트리밍 실험을 수행한다. 실험 결과는 제안 시스템이 시간에 따라 가변하는 무선 채널 상태에서 기존 기법에 비해 종단간 비디오 스트리밍의 품질을 향상시킬 수 있음을 보여준다.

이질 분산환경에서 MPEG 비디오의 병렬 파싱 (Parallel Parsing of MPEG Video in Heterogeneous Distributed Environment)

  • 남윤영;황인준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.91-93
    • /
    • 2003
  • 디지털 비디오의 사용 증가로 인해 비디오의 인덱싱, 브라우징, 검색과 같은 서비스가 필요하게 되었다. 이와 같은 서비스의 효율적인 구축을 위한 단계 중, 비디오 파싱은 멀티미디어 애플리케이션에서 중요한 부분을 차지하고 있다. 일반적으로. 비디오 파싱은 복잡한 연산을 하기 때문에. 전통적인 단일 컴퓨터에 의한 파싱 방법은 많은 시간이 소요된다. 이러한 문제는 병렬 및 분산 컴퓨팅을 사용하여 파싱에 필요한 시간을 줄임으로써 해결할 수 있다. 본 논문에서는 이질 분산 환경의 멀티 컴퓨터를 사용한 세 가지 MPEG 비디오의 병렬 스케쥴링 알고리즘을 제안하였다. 성능 평가에서는 제안한 스케쥴링 알고리즘의 speedup과 load balancing에 관하여 비교 실험하였으며, 제안한 스케쥴링 알고리즘을 통해 매우 좋은 성능 향상을 얻을 수 있었다.

  • PDF

스토리지 부하 최적화를 위한 영상분석정보 관리시스템 설계 (Design of Video Analytics Information Management System for Optimizing the Storage Load.)

  • 심재성;박석천
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 춘계학술발표대회
    • /
    • pp.941-942
    • /
    • 2014
  • 본 논문에서는 기존 지능형 영상감시 시스템에서의 영상정보 분석 시 발생하는 XML 데이터가 불필요하게 많이 생성(XML data 30ea/1s)되어 스토리지의 저장 및 관리 부하를 개선하기 위해 분석되어진 XML 데이터를 Parsing & Filtering하여 저장함으로써 생성되는 데이터를 간소화함으로써, 효율적인 관리가 가능한 스토리지 부하 최적화를 위한 영상분석정보 관리시스템을 설계하였다.

동영상 이미지의 특징정보 분석 시스템 설계 및 구현 (Design and Implementation of the Feature Information Parsing System for Video Image)

  • 최내원;지정규
    • 한국컴퓨터정보학회논문지
    • /
    • 제7권3호
    • /
    • pp.1-8
    • /
    • 2002
  • 컴퓨터 응용기술의 급속한 발전으로 인해 동영상 정보는 인터넷 및 사회전반의 다양한 분야에서 활용되고 그 수가 기하급수적으로 증가되고 있다. 동영상 정보 분석 시스템은 기본적으로 텍스트를 기반으로 하기 때문에, 동영상 정보가 가지는 애매성을 표현하기 곤란하며, 주석 작성에 따르는 과다한 작업부담 및 객관성 결여 등의 문제점을 가지고 있다. 본 논문에서는 대용량의 동영상 정보를 효율적으로 분석하기 위해 동영상 이미지의 분할영역에서 색상정보와 모양정보를 이용한 방법을 제안하고자 한다. 색상정보를 추출하기 위해서는 기존의 RGB 방식에서 HSI방식으로 색상변환 하여 대표색상과 매칭 되는 특징 정보를 사용한다. 그리고 모양정보는 물체의 윤곽선에 해당하는 화소들만을 대상으로 연산을 수행하는 향상된 불변 모멘트(IMI)를 이용한다.

  • PDF

특이값 분해와 점증적 클러스터링을 이용한 뉴스 비디오 샷 경계 탐지 (News Video Shot Boundary Detection using Singular Value Decomposition and Incremental Clustering)

  • 이한성;임영희;박대희;이성환
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권2호
    • /
    • pp.169-177
    • /
    • 2009
  • 본 논문에서는 뉴스 기사 분할 관점에서, 뉴스 비디오 샷 경계 탐지 알고리즘의 특성을 고려한 다음과 같은 설계 기준을 제시하고, 이를 모두 만족하는 새로운 샷 경계 탐지 알고리즘을 제안하고자 한다. 1) 뉴스 비디오 샷 경계 탐지의 재현율을 높임으로써, 앵커 샷 탐지 단계에서 입력으로 사용될 데이타의 오류를 최소화한다; 2) 급격한 장면 변환과 점증적 장면 변환을 하나의 알고리즘으로 탐지함으로써 한번의 데이타 탐색으로 샷 분할을 수행한다; 3) 분할된 샷들을 정적 샷과 동적 샷으로 분류함으로써 앵커샷 탐지 단계의 탐색 공간을 축소한다. 제안된 뉴스 비디오 샷 경계 탐지 알고리즘은 특이간 분해를 기반으로 점증적 클러스터링 알고리즘과 머서 커널을 결합한 구조로서, 위에서 제시한 기준을 모두 만족하도록 설계되었다. 제안된 방법론은 특이간 분해를 통해 특징 벡터의 차원축소 뿐만 아니라, 뉴스 비디오를 구성하는 연속적인 프레임에서의 잡음과 아주 작은 변화를 제거함으로써 분류 성능을 높일 수 있다. 또한 머서 커널의 도입은 쉽게 분류되지 않는 데이타를 고차원 공간으로 매핑함으로써 구분하기 어려운 샷 경계의 탐지 가능성을 높여준다. 실험을 통하여 제안된 방법론이 매우 높은 재현율을 보이며, 앵커 샷 탐지를 위한 탐색 공간 축소를 효과적으로 수행함을 보인다.