• 제목/요약/키워드: video information extraction

검색결과 345건 처리시간 0.027초

압축된 동영상에서 AC 예측 기법을 이용한 DC 영상 추출 기법 (A DC IMAGE EXTRACTION SCHEME USING AC PREDICTION IN COMPRESSED VIDEO SEQUENCES)

  • 김성득;나종범
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1998년도 추계종합학술대회 논문집
    • /
    • pp.867-870
    • /
    • 1998
  • Video data is usually stored in a compressed format in order to reduce the storage space. For efficient browsing, searching, and retrieval of compressed video sequences, size-reduced images (or DC images which are formed with block DC coefficients) are generally preferred to avoid unnecessary computational complexity. In this paper, we propose a DC image extraction scheme appropriate for scene analysis and efficient browsing of compressed video sequences. The proposed algorithm utilizes predicted low frequency AC coefficients to achieve better approximation and to reduce the error drift. Due to the AC prediction based on a quadratic surface model, the proposed scheme requires no additional memory compared with the previous zero-order or first-order approximation scheme. Simulation results show that the proposed scheme achieves better subjective and objective quality with minor additional operations.

  • PDF

IEEE802.11e의 MAC 파라미터를 이용한 적응적인 HD급 비디오 스트리밍 제어 (Control of HD Video Streaming Using IEEE802.11e MAC Parameters)

  • 박춘배;이용헌;박광훈;김규헌;정영식;허재두;서덕영
    • 방송공학회논문지
    • /
    • 제13권5호
    • /
    • pp.696-706
    • /
    • 2008
  • 본 논문에서는 IEEE 802.11e MAC의 모니터링과 제어가 가능하도록 제작된 QWLAN(Quality Wireless LAN) 보드를 장착한 네트워크에서 적응적인 고선명 스케일러블 비디오(Scalable Video Coding: SVC) 스트리밍 시스템의 성능을 보여준다. 제작된 MAC 보드에서 실시간으로 측정된 MAC 파라미터들을 이용하여 예측한 가용 대역폭에 적응적으로 추출할 비디오 데이터를 결정한다. 이를 위하여, 기존 SVC 비디오 패킷 추출방식보다 R-D(Rate-Distortion) 곡선 관점에서 우수한 추출방식을 제안한다. 제안하는 방법을 적용한 실험을 통하여, 무선 채널 상황에 빠르게 적응하여 비디오 스트리밍의 품질을 향상시킬 수 있음을 보여준다.

Energy Minimization Based Semantic Video Object Extraction

  • 김동현;최성환;김봉조;신형철;손광훈
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2010년도 하계학술대회
    • /
    • pp.138-141
    • /
    • 2010
  • In this paper, we propose a semi-automatic method for semantic video object extraction which extracts meaningful objects from an input sequence with one correctly segmented training image. Given one correctly segmented image acquired by the user's interaction in the first frame, the proposed method automatically segments and tracks the objects in the following frames. We formulate the semantic object extraction procedure as an energy minimization problem at the fragment level instead of pixel level. The proposed energy function consists of two terms: data term and smoothness term. The data term is computed by considering patch similarity, color, and motion information. Then, the smoothness term is introduced to enforce the spatial continuity. Finally, iterated conditional modes (ICM) optimization is used to minimize energy function in a globally optimal manner. The proposed semantic video object extraction method provides faithful results for various types of image sequences.

  • PDF

Spatial-temporal texture features for 3D human activity recognition using laser-based RGB-D videos

  • Ming, Yue;Wang, Guangchao;Hong, Xiaopeng
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권3호
    • /
    • pp.1595-1613
    • /
    • 2017
  • The IR camera and laser-based IR projector provide an effective solution for real-time collection of moving targets in RGB-D videos. Different from the traditional RGB videos, the captured depth videos are not affected by the illumination variation. In this paper, we propose a novel feature extraction framework to describe human activities based on the above optical video capturing method, namely spatial-temporal texture features for 3D human activity recognition. Spatial-temporal texture feature with depth information is insensitive to illumination and occlusions, and efficient for fine-motion description. The framework of our proposed algorithm begins with video acquisition based on laser projection, video preprocessing with visual background extraction and obtains spatial-temporal key images. Then, the texture features encoded from key images are used to generate discriminative features for human activity information. The experimental results based on the different databases and practical scenarios demonstrate the effectiveness of our proposed algorithm for the large-scale data sets.

KD-Trees구조를 이용한MPEG 비디오 검색 (MPEG Video Retrieval Using U-Trees Construction)

  • Kim, Daeil;Hong, Jong-Sun;Jang, Hye-Kyoung;Kim, Young-Ho;Kang, Dae-Seong
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅳ
    • /
    • pp.1855-1858
    • /
    • 2003
  • In this paper, we propose image retrieval method more accurate and efficient than the conventional one. First of ail, we perform a shot detection and key frame extraction from the DC image constructed by DCT DC coefficients in the compressed video stream that is video compression standard such as MPEG[I][2]. We get principal axis applying PCA(Principal Component Analysis) to key frames for obtaining indexing information, and divide a domain. Video retrieval uses indexing information of high dimension. We apply KD-Trees(K Dimensional-Trees)[3] which shows efficient retrieval in data set of high dimension to video retrieval method. The proposed method can represent property of images more efficiently and property of domains more accurately using KD-Trees.

  • PDF

Segmentation and Appearance Features Index for Digital Video Data

  • Yun, Hong-Won
    • Journal of information and communication convergence engineering
    • /
    • 제8권6호
    • /
    • pp.697-701
    • /
    • 2010
  • The numbers of digital video cameras are fast increased. Accordingly, digital video data management is becoming more important. Efficient storing method and fast browsing method still remains to be one of significant issue. In this paper, an optimized data storing process without losing information and an organized appearance features indexing method are proposed. Also, the data removing policy could be used to reduce large amount of space and it facilitates fast sequential search. The appearance features index constructs key information of moving objects to answer queries about what people are doing, particularly when, where and who they move. The evaluation results showed better performance in the transfer time and the saving in storage space.

내용 기반 동영상 검색을 위한 컬러 및 모션 특징 추출 알고리즘 (Color and Motion Feature Extraction Algorithm for Content-Based Video Retrieval)

  • 김영재;이철희;권용무
    • 방송공학회논문지
    • /
    • 제4권2호
    • /
    • pp.187-196
    • /
    • 1999
  • 본 논문에서는 내용 기반 동영상 검색을 위하여 컬러 정보 및 모션 정보를 사용하는 효율적인 자동 특징 추출 알고리즘을 제안하고, 이를 동영상 검색 시스템에 적용한다. 컬러 정보의 경우 기존의 key-frame단위의 컬러 특징 추출의 한계를 극복하고, 동영상의 컬러 히스토그램 정보와 컬러의 공간분포 정보를 반영할 수 있는 컬러 특징 추출 알고리즘을 제안한다. 또한 MPEG-1 동영상 내의 모션 벡터와 컬러 정보를 조합한 컬러-모션 특징을 추출하여, 기존의 위치 기반 특징 추출 알고리즘의 한계를 극복하였다. 최종적으로 추출된 특징을 이용한 검색 시스템을 구현하여, 제안된 알고리즘의 성능을 평가하였다.

  • PDF

H.264 SVC에서 비트 스트림 추출을 위한 공간과 시간 해상도 선택 기법 (Spatial and Temporal Resolution Selection for Bit Stream Extraction in H.264 Scalable Video Coding)

  • 김남윤;황호영
    • 한국멀티미디어학회논문지
    • /
    • 제13권1호
    • /
    • pp.102-110
    • /
    • 2010
  • H.264 SVC(Scalable Video Coding)는 디스크 저장 공간 효율성과 높은 확장성을 제공할 수 있는 장점이 있다. 그러나 스트리밍 서버나 단말기는 비트 스트림을 효율적으로 추출해야 한다. 본 논문에서는 네트워크 가용 대역폭을 넘지 않으면서 최대의 PSNR을 얻기 위한 SVC 비트 스트림 추출 기법을 제공한다. 이를 위하여 오프라인시에 최대의 PSNR을 얻기 위한 추출 지점에 대한 정보를 획득한 후, 온라인시에 네트워크 가용 대역폭을 만족하는 비트 스트림의 공간/시간 해상도를 결정한다. 이러한 공간/시간 해상도 정보는 네트워크 가용 대역폭과 함께 비트 스트림 추출기의 입력 파라미터로 사용된다. JSVM 참조 소프트웨어를 활용한 실험을 통하여 본 논문에서 제시한 추출 기법이 높은 PSNR을 제공함을 증명하였다.

동적 분할 기법을 이용한 비디오 데이터의 대표키 프레임 추출 (A Dynamic Segmentation Method for Representative Key-frame Extraction from Video data)

  • 이순희;김영희;유근호
    • 전자공학회논문지CI
    • /
    • 제38권1호
    • /
    • pp.46-57
    • /
    • 2001
  • 시간적 특성을 가진 비디오 자료와 같은 멀티미디어의 자료에 접근하기 위해서는 내용 기반 이미지 검색 기술이 필요하다. 더욱이, 내용 기반 이미지 검색의 기본적인 기술 중의 하나가 대표키 프레임들의 추출이다. 제안된 방법을 구현했을 뿐만 아니라, 대표키 프레임들이 비디오 데이터의 특성에 대한 데이터 분석을 사용하여 추출될 수 있음을 보였다. 또한, 제안된 방법이 정확함 뿐만 아니라 효과적이라는 것을 증명하였다. 제안한 방법은 비디오 데이터 베이스를 위해 색인을 구축하는데 매우 유용하다. 그러므로 제안한 방법이 실세계에서 비디오 데이터 베이스를 구축하는데 사용되기를 기대한다.

  • PDF

Semi-fragile Watermarking Scheme for H.264/AVC Video Content Authentication Based on Manifold Feature

  • Ling, Chen;Ur-Rehman, Obaid;Zhang, Wenjun
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제8권12호
    • /
    • pp.4568-4587
    • /
    • 2014
  • Authentication of videos and images based on the content is becoming an important problem in information security. Unfortunately, previous studies lack the consideration of Kerckhoffs's principle in order to achieve this (i.e., a cryptosystem should be secure even if everything about the system, except the key, is public knowledge). In this paper, a solution to the problem of finding a relationship between a frame's index and its content is proposed based on the creative utilization of a robust manifold feature. The proposed solution is based on a novel semi-fragile watermarking scheme for H.264/AVC video content authentication. At first, the input I-frame is partitioned for feature extraction and watermark embedding. This is followed by the temporal feature extraction using the Isometric Mapping algorithm. The frame index is included in the feature to produce the temporal watermark. In order to improve security, the spatial watermark will be encrypted together with the temporal watermark. Finally, the resultant watermark is embedded into the Discrete Cosine Transform coefficients in the diagonal positions. At the receiver side, after watermark extraction and decryption, temporal tampering is detected through a mismatch between the frame index extracted from the temporal watermark and the observed frame index. Next, the feature is regenerate through temporal feature regeneration, and compared with the extracted feature. It is judged through the comparison whether the extracted temporal watermark is similar to that of the original watermarked video. Additionally, for spatial authentication, the tampered areas are located via the comparison between extracted and regenerated spatial features. Experimental results show that the proposed method is sensitive to intentional malicious attacks and modifications, whereas it is robust to legitimate manipulations, such as certain level of lossy compression, channel noise, Gaussian filtering and brightness adjustment. Through a comparison between the extracted frame index and the current frame index, the temporal tempering is identified. With the proposed scheme, a solution to the Kerckhoffs's principle problem is specified.