• 제목/요약/키워드: Video representation

검색결과 194건 처리시간 0.024초

계층적 깊이 영상 표현에 의한 컬러와 깊이 정보를 포함하는 다시점 영상에 대한 효율적인 압축기술 (Efficient Compression Technique of Multi-view Image with Color and Depth Information by Layered Depth Image Representation)

  • 임중희;신종홍;지인호
    • 한국통신학회논문지
    • /
    • 제34권2C호
    • /
    • pp.186-193
    • /
    • 2009
  • 다시점 비디오는 데이터 양이 매우 많아서 이를 효과적으로 저장하고 전송하기 위해서는 새로운 압축 부호화의 기술 개발이 필수적이다. 계층적 깊이 영상은 다시점 비디오를 효과적으로 부호화할 수 있는 방법으로 여러 시점의 컬러와 깊이 영상을 합성하여 하나의 데이터 구조로 만든 것이다. 본 논문에서는 실제 거리비교, 오버랩 문제해결, YCrCb 컬러변환을 이용한 효율적인 계층적 깊이 영상 표현을 통해서 다시점 영상에 대한 압축 효율을 향상시키는 방법을 제안하였다. 실험 결과를 통해서 압축성능 향상과 우수한 복원 성능을 얻을 수 있었다.

Silhouette-Edge-Based Descriptor for Human Action Representation and Recognition

  • Odoyo, Wilfred O.;Choi, Jae-Ho;Moon, In-Kyu;Cho, Beom-Joon
    • Journal of information and communication convergence engineering
    • /
    • 제11권2호
    • /
    • pp.124-131
    • /
    • 2013
  • Extraction and representation of postures and/or gestures from human activities in videos have been a focus of research in this area of action recognition. With various applications cropping up from different fields, this paper seeks to improve the performance of these action recognition machines by proposing a shape-based silhouette-edge descriptor for the human body. Information entropy, a method to measure the randomness of a sequence of symbols, is used to aid the selection of vital key postures from video frames. Morphological operations are applied to extract and stack edges to uniquely represent different actions shape-wise. To classify an action from a new input video, a Hausdorff distance measure is applied between the gallery representations and the query images formed from the proposed procedure. The method is tested on known public databases for its validation. An effective method of human action annotation and description has been effectively achieved.

Real-Time Apartment Building Detection and Tracking with AdaBoost Procedure and Motion-Adjusted Tracker

  • Hu, Yi;Jang, Dae-Sik;Park, Jeong-Ho;Cho, Seong-Ik;Lee, Chang-Woo
    • ETRI Journal
    • /
    • 제30권2호
    • /
    • pp.338-340
    • /
    • 2008
  • In this letter, we propose a novel approach to detecting and tracking apartment buildings for the development of a video-based navigation system that provides augmented reality representation of guidance information on live video sequences. For this, we propose a building detector and tracker. The detector is based on the AdaBoost classifier followed by hierarchical clustering. The classifier uses modified Haar-like features as the primitives. The tracker is a motion-adjusted tracker based on pyramid implementation of the Lukas-Kanade tracker, which periodically confirms and consistently adjusts the tracking region. Experiments show that the proposed approach yields robust and reliable results and is far superior to conventional approaches.

  • PDF

Multiple Description Coding Using Directional Discrete Cosine Transform

  • Lama, Ramesh Kumar;Kwon, Goo-Rak
    • Journal of information and communication convergence engineering
    • /
    • 제11권4호
    • /
    • pp.293-297
    • /
    • 2013
  • Delivery of high quality video over a wide area network with large number of users poses great challenges for the video communication system. To ensure video quality, multiple descriptions have recently attracted various attention as a way of encoding and visual information delivery over wireless network. We propose a new efficient multiple description coding (MDC) technique. Quincunx lattice sub-sampling is used for generating multiple descriptions of an image. In this paper, we propose the application of a directional discrete cosine transform (DCT) to a sub-sampled quincunx lattice to create an MDC representation. On the decoder side, the image is decoded from the received side information. If all the descriptions arrive successfully, the image is reconstructed by combining the descriptions. However, if only one side description is received, decoding is executed using an interpolation process. The experimental results show that such the directional DCT can achieve a better coding gain as well as energy packing efficiency than the conventional DCT with re-alignment.

A HIGH PRECISION CAMERA OPERATING PARAMETER MEASUREMENT SYSTEM AND ITS APPLICATION TO IMAGE MOTION INFERRING

  • Wentao-Zheng;Yoshiaki-Shishikui;Yasuaki-Kanatsugu;Yutaka-Tanaka
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1999년도 KOBA 방송기술 워크샵 KOBA Broadcasting Technology Workshop
    • /
    • pp.77-82
    • /
    • 1999
  • Information about camera operating such as zoom, focus, pan, tilt and tracking is useful not only for efficient video coding, but also for content-based video representation. A camera operating parameter measurement system designed specifically for these applications is therefore developed. This system, implemented in real time and synchronized with the video signal, measures the precise camera operating parameters. We calibrated the camera lens using a camera model that accounts for redial lens distortion. The system is then applied to infer image motion from pan and tilt operating parameters. The experimental results show that the inferred motion coincides with the actual motion very well, with an error of less than 0.5 pixel even for large motion up to 80 pixels.

에너지 효율적인 버퍼 기반 비디오 스트리밍 최적화 기법 (An Energy-aware Buffer-based Video Streaming Optimization Scheme)

  • Kang, Young-myoung
    • 한국정보통신학회논문지
    • /
    • 제26권10호
    • /
    • pp.1563-1566
    • /
    • 2022
  • Video streaming applications such as Netflix and Youtube are widely used in our daily life. A DASH based streaming client exploits adaptive bit rate (ABR) method to choose the most appropriate video source representation that the network can support. In this paper we propose a novel energy-aware ABR scheme that adds the ability to monitor energy efficiency in addition to the linear quadratic regulator algorithm we previously introduced. Our trace-driven simulation studies show that our proposed scheme mitigates and shortens re-buffering, resulting in energy savings of mobile devices while preserving the similar QoE compared to the state-of-the-art ABR algorithms.

몰입형 비디오 부호화를 위한 패치 패킹 정보의 효율적인 표현 (Efficient Representation of Patch Packing Information for Immersive Video Coding)

  • 임성균;윤용욱;김재곤
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 추계학술대회
    • /
    • pp.126-128
    • /
    • 2021
  • MPEG(Moving Picture Experts Group) 비디오 그룹은 사용자에게 움직임 시차(motion parallax)를 제공하면서 3D 공간 내에서 임의의 위치와 방향의 시점(view)을 렌더링(rendering) 가능하게 하는 6DoF(Degree of Freedom)의 몰입형 비디오 부호화 표준인 MIV(MPEG Immersive Video) 표준화를 진행하고 있다. MIV 표준화 과정에서 참조 SW 인 TMIV(Test Model for Immersive Video)도 함께 개발하고 있으며 점진적으로 부호화 성능을 개선하고 있다. TMIV 는 여러 뷰로 구성된 방대한 크기의 6DoF 비디오를 압축하기 위하여 입력되는 뷰 비디오들 간의 중복성을 제거하고 남은 영역들은 각각 개별적인 패치(patch)로 만든 후 아틀라스에 패킹(packing)하여 부호화되는 화소수를 줄인다. 이때 아틀라스 비디오에 패킹된 패치들의 위치 정보를 메타데이터로 압축 비트열과 함께 전송하게 되며, 본 논문에서는 이러한 패킹 정보를 보다 효율적으로 표현하기 위한 방법을 제안한다. 제안방법은 기존 TMIV10.0 에 비해 약 10%의 메타데이터를 감소시키고 종단간 BD-rate 성능을 0.1% 향상시킨다.

  • PDF

비디오객체의 경계향상을 위한 VLSI 구조 (VLSI Architecture for Video Object Boundary Enhancement)

  • 김진상
    • 한국통신학회논문지
    • /
    • 제30권11A호
    • /
    • pp.1098-1103
    • /
    • 2005
  • 에지나 윤곽 정보는 인간의 시각 시스템에 의하여 가장 잘 인식되며 객체의 인식과 지각에 사용되는 중요한 정보이다. 그러므로 비디오내의 객체간의 상호작용, 객체기반 코딩과 표현과 같은 응용을 위하여, 비디오객체의 추출과정에 에지정보를 적용하면 인간의 시각 시스템과 근접한 객체 경계를 얻을 수 있다. 대부분의 객체추출 방식은 연산량이 많고 반복적인 연산을 수행하므로 실시간 처리가 어렵다. 본 논문에서는 비디오객체 분할 과정에 에지 정보를 적용하여 정확한 객체 경계를 추출하는 VLSI 구조를 제안한다. 제안된 하드웨어 구조는 연산방식이 간단하므로 하드웨어로 쉽게 구현될 수 있으며, 제안된 VLSI 하드웨어 구조를 이용하면 객체기반 멀티미디어 응용을 위하여 실시간으로 비디오객체를 분할할 수 있다.

비디오 데이터 세트의 하이퍼 사각형 표현에 기초한 비디오 유사성 검색 알고리즘 (Similarity Search Algorithm Based on Hyper-Rectangular Representation of Video Data Sets)

  • 이석룡
    • 정보처리학회논문지D
    • /
    • 제11D권4호
    • /
    • pp.823-834
    • /
    • 2004
  • 이 연구에서는 대용량 비디오 데이터 스트림에 대한 유사성 검색 알고리즘을 제시한다. 수많은 프레임으로 이루어진 비디오 스트림은 각 프레임을 다차원 벡터(multidimensional vector)로 나타냄으로써 다차원 데이터 공간 상에서 시퀸스로 나타낼 수 있다. 이 시퀸스의 특성을 분석 함으로써 각 시퀸스를 비디오 세그먼트(video segment)와 이 세그먼트의 집합인 비디오 클러스터(video cluster)로 표현한다. 본 연구에서는 이러한 비디오 세그먼트와 클러스터를 사용하여 두 비디오 스트림 사이의 유사성 함수(similarity function)를 제시하고, 이 함수에 근거하여 비디오 세그먼트의 하이퍼 사각형과 대표 프레임에 기초한 두 가지의 유사성 검색 알고리즘을 제안한다. 전자는 정해성(correctness)을 보장하는 알고리즘이며, 후자는 정해성을 약간 희생하는 대신 상당한 효율성을 얻을 수 있는 알고리즘이다. 다양한 유형의 비디오 스트림 및 가상으로 생성된 스트림 데이터에 대한 실험을 통하여 제시한 알고리즘의 성능을 분석한다.

바이섹슈얼 라이팅(Bisexual Lighting)의 영상 표현 연구 (A Study on Image Representation of Bisexual Lighting)

  • 교이나
    • 트랜스-
    • /
    • 제11권
    • /
    • pp.119-142
    • /
    • 2021
  • 영상은 이미지를 전제로 하는 문화적 실천이다. 영상이미지를 통해 관객은 일상이 아닌 새로운 것을 체험하기를 갈망한다. 영상이미지의 구성 요소는 많지만 그중에 시각적 표현인 색채가 큰 역할을 담당하고 있다. 컬러영화가 등장하기 시작하면서부터 색채는 영상예술의 중요한 구성요소로서 끊임없이 발전하고 혁신적인 영상미술 디자인에서 중요한 역할을 하였다. 영화인들은 1895년 영화가 흑백으로 탄생할 때부터 색채에 대한 관심이 있었다. 이 두 가지 색채로 더 이상 시청자를 만족시키지 못했기 때문에 필름에 색채를 입히는 등 더 많은 색채를 영화 속에서 표현하려고 노력했다. 영상에서의 색채는 표현의 기법이면서도 정신과 사상으로 이해할 수 있다. 색채가 단순히 그냥 존재하는 것이 아니라 인간심리에 강하게 작용하고 있음에 일러주는 것이기도 하다. 색채는 영화 언어의 일부로, 색채언어는 영화 속에서 영화의 사상적 주제를 표현하거나 선명한 캐릭터를 묘사할 수 있으며, 사람들에게 더 직관적으로 메시지를 전달할 수 있다. 본 연구는 색 조명 방식 혹은 배색 방안인 바이섹슈얼 라이팅을 대상으로, 그의 기본적인 색채 구성요소, 즉 핑크색, 파란색 및 보라색이 갖고 있는 색채 특성을 이해해 색채를 통해 인간심리가 어떤 영향을 받고 있는 지에 대해 분석하고 바이섹슈얼 라이팅이 영상에서 나오는 장면들을 결합해 구체적인 사례분석을 했다. 이를 통해 바이섹슈얼 라이팅이 영상에서 색채 속성을 이용해 표현한 색채 언어가 무엇이고 바이섹슈얼 라이팅이 어떻게 색채를 통해 인간심리와 상호 작용하는지를 탐색하였다.