• 제목/요약/키워드: 3D video

검색결과 1,152건 처리시간 0.028초

A New Residual Attention Network based on Attention Models for Human Action Recognition in Video

  • Kim, Jee-Hyun;Cho, Young-Im
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권1호
    • /
    • pp.55-61
    • /
    • 2020
  • 딥 러닝 기술의 발전과 컴퓨팅 파워 등의 개선으로 인해 비디오 기반 연구는 최근 많은 관심을 얻고 있다. 비디오 데이터가 이미지 데이터와 비교하여 가장 큰 차이는 비디오 데이터에는 많은 양의 시간적, 공간적 정보가 포함되어 있다는 점이다. 이처럼 비디오에 포함된 많은 양의 데이터로 인해 컴퓨터 비전 연구에 있어서 행동 인식은 중요한 연구 과제 중 하나이지만, 비디오와 같이 움직임이 있는 환경에서 인간의 행동 인식은 매우 복잡하고 도전적인 과제이다. 인간에 대한 여러 연구를 바탕으로 인공지능에서는 인간과 유사한 주의(attention)메커니즘이 효율적인 인식 모델이라는 것을 알게 되었다. 이 효율적인 모델은 이미지 정보와 복잡한 연속 비디오 정보를 처리하는 데 이상적이다. 본 논문에서는 이러한 연구배경을 기반으로, 비디오에서 인간의 행동을 효율적으로 인식하기 위해 먼저 인간의 행동에 주목한 후 비디오 행동 인식에 주의메커니즘을 도입하고자 한다. 논문의 주요내용은 두 가지 주의 메카니즘을 기반으로 컨볼루션 신경망을 이용한 새로운 3D 잔류 주의 네트워크를 제안함으로써 비디오에서 인간의 행동을 식별하고자 한다. 제안 모델의 평가 결과 최대 90.7%정도의 정확도를 보였다.

Digital Holographic Display System with Large Screen Based on Viewing Window Movement for 3D Video Service

  • Park, Minsik;Chae, Byung Gyu;Kim, Hyun-Eui;Hahn, Joonku;Kim, Hwi;Park, Cheong Hee;Moon, Kyungae;Kim, Jinwoong
    • ETRI Journal
    • /
    • 제36권2호
    • /
    • pp.232-241
    • /
    • 2014
  • A holographic display system with a 22-inch LCD panel is developed to provide a wide viewing angle and large holographic 3D image. It is realized by steering a narrow viewing window resulting from a very large pixel pitch compared to the wave length of the laser light. Point light sources and a lens array make it possible to arbitrarily control the position of the viewing window for a moving observer. The holographic display provides both eyes of the observer with a holographic 3D image using two vertically placed LCD panels and a beam splitter to support the holographic stereogram.

Producing a Virtual Object with Realistic Motion for a Mixed Reality Space

  • Daisuke Hirohashi;Tan, Joo-Kooi;Kim, Hyoung-Seop;Seiji Ishikawa
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2001년도 ICCAS
    • /
    • pp.153.2-153
    • /
    • 2001
  • A technique is described for producing a virtual object with realistic motion. A 3-D human motion model is obtained by applying a developed motion capturing technique to a real human in motion. Factorization method is a technique for recovering 3-D shape of a rigid object from a single video image stream without using camera parameters. The technique is extended for recovering 3-D human motions. The proposed system is composed of three fixed cameras which take video images of a human motion. Three obtained image sequences are analyzed to yield measurement matrices at individual sampling times, and they are merged into a single measurement matrix to which the factorization is applied and the 3-D human motion is recovered ...

  • PDF

상호작용 동영상 구현을 위한 객체 분리 제작 기법 (Object Segmentation Technique for Implementation of Interactive Video)

  • 성혁재;곽호영
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2018년도 제58차 하계학술대회논문집 26권2호
    • /
    • pp.116-118
    • /
    • 2018
  • 본 논문에서는 기존의 동영상을 그랩컷(GrabCut) 알고리즘과 유니티3D를 이용하여 상호작용이 가능한 동영상을 제작하는 기법을 제안한다. 그랩컷 알고리즘을 이용하여 동영상에서 재생 프레임 단위로 원하는 객체 영역을 추출하고 흑백의 이미지로 이진화한다. 이진화된 결과물과 원본 동영상을 유니티3D에서 동시에 재생하면서 선택 영역의 이진화 픽셀 정보를 기반으로 사용자의 입력을 감지하는 동영상의 제작이 가능함을 보였다.

  • PDF

HEVC 기반 3DV 부호화 성능 분석 (Performance analysis of the HEVC based 3DV Coding)

  • 박대민;손소희;최해철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2014년도 추계학술대회
    • /
    • pp.214-215
    • /
    • 2014
  • 3차원 비디오 부호화를 위한 표준안을 제정하기 위해 국제 표준화 기구인 JCT-3V(Joint Collaborative Team on 3D Video Coding Extension Development)에서는 3차원 비디오 부호화기술에 대한 표준화가 진행되고 있다. 본 논문은 현재 JCT-3V에서 HEVC(High Efficiency Video Coding) 기반으로 표준화가 진행 중인 3D-HEVC 부호화 기술들에 대해 살펴보고 그 부호화 및 복잡도 성능을 분석하였다. 이러한 성능 분석은 향후 3D-HEVC 기술에 대한 알고리즘 개발을 위한 기술 선별 및 조정에 유용할 것으로 판단된다.

  • PDF

DTV시스템에서의 정적 화질 테스트를 위한 고화질 스트림의 생성 (Generation of high quality stream for static picture quality test in DTV system)

  • 이광순;한찬호;장수욱;김은수;송규익
    • 한국통신학회논문지
    • /
    • 제29권2C호
    • /
    • pp.315-323
    • /
    • 2004
  • 본 논문은 디지털 TV 시스템의 화질 테스트를 위해 사용될 수 있는 정적 비디오 테스트 패턴에 대한 고화질 스트림을 생성할 수 있는 방법을 제안하고 있다. 이를 위해 정적 비디오 테스트 패턴의 부호화에 적합하고 양자화로 인한 화질의 손실을 최소화할 수 있는 사용자 양자화 테이블을 제안하고 있으며, 정적 테스트 패턴의 부호화 과정에서 발생할 수 있는 비디오 버퍼의 넘침 및 고갈 현상을 적응적인 제로 추가 방법을 이용하여 해결함으로써 최적의 화질을 구현하였다. 제안한 알고리즘을 실험해 본 결과 안정된 전송률을 나타낼 뿐만 아니라 화질 또한 멀티버스트 패턴에서 기존 방식 보다 약 3 dB 정도의 우수함을 보여 DTV 시스템의 테스트에 적합함을 알 수 있었다.

3차원 비디오의 합성영상 경계 잡음 제거 (Boundary Artifacts Reduction in View Synthesis of 3D Video System)

  • 이도훈;양윤모;오병태
    • 방송공학회논문지
    • /
    • 제21권6호
    • /
    • pp.878-888
    • /
    • 2016
  • 본 논문에서는 3차원 비디오 시스템에서 손상된 깊이영상으로 인하여 합성된 가상시점 영상에서 발생하는 경계 잡음을 효과적으로 제거하는 방식을 제안한다. 제안 방식에서는 손실 압축에 의한 깊이영상의 잡음으로부터 발생하는 경계 잡음의 특징을 분석하고, 이를 바탕으로 픽셀 도메인과 주파수 도메인에서의 convex set을 설정하여 해당 조건들을 반복적으로 사영시키는 projection onto convex sets (POCS) 기법을 활용하여 올바른 정보는 유지한 채 경계 잡음만을 제거한다. 이 논문에서 제안한 방식은 영상합성 과정에서 생성되는 컬러 및 깊이영상에 모두 적용하였다. 실험 결과 제안 기법은 경계 잡음을 효과적으로 제거하여 가상시점 영상의 화질을 향상시켰음을 확인하였다.

게임 디스플레이 종류와 안경착용 여부에 따른 영상의 인지된 특성, 프레즌스 그리고 피로도의 차이 (Influence of Gaming Display and Wearing Glasses on Perceived Characteristics, Presence, and Fatigue)

  • 이현지;정동훈
    • 방송공학회논문지
    • /
    • 제17권6호
    • /
    • pp.1004-1013
    • /
    • 2012
  • 3D 영상 산업의 활성화와 함께 3D 영상이 적용됨으로써 유망한 산업 분야 중 하나가 게임이다. 2D에서 3D 그래픽으로 그리고 현재는 3D 입체영상으로 진화하면서 이용자에게 깊이감을 제공함으로써 더 큰 즐거움을 주고 있다. 그러나 우리나라 18세 이상 성인 중절반이 안경 또는 콘택트렌즈를 착용하고 있을 정도로 안경 착용자가 많은 환경에서 3D 영상을 즐기기 위해서 또 다른 안경인 3D 안경을 착용해야 하는 것은 큰 불편이 아닐 수 없다. 본 연구에서는 게임에서의 입체영상 및 안경 착용여부가 영상의 특성, 프레즌스 그리고 피로도 등에 어떠한 영향을 미치는지 알아보고자 했으며, 실험결과 디스플레이와 안경착용의 상호작용효과는 프레즌스 구성요소 중 시간관여에서 유의미하게 나타났다. 2D 영상에서는 안경 착용자가 높은 반면 3D 입체영상에서는 안경 비착용자가 높게 인지하였다. 그리고 인지된 특성과 피로도 변인에서는 영상 여부의 주효과에서만 유의미한 것으로 나타났다. 인지된 특성 구성요소 중 선명도에서는 3D 입체영상 보다 2D 영상의 화질이 좋다고 평가하였으며, 피로도는 2D 영상 보다는 3D 입체영상에서 높은 것으로 나타났다.

$CAVE^{TM}$-like 시스템에서 시각 커뮤니케이션 지원을 위한 스테레오 비디오 아바타 (A Stereo Video Avatar for Supporting Visual Communication in a $CAVE^{TM}$-like System)

  • 이선민;박지영;김명희
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제33권6호
    • /
    • pp.354-362
    • /
    • 2006
  • 본 논문에서는 CAVE$^{TM}$-like 시스템에서 시각 커뮤니케이션 지원을 위한 고화질 스테레오 비디오 아바타 생성 기법을 제안한다. CAVE$^{TM}$-like 시스템에서는 사용자를 둘러싸고 있는 스크린으로 투사되는 빛의 잦은 변화 때문에 비디오 아바타 생성에 필수적인 사용자 추출이 쉽지 않다. 본 연구에서는 가시광선 차단 필터를 부착한 흑백 카메라로 획득된 적외선 반사 영상을 이용함으로써 스크린 상 빛의 변화를 차단하여 강건하게 사용자를 추출할 수 있도록 하였다. 또한, 사람의 양안차 간격으로 배치한 두 대의 컬러 카메라를 사용하여 삼차원 기하 정보의 재구성 없이 고화질 비디오 아바타를 빠르게 생성하고 입체 디스플레이 하기 위한 양안용 사용자 영상을 획득하였다. 획득된 영상에서 배경을 제거하기 위하여 적외선 반사 영상으로 정의된 실루엣 마스크와의 피팅 알고리즘을 제안한다. 생성된 비디오 아바타 스테레오 영상은 가상공간 내 평면 상에 텍스처 매핑하여 프레임 순차 스테레오 방식를 이용하여 입체 디스플레이할 수 있도록 하였다. 제안된 방식은 기존의 3D 비디오 아바타보다 고화질의 결과를 빠르게 생성할 수 있으며, 2D 기반 방식에서 제공해주지 못하던 입체감을 제공해준다.

Adaptive Pre-/Post-Filters for NRT-Based Stereoscopic Video Coding

  • Lee, Byung-Tak;Lee, BongHo;Choi, Haechul;Kim, Jin-Soo;Yun, Kugjin;Cheong, Won-Sik;Kim, Jae-Gon
    • ETRI Journal
    • /
    • 제34권5호
    • /
    • pp.666-673
    • /
    • 2012
  • Non-real-time delivery of stereoscopic video has been considered as a service scenario for 3DTV to overcome the limited bandwidth in the terrestrial digital television system. A hybrid codec combining MPEG-2 and H.264/AVC has been suggested for the compression of stereoscopic video for 3DTV. In this paper, we propose a stereoscopic video coding scheme using adaptive pre-/post-filters (APPF) to improve the quality of 3D video while retaining compatibility with legacy video coding standards. The APPF are applied adaptively to blocks of various sizes determined by the macroblock coding mode and reference frame index. Experiment results show that the proposed method achieves up to 24.86% bit rate savings relative to a hybrid codec of MPEG-2 and H.264/AVC including the inter-view prediction.