• Title/Summary/Keyword: 깊이 이미지

Search Result 243, Processing Time 0.028 seconds

AI-Based Object Recognition Research for Augmented Reality Character Implementation (증강현실 캐릭터 구현을 위한 AI기반 객체인식 연구)

  • Seok-Hwan Lee;Jung-Keum Lee;Hyun Sim
    • The Journal of the Korea institute of electronic communication sciences
    • /
    • v.18 no.6
    • /
    • pp.1321-1330
    • /
    • 2023
  • This study attempts to address the problem of 3D pose estimation for multiple human objects through a single image generated during the character development process that can be used in augmented reality. In the existing top-down method, all objects in the image are first detected, and then each is reconstructed independently. The problem is that inconsistent results may occur due to overlap or depth order mismatch between the reconstructed objects. The goal of this study is to solve these problems and develop a single network that provides consistent 3D reconstruction of all humans in a scene. Integrating a human body model based on the SMPL parametric system into a top-down framework became an important choice. Through this, two types of collision loss based on distance field and loss that considers depth order were introduced. The first loss prevents overlap between reconstructed people, and the second loss adjusts the depth ordering of people to render occlusion inference and annotated instance segmentation consistently. This method allows depth information to be provided to the network without explicit 3D annotation of the image. Experimental results show that this study's methodology performs better than existing methods on standard 3D pose benchmarks, and the proposed losses enable more consistent reconstruction from natural images.

A Survey on Visual Interference Elements Improvement Techniques to Improve Camera Performance (카메라의 성능 향상을 위한 시각적 방해 요소 개선 기법 조사)

  • Park, Hyunkook;Ji, Hyunseo;Choi, Heesu;Lee, Chul
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.05a
    • /
    • pp.605-607
    • /
    • 2019
  • 최적의 사진을 얻기 위해 시각적 방해요소들을 개선할 수 있는 기술들을 조사했다. CNN 모델을 활용한 HDR 이미지 재구성, 방해물과 원하는 피사체와의 깊이 차이에서 생기는 시차를 이용한 이미지 처리를 사용해서 시각적 방해요소를 개선하는 알고리즘을 기술했다.

Online Monitoring System based notifications on Mobile devices with Kinect V2 (키넥트와 모바일 장치 알림 기반 온라인 모니터링 시스템)

  • Niyonsaba, Eric;Jang, Jong-Wook
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.20 no.6
    • /
    • pp.1183-1188
    • /
    • 2016
  • Kinect sensor version 2 is a kind of camera released by Microsoft as a computer vision and a natural user interface for game consoles like Xbox one. It allows acquiring color images, depth images, audio input and skeletal data with a high frame rate. In this paper, using depth image, we present a surveillance system of a certain area within Kinect's field of view. With computer vision library(Emgu CV), if an object is detected in the target area, it is tracked and kinect camera takes RGB image to send it in database server. Therefore, a mobile application on android platform was developed in order to notify the user that Kinect has sensed strange motion in the target region and display the RGB image of the scene. User gets the notification in real-time to react in the best way in the case of valuable things in monitored area or other cases related to a reserved zone.

Model-Based Three-dimensional Multiview Object Implementation by OpenGL (OpenGL을 이용한 모델 기반 3차원 다시점 객체 구현)

  • Oh, Won-Sik;Kim, Dong-Uk;Kim, Hwa-Sung;Yoo, Ji-Sang
    • Journal of Broadcast Engineering
    • /
    • v.13 no.3
    • /
    • pp.299-309
    • /
    • 2008
  • In this paper, we propose an algorithm for object generation from model-based 3-dimensional multi-viewpoint images using OpenGL rendering. In the first step, we preprocess a depth map image in order to get a three-dimensional coordinate which is sampled as a vertex information on OpenGL and has a z-value as depth information. Next, the Delaunay Triangulation algorithm is used to construct a polygon for texture-mapping using the vertex information. Finally, by mapping a texture image on the constructed polygon, we generate a viewpoint-adaptive object by calculating 3-dimensional coordinates on OpenGL.

Rendering Trees Using Billboarding Method with View Dependent Texture Re-creation in Real-Time (시점 종속적 빌보드 텍스쳐 재생성을 이용한 나무의 실시간 렌더링)

  • Min, Sung-Hwan;Kim, Chang-Hun
    • Journal of the Korea Computer Graphics Society
    • /
    • v.8 no.4
    • /
    • pp.9-16
    • /
    • 2002
  • In this paper we propose an extended billboarding method for rendering trees. It's difficult circumstance that PC renders forest by general polygon rendering in real-time, because tree object consists of tremendous leaves and limbs. Our method re-creates an appropriate texture image by 3D image warping equation each frame, and we use it for a billboarding method. For speed up, we use warping method with a image pyramid and image caching.

  • PDF

홀로그래픽 회절 토모그래피와 그 생물학적 응용

  • Gang, Pil-Seong;Choe, Won-Sik
    • Broadcasting and Media Magazine
    • /
    • v.18 no.3
    • /
    • pp.95-108
    • /
    • 2013
  • 디지털 홀로그래픽 현미경이나 정량적 위상 현미경(quantitative phase microscopy)과 같은 기존의 간섭현미경은 3차원 이미징 기술로 분류되는데, 이는 획득한 이미지의 복소장(complex field)을 계산을 통해 다른 깊이로 전파시킬 수 있기 때문이다. 그러나 엄밀한 의미에서는 하나의 복소장 이미지는 단지 2차원 맵이기 때문에 근본적으로는 샘플의 2차원 정보만을 가지고, 물체의 3차원 구조의 일부분을 측정하는 것에 지나지 않는다. 본 논문에서는 1969년에 Wolf가 제안한[1,2] 홀로그래픽 회절 토모그래피(Optical Diffraction Tomography: ODT)를 실험적으로 구현한 3차원 위상 현미경(Tomographic Phase Microscopy: TPM)을 소개하고자 한다. TPM은 샘플을 다양한 각도로 조명하여 서로 다른 입사각에 대해 복소장 이미지를 얻고, ODT를 통해서 샘플의 3차원 구조를 복원해내는 기술이다. 보다 구체적으로는 다양하고 독립적인 2차원 이미지들을 샘플의 3차원 푸리에 공간에 맵핑함으로써 샘플 단면의 흡수율과 굴절률을 복원할 수 있다. 굴절률은 분자 농도와 비례하기 때문에, 살아있는 세포에 대한 굴절률의 3차원 맵을 얻을 수 있으면 세포 내부의 분자 구성을 연구할 수 있고, 이를 통해 다양한 생의학적 응용을 연구할 수 있다.

Improvement of point cloud data using 2D super resolution network (2D super resolution network를 이용한 Point Cloud 데이터 개선)

  • Park, Seong-Hwan;Kim, Kyu-Heon
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2021.06a
    • /
    • pp.16-18
    • /
    • 2021
  • 미디어 기술은 사용자가 더욱 몰입감을 느낄 수 있는 방향으로 개발되어 왔다. 이러한 흐름에 따라 기존의 2D 이미지에 비해 깊이감을 느낄 수 있는 증강 현실, 가상 현실 등 3D 공간 데이터를 활용하는 미디어가 주목을 받고 있다. 포인트 클라우드는 수많은 3차원 좌표를 가진 여러 개의 점들로 구성된 데이터 형식이므로 각각의 점들에 대한 좌표 및 색상 정보를 사용하여 3D 미디어를 표현한다. 고정된 크기의 해상도를 갖는 2D 이미지와 다르게 포인트 클라우드는 포인트의 개수에 따라 용량이 유동적이며, 이를 기존의 비디오 코덱을 사용하여 압축하기 위해 국제 표준기구인 MPEG(Moving Picture Experts Group)에서는 Video-based Point Cloud Compression (V-PCC)을 제정하였다. V-PCC는 3D 포인트 클라우드 데이터를 직교 평면 벡터를 이용하여 2D 패치로 분해하고 이러한 패치를 2D 이미지에 배치한 다음 기존의 2D 비디오 코덱을 사용하여 압축한다. 본 논문에서는 앞서 설명한 2D 패치 이미지에 super resolution network를 적용함으로써 3D 포인트 클라우드의 성능 향상하는 방안을 제안한다.

  • PDF

A Concept Extraction Method for Image Based on Human's Natural Abilities (인간의 생득적 능력에 기반한 이미지의 의미정보 추출방법)

  • Park, Hyung-Kun;Lee, Yill-Byung
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06c
    • /
    • pp.307-310
    • /
    • 2011
  • 최근 멀티미디어 데이터의 급속한 증가는 그를 대상으로 하는 다양한 컴퓨팅 기술의 발전을 가져왔다. 이러한 기술이 인간과의 상호 작용에서 그 양적 범위와 질적 깊이를 더해감에 따라, 멀티미디어 데이터 특히 그 중 가장 대표적이라 할 수 있는 이미지 데이터를 의미적으로 이해할 수 있는 방법의 필요성이 대두되고 있다. 이미지의 의미를 이해하기 위해 저수준(low level)의 시각 정보만을 이용하는 경우 인간과의 상호 작용에서 의미 격차(conceptual gap) 문제가 발생할 수 있다. 이미지 객체의 시각 정보들을 가공해서 온톨로지(ontology)와 같은 형태의 지식 베이스(knowledge base)와 연동하여 보다 고수준의 의미를 부여하는 경우에는 해당 도메인을 벗어난 새로운 환경에 대해 적응력과 강인함이 떨어진다. 이러한 문제를 근본적으로 해결하기 위해서는 지식 베이스가 없는 상태에서 이미지 데이터의 형태로 주어진 대상 객체로부터 의미를 부여할 수 있는 정보들을 추출해, 구조적으로 지식 베이스를 형성해 나가고 이를 토대로 대상 이미지 객체의 의미를 이해할 수 있는 시스템이 필요하다. 본 논문에서는 발달 심리학 이론들을 바탕으로 시각과 관련된 인간의 생득적 능력을 찾고, 이를 기반으로 우선 주어진 이미지 객체로부터 의미 정보를 효과적으로 추출할 수 있는 방법을 제안한다.

PCA-Based Feature Reduction for Depth Estimation (깊이 추정을 위한 PCA기반의 특징 축소)

  • Shin, Sung-Sik;Gwun, Ou-Bong
    • Journal of the Institute of Electronics Engineers of Korea CI
    • /
    • v.47 no.3
    • /
    • pp.29-35
    • /
    • 2010
  • This paper discusses a method that can enhance the exactness of depth estimation of an image by PCA(Principle Component Analysis) based on feature reduction through learning algorithm. In estimation of the depth of an image, hyphen such as energy of pixels and gradient of them are found, those selves and their relationship are used for depth estimation. In such a case, many features are obtained by various filter operations. If all of the obtained features are equally used without considering their contribution for depth estimation, The efficiency of depth estimation goes down. This paper proposes a method that can enhance the exactness of depth estimation of an image and its processing speed is considered as the contribution factor through PCA. The experiment shows that the proposed method(30% of an feature vector) is more exact(average 0.4%, maximum 2.5%) than using all of an image data in depth estimation.

An Efficient Median Filter Algorithm for Floating-point Images (부동소수점 형식 이미지를 위한 효율적인 중간값 필터 알고리즘)

  • Kim, Jin Wook
    • Journal of IKEEE
    • /
    • v.26 no.2
    • /
    • pp.240-248
    • /
    • 2022
  • Floating-point images that express pixel information as real numbers are used in HDR images. There have been various researches on efficient median filter algorithms, but most of them are applicable to 8-bit depth images and there are only a few number of algorithms applicable to floating-point images, including Gil and Werman's algorithm. In this paper, we propose a median filter algorithm that works efficiently on floating-point images by improving Kim's algorithm, which improved Gil and Werman's algorithm. Experimental results show that the execution time is improved by about 10% compared to the Kim's algorithm by reducing the redundant work for the repetitively used binary search tree and applying the inverted index.