• Title/Summary/Keyword: virtual image technique

검색결과 182건 처리시간 0.034초

개선된 패치 매칭을 이용한 깊이 영상 기반 렌더링의 홀 채움 방법 (Hole-Filling Method for Depth-Image-Based Rendering for which Modified-Patch Matching is Used)

  • 조재형;송원석;최혁
    • 정보과학회 논문지
    • /
    • 제44권2호
    • /
    • pp.186-194
    • /
    • 2017
  • 깊이 영상 기반 렌더링은 깊이 정보를 활용하여 가상 시점의 영상을 생성하는 기술로 다양한 3차원 영상시스템에서 필요로 하는 기술이다. 깊이 영상 기반 렌더링에서 가장 어려운 과제는 가상 시점 영상에서 새롭게 드러나는 부분을 채우는 과정이다. 영상 인페인팅은 이 과정에서 보편적으로 활용되는 방법이다. 본 논문에서는 홀을 채우는 과정에서 발생하는 오류를 줄이고 자연스럽게 채우는 방법을 제안한다. 먼저 색상 영상의 정보와 깊이 정보를 활용하여 지역적으로 적응적 패치 크기를 선택하도록 하였다. 또한 패치 간 유사도에 따라 홀을 채우는 방법을 한 번에 채우는 경우와 부분적으로 채우는 경우로 구분하였다. 이를 통해 오류의 발생을 줄이고 깊이 영상 기반 렌더링에서 가장 큰 문제가 되는 오류의 전파를 억제하였다. 실험을 통해 제안한 방법이 기존의 방법보다 시각적으로 자연스러운 가상 시점 영상을 생성하는 것을 확인하였다.

딥러닝 의류 가상 합성 모델 연구: 가중치 공유 & 학습 최적화 기반 HR-VITON 기법 활용 (Virtual Fitting System Using Deep Learning Methodology: HR-VITON Based on Weight Sharing, Mixed Precison & Gradient Accumulation)

  • 이현상;오세환;하성호
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제31권4호
    • /
    • pp.145-160
    • /
    • 2022
  • Purpose The purpose of this study is to develop a virtual try-on deep learning model that can efficiently learn front and back clothes images. It is expected that the application of virtual try-on clothing service in the fashion and textile industry field will be vitalization. Design/methodology/approach The data used in this study used 232,355 clothes and product images. The image data input to the model is divided into 5 categories: original clothing image and wearer image, clothing segmentation, wearer's body Densepose heatmap, wearer's clothing-agnosting. We advanced the HR-VITON model in the way of Mixed-Precison, Gradient Accumulation, and sharing model weights. Findings As a result of this study, we demonstrated that the weight-shared MP-GA HR-VITON model can efficiently learn front and back fashion images. As a result, this proposed model quantitatively improves the quality of the generated image compared to the existing technique, and natural fitting is possible in both front and back images. SSIM was 0.8385 and 0.9204 in CP-VTON and the proposed model, LPIPS 0.2133 and 0.0642, FID 74.5421 and 11.8463, and KID 0.064 and 0.006. Using the deep learning model of this study, it is possible to naturally fit one color clothes, but when there are complex pictures and logos as shown in <Figure 6>, an unnatural pattern occurred in the generated image. If it is advanced based on the transformer, this problem may also be improved.

360° 3D 파노라마 기술을 적용한 VFT 개발 및 효과 (Development and Effects of Virtual Geological Field Trip Program using 360° 3D Panorama Technique)

  • 김희수
    • 대한지구과학교육학회지
    • /
    • 제8권2호
    • /
    • pp.193-205
    • /
    • 2015
  • In this study, a Virtual geological Field Trip(VFT) learning program using 3D panorama virtual reality techniques was developed to learn about the Gongju city 7 area located in Chungcheongnam-do, Korea. The developed $360^{\circ}$ 3D VFT program can show every face of observational points and interact as zoom-in, zoom-out and image rotation. For the educational effects of the materials, it is provided with a compass, a protractor, enlarged images, pop-up windows, etc.. The program was applied to the class of 35 gifted students in middle school to investigate the effectiveness of the program. The results showed that positive responses of the students were 90% or more. When geological field trip problems like cost, safety, distance occur in geological learning procedure of middle school science, this VFT program can become as a supplementary learning material and a solution.

Virtual Reality Image Shooting for Single Person Broadcasting with Multiple Smartphones

  • Budiman, Sutanto Edward;Lee, Suk-Ho
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제11권2호
    • /
    • pp.43-49
    • /
    • 2019
  • Nowadays, one-person media broadcasting has become popular, and with the progress of this popularity, multimedia techniques which can support such broadcasting are also becoming more and more advanced. One of the most emerging multimedia technique used in this field is the virtual reality technology which sets the one-person media broadcasting environment as a virtual reality environment. However, as such an environment requires instruments of high cost, it is not easy for normal individuals to constitute such environments. Therefore, in this paper we propose how to construct virtual reality-like panoramas with a multiple of smartphones. For this purpose, we designed a special rig which can hold firmly 8 smartphone cameras which have overlapping view of the environment such that panorama stitching becomes possible. To reduce the computation cost, we precomputed the homography matrices, and used 1-D pointer structures to store the computed coordinate values.

스테레오 PTV법의 개발 (Development of a Stereoscopic PTV)

  • 도덕희;이원제;조용범;편용범
    • 한국가시화정보학회지
    • /
    • 제1권1호
    • /
    • pp.92-97
    • /
    • 2003
  • A new Stereoscopic PTV was developed using two CCD cameras, stereoscopic photogrammetry based on a 3D-PTV principle. Virtual images were produced for the benchmark test of the constructed Stereoscopic PTV technique. The arrangement of the two cameras was based on angular position. The calibration of cameras and the pair-matching of the three-dimensional velocity vectors were based on the Genetic Algorithm based 3D-PTV technique. The constructed Stereoscopic PTV technique was tested on the standard images of the impinged jet proposed by VSJ. The results obtained by the constructed system showed good agreements with the original data.

  • PDF

스테레오 PIV (Stereoscopic PIV)

  • 도덕희;이원제;조경래;편용범;김동혁
    • 대한기계학회:학술대회논문집
    • /
    • 대한기계학회 2001년도 추계학술대회논문집B
    • /
    • pp.394-399
    • /
    • 2001
  • A new stereoscopic PIV is introduced. The system works with CCD cameras, stereoscopic photogrammetry, and a 3D-PTV principle. Virtual images are produced for the construction of a benchmark testing tool of PIV techniques. The arrangement of the two cameras is based on angular position. The calibration of cameras and the pair-matching of the three-dimensional velocity vectors are based on 3D-PTV technique.

  • PDF

Automatic Classification of Drone Images Using Deep Learning and SVM with Multiple Grid Sizes

  • Kim, Sun Woong;Kang, Min Soo;Song, Junyoung;Park, Wan Yong;Eo, Yang Dam;Pyeon, Mu Wook
    • 한국측량학회지
    • /
    • 제38권5호
    • /
    • pp.407-414
    • /
    • 2020
  • SVM (Support vector machine) analysis was performed after applying a deep learning technique based on an Inception-based model (GoogLeNet). The accuracy of automatic image classification was analyzed using an SVM with multiple virtual grid sizes. Six classes were selected from a standard land cover map. Cars were added as a separate item to increase the classification accuracy of roads. The virtual grid size was 2-5 m for natural areas, 5-10 m for traffic areas, and 10-15 m for building areas, based on the size of items and the resolution of input images. The results demonstrate that automatic classification accuracy can be increased by adopting an integrated approach that utilizes weighted virtual grid sizes for different classes.

3D Visualization Technique for Occluded Objects in Integral Imaging Using Modified Smart Pixel Mapping

  • Lee, Min-Chul;Han, Jaeseung;Cho, Myungjin
    • Journal of information and communication convergence engineering
    • /
    • 제15권4호
    • /
    • pp.256-261
    • /
    • 2017
  • In this paper, we propose a modified smart pixel mapping (SPM) to visualize occluded three-dimensional (3D) objects in real image fields. In integral imaging, orthoscopic real 3D images cannot be displayed because of lenslets and the converging light field from elemental images. Thus, pseudoscopic-to-orthoscopic conversion which rotates each elemental image by 180 degree, has been proposed so that the orthoscopic virtual 3D image can be displayed. However, the orthoscopic real 3D image cannot be displayed. Hence, a conventional SPM that recaptures elemental images for the orthoscopic real 3D image using virtual pinhole array has been reported. However, it has a critical limitation in that the number of pixels for each elemental image is equal to the number of elemental images. Therefore, in this paper, we propose a modified SPM that can solve this critical limitation in a conventional SPM and can also visualize the occluded objects efficiently.

개선된 공간 도약법을 이용한 고속 가상 내시경 기법 (High-Speed Virtual Endoscopy using Improved Space-Leaping)

  • 신병석;김혁
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제29권8호
    • /
    • pp.463-471
    • /
    • 2002
  • 가상 내시경을 구현하기 위해서는 세밀하고 정확한 원근 투영 영상의 고속생성과 충돌검출이 필수적이다. 본 논문에서는 고속 원근 볼륨 렌더링 기법을 이용하여 정확하면서도 빠른 렌더링이 가능한 가상 내시경 기술을 제안한다. 이 방법은 기본적으로 화질이 우수한 광선 투영법을 기반으로 하며 거리정보(distance information)를 이용하여 투명한 공간을 비약하도록 함으로써 렌더링 속도를 향상시키도록 하였다. 렌더링 시에는 광선의 진행 방향에 따라 샘플 간격을 가변적으로 조절하는 방법을 이용하여 화질의 손실을 최소화하면서 처리시간을 향상시킨다. 또한 전처리 단계에서 생성된 거리 정보를 이용하여 충돌 검출을 간단히 할 수 있는 방법을 제안한다.

가상현실에서 효과적인 3차원 영상 연출을 위한 연구 -언리얼 엔진의 영상 제작을 이용한 인터렉티브 쇼트 중심으로- (A Study on effective directive technique of 3D animation in Virtual Reality -Focus on Interactive short using 3D Animation making of Unreal Engine-)

  • 이준수
    • 만화애니메이션 연구
    • /
    • 통권47호
    • /
    • pp.1-29
    • /
    • 2017
  • 360도 가상현실은 오래전부터 상용되고 있던 기술이었으나 HMD(Head Mounted Display)와 같은 기기의 발전과 가상현실의 영상을 제어하고 실행시키는 하드웨어의 발전으로 최근에 가상현실의 제작이 전 세계적으로 활발하게 진행되는데 360도 영상의 제작은 기존의 영상제작과는 다른 연출 방식을 요구하고 사용자를 위한 연구가 진행되고 있다. 가상현실 영상은 몰입성, 현재성과 상호작용을 요구하는 플랫폼을 지향하기 때문에 이에 맞는 영상문법이 필요하다. VR에서 사용자는 연출자가 만들어 놓은 세계를 자유롭게 감상할 수 있으며 본인의 관심대상에 집중할 수 있는 장점이 있다. 하지만 이것은 또한 연출자에게 내러티브의 진행과 전달하고자 하는 영상에 집중할 수 있게 하는 장치를 개발하고 설치할 필요성을 요구한다. 연출자에게는 영상을 전달하는 다양한 방법들 가운데 쇼트의 구성을 이용할 수 있는데 본 고에서는 이 쇼트의 구성을 통한 연출기법을 어떻게 효과적으로 360도 가상현실에서 적용시킬 수 있는지에 대해 연구하고자 한다. 현재의 가상현실 연출방식은 기존 영상제작 방식을 많이 따르고 있으며 쇼트구성도 마찬가지이다. 다만 360도 가상현실에서는 전통적인 3인칭 시점의 롱테이크 기법이나 블로킹 기법을 주된 연출구성으로 이용하지만 여전히 쇼트구성의 한계를 느끼고 있다. 또한 사용자가 HMD 트레킹을 이용하여 인터렉티브하게 360도 화면을 시청할 수 있는 반면에 쇼트의 구성과 쇼트의 연결은 기존 영상문법과 마찬가지로 연출자에게 절대적으로 의존하고 있다. 본 연구에서는 이러한 영상문법도 VR 영상의 상호작용의 특징인 사용자가 원하는 시점에 쇼트의 구성과 같은 영상문법을 자유롭게 변경할 수 있는지를 연구하고자 언리얼 엔진이라는 게임 툴을 사용하여 3D 애니메이션을 제작하고 블루프린트(Blueprint)라는 언리얼엔진의 비주얼 스크립팅을 가지고 트리거(Trigger)라는 노드로 조건의 참과 거짓을 구분시키는 장치를 만들어 각각의 상태에 따른 카메라의 위치를 선택하게끔 하여 다양한 쇼트를 만드는 인터렉티브 영상구성을 시도함으로 다양한 연출기법이 개발되고 관련 연구가 진행되어 360도 VR 영상 발전에 도움이 되길 기대한다.