• Title/Summary/Keyword: 합성영상

Search Result 1,480, Processing Time 0.023 seconds

Image Super-Resolution Using Deep Convolutional Neural Networks Based on Residual Blocks (잔차 블록 기반의 깊은 합성곱 신경망을 통한 단일 영상 초해상도 복원)

  • Kim, Ingu;Yu, Songhyun;Jeong, Jaechang
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2018.11a
    • /
    • pp.62-65
    • /
    • 2018
  • 신경망은 깊어질수록 gradient vanishing/exploding과 같은 네트워크가 불안정해지는 문제가 발생 한다. 잔차 블록을 이용하여 이러한 문제를 해결 할 수 있다. 본 논문에서는 영상 인식 분야에서 훌륭한 성능을 보여준 잔차 블록 기반의 깊은 합성곱 신경망을 통한 단일 영상 초해상도 복원 기법을 제안 한다. 제안한 알고리듬은 EDSR에 사용된 잔차 블록을 다양한 크기의 합성곱 연산을 통해 영상의 특징들을 다르게 분석하도록 수정하고 VDSR과 비슷한 수준의 복잡도로 구성하여 향상된 성능을 얻었다. 실험 결과, VDSR에 비해 PSNR이 최대 0.1dB까지 증가했다.

  • PDF

Virtual Imaging System (가상이미징 시스템)

  • 박성춘
    • Broadcasting and Media Magazine
    • /
    • v.7 no.4
    • /
    • pp.33-40
    • /
    • 2002
  • 최근에 축구 중계 방송에서 경기장 바닥에 로고와 함께 득점 상황을 보여주거나 대형의 가상 전광판 같은 그래픽 영상을 경기장에 실레조 존재하는 듯이 합성하여 보여주는 것을 종종 볼수 있다. 이를 가능하게 하는 것이 가상이미징(virtual imaging) 기술이며, 외국에서는 가상광고(virtual advertising)로도 이용하고 있다 본고에서는 새로운 영상합성 기술로 각광받고 있는 가상이미징 시스템에 대하여 살펴 보고자 한다.

Bidirectional Dynamic Programming Based Disparity Estimation and its application to the Intermediate View Reconstruction of 3D Images (양방향 다이나믹 프로그래밍 기반 변이 추정을 이용한 3차원 영상의 중간 시점 영상 합성)

  • 배진환;김성식;손정영;손광훈
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.26 no.7B
    • /
    • pp.975-982
    • /
    • 2001
  • 본 논문에서는 3차원 영상 시스템에서 기준이 되는 좌우 영상이 있을 때 임의의 중간 시점 영상 합성 기법을 제안하였다. 제안한 기법은 양방향 다이나믹 프로그래밍 기반 변이 추정 과정과, 이를 기반으로 양방향 변이 정합과정에 의해 가려진 영역을 추출하는 과정, 그리고 완성된 변이 맵을 바탕으로 중간 시점 영상을 생성하는 과정으로 구성된다. 이중 변이 추정 과정에 제안된 양방향 다이나믹 프로그래밍 기법은, 일반적인 다이나믹 프로그래밍이 가진 장점을 살리면서, 영상 특성을 고려한 코스트 값의 사용 및 양방향 코스트 행렬 생성 방법으로 발생될 수 있는 오류를 최소화함으로써 가려진 영역을 보다 정확하게 구분해 낼 수 있었다. 이후 이러한 과정에서 생성된 변이 맵에 대해 적절한 후처리 과정으로 가려진 영역을 판별하고, 이를 기반으로 한 중간 영상 생성에서 모호한 영역을 고려하여 보다 정확하고 안정적인 결과를 얻을 수 있었다.

  • PDF

Feature-Based High Speed Image Registration With Rotation and Scale Change (크기와 회전 변화를 고려한 특징 기반 고속 영상 정합 기법)

  • Bae, Ki-Tae;Kim, Song-Gook;Lee, Chil-Woo
    • 한국HCI학회:학술대회논문집
    • /
    • 2006.02a
    • /
    • pp.1361-1366
    • /
    • 2006
  • 본 논문에서는 제약되지 않은 카메라에서 얻어진 회전과 크기 변화를 가진 영상들을 특징 기반의 보로노이 거리 매칭 방법을 이용하여 고속으로 합성 하는 기법에 관해 기술한다. 기존의 특징점 기반 매칭 기법들이 사람의 개입에 의해 영상을 정합하거나, 크기나 회전 변화를 고려하지 않은 형태의 영상들을 처리하는 것과 달리 회전이나 크기변화요소가 포함된 입력영상들을 사람의 개입이 없이 자동으로 정확한 중첩영역을 빠르게 검색하는 방법을 제안한다. 제안된 방법은 우선 영상내의 특징 점들의 위상 정보와 특징 점들 사이의 거리 정보를 가지는 보로노이 거리 정합법을 통해 대응점을 구하고, 찾아진 대응 쌍들을 이용하여 2차원 투영의 초기 변환행렬을 구한다. 다음으로 비선형 이승오차 최적화 알고리즘을 이용하여 최적의 변환 행렬을 구한 후, 마지막으로 구해진 변환 행렬을 이용하여 영상을 합성한다. 실험결과를 통해 본 논문에서 제안한 방법의 효율성을 보인다.

  • PDF

Viewpoint interpolation of face images using an ellipsoid model (타원체 MODEL을 사용한 얼굴 영상의 시점합성에 관한 연구)

  • Yoon, Na-Ree;Lee, Byung-Uk
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.32 no.6C
    • /
    • pp.572-578
    • /
    • 2007
  • To establish eye contact in video teleconferencing, it is necessary to synthesize a front view image by viewpoint interpolation. We can find the viewing direction of a user, and interpolate an image seen from that viewpoint, which will result in a face image observed from the front. There are two categories of previous research: image based method and model based method. The former is simple to calculate, however, it shows limited performance for complex objects. And the latter is robust to noise while it is computationally expensive. We propose to approximate face images as ellipses and match them to build an ellipsoid and then synthesize a new image from a given virtual camera position. We show that it is simple and robust from various experiments.

Depth Extraction of Convergent-Looking Stereo Images Based on the Human Visual System (인간시각체계에 기초한 교차시각 스테레오 영상의 깊이 추출)

  • 이적식
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.27 no.4A
    • /
    • pp.371-382
    • /
    • 2002
  • A camera model with optical axes parallel has been widely used for stereo vision applications. A pair of input ages are obtained from a convergent-looking stereo camera model based on the human visual system in this per, and each image is divided into quadrant regions with respect to the fixation point. The reasoning of quadrant partitions is based on the human visual system and is proven by a geometrical method. Image patches : constructed from the right and left stereo images. A modified cepstrum filter is applied to the patches and disparity vectors are determined by peak detection algorithm. The three-dimensional information for synthetic ages is obtained from the measured disparity and the convergent stereo camera model. It is shown that the experimental results of the proposed method for various stereo images are accurate around the fixation point like the human visual system.

Generating a Reflectance Image from a Low-Light Image Using Convolutional Neural Network (합성곱 신경망 기반 저조도영상의 반사 영상 생성)

  • Lee, Seungsoo;Choi, Changyeol;Kim, Manbae
    • Journal of Broadcast Engineering
    • /
    • v.24 no.4
    • /
    • pp.623-632
    • /
    • 2019
  • Many researches have been carried out for brightness and contrast enhancement, illumination reduction and so forth. Recently, the aforementioned hand-crafted approaches have been replaced by artificial neural networks. This paper proposes a convolutional neural network that can replace the method of generating a reflectance image where illumination component is attenuated. Experiments are carried out on 102 low-light images and we validate the feasibility of the replacement by producing satisfactory reflectance images.

Satellite Land Cover Map Generation Using Deep Learning (딥러닝을 이용한 인공위성영상의 토지피복지도 생성기술)

  • Kim, Youngeun;Lee, Hyukzae;Park, Hyoungseob;Ryu, Kwangsun;Kim, Changick
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2019.06a
    • /
    • pp.240-242
    • /
    • 2019
  • 본 논문에서는 대한민국 국토에 대한 토지피복지도를 인공위성 영상으로부터 생성하는 기술을 제안한다. 제안하는 방법은 먼저 합성곱 신경망을 이용하여 인공위성 영상의 각 패치를 4 종류의 토지 용도로 분류한다. 이후 인공위성 영상과 토지 용도 분류 결과를 조건부 랜덤 필드에 적용하여 픽셀 단위로 색상과 질감이 유사한 영역을 같은 토지 용도로 분류될 수 있도록 하여 정확한 토지피복지도를 생성한다. 현재 대한민국 국토에 대한 토지피복지도 생성을 위해 구축된 데이터 세트가 없기 때문에 본 연구에서는 합성곱 신경망 학습을 위한 데이터 세트를 직접 구축하였다. 이를 위해 환경공간정보 서비스 웹사이트로부터 인공위성 영상을 취득하고, 각 영상을 패치 단위로 나누어 토지 용도를 직접 분류하였다. 실험 결과를 통해 제안하는 토지 용도 분류 합성곱 신경망의 성능을 평가하였으며, 최종 생성된 토지피복지도는 제안하는 방법이 효과적으로 토지 용도를 분류할 수 있음을 나타낸다.

  • PDF

Enhancement of Pruning Order Determining for Immersive Video Test Model (이머시브 비디오 테스트 모델에서의 프루닝 기법의 개선)

  • Shin, Hong-Chang;Yun, Junyoung;Lee, Gwangsoon;Eum, Homin;Seo, Jungil
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2020.07a
    • /
    • pp.305-307
    • /
    • 2020
  • 이머시브 비디오 서비스를 위해 MPEG-I Visual 그룹에서는 3DoF+ 기술과 관련하여 MIV(Metadata for Immersive video)의 표준화를 진행하고 있으며, 이를 위해 다시점 영상 및 전방위 장면을 촬영한 ERP 규격의 영상들이 주어진 경우에 운동시차를 제공할 수 있는 영상 합성 레퍼런스 소프트웨어인 TMIV SW를 제공한다. TMIV는 기본적으로 송신부인 인코더와 수신부인 디코더로 구성이 되어있으며, 인코더에서 가장 중요한 기능은 다수의 입력 시점영상 간의 중복된 데이터를 찾아내서 제거하는 프루닝 과정이다. 프루닝 방법에 따라 데이터 전송량과 디코더에서의 합성 품질이 달라지기 때문에 인코더에서 핵심이라고 할 수 있다. 본 논문은 인코더의 프루닝의 효율을 높이기 위해 전체 흐름도에서 프루닝 순서 변경 과정을 추가하고 그 과정에서 시점 영상간 중첩 영역을 계산하여 이를 토대로 프루닝 순서를 결정하는 방법을 제안하였고 이를 통해 데이터 압축률이 향상됨을 확인할 수 있었고, 또한 수신부에서 영상 합성의 품질이 달라짐을 확인할 수 있었다.

  • PDF

Virtual View Rendering for 2D/3D Freeview Video Generation (2차원/3차원 자유시점 비디오 재생을 위한 가상시점 합성시스템)

  • Min, Dong-Bo;Sohn, Kwang-Hoon
    • Journal of the Institute of Electronics Engineers of Korea SP
    • /
    • v.45 no.4
    • /
    • pp.22-31
    • /
    • 2008
  • In this paper, we propose a new approach for efficient multiview stereo matching and virtual view generation, which are key technologies for 3DTV. We propose semi N-view & N-depth framework to estimate disparity maps efficiently and correctly. This framework reduces the redundancy on disparity estimation by using the information of neighboring views. The proposed method provides a user 2D/3D freeview video, and the user can select 2D/3D modes of freeview video. Experimental results show that the proposed method yields the accurate disparity maps and the synthesized novel view is satisfactory enough to provide user seamless freeview videos.