• Title/Summary/Keyword: 복원 이미지 모델

Search Result 80, Processing Time 0.03 seconds

Adversarial Detection and Purification with GAN (적대적 공격 감지와 GAN 을 이용한 복원)

  • Junyoung Jang;Minju Ro;Junseok Kwon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2024.05a
    • /
    • pp.639-640
    • /
    • 2024
  • 인위적인 공격뿐만 아니란 현실 세계에서도 이미지에 노이즈가 추가되는 경우가 있다. 이를 해결하기 위한 많은 연구가 이루어지고 있지만, 적대적 공격에 강건한 모델은 기존의 모델에 비해 원본 이미지에 대해 정확도가 떨어진다는 문제점이 있다. 따라서 본 논문은 생성 모델을 활용하여 적대적 예제에 강건한 모듈을 제안한다. 또한, 적대적 공격을 탐지하는 모듈을 활용하여 적대적 예제뿐만 아니라 원본 이미지에 대해서도 정확도를 높이는 방법을 제안한다.

Automaitc Generation of Fashion Image Dataset by Using Progressive Growing GAN (PG-GAN을 이용한 패션이미지 데이터 자동 생성)

  • Kim, Yanghee;Lee, Chanhee;Whang, Taesun;Kim, Gyeongmin;Lim, Heuiseok
    • Journal of Internet of Things and Convergence
    • /
    • v.4 no.2
    • /
    • pp.1-6
    • /
    • 2018
  • Techniques for generating new sample data from higher dimensional data such as images have been utilized variously for speech synthesis, image conversion and image restoration. This paper adopts Progressive Growing of Generative Adversarial Networks(PG-GANs) as an implementation model to generate high-resolution images and to enhance variation of the generated images, and applied it to fashion image data. PG-GANs allows the generator and discriminator to progressively learn at the same time, continuously adding new layers from low-resolution images to result high-resolution images. We also proposed a Mini-batch Discrimination method to increase the diversity of generated data, and proposed a Sliced Wasserstein Distance(SWD) evaluation method instead of the existing MS-SSIM to evaluate the GAN model.

Considering Encoding Information for CNN based In-loop Filter in Inter Video Coding (화면 간 예측에서 인코딩 정보를 고려한 딥러닝 기반 인루프 필터)

  • Kim, Yang-Woo;Lee, Yung-Lyul
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2020.11a
    • /
    • pp.143-144
    • /
    • 2020
  • VVC (Versatile Video Coding)는 HEVC이후 차세대 표준 비디오 코딩으로 JVET(Joint Video Exploration)에 의해 2018년 표준화를 시작하였다. VVC에는 복원픽쳐의 변환-양자화에러에 의해 발생한 블로어, 블로킹, 링잉 아티팩트를 감소시키기 위하여 deblocking filter (DF), sample adaptive offset (SAO), adaptive loop filter(ALF)와 같은 모듈을 사용한다. 한편 CNN (Convolutional Neural Network)은 최근 이미지와 비디오 복원에 높은 성능을 보이고 있다. VVC에서 픽쳐는 CTU (Coding Tree Unit)으로 분할되고 각 CTU는 다시 CU (Coding Unit)으로 분할된다. 그리고 인코딩을 위한 중요한 정보들이 Picture, CTU, CU단위로 디코더에 전송된다. 이 논문에서는 화면 간 예측으로 인코딩 된 픽처에서 블록과 픽처정보를 이용한 딥러닝 기반의 인루프 필터 모델을 제안한다. 제안하는 모델은 화면 간 예측에서 QP, 4×4 블록단위의 모션벡터, 참조블록과의 시간적거리, CU의 깊이를 모델에 추가적인 정보로 이용한다.

  • PDF

Image Center Estimation Method Using Camera Rotation (카메라 회전을 이용한 이미지 센터 추정 방법)

  • Yu, Won-Pil;Chung, Yun-Koo;Bae, Young-Rae
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.04a
    • /
    • pp.721-724
    • /
    • 2002
  • 본 논문에서는 카메라 파라메타의 하나로서 이미지 센터를 구하는 방법에 대해 소개한다. 3 차원 게임, 그래픽스, 의료, 측정, 형상 복원 등의 응용에 거리 정보를 포함하는 3 차원 정보는 필수적이며 이러한 정보를 추출하기 위해서는 카메라 캘리브레이션을 반드시 거쳐야 한다. 이미지 센터는 대부분의 경우에 카메라 파라메타를 구하기 위한 모델 추정 방법에서 하나의 값으로 취급되는 경우가 많아 이미지 센터 외의 카메라 파라메타의 정확도에 영향을 받을 수 있다. 본 연구에서는 카메라 회전을 이용하여 이미지 센터만을 독립적으로 구하는 방법을 제안하며 그 편이성과 반복성, 정확도를 카메라 회전 모델링 시뮬레이션과 실험을 통해 보인다.

  • PDF

Development of Image Manipulation System based on Reconstructed Point-cloud Model (재구성된 포인트 클라우드 모델 기반 이미지 편집 시스템 개발)

  • Yoon, Hyun-Wook;Hong, Kwang-Jin
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2018.05a
    • /
    • pp.465-468
    • /
    • 2018
  • 현재 사용되고 있는 보편적인 이미지 편집 방식은 이미지 내부 일부 영역을 선택 및 추출하는 방식으로 객체를 배경과 분리한다. 객체가 분리되는 과정에서 객체가 있었던 곳에서는 빈 영역이 발생하게 되는데, 이 문제를 해결하기 위해 인접한 영역을 가져와서 채우거나, 딥러닝을 적용하여 유사한 이미지로 채우는 방식이 가장 보편적이다. 그러나 이러한 방식은 배경에서 유실된 부분을 인공적인 방법으로 채우기 때문에 완벽하게 복원하기가 힘들다. 따라서 본 논문에서는 미리 해당 이미지에 대한 3 차원 정보를 가공 및 저장함으로써 편집으로 인해 유실되는 부분을 3 차원 정보로 부터 복구할 수 있는 아이디어를 제안한다.

Development of Technique in Super Resolution domain that eliminates unnecessary Correlation information between Pixels & Channels. (픽셀, 채널간 불필요한 상호연관 정보를 제거하는 초해상화 딥러닝 기법)

  • Kang, Jung-Heum;Bae, Sung-Ho
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2020.07a
    • /
    • pp.656-659
    • /
    • 2020
  • 초해상화 딥러닝 기법은 학습 시 수렴하기까지 최소 수백 번의 에폭을 필요로 하며 오랜 시간이 걸린다. 최근, 영상 인식용 딥러닝 모델에서는 학습 수렴 속도를 향상시키기 위해 픽셀, 채널간 불필요한 상호연관 정보를 제거하는 Deconvolution 기술이 제안되었다. 본 논문에서는 최초로 Deconvolution 기술을 초해상화 딥러닝 방법에 적용하여 학습 수렴 속도 증가를 시도했다. 영상 인식 딥러닝 기법과 다르게 초해상화 딥러닝 기법은 이미지 특성 추출 부분과 이미지 복원 부분의 정보를 보존하는 것이 중요하기 때문에, EDSR을 Baseline 모델로 사용하여 양쪽 끝의 레이어는 기존의 Convolution 연산을 그대로 유지하고, 중간 레이어의 ResBlock 내의 Convolution 연산만 Deconvolution 연산으로 바꿔서 구성하였다. 초해상화 벤치마크 데이터셋을 사용한 실험 결과, 수렴속도가 빨라지지 않는 결과를 도출했다. 본 논문에서는 Deconvolution 기술이 Baseline 모델의 성능을 개선하지 못하는 이유를 초해상화 분야에서 기본적으로 적용되는 Residual Learning 기법 때문으로 분석했다.

  • PDF

A Study on the Application of ColMap in 3D Reconstruction for Cultural Heritage Restoration

  • Byong-Kwon Lee;Beom-jun Kim;Woo-Jong Yoo;Min Ahn;Soo-Jin Han
    • Journal of the Korea Society of Computer and Information
    • /
    • v.28 no.8
    • /
    • pp.95-101
    • /
    • 2023
  • Colmap is one of the innovative artificial intelligence technologies, highly effective as a tool in 3D reconstruction tasks. Moreover, it excels at constructing intricate 3D models by utilizing images and corresponding metadata. Colmap generates 3D models by merging 2D images, camera position data, depth information, and so on. Through this, it achieves detailed and precise 3D reconstructions, inclusive of objects from the real world. Additionally, Colmap provides rapid processing by leveraging GPUs, allowing for efficient operation even within large data sets. In this paper, we have presented a method of collecting 2D images of traditional Korean towers and reconstructing them into 3D models using Colmap. This study applied this technology in the restoration process of traditional stone towers in South Korea. As a result, we confirmed the potential applicability of Colmap in the field of cultural heritage restoration.

Study of three dimention image height information analysis (3차원 이미지 높이 정보 분석에 대한 연구)

  • Lee, Haeng-Jae;Hwangbo, Seong
    • Proceedings of the KIEE Conference
    • /
    • 2008.07a
    • /
    • pp.1408-1409
    • /
    • 2008
  • 3차원 복원 기술은 실세계에 존재하는 물체의 3차원 형상과 표면의 색상을 디지털화하는 기술이다. 일반적으로 가상현실, 게임, 애니메이션 등의 컴퓨터 그래픽스에 기반한 응용에서는 숙련된 디자이너가 수작업으로 3차원 모델을 제작하는데, 이는 시간이 많이 소요되고, 디자이너의 숙련도에 따라서 품질의 차이가 많은 단점이 있다. 뿐만 아니라 실세계에 존재하는 물체를 모델링할 때는 일일이 측정을 하는 과정을 거쳐야 하는 단점이 있다. 3차원 복원 기술은 이에 대한 대안으로 연구되고 있는 기술로써, 이미 많은 응용 분야에서 활용되고 있을 뿐만 아니라 새로운 서비스가 꾸준히 창출되고 있는 기술이다 이를 위하여 본 논문에서는 3차원 복원 기술의 정밀도를 높이기 위한 높이정보 분석에 대하여 연구하였다.

  • PDF

Fast Camera Pose Estimation from a Single Frame for Augmented Reality Applications (증강현실 시스템 구현을 위한 단일 프레임에서의 고속 카메라 위치추정)

  • Lee, Bum-Jong;Park, Jong-Seung;Sung, Mee-Young;Noh, Sung-Ryul
    • 한국HCI학회:학술대회논문집
    • /
    • 2006.02a
    • /
    • pp.7-14
    • /
    • 2006
  • 본 논문에서는 3D 복원과 카메라 측정과정 없이 정확하게 카메라 자세를 계산하고 가상객체를 비디오에 합성하기 위한 단일 프레임 기반의 고속 계산 기법을 제안한다. 객체의 로컬 좌표와 단일 이미지에서의 대응되는 이미지 좌표로부터 카메라 자세를 계산한다. 정사영 투영모델에서의 분해기법에 기반한 구조 계산 방법으로 카메라 자세의 고속 추정이 가능하다. 정사영 투영모델에 기반하기 때문에 참조점의 설정에 따라 정확도가 달라진다. 객체에 따라 참조점을 설정하여 정확한 카메라 자세를 계산하는 방법을 제안한다. 카메라 자세 및 물체의 형태는 단일 프레임 기반으로 수행되며 카메라 자세 추정 결과가 즉시 비디오 합성에 사용될 수 있도록 하였다. 제안하는 기법의 유효성 입증을 위해 실사 비디오에 기반한 증강현실시스템을 구현하고 카메라 자세 계산과 비디오 합성의 전체 과정을 단일 프레임에 기반하여 실험을 수행하고 제안 기법의 실용성을 보였다.

  • PDF

Glint Reconstruction Algorithm Using Homography in Gaze Tracking System (시선 추적 시스템에서의 호모그래피를 이용한 글린트 복원 알고리즘)

  • Ko, Eun-Ji;Kim, Myoung-Jun
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.18 no.10
    • /
    • pp.2417-2426
    • /
    • 2014
  • Remote gaze tracking system calculates the gaze from captured images that reflect infra-red LEDs in cornea. Glint is the point that reflect infra-red LEDs to cornea. Recently, remote gaze tracking system uses a number of IR-LEDs to make the system less prone to head movement and eliminate calibration procedure. However, in some cases, some of glints are unable to spot. In this case, it is impossible to calculate gaze. This study examines patterns of glints that are difficult to detect in remote gaze tracking system. Afterward, we propose an algorithm to reconstruct positions of missing glints that are difficult to detect using other detected glints. Based on this algorithm, we increased the number of valid image frames in gaze tracking experiments, and reduce errors of gaze tracking results by correcting glint's distortion in the reconstruction phase.