• Title/Summary/Keyword: super 해상도

Search Result 240, Processing Time 0.032 seconds

Improvement of MIV using Deep Learning based Super Resolution (딥러닝 기반 초해상화 기술을 이용한 MIV 성능 개선)

  • TaeHyun Jeong;YoonSeob Lee;Kwan-Jung Oh;Byung Tae Oh
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2022.11a
    • /
    • pp.44-46
    • /
    • 2022
  • 본 논문에서는 TMIV 부호화 과정에서 개선된 압축성능을 위해 딥러닝을 이용한 초해상화 기술을 적용하는 방식을 제안한다. 제안 방식에서는 TMIV 인코더에서 아틀라스 생성한 후, 해당 아틀라스의 패킹된 뷰들을 downsampling하여 뷰들이 축소된 아틀라스를 생성하는 방식을 사용한다. 생성된 아틀라스는 기존의 방식 그대로 VVC를 이용하여 부복호화를 한다. 복호화된 아틀라스를 렌더링을 위해 뷰로 만드는 과정 중에 딥러닝을 이용한 초해상화 기술을 적용하여 줄어든 뷰들을 원래의 크기로 복원시킨다. 제안 기술을 통해 복원된 뷰의 화질을 유지시킨 채 많은 비트율을 감소시킬 수 있음이 확인된다.

  • PDF

Multiple Objects Detection using Super-Resolution Method with Two Discriminators (두 개의 구분자 기반의 초해상화 기법을 이용한 다중객체 검출 방법)

  • Kim, Jin-Seo;Jung, Young-Min;Hwang, Seong-Bin;Kwon, Oh-Seol
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2022.11a
    • /
    • pp.82-84
    • /
    • 2022
  • 최근 자율주행에서 안전한 주행을 위해 영상 기반 다중객체 검출 기술이 활발히 연구되고 있다. 이때, 저해상도 영상은 객체 검출 단계에서 정확도가 떨어지는 한계가 있다. 본 논문에서는 이러한 문제점을 해결하기 위해 초해상화와 객체 검출을 위한 방법을 함께 사용하는 기법을 제안한다. 더 나아가 초해상화 단계에서 하나의 구분자만 사용하는 기존의 방법과 다르게 이미지 생성 과정 중간에서 추가의 구분자를 사용하여 총 두 개의 구분자를 사용하여 성능을 향상하고자 하였다. 본 논문은 한국 고속도로 교통 데이터를 사용하여 실험하였으며, 그 결과 제안된 방법의 성능이 mAP@0.5 및 F1 점수 측면에서 기존 방법보다 우수하다는 것을 확인하였다.

  • PDF

A Study on Lightweight and Optimizing with Generative Adversarial Network Based Video Super-resolution Model (생성적 적대 신경망 기반의 딥 러닝 비디오 초 해상화 모델 경량화 및 최적화 기법 연구)

  • Kim, Dong-hwi;Lee, Su-jin;Park, Sang-hyo
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2022.06a
    • /
    • pp.1226-1228
    • /
    • 2022
  • FHD 이상을 넘어선 UHD급의 고해상도 동영상 콘텐츠의 수요 및 공급이 증가함에 따라 전반적인 산업 영역에서 네트워크 자원을 효율적으로 이용하여 동영상 콘텐츠를 제공하는 데에 관심을 두게 되었다. 기존 방법을 통한 bi-cubic, bi-linear interpolation 등의 방법은 딥 러닝 기반의 모델에 비교적 인풋 이미지의 특징을 잘 잡아내지 못하는 결과를 나타내었다. 딥 러닝 기반의 초 해상화 기술의 경우 기존 방법과 비교 시 연산을 위해 더 많은 자원을 필요로 하므로, 이러한 사용 조건에 따라 본 논문은 초 해상화가 가능한 딥 러닝 모델을 경량화 기법을 사용하여 기존에 사용된 모델보다 비교적 적은 자원을 효율적으로 사용할 수 있도록 연구 개발하는 데 목적을 두었다. 연구방법으로는 structure pruning을 이용하여 모델 자체의 구조를 경량화 하였고, 학습을 진행해야 하는 파라미터를 줄여 하드웨어 자원을 줄이는 연구를 진행했다. 또한, Residual Network의 개수를 줄여가며 PSNR, LPIPS, tOF등의 결과를 비교했다.

  • PDF

A Study on Single Image Super Resolution Using Attention Model (Attention 모델을 이용한 단일 영상 초고해상도 복원 기술)

  • Mun, Hwanbok;Yoon, Sang Min
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2020.07a
    • /
    • pp.537-539
    • /
    • 2020
  • 단일 영상 기반 초고해상도 복원은 컴퓨터 비전 및 영상처리 분야의 중요한 기초 및 응용 분야 중 하나이며, 딥러닝에 대한 연구가 발전됨에 따라 이를 이용한 다양한 연구들이 활발히 진행되고 있다. 기존 딥러닝 기반 연구들은 복원 성능을 높이기 위해서 다양한 구조의 네트워크를 설계하거나 네트워크를 학습하는 알고리즘들을 중점으로 연구되어 왔다. 최근 들어 네트워크 구조나 설계 이외에 네트워크를 통과하는 정보의 집합체인 특징 맵에 관한 연구들이 진행되고 있다. Attention은 특징 맵에서 채널 간의 관계를 이용하여 특정 채널을 강조하거나 또는 공간 정보를 강조하는 방식으로 특징 맵의 정보를 잘 활용하도록 하여 전체적인 네트워크의 성능을 향상시킨다. 본 논문은 단일 영상 기반 초고해상도 복원 네트워크를 기반으로 다양한 Attention방법들을 적용하고 성능을 비교 및 분석한다.

  • PDF

Improving License Plate Recognition Based on a Deblurring Super-Resolution Model (디블러를 고려한 초해상화 모델 기반 차량 번호판 인식 성능 개선)

  • Yeo-Jin Lee;Yong-Hyuk Moon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.05a
    • /
    • pp.473-475
    • /
    • 2023
  • 자동차 번호판 인식은 영상 내 검출한 차량의 번호판의 문자열을 인식하여 차량을 식별하고 추적하는 기술로 주변 환경에 의한 잡음, 왜곡과 차량의 움직임으로 발생한 흐림, 영상 입력 장치와의 물리적 거리 등에 강인해야 한다. 본 논문에서는 차량 움직임으로 발생한 흐림이 있는 저해상도 영상에 대한 번호판 인식 성능의 향상을 위해 디블러링 모델과 초해상화 모델을 이용한 영상 복원 방법을 제안한다. 실험을 통해 디블러링 모델과 초해상화 모델을 결합하여 흐림이 있는 저해상도 국내 번호판 영상에서의 인식 성능을 개선하였다.

Hardware Design of Super Resolution on Human Faces for Improving Face Recognition Performance of Intelligent Video Surveillance Systems (지능형 영상 보안 시스템의 얼굴 인식 성능 향상을 위한 얼굴 영역 초해상도 하드웨어 설계)

  • Kim, Cho-Rong;Jeong, Yong-Jin
    • Journal of the Institute of Electronics Engineers of Korea SD
    • /
    • v.48 no.9
    • /
    • pp.22-30
    • /
    • 2011
  • Recently, the rising demand for intelligent video surveillance system leads to high-performance face recognition systems. The solution for low-resolution images acquired by a long-distance camera is required to overcome the distance limits of the existing face recognition systems. For that reason, this paper proposes a hardware design of an image resolution enhancement algorithm for real-time intelligent video surveillance systems. The algorithm is synthesizing a high-resolution face image from an input low-resolution image, with the help of a large collection of other high-resolution face images, called training set. When we checked the performance of the algorithm at 32bit RISC micro-processor, the entire operation took about 25 sec, which is inappropriate for real-time target applications. Based on the result, we implemented the hardware module and verified it using Xilinx Virtex-4 and ARM9-based embedded processor(S3C2440A). The designed hardware can complete the whole operation within 33 msec, so it can deal with 30 frames per second. We expect that the proposed hardware could be one of the solutions not only for real-time processing at the embedded environment, but also for an easy integration with existing face recognition system.

Sampling-based Super Resolution U-net for Pattern Expression of Local Areas (국소부위 패턴 표현을 위한 샘플링 기반 초해상도 U-Net)

  • Lee, Kyo-Seok;Gal, Won-Mo;Lim, Myung-Jae
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • /
    • v.22 no.5
    • /
    • pp.185-191
    • /
    • 2022
  • In this study, we propose a novel super-resolution neural network based on U-Net, residual neural network, and sub-pixel convolution. To prevent the loss of detailed information due to the max pooling of U-Net, we propose down-sampling and connection using sub-pixel convolution. This uses all pixels in the filter, unlike the max pooling that creates a new feature map with only the max value in the filter. As a 2×2 size filter passes, it creates a feature map consisting only of pixels in the upper left, upper right, lower left, and lower right. This makes it half the size and quadruple the number of feature maps. And we propose two methods to reduce the computation. The first uses sub-pixel convolution, which has no computation, and has better performance, instead of up-convolution. The second uses a layer that adds two feature maps instead of the connection layer of the U-Net. Experiments with a banchmark dataset show better PSNR values on all scale and benchmark datasets except for set5 data on scale 2, and well represent local area patterns.

Super Multi-View 3D Display Using Liquid-Crystal Shutter Glasses and Parallax Barrier (액정 셔터 안경방식 3D 디스플레이와 패럴랙스 베리어를 이용한 초다시점 3D 디스플레이)

  • Lee, Hyun-Min;Kwon, Ki-Chul;Park, Jae-Hyeung;Kim, Sung-Kyu;Min, Sung-Wook;Kim, Nam
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.39C no.2
    • /
    • pp.130-138
    • /
    • 2014
  • In this paper, the SMV 3D display method using liquid crystal shutter glass(LCSG) and SPB has been proposed. The proposed SMV display can solve the resolution degradation problem of conventional multiview displays that using based time-multiplexing method. Also, observers fatigue due to the mismatch between accommodation and vergence problem of glass-type 3D displays and conventional multiview displays, can be improved using SMV 3D display method.

Selective labeling using image super resolution for improving the efficiency of object detection in low-resolution oriental paintings

  • Moon, Hyeyoung;Kim, Namgyu
    • Journal of the Korea Society of Computer and Information
    • /
    • v.27 no.9
    • /
    • pp.21-32
    • /
    • 2022
  • Image labeling must be preceded in order to perform object detection, and this task is considered a significant burden in building a deep learning model. Tens of thousands of images need to be trained for building a deep learning model, and human labelers have many limitations in labeling these images manually. In order to overcome these difficulties, this study proposes a method to perform object detection without significant performance degradation, even though labeling some images rather than the entire image. Specifically, in this study, low-resolution oriental painting images are converted into high-quality images using a super-resolution algorithm, and the effect of SSIM and PSNR derived in this process on the mAP of object detection is analyzed. We expect that the results of this study can contribute significantly to constructing deep learning models such as image classification, object detection, and image segmentation that require efficient image labeling.

Vehicle Detection Algorithm Using Super Resolution Based on Deep Residual Dense Block for Remote Sensing Images (원격 영상에서 심층 잔차 밀집 기반의 초고해상도 기법을 이용한 차량 검출 알고리즘)

  • Oh-Seol Kwon
    • Journal of Broadcast Engineering
    • /
    • v.28 no.1
    • /
    • pp.124-131
    • /
    • 2023
  • Object detection techniques are increasingly used to obtain information on physical characteristics or situations of a specific area from remote images. The accuracy of object detection is decreased in remote sensing images with low resolution because the low resolution reduces the amount of detail that can be captured in an image. A single neural network is proposed to joint the super-resolution method and object detection method. The proposed method constructs a deep residual-based network to restore object features in low-resolution images. Moreover, the proposed method is used to improve the performance of object detection by jointing a single network with YOLOv5. The proposed method is experimentally tested using VEDAI data for low-resolution images. The results show that vehicle detection performance improved by 81.38% on mAP@0.5 for VISIBLE data.