• 제목/요약/키워드: 이미지 초해상도

검색결과 50건 처리시간 0.028초

생성적 적대 신경망 기반의 딥 러닝 비디오 초 해상화 모델 경량화 및 최적화 기법 연구 (A Study on Lightweight and Optimizing with Generative Adversarial Network Based Video Super-resolution Model)

  • 김동휘;이수진;박상효
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.1226-1228
    • /
    • 2022
  • FHD 이상을 넘어선 UHD급의 고해상도 동영상 콘텐츠의 수요 및 공급이 증가함에 따라 전반적인 산업 영역에서 네트워크 자원을 효율적으로 이용하여 동영상 콘텐츠를 제공하는 데에 관심을 두게 되었다. 기존 방법을 통한 bi-cubic, bi-linear interpolation 등의 방법은 딥 러닝 기반의 모델에 비교적 인풋 이미지의 특징을 잘 잡아내지 못하는 결과를 나타내었다. 딥 러닝 기반의 초 해상화 기술의 경우 기존 방법과 비교 시 연산을 위해 더 많은 자원을 필요로 하므로, 이러한 사용 조건에 따라 본 논문은 초 해상화가 가능한 딥 러닝 모델을 경량화 기법을 사용하여 기존에 사용된 모델보다 비교적 적은 자원을 효율적으로 사용할 수 있도록 연구 개발하는 데 목적을 두었다. 연구방법으로는 structure pruning을 이용하여 모델 자체의 구조를 경량화 하였고, 학습을 진행해야 하는 파라미터를 줄여 하드웨어 자원을 줄이는 연구를 진행했다. 또한, Residual Network의 개수를 줄여가며 PSNR, LPIPS, tOF등의 결과를 비교했다.

  • PDF

재가중치 ℓ1-최소화를 통한 밀리미터파(W밴드) 전방 관측 초해상도 레이다 영상 기법 (Millimeter-Wave(W-Band) Forward-Looking Super-Resolution Radar Imaging via Reweighted ℓ1-Minimization)

  • 이혁중;전주환;송성찬
    • 한국전자파학회논문지
    • /
    • 제28권8호
    • /
    • pp.636-645
    • /
    • 2017
  • 실 개구(real-aperture)를 사용하는 스캐닝 레이다(scanning radar)는 지상을 감시하거나 재난 구조를 하는 등 폭 넓게 이용 가능하다. 그러나 스캐닝 레이다의 특성상 거리 방향의 분해능은 송신하는 신호의 대역폭에 의해 제한되며, 거리방향에 수직한 방향의 분해능은 빔 폭에 의해 결정된다. 본 논문에서는 초해상도(super-resolution) 레이다 영상 기법을 제안한다. 산란체가 스캔 영역에 드문드문 존재한다면 반사율의 분포를 sparse 신호로 간주할 수 있게 되고, '압축 감지(compressive sensing)' 문제로 수식화하는 것이 가능하다. 본 논문에서는 '재가중치 ${\ell}_1$-최소화'를 통해 2차원 레이다 이미지를 얻는다. 모의실험 결과에서는 제안하는 기법으로 얻은 이미지와 더불어 기존에 널리 쓰이는 Orthogonal Matching Pursuit(OMP), 합성 개구 레이다(Synthetic Aperture Radar : SAR)의 결과와 비교하였다.

잔여 밀집 및 채널 집중 기법을 갖는 재귀적 경량 네트워크 기반의 단일 이미지 초해상도 기법 (Single Image Super Resolution Based on Residual Dense Channel Attention Block-RecursiveSRNet)

  • 우희조;심지우;김응태
    • 방송공학회논문지
    • /
    • 제26권4호
    • /
    • pp.429-440
    • /
    • 2021
  • 최근 심층 합성 곱 신경망 학습의 발전에 따라 단일 이미지 초해상도에 적용되는 심층 학습 기법들은 좋은 성과를 보여주고 있다. 현존하는 딥러닝 기반 초해상도 기법들 중 하나로 잔여 밀집 블록을 이용하여 초기의 특징 정보를 마지막 계층에 전달하여 이후의 계층들이 이전의 계층들의 입력정보를 사용하여 복원하는 RDN(Residual Dense Network)이 있다. 하지만 계층적인 모든 특징을 연결하여 학습하고 다수의 잔여 밀집 블록을 쌓게 되면 좋은 성능에도 불구하고 많은 파라미터의 수와 연산량을 가지게 되어 느린 처리 속도와 네트워크를 학습하는데 많은 시간이 소요되고 모바일 시스템에 적용이 어렵다는 단점을 가지고 있다. 본 논문에서는 이전의 정보를 다시 사용하는 연속 메모리 구조인 잔여 밀집 구조와 이미지의 특징맵에 따라 중요도를 결정해주는 채널 집중 기법을 이용한 잔여밀집 채널 집중 블록을 재귀적인 방식으로 사용하여 추가적인 파라미터 없이 네트워크의 깊이를 늘려 큰 수용 영역을 얻으며 동시에 간결한 모델을 유지할 수 있는 방식을 제안한다. 실험 결과 제안하는 네트워크는 RDN과 비교 하였을 때 4배 확대 배율에서 평균적으로 PSNR 0.205dB만큼 낮지만 약 1.8배 더 빠른 처리속도, 약 10배 더 적은 파라미터의 수와 약 1.74배 더 적은 연산량을 갖는 것을 실험을 통해 확인하였다.

객체 탐지 및 호모그래피 추정을 이용한 안저영상 자동 조정체계 시스템 연구 (A Study on Automatic Alignment System based on Object Detection and Homography Estimation)

  • 인상규;범정현;추현승
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 춘계학술발표대회
    • /
    • pp.401-403
    • /
    • 2021
  • 본 시스템은 같은 환자로부터 촬영한 기존 안저영상과 초광각 안저영상을 Paired Dataset으로 지니고 있으며, 영상의 크기 및 해상도를 똑같이 맞추고, 황반부와 신경유두 및 혈관의 위치를 미세조정하는 과정을 자동화하는 것을 목표로 하고 있다. 이 과정은 황반부를 중심으로 하여 영상을 잘라내어 이미지의 크기를 맞추는 과정(Scaling)과, 황반부를 중심으로 잘라낸 한 쌍의 영상을 포개었을 때 황반부, 신경 유두, 혈관 등의 위치가 동일하도록 미세조정하는 과정(Warping)이 있다. Scaling Stage에선 기존 안저영상과 초광각 안저영상의 촬영범위가 현저하게 차이나기 때문에, 황반변성 부위를 잘 나타내도록 사전에 잘라낼 필요가 있으며, 이를 신경유두의 Object Detection을 활용할 예정이다. Warping Stage에선 동일한 위치에 같은 황반변성 정보가 내포되어야 하므로 규격조정 및 위치조정 과정이 필수적이며, 이후 안저영상 내의 특징들을 매칭하는 작업을 하기 위해 회전, 회절, 변환 작업 등이 이루어지며, 이는 Homography Estimation을 통하여 이미지 변환 matrix를 구하는 방법으로 진행된다. 자동조정된 안저영상 데이터는 추후에 GAN을 이용한 안저영상 생성모델을 위한 학습데이터로 이용할 예정이며, 현재로선 2500쌍의 데이터를 대상으로 실험을 진행중이지만, 최종적으로 3만 쌍의 안저영상 데이터를 목표로 하고 있다.

딥러닝 기반 임의적 스케일 초해상도 모듈을 이용한 Mask-RCNN 성능 향상 (Improvement of Mask-RCNN Performance Using Deep-Learning-Based Arbitrary-Scale Super-Resolution Module)

  • 안영필;박현준
    • 한국정보통신학회논문지
    • /
    • 제26권3호
    • /
    • pp.381-388
    • /
    • 2022
  • 인스턴스 분할에서 Mask-RCNN은 베이스 모델로 자주 사용된다. Mask-RCNN의 성능을 높이는 것은 파생된 모델에 영향을 미치기에 의미가 있다. Mask-RCNN에는 입력 이미지 크기를 배치 크기로 통일시키는 변환 모듈(transform module)이 있다. 이 논문에서는 Mask-RCNN의 성능 향상을 위해 변환 모듈의 크기 조정 부분에 딥러닝 기반 ASSR(Arbitrary-Scale Super-Resolution)을 적용하고, 스케일 정보를 모델의 IM(Integration Module)을 이용하여 주입한다. 제안하는 방법을 COCO 데이터세트에 적용하였을 때 인스턴스 분할 성능이 Mask-RCNN 성능보다 2.5 AP 높았다. 그리고 제안하는 IM 위치 최적화를 위한 실험에서는 FPN(Feature Pyramid Network)과 백본(backbone)이 결합하기 전의 'Top' 위치에 배치했을 때 가장 좋은 성능을 보였다. 따라서 제안하는 방법은 Mask-RCNN을 베이스 모델로 사용하는 모델들의 성능을 향상시킬 수 있다.

딥 러닝 기반의 초해상도 이미지 복원 기법 성능 분석 (Performance Analysis of Deep Learning-based Image Super Resolution Methods)

  • 이현재;신현광;최규상;진성일
    • 대한임베디드공학회논문지
    • /
    • 제15권2호
    • /
    • pp.61-70
    • /
    • 2020
  • Convolutional Neural Networks (CNN) have been used extensively in recent times to solve image classification and segmentation problems. However, the use of CNNs in image super-resolution problems remains largely unexploited. Filter interpolation and prediction model methods are the most commonly used algorithms in super-resolution algorithm implementations. The major limitation in the above named methods is that images become totally blurred and a lot of the edge information are lost. In this paper, we analyze super resolution based on CNN and the wavelet transform super resolution method. We compare and analyze the performance according to the number of layers and the training data of the CNN.

국가무형문화재 기록영상 화질 개선에 관한 연구 (A Study on the Video Quality Improvement of National Intangible Cultural Heritage Documentary Film)

  • 권도형;유정민
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2020년도 제62차 하계학술대회논문집 28권2호
    • /
    • pp.439-441
    • /
    • 2020
  • 본 논문에서는 국가무형문화재 기록영상의 화질 개선에 관한 연구를 진행한다. 기록영상의 화질 개선을 위해 SRGAN 기반의 초해상화 복원영상 생성 프레임워크의 적용을 제안한다. Image aumentation과 median filter를 적용한 데이터셋과 적대적 신경망인 Generative Adversarial Network (GAN)을 기반으로 딥러닝 네트워크를 구축하여 입력된 Low-Resolution 이미지를 통해 High-Resolution의 복원 영상을 생성한다. 이 연구를 통해 국가무형문화재 기록영상 뿐만 아니라 문화재 전반의 사진 및 영상 기록 자료의 품질 개선 가능성을 제시하고, 영상 기록 자료의 아카이브 구축을 통해 지속적인 활용의 기초연구가 되는 것을 목표로 한다.

  • PDF

고주파에 적합한 교차 엔트로피 손실함수에 대한 초해상도 (Super-Resolution with Cross-Entropy Loss Adapted to High Frequencies)

  • 오윤주;김태현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2024년도 춘계학술발표대회
    • /
    • pp.709-710
    • /
    • 2024
  • Super resolution에서 High-frequency Details를 개선하는 것이 최근 문제이다. 기존에는 Super resolution을 Regression task로 접근하므로써 L2 Loss를 사용하여 이미지가 흐릿하게 되었다. 이를 해결하기위해, Classification task로 바꾸므로써 Cross Entropy Loss을 적용하여 Cross-entropy Super-resolution (CS)를 설계한다. CS를 통해 선명도와 Details이 개선되지만, 저주파의 CE Loss 학습으로인한 Black Artifacts가 발생한다. 그래서, L2 Loss는 저주파와 같이 큰 신호에 더 초점을 맞추므로, 성능 개선을 위해 저주파를 L2 Loss에서, 고주파를 CE Loss에서 학습시킨 Frequency-specific Cross-entropy Super-resolution (FCS)을 제안한다. 우리는 왜곡에 강하며 Human의 인식과 유사한 측정지표인 Learned Perceptual Image Patch Similarity (LPIPS)로 평가한다. 실험한 모든 데이터 셋에서 우리의 FCS는 Baseline보다 LPIPS가 약 1.7배 정도 개선되었다.

고화질 멀티 모달 영상 합성을 통한 다중 콘텐츠 통합 애니메이션 방법 (Multicontents Integrated Image Animation within Synthesis for Hiqh Quality Multimodal Video)

  • 노재승;강진범
    • 지능정보연구
    • /
    • 제29권4호
    • /
    • pp.257-269
    • /
    • 2023
  • 최근 딥러닝 모델을 통해 사진이나 영상을 활용하여 영상 합성을 수행하는 것에 대한 요구가 높아지고 있다. 기존 영상 합성 모델의 경우 주어진 영상으로부터 모션 정보만을 전이하여 사진에 대한 애니메이션 효과를 생성하였다. 하지만 이러한 합성 모델의 경우 음성에 따른 립싱크가 불가능하다는 문제와 함께 합성 결과물의 화질이 떨어진다는 문제점이 있다. 문제를 해결하기 위해 본 논문에서는 이미지 애니메이션 기법을 기반으로 한 새로운 프레임워크에 대해 설명한다. 본 프레임워크에서는 합성하려는 사진과 영상, 그리고 오디오를 제공하면 사진의 인물 특징을 유지한 채 주어진 영상의 행동을 따라 움직이는 것뿐만 아니라 음성에 맞게 발화하는 모습도 함께 합성하여 모션 전이와 함께 립싱크를 수행한 합성 결과물을 생성한다. 또한 초해상화 기법을 영상 합성물에도 활용하여 더욱 고화질, 고해상도의 합성 결과물을 제공하도록 구성하였다.

UWB/WiFi 모듈 기반의 내시경 카메라용 무선전송 설계 (Design of UWB/WiFi Module based Wireless Transmission for Endoscopic Camera)

  • 심동하;이재곤;이재선;차재상;강민구
    • 인터넷정보학회논문지
    • /
    • 제16권1호
    • /
    • pp.1-8
    • /
    • 2015
  • 본 논문에서는 초광각 무선 내시경을 제안하고 구현하였다. 내시경은 초광각 카메라 모듈과 무선전송 모듈로 구성된다. 162도의 초광광 렌즈와 이미지 센서 및 카메라 프로세서가 $3{\times}3{\times}9cm3$ 크기의 케이스에 함께 패키지 된다. 무선전송 모듈로 UWB 기반 및 WiFi 기반의 플랫폼을 각각 구현한다. UWB 기반 모듈은 의 고화질 영상을 MJPEG로 압축하여, $2048{\times}1536$ (QXGA)의 해상도에서 15 fps의 속도로 영상을 전송하며, 최대 데이터 전송속도는 41.2 Mbps에 달한다. 구현된 내시경은 의료용 내시경의 화각과 해상도 수준을 가지며, 상용 고성능 WiFi 내시경과 비교할 때 ~3X의 화각과 16X의 해상도를 갖는다. WiFi 기반의 모듈은 $640{\times}480$ (VGA)의 해상도에서 30 fps의 속도로 영상을 스마트 기기로 스트리밍 하며, 최대 1.5 Mbps의 데이터 전송속도를 보여준다. 구현된 모듈은 저가격의 의료용 무선 전자 내시경의 구현 가능성을 보여주며, U-헬스케어, 응급처치, 가정의료, 원격진료 등에 효과적으로 활용될 수 있을 것으로 기대된다.