• 제목/요약/키워드: generative learning

검색결과 285건 처리시간 0.027초

U-Net과 cWGAN을 이용한 탄성파 탐사 자료 보간 성능 평가 (Comparison of Seismic Data Interpolation Performance using U-Net and cWGAN)

  • 유지윤;윤대웅
    • 지구물리와물리탐사
    • /
    • 제25권3호
    • /
    • pp.140-161
    • /
    • 2022
  • 탄성파 탐사 자료 획득 시 자료의 일부가 손실되는 문제가 발생할 수 있으며 이를 위해 자료 보간이 필수적으로 수행된다. 최근 기계학습 기반 탄성파 자료 보간법 연구가 활발히 진행되고 있으며, 특히 영상처리 분야에서 이미지 초해상화에 활용되고 있는 CNN (Convolutional Neural Network) 기반 알고리즘과 GAN (Generative Adversarial Network) 기반 알고리즘이 탄성파 탐사 자료 보간법으로도 활용되고 있다. 본 연구에서는 손실된 탄성파 탐사 자료를 높은 정확도로 복구하는 보간법을 찾기 위해 CNN 기반 알고리즘인 U-Net과 GAN 기반 알고리즘인 cWGAN (conditional Wasserstein Generative Adversarial Network)을 탄성파 탐사 자료 보간 모델로 사용하여 성능 평가 및 결과 비교를 진행하였다. 이때 예측 과정을 Case I과 Case II로 나누어 모델 학습 및 성능 평가를 진행하였다. Case I에서는 규칙적으로 50% 트레이스가 손실된 자료만을 사용하여 모델을 학습하였고, 생성된 모델을 규칙/불규칙 및 샘플링 비율의 조합으로 구성된 총 6가지 테스트 자료 세트에 적용하여 모델 성능을 평가하였다. Case II에서는 6가지 테스트 자료와 동일한 형식으로 샘플링된 자료를 이용하여 해당 자료별 모델을 생성하였고, 이를 Case I과 동일한 테스트 자료 세트에 적용하여 결과를 비교하였다. 결과적으로 cWGAN이 U-Net에 비해 높은 정확도의 예측 성능을 보였으며, 정량적 평가지수인 PSNR과 SSIM에서도 cWGAN이 높은 값이 나타나는 것을 확인하였다. 하지만 cWGAN의 경우 예측 결과에서 추가적인 잡음이 생성되었으며, 잡음을 제거하고 정확도를 개선하기 위해 앙상블 작업을 수행하였다. Case II에서 생성된 cWGAN 모델들을 이용하여 앙상블을 수행한 결과, 성공적으로 잡음이 제거되었으며 PSNR과 SSIM 또한 기존의 개별 모델 보다 향상된 결과를 나타내었다.

방사선 조사선량의 최소화를 위한 생성적 적대 신경망을 활용한 복부 엑스선 영상 최적화 연구 (Optimization of Abdominal X-ray Images using Generative Adversarial Network to Realize Minimized Radiation Dose)

  • 김상우;임재동
    • 한국방사선학회논문지
    • /
    • 제17권2호
    • /
    • pp.191-199
    • /
    • 2023
  • 본 연구는 높은 관전압과 낮은 관전류로 인한 복부 영상 노이즈 발생을 BSRGAN (Deep Bline Image Super-Resolution Generative Adversarial)기법으로 보정하고, 최소화된 방사선량을 가진 촬영 조건을 제시하는 것을 목표로 하였다. 먼저 각 촬영 조건에 따른 입사표면 선량(entrance surface doses, ESD)을 측정하였고, 해당 촬영 조건들의 복부 영상을 획득한 후 그 획득한 모든 복부 영상들은 BSRGAN 기법을 통해 재구성하였다. 영상 분석방법으로는 복부의 기준 촬영 조건인 80 kVp, 320 mA의 영상과 비교 분석하였고, 그 방법으로는 평균제곱오차(mean squared error, MSE), 최대 신호 대 잡음비(peak signal-to-noise ratio, PSNR), 그리고 구조적 유사도 지수 측정(structural similarity index measure, SSIM)을 사용하였다. 또한, BSRGAN 기법으로 재구성된 복부 영상효과를 검증하기 위해 절편 신호강도 분석은 실행되었다. MSE가 가장 낮은 조사조건은 90 kVp, 125 mA와 100 kVp, 100 mA (약 0.285)이었고, PSNR은 37.694와 SSIM은 0.999로 나타났다. 그 촬영 조건들은 ESD를 약 52 ~ 53%를 감소시켰다. 게다가, 최적화된 조건들의 신호 강도의 변화는 기준 복부 영상보다 오히려 감소하였다. 이 결과는 방사선량을 크게 줄임과 동시에 기준 복부 영상과 유사한 영상을 획득할 수 있음을 의미하며, 이는 방사선방호의 원리인 ALARA 개념을 충분히 반영할 수 있음을 시사한다.

적대적 학습 기반 오토인코더(ATAE)를 이용한 다차원 상수도관망 데이터 생성 (Multidimensional data generation of water distribution systems using adversarially trained autoencoder)

  • 김세형;전상훈;정동휘
    • 한국수자원학회논문집
    • /
    • 제56권7호
    • /
    • pp.439-449
    • /
    • 2023
  • 최근 계측 기술의 발전으로 압력계와 유량계 등 다양한 센서를 설치하여 상수도관망의 상태를 효과적으로 파악할 수 있게 되었으나, 도시가 광범위하게 개발됨에 따라 계측 신뢰도에 영향을 미치는 변수는 다양해지고 있다. 특히 상수도관망 분석에 중요한 영향력을 가지는 수요 데이터의 경우 직접 계측의 난이도가 높고 결측이 발생하기 쉬운 것으로 알려져 데이터 생성의 중요도가 증가하고 있다. 본 논문에서는 상수도관망에서 누락된 데이터를 정확하게 생성하기 위해 생성적 딥러닝 모델에 기반한 적대적 학습 기반 오토인코더(ATAE) 모델을 제안한다. 제안된 모델은 판별 신경망과 생성 신경망의 두 가지 신경망의 적대적 학습을 사용하여 압력 데이터로부터 수요 데이터를 생성한다. 학습이 완료된 ATAE 모델의 생성 신경망은 관망의 계측되는 압력 데이터가 존재하는 경우, 그로부터 추정된 관망 수요 데이터를 제공할 수 있다. ATAE 모델은 미국 텍사스주 오스틴의 실제 상수도망에 적용되어 성능이 검증되었다. 수요 및 압력 시계열 데이터의 불확실성 정도에 따른 ATAE 예측 결과의 정확도를 비교하여 데이터 불확실성의 영향을 분석하였으며, 또한 수요 수준에 따른 데이터 수집 기간별 생성 결과를 비교하여 이에 따른 데이터 생성 성능을 검토하였다.

생성적 적대 신경망과 딥러닝을 활용한 이상거래탐지 시스템 모형 (Fraud Detection System Model Using Generative Adversarial Networks and Deep Learning)

  • 김예원;유예림;최홍용
    • 경영정보학연구
    • /
    • 제22권1호
    • /
    • pp.59-72
    • /
    • 2020
  • 인공지능이 다루기 어려운 개념에서 아주 익숙한 도구로 자리매김 하고 있다. 이와 더불어 금융권에서도 인공지능 기술을 도입하여 기존 시스템의 문제점을 개선하고자 하는 추세이며, 그 대표적인 예가 이상거래탐지 시스템(Fraud Detection System, FDS)이다. 결제 수단의 다양화 및 전자금융거래의 증가에 따라 치밀해져 가는 사이버 금융사기(Fraud)를 기존의 규칙기반 FDS로는 탐지하기 어려워지고 있다. 이를 극복하기 위해 딥러닝 기술을 적용하여 이상거래 탐지율을 향상시키고, 이상행위에 즉각 대응하며, 탐지 결과의 반영을 자동화하고자 하는 시도가 이루어지고 있다. 딥러닝 FDS 구축에서 핵심 문제는 데이터 불균형과 이상거래 패턴의 변동이다. 본 논문에서는 생성적 적대 신경망(Generative Adversarial Network, GAN)을 활용한 오버샘플링 기법을 통해 데이터 불균형 문제를 개선하고, 이상거래 분류기로써 심층 신경망(Deep Neural Network, DNN)과 합성곱 신경망(Convolutional Neural Network, CNN)을 적용하여 이러한 문제를 개선하고자 하였다. 실험 결과, GAN 오버샘플링이 이상거래 데이터의 불균형 문제를 개선하는데 효과를 보였으며, WGAN이 가장 높은 개선 효과가 있음을 확인하였다. 또한 제안 FDS 모형의 AUC가 0.9857로 랜덤포레스트 FDS 모형에 비해 약 6.5% 향상되어, 딥러닝이 이상거래 탐지에 뛰어난 성능을 가짐을 입증하였다. 더불어 딥러닝 모형 중 DNN은 CNN에 비해 오버샘플링의 효과를 더 잘 반영함을 확인하였다.

Waste Classification by Fine-Tuning Pre-trained CNN and GAN

  • Alsabei, Amani;Alsayed, Ashwaq;Alzahrani, Manar;Al-Shareef, Sarah
    • International Journal of Computer Science & Network Security
    • /
    • 제21권8호
    • /
    • pp.65-70
    • /
    • 2021
  • Waste accumulation is becoming a significant challenge in most urban areas and if it continues unchecked, is poised to have severe repercussions on our environment and health. The massive industrialisation in our cities has been followed by a commensurate waste creation that has become a bottleneck for even waste management systems. While recycling is a viable solution for waste management, it can be daunting to classify waste material for recycling accurately. In this study, transfer learning models were proposed to automatically classify wastes based on six materials (cardboard, glass, metal, paper, plastic, and trash). The tested pre-trained models were ResNet50, VGG16, InceptionV3, and Xception. Data augmentation was done using a Generative Adversarial Network (GAN) with various image generation percentages. It was found that models based on Xception and VGG16 were more robust. In contrast, models based on ResNet50 and InceptionV3 were sensitive to the added machine-generated images as the accuracy degrades significantly compared to training with no artificial data.

GAN을 활용한 분류 시스템에 관한 연구 (A Study on Classification System using Generative Adversarial Networks)

  • 배상중;임병연;정지학;나철훈;정회경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2019년도 춘계학술대회
    • /
    • pp.338-340
    • /
    • 2019
  • 최근 네트워크의 발달로 인해 데이터가 축적되는 속도와 크기가 증가되고 있다. 이 데이터들을 분류하는데 많은 어려움이 있는데 그 어려움 중에 하나가 라벨링의 어려움이다. 라벨링은 보통 사람이 진행하게 되는데 모든 사람이 같은 방식으로 데이터를 이해를 하는데 무리가 있어 동일한 기준으로 라벨링하는 것은 매우 어렵다는 문제가 있다. 이를 해결하기 위해 본 논문에서는 GAN을 이용하여 입력 이미지를 기반으로 새로운 이미지를 생성하고 이를 학습을 하는 데 사용을 하여 입력 데이터를 간접적으로 학습할 수 있게 구현하였다. 이를 통해 학습 데이터의 개수를 늘려 분류의 정확도를 높일 수 있을 것으로 사료된다.

  • PDF

이미지 생성 및 지도학습을 통한 전통 건축 도면 노이즈 제거 (Denoising Traditional Architectural Drawings with Image Generation and Supervised Learning)

  • 최낙관;이용식;이승재;양승준
    • 건축역사연구
    • /
    • 제31권1호
    • /
    • pp.41-50
    • /
    • 2022
  • Traditional wooden buildings deform over time and are vulnerable to fire or earthquakes. Therefore, traditional wooden buildings require continuous management and repair, and securing architectural drawings is essential for repair and restoration. Unlike modernized CAD drawings, traditional wooden building drawings scan and store hand-drawn drawings, and in this process, many noise is included due to damage to the drawing itself. These drawings are digitized, but their utilization is poor due to noise. Difficulties in systematic management of traditional wooden buildings are increasing. Noise removal by existing algorithms has limited drawings that can be applied according to noise characteristics and the performance is not uniform. This study presents deep artificial neural network based noised reduction for architectural drawings. Front/side elevation drawings, floor plans, detail drawings of Korean wooden treasure buildings were considered. First, the noise properties of the architectural drawings were learned with both a cycle generative model and heuristic image fusion methods. Consequently, a noise reduction network was trained through supervised learning using training sets prepared using the noise models. The proposed method provided effective removal of noise without deteriorating fine lines in the architectural drawings and it showed good performance for various noise types.

Selection of Three (E)UV Channels for Solar Satellite Missions by Deep Learning

  • Lim, Daye;Moon, Yong-Jae;Park, Eunsu;Lee, Jin-Yi
    • 천문학회보
    • /
    • 제46권1호
    • /
    • pp.42.2-43
    • /
    • 2021
  • We address a question of what are three main channels that can best translate other channels in ultraviolet (UV) and extreme UV (EUV) observations. For this, we compare the image translations among the nine channels of the Atmospheric Imaging Assembly on the Solar Dynamics Observatory using a deep learning model based on conditional generative adversarial networks. In this study, we develop 170 deep learning models: 72 models for single-channel input, 56 models for double-channel input, and 42 models for triple-channel input. All models have a single-channel output. Then we evaluate the model results by pixel-to-pixel correlation coefficients (CCs) within the solar disk. Major results from this study are as follows. First, the model with 131 Å shows the best performance (average CC = 0.84) among single-channel models. Second, the model with 131 and 1600 Å shows the best translation (average CC = 0.95) among double-channel models. Third, among the triple-channel models with the highest average CC (0.97), the model with 131, 1600, and 304 Å is suggested in that the minimum CC (0.96) is the highest. Interestingly they are representative coronal, photospheric, and chromospheric lines, respectively. Our results may be used as a secondary perspective in addition to primary scientific purposes in selecting a few channels of an UV/EUV imaging instrument for future solar satellite missions.

  • PDF

Image Translation of SDO/AIA Multi-Channel Solar UV Images into Another Single-Channel Image by Deep Learning

  • Lim, Daye;Moon, Yong-Jae;Park, Eunsu;Lee, Jin-Yi
    • 천문학회보
    • /
    • 제44권2호
    • /
    • pp.42.3-42.3
    • /
    • 2019
  • We translate Solar Dynamics Observatory/Atmospheric Imaging Assembly (AIA) ultraviolet (UV) multi-channel images into another UV single-channel image using a deep learning algorithm based on conditional generative adversarial networks (cGANs). The base input channel, which has the highest correlation coefficient (CC) between UV channels of AIA, is 193 Å. To complement this channel, we choose two channels, 1600 and 304 Å, which represent upper photosphere and chromosphere, respectively. Input channels for three models are single (193 Å), dual (193+1600 Å), and triple (193+1600+304 Å), respectively. Quantitative comparisons are made for test data sets. Main results from this study are as follows. First, the single model successfully produce other coronal channel images but less successful for chromospheric channel (304 Å) and much less successful for two photospheric channels (1600 and 1700 Å). Second, the dual model shows a noticeable improvement of the CC between the model outputs and Ground truths for 1700 Å. Third, the triple model can generate all other channel images with relatively high CCs larger than 0.89. Our results show a possibility that if three channels from photosphere, chromosphere, and corona are selected, other multi-channel images could be generated by deep learning. We expect that this investigation will be a complementary tool to choose a few UV channels for future solar small and/or deep space missions.

  • PDF

Denoising solar SDO/HMI magnetograms using Deep Learning

  • Park, Eunsu;Moon, Yong-Jae;Lim, Daye;Lee, Harim
    • 천문학회보
    • /
    • 제44권2호
    • /
    • pp.43.1-43.1
    • /
    • 2019
  • In this study, we apply a deep learning model to denoising solar magnetograms. For this, we design a model based on conditional generative adversarial network, which is one of the deep learning algorithms, for the image-to-image translation from a single magnetogram to a denoised magnetogram. For the single magnetogram, we use SDO/HMI line-of-sight magnetograms at the center of solar disk. For the denoised magnetogram, we make 21-frame-stacked magnetograms at the center of solar disk considering solar rotation. We train a model using 7004 paris of the single and denoised magnetograms from 2013 January to 2013 October and test the model using 1432 pairs from 2013 November to 2013 December. Our results from this study are as follows. First, our model successfully denoise SDO/HMI magnetograms and the denoised magnetograms from our model are similar to the stacked magnetograms. Second, the average pixel-to-pixel correlation coefficient value between denoised magnetograms from our model and stacked magnetogrmas is larger than 0.93. Third, the average noise level of denoised magnetograms from our model is greatly reduced from 10.29 G to 3.89 G, and it is consistent with or smaller than that of stacked magnetograms 4.11 G. Our results can be applied to many scientific field in which the integration of many frames are used to improve the signal-to-noise ratio.

  • PDF