• 제목/요약/키워드: generative learning

검색결과 285건 처리시간 0.026초

Counterfactual image generation by disentangling data attributes with deep generative models

  • Jieon Lim;Weonyoung Joo
    • Communications for Statistical Applications and Methods
    • /
    • 제30권6호
    • /
    • pp.589-603
    • /
    • 2023
  • Deep generative models target to infer the underlying true data distribution, and it leads to a huge success in generating fake-but-realistic data. Regarding such a perspective, the data attributes can be a crucial factor in the data generation process since non-existent counterfactual samples can be generated by altering certain factors. For example, we can generate new portrait images by flipping the gender attribute or altering the hair color attributes. This paper proposes counterfactual disentangled variational autoencoder generative adversarial networks (CDVAE-GAN), specialized for data attribute level counterfactual data generation. The structure of the proposed CDVAE-GAN consists of variational autoencoders and generative adversarial networks. Specifically, we adopt a Gaussian variational autoencoder to extract low-dimensional disentangled data features and auxiliary Bernoulli latent variables to model the data attributes separately. Also, we utilize a generative adversarial network to generate data with high fidelity. By enjoying the benefits of the variational autoencoder with the additional Bernoulli latent variables and the generative adversarial network, the proposed CDVAE-GAN can control the data attributes, and it enables producing counterfactual data. Our experimental result on the CelebA dataset qualitatively shows that the generated samples from CDVAE-GAN are realistic. Also, the quantitative results support that the proposed model can produce data that can deceive other machine learning classifiers with the altered data attributes.

GAN기반의 Semi Supervised Learning을 활용한 이미지 생성 및 분류 (Image generation and classification using GAN-based Semi Supervised Learning)

  • 정도윤;최광미;김남호
    • 스마트미디어저널
    • /
    • 제13권3호
    • /
    • pp.27-35
    • /
    • 2024
  • 본 연구는 GAN(Generative Adversarial Network)을 기반으로 한 Semi Supervised Learning을 활용하여 이미지 생성과 ResNet50을 이용한 이미지 분류를 결합하는 방법에 대해 다루고 있다. 이를 통해 새로운 접근법을 제시하여 이미지 생성과 분류를 통합함으로써 더 정확하고 다양한 결과를 얻을 수 있도록 하였다. 생성자와 판별자를 학습시켜 생성된 이미지와 실제 이미지를 구별하고, ResNet50을 활용하여 이미지 분류를 수행한다. 실험 결과에서는 생성된 이미지의 품질이 epoch에 따라 변화함을 확인할 수 있었으며, 이를 통해 산업재해 예측 정확성을 향상하고자 한다. 또한, GAN과 ResNet50의 결합을 통해 이미지 생성의 품질을 향상시키고 이미지 분류의 정확도를 높이는 효율적인 방법을 제시하고자 한다.

불균형 데이터 분류를 위한 딥러닝 기반 오버샘플링 기법 (A Deep Learning Based Over-Sampling Scheme for Imbalanced Data Classification)

  • 손민재;정승원;황인준
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권7호
    • /
    • pp.311-316
    • /
    • 2019
  • 분류 문제는 주어진 입력 데이터에 대해 해당 데이터의 클래스를 예측하는 문제로, 자주 쓰이는 방법 중의 하나는 주어진 데이터셋을 사용하여 기계학습 알고리즘을 학습시키는 것이다. 이런 경우 분류하고자 하는 클래스에 따른 데이터의 분포가 균일한 데이터셋이 이상적이지만, 불균형한 분포를 가지고 경우 제대로 분류하지 못하는 문제가 발생한다. 이러한 문제를 해결하기 위해 본 논문에서는 Conditional Generative Adversarial Networks(CGAN)을 활용하여 데이터 수의 균형을 맞추는 오버샘플링 기법을 제안한다. CGAN은 Generative Adversarial Networks(GAN)에서 파생된 생성 모델로, 데이터의 특징을 학습하여 실제 데이터와 유사한 데이터를 생성할 수 있다. 따라서 CGAN이 데이터 수가 적은 클래스의 데이터를 학습하고 생성함으로써 불균형한 클래스 비율을 맞추어 줄 수 있으며, 그에 따라 분류 성능을 높일 수 있다. 실제 수집된 데이터를 이용한 실험을 통해 CGAN을 활용한 오버샘플링 기법이 효과가 있음을 보이고 기존 오버샘플링 기법들과 비교하여 기존 기법들보다 우수함을 입증하였다.

GAN-based Color Palette Extraction System by Chroma Fine-tuning with Reinforcement Learning

  • Kim, Sanghyuk;Kang, Suk-Ju
    • Journal of Semiconductor Engineering
    • /
    • 제2권1호
    • /
    • pp.125-129
    • /
    • 2021
  • As the interest of deep learning, techniques to control the color of images in image processing field are evolving together. However, there is no clear standard for color, and it is not easy to find a way to represent only the color itself like the color-palette. In this paper, we propose a novel color palette extraction system by chroma fine-tuning with reinforcement learning. It helps to recognize the color combination to represent an input image. First, we use RGBY images to create feature maps by transferring the backbone network with well-trained model-weight which is verified at super resolution convolutional neural networks. Second, feature maps are trained to 3 fully connected layers for the color-palette generation with a generative adversarial network (GAN). Third, we use the reinforcement learning method which only changes chroma information of the GAN-output by slightly moving each Y component of YCbCr color gamut of pixel values up and down. The proposed method outperforms existing color palette extraction methods as given the accuracy of 0.9140.

딥러닝 기반 단일 이미지 생성적 적대 신경망 기법 비교 분석 (Deep Learning-based Single Image Generative Adversarial Network: Performance Comparison and Trends)

  • 정성훈;공경보
    • 방송공학회논문지
    • /
    • 제27권3호
    • /
    • pp.437-450
    • /
    • 2022
  • 생성적 적대 신경망(GAN, Generative Adversarial Networks)는 이미지 생성 분야에서 주목할 만한 발전을 이루었다. 하지만 큰 데이터 셋에서 불안정한 모습을 보인다는 한계 때문에 다양한 응용 분야에 쉽게 적용하기 어렵다. 단일 이미지 생성적 적대 신경망은 한장의 이미지의 내부 분포를 잘 학습하여 다양한 영상을 생성하는 분야이다. 큰 데이터셋이 아닌 단 한장만 학습함으로써 안정적인 학습이 가능하며 이미지 리타겟팅, 이미지 조작, super resolution 등 다양한 분야에 활용 가능하다. 본 논문에서는 SinGAN, ConSinGAN, InGAN, DeepSIM, 그리고 One-Shot GAN 총 다섯 개의 단일 이미지 생성적 적대 신경망을 살펴본다. 우리는 각각의 단일 이미지 생성적 적대 신경망 모델들의 성능을 비교하고 장단점을 분석한다.

PathGAN: Local path planning with attentive generative adversarial networks

  • Dooseop Choi;Seung-Jun Han;Kyoung-Wook Min;Jeongdan Choi
    • ETRI Journal
    • /
    • 제44권6호
    • /
    • pp.1004-1019
    • /
    • 2022
  • For autonomous driving without high-definition maps, we present a model capable of generating multiple plausible paths from egocentric images for autonomous vehicles. Our generative model comprises two neural networks: feature extraction network (FEN) and path generation network (PGN). The FEN extracts meaningful features from an egocentric image, whereas the PGN generates multiple paths from the features, given a driving intention and speed. To ensure that the paths generated are plausible and consistent with the intention, we introduce an attentive discriminator and train it with the PGN under a generative adversarial network framework. Furthermore, we devise an interaction model between the positions in the paths and the intentions hidden in the positions and design a novel PGN architecture that reflects the interaction model for improving the accuracy and diversity of the generated paths. Finally, we introduce ETRIDriving, a dataset for autonomous driving, in which the recorded sensor data are labeled with discrete high-level driving actions, and demonstrate the state-of-the-art performance of the proposed model on ETRIDriving in terms of accuracy and diversity.

딥러닝 훈련을 위한 GAN 기반 거짓 영상 분석효과에 대한 연구 (Effective Analsis of GAN based Fake Date for the Deep Learning Model )

  • 장승민;손승우;김봉석
    • KEPCO Journal on Electric Power and Energy
    • /
    • 제8권2호
    • /
    • pp.137-141
    • /
    • 2022
  • To inspect the power facility faults using artificial intelligence, it need that improve the accuracy of the diagnostic model are required. Data augmentation skill using generative adversarial network (GAN) is one of the best ways to improve deep learning performance. GAN model can create realistic-looking fake images using two competitive learning networks such as discriminator and generator. In this study, we intend to verify the effectiveness of virtual data generation technology by including the fake image of power facility generated through GAN in the deep learning training set. The GAN-based fake image was created for damage of LP insulator, and ResNet based normal and defect classification model was developed to verify the effect. Through this, we analyzed the model accuracy according to the ratio of normal and defective training data.

A Study on Impact of Deep Learning on Korean Economic Growth Factor

  • Dong Hwa Kim;Dae Sung Seo
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제15권4호
    • /
    • pp.90-99
    • /
    • 2023
  • This paper deals with studying strategy about impact of deep learning (DL) on the factor of Korean economic growth. To study classification of impact factors of Korean economic growth, we suggest dynamic equation of microeconomy and study methods on economic growth impact of deep learning. Next step is to suggest DL model to dynamic equation with Korean economy data with growth related factors to classify what factor is import and dominant factors to build policy and education. DL gives an influence in many areas because it can be implemented with ease as just normal editing works and speak including code development by using huge data. Currently, young generations will take a big impact on their job selection because generative AI can do well as much as humans can do it everywhere. Therefore, policy and education methods should be rearranged as new paradigm. However, government and officers do not understand well how it is serious in policy and education. This paper provides method of policy and education for AI education including generative AI through analysing many papers and reports, and experience.

확률적 자율 학습을 위한 베이지안 모델 (Bayesian Model for Probabilistic Unsupervised Learning)

  • 최준혁;김중배;김대수;임기욱
    • 한국지능시스템학회논문지
    • /
    • 제11권9호
    • /
    • pp.849-854
    • /
    • 2001
  • Bishop이 제안한 Generative Topographic Mapping(GTM)은 Kohonen이 제안한 자율 학습 신경망인 Self Organizing Maps(SOM)의 확률 버전이다. GTM은 데이터가 생성되는 확률 분포를 잠재 변수, 혹은 은닉 변수를 사용하여 모형화한다. 이것은 SOM에서는 구현될 수 없는 GTM만의 특징이며, 이러한 특징으로 인하여 SOM의 한계들을 극복할 수 있게 된다. 본 논문에서는 이러한 GTM 모형에 베이지안 학습(Bayesian learning)을 결합하여 작은 오분류율을 가지는 분류 알고리즘인 베이지안 GTM(Bayesian GTM)을 제안한다. 이 알고리즘은 기존의 GTM의 빠른 계산 처리 능력과 데이터에 대한 확률 분포, 그리고 베이지안 추론의 정확성을 이용하여 기존의 분류 알고리즘보다 우수한 결과를 얻게 된다. 본 논문에서는 기존의 분류 알고리즘에서 많이 실험하였다. 학습 데이터를 통하여 이를 확인하였다.

  • PDF

심층 학습을 활용한 가상 치아 이미지 생성 연구 -학습 횟수를 중심으로 (A Study on Virtual Tooth Image Generation Using Deep Learning - Based on the number of learning)

  • 배은정;정준호;손윤식;임중연
    • 대한치과기공학회지
    • /
    • 제42권1호
    • /
    • pp.1-8
    • /
    • 2020
  • Purpose: Among the virtual teeth generated by Deep Convolutional Generative Adversarial Networks (DCGAN), the optimal data was analyzed for the number of learning. Methods: We extracted 50 mandibular first molar occlusal surfaces and trained 4,000 epoch with DCGAN. The learning screen was saved every 50 times and evaluated on a Likert 5-point scale according to five classification criteria. Results were analyzed by one-way ANOVA and tukey HSD post hoc analysis (α = 0.05). Results: It was the highest with 83.90±6.32 in the number of group3 (2,050-3,000) learning and statistically significant in the group1 (50-1,000) and the group2 (1,050-2,000). Conclusion: Since there is a difference in the optimal virtual tooth generation according to the number of learning, it is necessary to analyze the learning frequency section in various ways.