• 제목/요약/키워드: GAN(Generative Adversarial Network

검색결과 176건 처리시간 0.031초

GAN-based shadow removal using context information

  • Yoon, Hee-jin;Kim, Kang-jik;Chun, Jun-chul
    • 인터넷정보학회논문지
    • /
    • 제20권6호
    • /
    • pp.29-36
    • /
    • 2019
  • When dealing with outdoor images in a variety of computer vision applications, the presence of shadow degrades performance. In order to understand the information occluded by shadow, it is essential to remove the shadow. To solve this problem, in many studies, involves a two-step process of shadow detection and removal. However, the field of shadow detection based on CNN has greatly improved, but the field of shadow removal has been difficult because it needs to be restored after removing the shadow. In this paper, it is assumed that shadow is detected, and shadow-less image is generated by using original image and shadow mask. In previous methods, based on CGAN, the image created by the generator was learned from only the aspect of the image patch in the adversarial learning through the discriminator. In the contrast, we propose a novel method using a discriminator that judges both the whole image and the local patch at the same time. We not only use the residual generator to produce high quality images, but we also use joint loss, which combines reconstruction loss and GAN loss for training stability. To evaluate our approach, we used an ISTD datasets consisting of a single image. The images generated by our approach show sharp and restored detailed information compared to previous methods.

사용자 인식을 위한 가상 심전도 신호 생성 기술에 관한 연구 (A Study on the Synthetic ECG Generation for User Recognition)

  • 김민구;김진수;반성범
    • 스마트미디어저널
    • /
    • 제8권4호
    • /
    • pp.33-37
    • /
    • 2019
  • 심전도 신호는 시간 및 환경 변화에 따라 측정되는 시계열 데이터로 매번 등록 데이터와 동일한 크기의 비교 데이터를 취득해야 하는 문제점이 발생한다. 본 논문에서는 신호 크기 부적합 문제를 해결하기 위해 가상 생체신호 생성을 위한 보조 분류기 기반 적대적 생성 신경망(Auxiliary Classifier Generative Adversarial Networks)의 네트워크 모델을 제안한다. 생성된 가상 생체신호의 유사성을 확인하기 위해 코사인 각도와 교차 상관관계를 이용하였다. 실험 결과, 코사인 유사도 측정 결과로 평균 유사도는 0.991의 결과를 나타냈으며, 교차 상관관계를 이용한 유클리디언 거리 기반 유사성 측정 결과는 평균 0.25 유사도 결과를 나타냈다. 이는 등록 데이터와 실험 데이터간의 크기가 일치하지 않더라도 가상 생체신호 생성을 통해 신호 크기 부적합 문제를 해결함을 확인하였다.

적대적 생성 신경망을 이용한 문법 오류 교정 (Grammatical Error Correction Using Generative Adversarial Network)

  • 권순철;유환조;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.488-491
    • /
    • 2019
  • 문법 오류 교정은 문법적으로 오류가 있는 문장을 입력 받아 오류를 교정하는 시스템이다. 문법 오류 교정을 위해서는 문법 오류를 제거하는 것과 더불어 자연스러운 문장을 생성하는 것이 중요하다. 이 연구는 적대적 생성 신경망(GAN)을 이용하여 정답 문장과 구분이 되지 않을 만큼 자연스러운 문장을 생성하는 것을 목적으로 한다. 실험 결과 GAN을 이용한 문법 오류 교정은 MaxMatch F0.5 score 기준으로 0.4942을 달성하여 Baseline의 0.4462보다 높은 성능을 기록했다.

  • PDF

3D 탑 복셀화를 통한 형상화 인공지능 알고리즘에 대한 연구 (A study on artificial intelligence algorithm for imagery through 3D pagoda voxelization)

  • 김범준;이병권
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제67차 동계학술대회논문집 31권1호
    • /
    • pp.323-324
    • /
    • 2023
  • 본 논문에서는 다양한 복원 인공지능 알고리즘 중 하나인 3차원 복원 기술은 실제로 존재하는 물체의 2차원적인 픽셀을 3차원의 형태로 구현하여 형상화한다. 정확한 3차원 정보 처리가 요구됨에 따라 포인트 클라우드로 표현되는 데이터를 통해 정확한 쿨체의 크기 정보나 좌표 정보를 표시할 수 있다. 데이터의 픽셀을 분석하여 3차원의 형태로 구현할 것을 정의하는 복셀화(Voxelization) 알고리즘 전처리 과정을 통해 3차원 복원 기술 3D-GAN 활용으로 3차원 형태 형상화를 하였다. 본 논문에서는 3차원 복원 알고리즘 통하여 2차원 포인트 클라우드를 분석해 3차원 형태로 복원하는 기술에 대한 설명한다.

  • PDF

적대적 생성 신경망과 장단기 메모리셀을 이용한 낙상 검출 (Fall detection based on GAN and LSTM)

  • 신효진;우지영
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제67차 동계학술대회논문집 31권1호
    • /
    • pp.21-22
    • /
    • 2023
  • 본 논문에서는 낙상과 비낙상 구별을 위한 분류 모델을 제안한다. 일상생활과 낙상을 구분해 내는 것은 낙상이 발생하기 이전에 감지하고 사고를 예방할 수 있다. 낙상은 일상생활 중 일어나기 쉬우며, 노인들에게는 골절 및 기관 파열 등과 같은 심각한 부상을 초래할 수 있기 때문에 낙상 방지를 위한 낙상과 비낙상 행동의 구분은 중요한 문제이다. 따라서 실시간으로 수집되는 다양한 활동에서의 센서 데이터를 활용하여 낙상과 비낙상의 행동을 구분하였다.

  • PDF

Dog-Species Classification through CycleGAN and Standard Data Augmentation

  • Chan, Park;Nammee, Moon
    • Journal of Information Processing Systems
    • /
    • 제19권1호
    • /
    • pp.67-79
    • /
    • 2023
  • In the image field, data augmentation refers to increasing the amount of data through an editing method such as rotating or cropping a photo. In this study, a generative adversarial network (GAN) image was created using CycleGAN, and various colors of dogs were reflected through data augmentation. In particular, dog data from the Stanford Dogs Dataset and Oxford-IIIT Pet Dataset were used, and 10 breeds of dog, corresponding to 300 images each, were selected. Subsequently, a GAN image was generated using CycleGAN, and four learning groups were established: 2,000 original photos (group I); 2,000 original photos + 1,000 GAN images (group II); 3,000 original photos (group III); and 3,000 original photos + 1,000 GAN images (group IV). The amount of data in each learning group was augmented using existing data augmentation methods such as rotating, cropping, erasing, and distorting. The augmented photo data were used to train the MobileNet_v3_Large, ResNet-152, InceptionResNet_v2, and NASNet_Large frameworks to evaluate the classification accuracy and loss. The top-3 accuracy for each deep neural network model was as follows: MobileNet_v3_Large of 86.4% (group I), 85.4% (group II), 90.4% (group III), and 89.2% (group IV); ResNet-152 of 82.4% (group I), 83.7% (group II), 84.7% (group III), and 84.9% (group IV); InceptionResNet_v2 of 90.7% (group I), 88.4% (group II), 93.3% (group III), and 93.1% (group IV); and NASNet_Large of 85% (group I), 88.1% (group II), 91.8% (group III), and 92% (group IV). The InceptionResNet_v2 model exhibited the highest image classification accuracy, and the NASNet_Large model exhibited the highest increase in the accuracy owing to data augmentation.

적대적생성신경망을 이용한 연안 파랑 비디오 영상에서의 빗방울 제거 및 배경 정보 복원 (Raindrop Removal and Background Information Recovery in Coastal Wave Video Imagery using Generative Adversarial Networks)

  • 허동;김재일;김진아
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제25권5호
    • /
    • pp.1-9
    • /
    • 2019
  • 본 논문에서는 강우시 빗방울로 인해 왜곡된 연안 파랑 비디오 영상에서 빗방울 제거와 제거된 영역에 대한 배경 정보를 복원하기 위한 적대적생성신경망을 이용한 영상 강화 방법을 제안하고자 한다. 영상 변환에 널리 사용되는 Pix2Pix 네트워크와 현재 단일 이미지에 대한 빗방울 제거에 좋은 성능을 보여주고 있는 Attentive GAN을 실험 대상 모델로 구현하고, 빗방울 제거를 위한 공개 데이터 셋을 이용하여 두 모델을 학습한 후 빗방울 왜곡 연안 파랑 영상의 빗방울 제거 및 배경 정보 복원 성능을 평가하였다. 연안 파랑 비디오에 영상에 대한 빗방울 왜곡 보정 성능을 향상시키기 위해 실제 연안에서 빗방울 유무가 짝을 이룬 데이터 셋을 직접 획득한 후 사전 학습된 모델에 대하여 전이 학습에 사용하여 빗방울 왜곡 보정에 대한 성능 향상을 확인하였다. 모델의 성능은 빗방울 왜곡 영상으로부터 파랑 정보 복원 성능을 최대 신호 대 잡음비와 구조적 유사도를 이용하여 평가하였으며, 전이 학습을 통해 파인 튜닝된 Pix2Pix 모델이 연안 파랑 비디오 영상의 빗방울 왜곡에 대한 가장 우수한 복원 성능을 보였다.

푸리에 변환 및 이미지 증강을 통한 분류 성능 최적화에 관한 연구 (A Study on Optimization of Classification Performance through Fourier Transform and Image Augmentation)

  • 김기현;김성목;김용수
    • 품질경영학회지
    • /
    • 제51권1호
    • /
    • pp.119-129
    • /
    • 2023
  • Purpose: This study proposes a classification model for implementing condition-based maintenance (CBM) by monitoring the real-time status of a machine using acceleration sensor data collected from a vehicle. Methods: The classification model's performance was improved by applying Fourier transform to convert the acceleration sensor data from the time domain to the frequency domain. Additionally, the Generative Adversarial Network (GAN) algorithm was used to augment images and further enhance the classification model's performance. Results: Experimental results demonstrate that the GAN algorithm can effectively serve as an image augmentation technique to enhance the performance of the classification model. Consequently, the proposed approach yielded a significant improvement in the classification model's accuracy. Conclusion: While this study focused on the effectiveness of the GAN algorithm as an image augmentation method, further research is necessary to compare its performance with other image augmentation techniques. Additionally, it is essential to consider the potential for performance degradation due to class imbalance and conduct follow-up studies to address this issue.

GAN 기반 의료영상 생성 모델에 대한 품질 및 다양성 평가 및 분석 (Assessment and Analysis of Fidelity and Diversity for GAN-based Medical Image Generative Model)

  • 장유진;유재준;홍헬렌
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제28권2호
    • /
    • pp.11-19
    • /
    • 2022
  • 최근 의료영상의 발전에 따라 의료 영상 생성에 대한 다양한 연구가 제안되고 있는데, 이와 관련하여 생성된 의료 영상의 품질과 다양성을 정확하게 평가하는 것이 중요해지고 있다. 생성된 의료 영상을 평가하는 방법으로는 전문가의 시각적 튜링 테스트(visual turing test), 특징 분포 시각화, IS, FID를 통한 정량적 평가를 통해 평가하고 있으나 의료 영상을 품질(fidelity)과 다양성(diversity) 측면에서 정량적으로 평가 하는 방법은 거의 이루어지고 있지 않다. 본 논문에서는 DCGAN과 PGGAN 생성 모델을 통해 비소세포폐암 환자의 흉부 CT 데이터 셋을 학습하여 영상을 생성하고, 이를 품질(fidelity)과 다양성(diversity) 측면에서 두 생성 모델의 성능을 평가한다. 1차원 점수 기반 평가방법인 IS, FID와 2차원 점수 기반 평가방법인 Precision 및 Recall, 개선된 Precision 및 Recall을 통해 성능을 정량적으로 평가하고, 의료영상에서의 각 평가방법들의 특징과 한계점에 대해서도 분석한다.

Waste Classification by Fine-Tuning Pre-trained CNN and GAN

  • Alsabei, Amani;Alsayed, Ashwaq;Alzahrani, Manar;Al-Shareef, Sarah
    • International Journal of Computer Science & Network Security
    • /
    • 제21권8호
    • /
    • pp.65-70
    • /
    • 2021
  • Waste accumulation is becoming a significant challenge in most urban areas and if it continues unchecked, is poised to have severe repercussions on our environment and health. The massive industrialisation in our cities has been followed by a commensurate waste creation that has become a bottleneck for even waste management systems. While recycling is a viable solution for waste management, it can be daunting to classify waste material for recycling accurately. In this study, transfer learning models were proposed to automatically classify wastes based on six materials (cardboard, glass, metal, paper, plastic, and trash). The tested pre-trained models were ResNet50, VGG16, InceptionV3, and Xception. Data augmentation was done using a Generative Adversarial Network (GAN) with various image generation percentages. It was found that models based on Xception and VGG16 were more robust. In contrast, models based on ResNet50 and InceptionV3 were sensitive to the added machine-generated images as the accuracy degrades significantly compared to training with no artificial data.