• 제목/요약/키워드: Generative Adversarial Network

검색결과 221건 처리시간 0.028초

잡음 환경에서 Generative Adversarial Network를 이용한 소리 음질 향상 (Sound Enhancement with Generative Adversarial Network under Noise Conditions)

  • 최용주;이종욱;;박대희;정용화
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 추계학술발표대회
    • /
    • pp.673-676
    • /
    • 2018
  • 4차 산업혁명이 도래하면서 정보 통신 기술 및 융합 기술의 발전에 힘입어 소리 데이터를 이용한 연구가 활발하게 진행되고 있다. 소리 데이터를 이용한 학술적 프로토타입 연구들을 실제 환경에서 운용하기 위해서는 소리 취득 시 발생하는 다양한 잡음 환경에서도 원시 데이터(raw data)에 근접한 정보를 취득할 수 있는 시스템의 강인함이 보장되어야 한다. 본 논문에서는 SEGAN(Speech Enhancement Generative Adversarial Network) 모델을 활용하여, 전처리 및 후처리 과정이 필요 없이 원시 데이터를 대상으로 하는 end-to-end 방식의 소리 음질 향상 시스템을 제안한다. 제안하는 시스템은, 축산업 분야의 돼지 호흡기 질병 소리 데이터를 이용하여 실험하였으며, 여러 가지 잡음 상황(인위적인 잡음, 실제 환경 잡음)에서 소리 음질이 개선됨을 실험적으로 검증하였다.

운전자 안정성 향상을 위한 Generative Adversarial Network 기반의 야간 도로 영상 변환 시스템 (Night-to-Day Road Image Translation with Generative Adversarial Network for Driver Safety Enhancement)

  • 안남현;강석주
    • 방송공학회논문지
    • /
    • 제23권6호
    • /
    • pp.760-767
    • /
    • 2018
  • 첨단 운전자 지원 시스템(ADAS)은 차량 기술 분야에서 활발한 연구가 이루어지고 있는 기술이다. ADAS 기술은 직접적으로 차량을 제어하는 기술과 간접적으로 운전자에게 편의를 제공하는 기술로 나뉜다. 본 논문에서는 야간 도로 영상을 보정하여 운전자에게 시각적 편의를 제공하는 시스템을 제안한다. 제안하는 시스템은 전방 블랙박스 카메라로부터 촬영된 도로 영상을 입력받는다. 입력된 영상은 가로 축을 따라 세 부분으로 분할된 뒤 일괄적으로 이미지 변환 모듈을 통해 각각 낮 영상으로 변환된다. 변환된 영상은 다시 결합된 뒤 운전자에게 제공되어 시각적 편의를 제공한다. 본 논문의 실험 결과를 통해 제안한 시스템이 기존의 밝기 변환 알고리즘과 비교하여 우수한 성능을 보임을 입증한다.

Voice Frequency Synthesis using VAW-GAN based Amplitude Scaling for Emotion Transformation

  • Kwon, Hye-Jeong;Kim, Min-Jeong;Baek, Ji-Won;Chung, Kyungyong
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권2호
    • /
    • pp.713-725
    • /
    • 2022
  • Mostly, artificial intelligence does not show any definite change in emotions. For this reason, it is hard to demonstrate empathy in communication with humans. If frequency modification is applied to neutral emotions, or if a different emotional frequency is added to them, it is possible to develop artificial intelligence with emotions. This study proposes the emotion conversion using the Generative Adversarial Network (GAN) based voice frequency synthesis. The proposed method extracts a frequency from speech data of twenty-four actors and actresses. In other words, it extracts voice features of their different emotions, preserves linguistic features, and converts emotions only. After that, it generates a frequency in variational auto-encoding Wasserstein generative adversarial network (VAW-GAN) in order to make prosody and preserve linguistic information. That makes it possible to learn speech features in parallel. Finally, it corrects a frequency by employing Amplitude Scaling. With the use of the spectral conversion of logarithmic scale, it is converted into a frequency in consideration of human hearing features. Accordingly, the proposed technique provides the emotion conversion of speeches in order to express emotions in line with artificially generated voices or speeches.

Real-time prediction of dynamic irregularity and acceleration of HSR bridges using modified LSGAN and in-service train

  • Huile Li;Tianyu Wang;Huan Yan
    • Smart Structures and Systems
    • /
    • 제31권5호
    • /
    • pp.501-516
    • /
    • 2023
  • Dynamic irregularity and acceleration of bridges subjected to high-speed trains provide crucial information for comprehensive evaluation of the health state of under-track structures. This paper proposes a novel approach for real-time estimation of vertical track dynamic irregularity and bridge acceleration using deep generative adversarial network (GAN) and vibration data from in-service train. The vehicle-body and bogie acceleration responses are correlated with the two target variables by modeling train-bridge interaction (TBI) through least squares generative adversarial network (LSGAN). To realize supervised learning required in the present task, the conventional LSGAN is modified by implementing new loss function and linear activation function. The proposed approach can offer pointwise and accurate estimates of track dynamic irregularity and bridge acceleration, allowing frequent inspection of high-speed railway (HSR) bridges in an economical way. Thanks to its applicability in scenarios of high noise level and critical resonance condition, the proposed approach has a promising prospect in engineering applications.

전자의무기록 데이터에서의 적대적 생성 알고리즘 기반 결측값 대치 알고리즘 성능분석 (Performance Evaluation of an Imputation Method based on Generative Adversarial Networks for Electric Medical Record)

  • 조용연;정민영;황보율
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.879-881
    • /
    • 2019
  • 전자의무기록 (EMR)과 같은 의료 현장에서 수집되는 대용량의 데이터는 임상 해석적으로 잠재가치가 크고 활용도가 다양하나 결측값이 많아 희소성이 크다는 한계점이 있어 분석이 어렵다. 특히 EMR의 정보수집과정에서 발생하는 결측값은 무작위적이고 임의적이어서 분석 정확도를 낮추고 예측 모델의 성능을 저하시키는 주된 요인으로 작용하기 때문에, 결측치 대체는 필수불가결하다. 최근 통상적으로 활용되어지던 통계기반 알고리즘기반의 결측치 대체 알고리즘보다는 딥러닝 기술을 활용한 알고리즘들이 새로이 등장하고 있다. 본 논문에서는 Generative Adversarial Network를 기반한 최신 결측값 대치 알고리즘인 Generative Adversarial Imputation Nets을 적용하여 EMR에서의 성능을 분석해보고자 하였다.

ESRGAN의 성능 향상을 위한 판별자 설계 공간 재검토에 관한 연구 (A Research on Re-examining Discriminator Design Space for Performance Improvement of ESRGAN)

  • 박성욱;김준영;박준;정세훈;심춘보
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.513-514
    • /
    • 2023
  • 초해상은 저해상도의 영상을 고해상도 영상으로 합성하는 기술이다. 이 기술에 딥러닝이 적용되어, 2014년에는 SRCNN(Super Resolution Convolutional Neural Network) 모델이 발표됐다. 이후에는 SRCAE(Super Resolution Convolutional Autoencoders)와 GAN(Generative Adversarial Networks)을 기반으로 한 SRGAN(Super Resolution Generative Adversarial Networks) 등, SRCNN의 성능을 능가하는 모델들이 발표됐다. ESRGAN(Enhanced Super Resolution Generative Adversarial Networks)은 SRGAN 모델의 성능을 개선했지만, 완벽한 성능을 내지 못하는 문제점이 있다. 이에 본 논문에서는 판별자(Discriminator) 구조를 변경하여 ESRGAN의 성능을 개선한다. 실험 결과, 제안하는 모델이 ESRGAN보다 더 높은 성능을 보일 것으로 기대된다.

적대적 생성 신경망을 이용한 레이더 기반 초단시간 강우예측 (Radar-based rainfall prediction using generative adversarial network)

  • 윤성심;신홍준;허재영
    • 한국수자원학회논문집
    • /
    • 제56권8호
    • /
    • pp.471-484
    • /
    • 2023
  • 적대적 생성 신경망 기반의 딥러닝 모델은 학습된 정보를 바탕으로 새로운 정보를 생성하는데 특화되어 있다. 구글 딥마인드에서 개발한 deep generative model of rain (DGMR) 모델은 대규모 레이더 이미지 데이터의 복잡한 패턴과 관계를 학습하여, 예측 레이더 이미지를 생성하는 적대적 생성 신경망 모델이다. 본 연구에서는 환경부 레이더 강우관측자료를 이용하여 DGMR 모델을 학습하고, 2021년 8월 호우사례를 대상으로 적대적 생성 신경망을 이용하여 강우예측을 수행하고 기존 예측기법들과 정확도를 비교하였다. DGMR은 대체적으로 선행 60분까지는 강우 분포 위치가 관측강우와 가장 유사하였으나, 전체 영역에서 강한 강우가 발생한 사례에서는 강우가 지속적으로 발달하는 것으로 예측하는 경향이 있었다. 통계적 평가에서도 DGMR 기법이 1시간 선행예측에서 임계성공지수 0.57~0.79, 평균절대오차 0.57~1.36 mm로 나타나 타 기법 대비 효과적인 강우예측 기법임을 보여주었다. 다만, 생성 결과의 다양성이 부족한 경우가 발생하여 예측 정확도를 저하하므로 다양성을 개선하기 위한 연구와 2시간 이상의 선행예측에 대한 정확도 개선을 위해 물리기반 수치예보모델 예측강우 자료를 이용한 보완이 필요할 것으로 판단되었다.

Experimental Analysis of Equilibrization in Binary Classification for Non-Image Imbalanced Data Using Wasserstein GAN

  • Wang, Zhi-Yong;Kang, Dae-Ki
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제11권4호
    • /
    • pp.37-42
    • /
    • 2019
  • In this paper, we explore the details of three classic data augmentation methods and two generative model based oversampling methods. The three classic data augmentation methods are random sampling (RANDOM), Synthetic Minority Over-sampling Technique (SMOTE), and Adaptive Synthetic Sampling (ADASYN). The two generative model based oversampling methods are Conditional Generative Adversarial Network (CGAN) and Wasserstein Generative Adversarial Network (WGAN). In imbalanced data, the whole instances are divided into majority class and minority class, where majority class occupies most of the instances in the training set and minority class only includes a few instances. Generative models have their own advantages when they are used to generate more plausible samples referring to the distribution of the minority class. We also adopt CGAN to compare the data augmentation performance with other methods. The experimental results show that WGAN-based oversampling technique is more stable than other approaches (RANDOM, SMOTE, ADASYN and CGAN) even with the very limited training datasets. However, when the imbalanced ratio is too small, generative model based approaches cannot achieve satisfying performance than the conventional data augmentation techniques. These results suggest us one of future research directions.

Generative Artificial Intelligence for Structural Design of Tall Buildings

  • Wenjie Liao;Xinzheng Lu;Yifan Fei
    • 국제초고층학회논문집
    • /
    • 제12권3호
    • /
    • pp.203-208
    • /
    • 2023
  • The implementation of artificial intelligence (AI) design for tall building structures is an essential solution for addressing critical challenges in the current structural design industry. Generative AI technology is a crucial technical aid because it can acquire knowledge of design principles from multiple sources, such as architectural and structural design data, empirical knowledge, and mechanical principles. This paper presents a set of AI design techniques for building structures based on two types of generative AI: generative adversarial networks and graph neural networks. Specifically, these techniques effectively master the design of vertical and horizontal component layouts as well as the cross-sectional size of components in reinforced concrete shear walls and frame structures of tall buildings. Consequently, these approaches enable the development of high-quality and high-efficiency AI designs for building structures.

A Positioning DB Generation Algorithm Applying Generative Adversarial Learning Method of Wireless Communication Signals

  • Ji, Myungin;Jeon, Juil;Cho, Youngsu
    • Journal of Positioning, Navigation, and Timing
    • /
    • 제9권3호
    • /
    • pp.151-156
    • /
    • 2020
  • A technology for calculating the position of a device is very important for users who receive positioning services, regardless of various indoor/outdoor or with/without any positioning infrastructure existence environments. One of the positioning resources widely used at present, LTE, is a typical infrastructure that can overcome the space limitation, however its positioning method based on the position of the LTE base station has low accuracy. A method of constructing a radio wave map of an LTE signal has been proposed as a method for overcoming the accuracy, but it takes a lot of time and cost to perform high-density collection in a wide area. In this paper, we describe a method of creating a high-density DB for the entire region by using vehicle-based partial collection data. To create a positioning database, we applied the idea of Generative Adversarial Network (GAN), which has recently been in the spotlight in the field of deep learning, and learned the collected data. Then, a virtually generated map which having the smallest error from the actual data is selected as the optimum DB. We verified the effectiveness of the positioning DB generation algorithm using the positioning data obtained from un-collected area.