• 제목/요약/키워드: GAN

검색결과 852건 처리시간 0.037초

RawNet3 화자 표현을 활용한 임의의 화자 간 음성 변환을 위한 StarGAN의 확장 (Extending StarGAN-VC to Unseen Speakers Using RawNet3 Speaker Representation)

  • 박보경;박소민;홍현기
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권7호
    • /
    • pp.303-314
    • /
    • 2023
  • 음성 변환(Voice Conversion)은 개인의 음성 데이터를 다른 사람의 음향적 특성(음조, 리듬, 성별 등)으로 재생성할 수 있는 기술로, 교육, 의사소통, 엔터테인먼트 등 다양한 분야에서 활용되고 있다. 본 논문은 StarGAN-VC 모델을 기반으로 한 접근 방식을 제안하여, 병렬 발화(Utterance) 없이도 현실적인 음성을 생성할 수 있다. 고정된 원본(source) 및 목표(target)화자 정보의 원핫 벡터(One-hot vector)를 이용하는 기존 StarGAN-VC 모델의 제약을 극복하기 위해, 본 논문에서는 사전 훈련된 Rawnet3를 사용하여 목표화자의 특징 벡터를 추출한다. 이를 통해 음성 변환은 직접적인 화자 간 매핑 없이 잠재 공간(latent space)에서 이루어져 many-to-many를 넘어서 any-to-any 구조가 가능하다. 기존 StarGAN-VC 모델에서 사용된 손실함수 외에도, Wasserstein-1 거리를 사용하여 생성된 음성 세그먼트가 목표 음성의 음향적 특성과 일치하도록 보장했다. 또한, 안정적인 훈련을 위해 Two Time-Scale Update Rule (TTUR)을 사용한다. 본 논문에서 제시한 평가 지표들을 적용한 실험 결과에 따르면, 제한된 목소리 변환만이 가능한 기존 StarGAN-VC 기법 대비, 본 논문의 제안 방법을 통해 다양한 발화자에 대한 성능이 개선된 음성 변환을 제공할 수 있음을 정량적으로 확인하였다.

소프트웨어 버그 정정에 SeqGAN 알고리즘을 적용 (Applying SeqGAN Algorithm to Software Bug Repair)

  • 양근석;이병정
    • 인터넷정보학회논문지
    • /
    • 제21권5호
    • /
    • pp.129-137
    • /
    • 2020
  • 최근 소프트웨어가 다양한 분야에 적용되면서 소프트웨어 규모와 프로그램 코드의 복잡성이 증가하였다. 이에 따라 소프트웨어 버그의 존재가 불가피하게 발생하고, 소프트웨어 유지보수의 비용이 증가하고 있다. 오픈 소스 프로젝트에서는 개발자가 할당 받은 버그 리포트를 해결할 때 많은 디버깅 시간을 소요한다. 이러한 문제를 해결하기 위해 본 논문은 SeqGAN 알고리즘을 소프트웨어 버그 정정에 적용한다. 자세히는 SeqGAN 알고리즘을 활용하여 프로그램 소스코드를 학습한다. 학습과정에서 공개된 유사 소스코드도 같이 활용한다. 생성된 후보 패치에 대한 적합성을 평가 하기 위해 적합도 함수를 적용하고, 주어진 모든 테스트 케이스를 통과하면 소프트웨어 버그 정정이 되었다고 본다. 제안한 모델의 효율성을 평가하기 위해 베이스라인과 비교하였으며, 제안한 모델이 더 잘 정정하는 것을 보였다.

TimeGAN을 활용한 트레이딩 알고리즘 선택 (Trading Algorithm Selection Using Time-Series Generative Adversarial Networks)

  • 이재윤;이주홍;최범기;송재원
    • 스마트미디어저널
    • /
    • 제11권1호
    • /
    • pp.38-45
    • /
    • 2022
  • 주식 시장에서 안정적으로 높은 수익을 얻기 위하여 많은 트레이딩 알고리즘에 대한 연구들이 이루어졌다. 트레이딩 알고리즘들이 미국 주식시장의 거래량에서 차지하는 비율은 80 프로가 넘을 정도로 많이 사용된다. 많은 연구에도 불구하고 항상 좋은 성능을 나타내는 트레이딩 알고리즘은 존재하지 않는다. 즉, 과거에 좋은 성능을 보이는 알고리즘이 미래에도 좋은 성능을 보인다는 보장이 없다. 그 이유는 주가에 영향을 주는 요인은 매우 많고, 미래의 불확실성도 존재하기 때문이다. 따라서 본 논문에서는 알고리즘들의 수익률에 대한 과거 기록을 바탕으로 미래의 수익률을 잘 예측하고 수익률도 높을 것으로 추정되는 알고리즘을 선택하는 TimeGAN을 활용한 모델을 제안한다. LSTM기법은 미래 시계열 데이터의 예측이 결정론적임에 반하여 TimeGAN은 확률적이다. TimeGAN의 확률적인 예측의 이점은 미래에 대한 불확실성을 반영하여 줄 수 있다는 점이다. 실험 결과로써, 본 논문에서 제안한 방법은 적은 변동성으로 높은 수익률을 달성하고, 여러 다수의 비교 알고리즘에 비해 우수한 결과를 보인다.

Generative Adversarial Nets 분석과 적용사례 (Generative Adversarial Nets Analysis and Applications)

  • 이준환;유지상
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2017년도 하계학술대회
    • /
    • pp.36-39
    • /
    • 2017
  • 2014 년 Ian Goodfellow 가 발표한 한편의 논문은 머신러닝 분야에 새로운 방향을 제시하였다. Generative Adversarial Networks, 일명 GAN 이라 불리는 이 논문은 이전까지 딥러닝으로 하지못했던 새로운 것을 창조해내는 작업을 하는 첫번째 딥러닝 알고리즘이다. 이전까지는 딥러닝을 통해 영상에서 객체의 종류를 판단하는 Classification 문제나, 영상에서 특정 객체를 검출하여 위치를 찾는 Object detection, 영상 내 특정 객체만 분리해내는 Image segmentation 문제를 해결하고 있었다. GAN 의 등장으로, 다양한 방면에서 GAN 을 적용하여 기존에는 하지 못했던 새로운 분야에 딥러닝을 적용한 사례들이 등장하고 있다. 본 논문에서는 GAN 의 원리 분석과 GAN 을 응용하여 여러 분야에 적용한 사례들을 살펴보고자 한다.

  • PDF

머신러닝을 활용한 자동 채색 시스템 알고리즘 비교 분석 (Comparison Analysis on Automatic Coloring System Algorithm Using Machine Learning)

  • 이송은;이지연;김나현;김진환
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 추계학술발표대회
    • /
    • pp.792-794
    • /
    • 2017
  • 현재 머신러닝(Machine Learning) 기술은 기존의 머신러닝과 조합 및 변형 되어 조금 더 발전 된 형태로 연구되어지고 있다. 따라서 수많은 알고리즘이 개발되고 있는 시점이다. 본 연구는 최근 좋은 결과로 관심을 받고있는 GAN(Generative Adversarial Net)을 중심으로 IT기술의 머신러닝과 그림을 조합하여 자동채색을 목적으로 GAN 알고리즘을 비교하고 분석하고자 한다. GAN 알고리즘들 가운데서 'Conditional GAN'과 'Wasserstein GAN'을 사용하여 자동채색을 적용시켰고, 가장 부합한 알고리즘을 찾고 성능을 비교하여 어떠한 알고리즘이 '자동채색' 목적에 더 부합한지 비교하고 판단 한다.

cGAN을 이용한 OCT 이미지의 층 분할 (Segmenting Layers of Retinal OCT Images using cGAN)

  • 권오흠;권기룡;송하주
    • 한국멀티미디어학회논문지
    • /
    • 제23권12호
    • /
    • pp.1476-1485
    • /
    • 2020
  • Segmenting OCT retinal images into layers is important to diagnose and understand the progression of retinal diseases or identify potential symptoms. The task of manually identifying these layers is a difficult task that requires a lot of time and effort even for medical professionals, and therefore, various studies are being conducted to automate this using deep learning technologies. In this paper, we use cGAN-based neural network to automatically segmenting OCT retinal images into seven terrain-type regions defined by six layer boundaries. The network is composed of a Segnet-based generator model and a discriminator model. We also proposed a dynamic programming algorithm for refining the outputs of the network. We performed experiments using public OCT image data set and compared its performance with the Segnet-only version of the network. The experimental results show that the cGAN-based network outperforms Segnet-only version.

SinGAN기반 데이터 증강과 random forest알고리즘을 이용한 고무 오링 결함 검출 시스템 (A rubber o-ring defect detection system using data augmentation based on the SinGAN and random forest algorithm)

  • 이용은;이한성;김대원;김경천
    • 한국가시화정보학회지
    • /
    • 제19권3호
    • /
    • pp.63-68
    • /
    • 2021
  • In this study, data was augmentation through the SinGAN algorithm using small image data, and defects in rubber O-rings were detected using the random forest algorithm. Unlike the commonly used data augmentation image rotation method to solve the data imbalance problem, the data imbalance problem was solved by using the SinGAN algorithm. A study was conducted to distinguish between normal products and defective products of rubber o-ring by using the random forest algorithm. A total of 20,000 image date were divided into transit and testing datasets, and an accuracy result was obtained to distinguish 97.43% defects as a result of the test.

가사의 감정 분석을 이용한 GAN 기반 댄스 공연 배경 생성 방법 (GAN-based Dance Performance Visual Background Generation Method using Emotion Analysis on Lyrics)

  • 윤혜원;곽정훈;성연식
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 춘계학술발표대회
    • /
    • pp.530-531
    • /
    • 2020
  • 최근 인공지능을 활용하여 예술 작품에 몰입할 수 있도록 무대 효과를 디자인하는 연구가 진행되고 있다. 무대 효과 중에서 무대 배경은 공연의 분위기를 형성한다. 춤의 장르별로 무대 배경에 사용되는 이미지를 생성하기 위해 소셜 미디어 기반 무대 배경 생성 시스템이 있다. 하지만 같은 장르 춤은 동일한 무대 배경 이미지가 제공되는 문제가 있다. 같은 장르의 춤이지만 노래의 분위기를 반영하여 차별된 무대 배경 이미지를 제공하는 것이 필요하다. 본 논문은 노래 가사의 감정을 활용하여 Generative Adversarial Network(GAN)을 통해 각 노래의 분위기를 고려한 무대 배경 이미지를 생성하는 방법을 제안한다. GAN은 노래에 포함된 단락별 감정 단어를 추출하여 스타일을 생성하도록 학습된다. 학습된 GAN은 노래 가사에 포함된 감정 단어를 활용하여 곡의 분위기를 반영한 무대 배경 이미지를 생성한다. 노래 가사를 고려하여 무대 배경 이미지를 생성함으로써 곡의 분위기가 고려된 무대 배경 이미지 생성이 가능하다.

Flaw Detection in LCD Manufacturing Using GAN-based Data Augmentation

  • Jingyi Li;Yan Li;Zuyu Zhang;Byeongseok Shin
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.124-125
    • /
    • 2023
  • Defect detection during liquid crystal display (LCD) manufacturing has always been a critical challenge. This study aims to address this issue by proposing a data augmentation method based on generative adversarial networks (GAN) to improve defect identification accuracy in LCD production. By leveraging synthetically generated image data from GAN, we effectively augment the original dataset to make it more representative and diverse. This data augmentation strategy enhances the model's generalization capability and robustness on real-world data. Compared to traditional data augmentation techniques, the synthetic data from GAN are more realistic, diverse and broadly distributed. Experimental results demonstrate that training models with GAN-generated data combined with the original dataset significantly improves the detection accuracy of critical defects in LCD manufacturing, compared to using the original dataset alone. This study provides an effective data augmentation approach for intelligent quality control in LCD production.

진간식풍탕(鎭肝熄風湯)이 가토(家兎)의 혈압(血壓) 및 혈청(血淸) Total Cholesterol에 미치는 영향(影響) (Effect of Chin Gan Sik Pung Tang on Blood Pressure and induced Hypercholesteremic Rabbit)

  • 김희준;임재훈
    • 대한한방내과학회지
    • /
    • 제11권1호
    • /
    • pp.109-120
    • /
    • 1990
  • In order to investigate the therapeutic effects on blood pressure and hyper cholesteremia, aqueous extract of Chin Gan Sik Pung Tang were studied. The result of the total cholesterol contents in serum and blood pressure of each group were as follows, 1. The aqueous extract of Chin Gan Sik Pung Tang inhibited increased Total cholesterol in serum of rabbits administrated with cholesterol rich diet. 2. Blood pressure manifested gradual response by the fall of 4, 3, 9.2, 19.9 percent in proportion to the administration of 10, 30, 100 mg/kg of Chin Gan Sik pung Tang, respectively 3. Administration of Chin Gan Sik Pung Tang to the rabbit pretreated with Vagotomy, Atropine and Regitine did not show any significant difference in the blood pressure, compare with that of the control group. 4. Administration of Chin Gan Sik Pung Tang to the rabbit pretreated with propranolol show significant difference in the blood pressure, compare with that of the control group. From the above results, it is suggested that Chin Gam Sik Pung Tang has the action on adrenergic ${\beta}-receptor$ and can he used therapeutic effect on the hypertension, and inhibit the increase of Total Cholesterol contents in serum.

  • PDF