• 제목/요약/키워드: generative learning

검색결과 284건 처리시간 0.028초

생성적 적대 신경망을 활용한 부분 위변조 이미지 생성에 관한 연구 (A Study on Image Creation and Modification Techniques Using Generative Adversarial Neural Networks)

  • 송성헌;최봉준;문미경
    • 한국전자통신학회논문지
    • /
    • 제17권2호
    • /
    • pp.291-298
    • /
    • 2022
  • 생성적 적대 신경망(Generative Adversarial Networks, GAN)은 내부의 두 신경망(생성망, 판별망)이 상호 경쟁하면서 학습하는 네트워크이다. 생성자는 현실과 가까운 이미지를 만들고, 구분자는 생성자의 이미지를 더 잘 감별하도록 프로그래밍 되어있다. 이 기술은 전체 이미지 X를 다른 이미지 Y로 생성, 변환 및 복원하기 위해 다양하게 활용되고 있다. 본 논문에서는 원본 이미지에서 부분 이미지만 추출한 후, 이를 자연스럽게 다른 객체로 위변조할 수 있는 방법에 관해 기술한다. 먼저 원본 이미지에서 부분 이미지만 추출한 후, 기존에 학습시켜놓은 DCGAN 모델을 통해 새로운 이미지를 생성하고, 이를 전체적 스타일 전이(overall style transfer) 기술을 사용하여 원본 이미지의 질감과 크기에 어울리도록 리스타일링(re-styling) 한 후, 원본 이미지에 자연스럽게 결합하는 과정을 거친다. 본 연구를 통해 원본 이미지의 특정 부분에 사용자가 원하는 객체 이미지를 자연스럽게 추가/변형할 수 있음으로써 가짜 이미지 생성의 또 다른 활용 분야로 사용될 수 있을 것이다.

MSaGAN: Improved SaGAN using Guide Mask and Multitask Learning Approach for Facial Attribute Editing

  • Yang, Hyeon Seok;Han, Jeong Hoon;Moon, Young Shik
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권5호
    • /
    • pp.37-46
    • /
    • 2020
  • 최근 얼굴 속성 편집(facial attribute editing)의 연구는 GAN(Generative Adversarial Net)과 인코더-디코더(encoder-decoder) 구조를 활용하여 사실적인 결과를 얻고 있다. 최신 연구 중 하나인 SaGAN(Spatial attention GAN)은 공간적 주의 기제(spatial attention mechanism)를 활용하여 얼굴 영상에서 원하는 속성만을 변경할 방법을 제안하였다. 그러나 불충분한 얼굴 영역 정보로 인하여 때로 부자연스러운 결과를 얻는 경우가 발생한다. 본 논문에서는 기존 연구의 한계점을 개선하기 위하여 유도 마스크(guide mask)를 학습에 활용하고, 다중작업 학습(multitask learning) 접근을 적용한 개선된 SaGAN(MSaGAN)을 제안한다. 폭넓은 실험을 통해 마스크 손실 함수와 신경망 구조에 따른 얼굴 속성 편집의 결과를 비교하여 제안하는 방법이 기존보다 더 자연스러운 결과를 효율적으로 얻을 수 있음을 보인다.

과학수업모형의 비교 분석 및 내용과 활동 유형에 따른 적정 과학수업모형의 고안 (The Identification and Comparison of Science Teaching Models and Development of Appropriate Science Teaching Models by Types of Contents and Activities)

  • 정완호;권재술;최병순;정진우;김효남;허명
    • 한국과학교육학회지
    • /
    • 제16권1호
    • /
    • pp.13-34
    • /
    • 1996
  • The purpose of this study is to develop appropriate science teaching models which can be applied effectively to relevant situations. Five science teaching models; cognitive conflict teaching models, generative teaching model, learning cycle teaching model, hypothesis verification teaching model and discovery teaching model, were identified from the existing models. The teaching models were modified and in primary and secondary students using a nonequivalent pretest-posttest control group design. Major findings of this study were as follows: 1. For teaching science concepts, three teaching models were found more effective; cognitive conflict teaching model, generative teaching model and discovery teaching model. 2. For teaching inquiry skills, two teaching models were found more effective; learning cycle teaching model and hypothesis verification teaching model. 3. For teaching scientific attitudes, two teaching models were found more effective; learning cycle teaching models and discovery teaching model. Each teaching model requires specific learning environment. It is strongly suggested that teachers should select a suitable teaching model carefully after evaluating the learning environment including teacher and student variables, learning objectives and curricular materials.

  • PDF

적대적 생성 모델을 활용한 사용자 행위 이상 탐지 방법 (Anomaly Detection for User Action with Generative Adversarial Networks)

  • 최남웅;김우주
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.43-62
    • /
    • 2019
  • 한때, 이상 탐지 분야는 특정 데이터로부터 도출한 기초 통계량을 기반으로 이상 유무를 판단하는 방법이 지배적이었다. 이와 같은 방법론이 가능했던 이유는 과거엔 데이터의 차원이 단순하여 고전적 통계 방법이 효과적으로 작용할 수 있었기 때문이다. 하지만 빅데이터 시대에 접어들며 데이터의 속성이 복잡하게 변화함에 따라 더는 기존의 방식으로 산업 전반에 발생하는 데이터를 정확하게 분석, 예측하기 어렵게 되었다. 따라서 기계 학습 방법을 접목한 SVM, Decision Tree와 같은 모형을 활용하게 되었다. 하지만 지도 학습 기반의 모형은 훈련 데이터의 이상과 정상의 클래스 수가 비슷할 때만 테스트 과정에서 정확한 예측을 할 수 있다는 특수성이 있고 산업에서 생성되는 데이터는 대부분 정답 클래스가 불균형하기에 지도 학습 모형을 적용할 경우, 항상 예측되는 결과의 타당성이 부족하다는 문제점이 있다. 이러한 단점을 극복하고자 현재는 클래스 분포에 영향을 받지 않는 비지도 학습 기반의 모델을 바탕으로 이상 탐지 모형을 구성하여 실제 산업에 적용하기 위해 시행착오를 거치고 있다. 본 연구는 이러한 추세에 발맞춰 적대적 생성 신경망을 활용하여 이상 탐지하는 방법을 제안하고자 한다. 시퀀스 데이터를 학습시키기 위해 적대적 생성 신경망의 구조를 LSTM으로 구성하고 생성자의 LSTM은 2개의 층으로 각각 32차원과 64차원의 은닉유닛으로 구성, 판별자의 LSTM은 64차원의 은닉유닛으로 구성된 1개의 층을 사용하였다. 기존 시퀀스 데이터의 이상 탐지 논문에서는 이상 점수를 도출하는 과정에서 판별자가 실제데이터일 확률의 엔트로피 값을 사용하지만 본 논문에서는 자질 매칭 기법을 활용한 함수로 변경하여 이상 점수를 도출하였다. 또한, 잠재 변수를 최적화하는 과정을 LSTM으로 구성하여 모델 성능을 향상시킬 수 있었다. 변형된 형태의 적대적 생성 모델은 오토인코더의 비해 모든 실험의 경우에서 정밀도가 우세하였고 정확도 측면에서는 대략 7% 정도 높음을 확인할 수 있었다.

생성적 적대 신경망(Generative Adversarial Network)을 이용하여 획득한 18F-FDG Brain PET/CT 인공지능 영상의 비교평가 (Comparative Evaluation of 18F-FDG Brain PET/CT AI Images Obtained Using Generative Adversarial Network)

  • 김종완;김정열;임한상;김재삼
    • 핵의학기술
    • /
    • 제24권1호
    • /
    • pp.15-19
    • /
    • 2020
  • 본 연구는 최근에 활발히 연구되고 있는 딥러닝 기술인 생성적 적대 신경망(GAN)을 핵의학 영상에 적용하여 잠재적으로 유용성이 있는지 확인해보고자 하였다. 본원에서 18F-FDG Brain PET/CT검사를 진행한 30명의 환자를 대상으로 하였고 List모드로 15분 검사한 후 이를 1, 2, 3, 4, 5분 초기획득시간 이미지로 재구성하였다. 이 중 25명의 환자를 GAN모델의 학습을 위한 트레이닝 이미지로 사용하고 5명의 환자를 학습된 GAN모델의 검증을 위한 테스트 이미지로 사용하였다. 학습된 GAN모델에 입력으로 1, 2, 3, 4, 5분의 초기획득 이미지를 넣고 출력으로 15분 인공지능 표준획득 이미지를 획득한 후 이를 기존의 15분 표준획득시간 검사 이미지와 비교 평가하였다. 평가에는 정량화된 이미지 평가방법인 평균제곱오차, 최대신호 대 잡음비, 구조적 유사도 지수를 이용하였다. 평가 결과 초기획득시간 이미지에서 1에서 5분으로 갈수록 실제 표준획득시간 이미지에 가까운 평균제곱오차, 최대신호 대 잡음비, 구조적 유사도 지수 수치를 나타내었다. 이러한 연구를 통해 앞으로 인공지능 기술이 핵의학 분야에서 의료영상의 획득시간 단축과 관련하여 중요한 영향을 미칠 수 있을 것으로 사료된다.

Using topic modeling-based network visualization and generative AI in online discussions, how learners' perception of usability affects their reflection on feedback

  • Mingyeong JANG;Hyeonwoo LEE
    • Educational Technology International
    • /
    • 제25권1호
    • /
    • pp.1-25
    • /
    • 2024
  • This study aims to analyze the impact of learners' usability perceptions of topic modeling-based visual feedback and generative AI interpretation on reflection levels in online discussions. To achieve this, we asked 17 students in the Department of Korean language education to conduct an online discussion. Text data generated from online discussions were analyzed using LDA topic modeling to extract five clusters of related words, or topics. These topics were then visualized in a network format, and interpretive feedback was constructed through generative AI. The feedback was presented on a website and rated highly for usability, with learners valuing its information usefulness. Furthermore, an analysis using the non-parametric Mann-Whitney U test based on levels of usability perception revealed that the group with higher perceived usability demonstrated higher levels of reflection. This suggests that well-designed and user-friendly visual feedback can significantly promote deeper reflection and engagement in online discussions. The integration of topic modeling and generative AI can enhance visual feedback in online discussions, reinforcing the efficacy of such feedback in learning. The research highlights the educational significance of these design strategies and clears a path for innovation.

DIFFERENTIAL LEARNING AND ICA

  • Park, Seungjin
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 ISIS 2003
    • /
    • pp.162-165
    • /
    • 2003
  • Differential learning relies on the differentiated values of nodes, whereas the conventional learning depends on the values themselves of nodes. In this paper, I elucidate the differential learning in the framework maximum likelihood learning of linear generative model with latent variables obeying random walk. I apply the idea of differential learning to the problem independent component analysis(ICA), which leads to differential ICA. Algorithm derivation using the natural gradient and local stability analysis are provided. Usefulness of the algorithm is emphasized in the case of blind separation of temporally correlated sources and is demonstrated through a simple numerical example.

  • PDF

Semi-Supervised Recursive Learning of Discriminative Mixture Models for Time-Series Classification

  • Kim, Minyoung
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제13권3호
    • /
    • pp.186-199
    • /
    • 2013
  • We pose pattern classification as a density estimation problem where we consider mixtures of generative models under partially labeled data setups. Unlike traditional approaches that estimate density everywhere in data space, we focus on the density along the decision boundary that can yield more discriminative models with superior classification performance. We extend our earlier work on the recursive estimation method for discriminative mixture models to semi-supervised learning setups where some of the data points lack class labels. Our model exploits the mixture structure in the functional gradient framework: it searches for the base mixture component model in a greedy fashion, maximizing the conditional class likelihoods for the labeled data and at the same time minimizing the uncertainty of class label prediction for unlabeled data points. The objective can be effectively imposed as individual mixture component learning on weighted data, hence our mixture learning typically becomes highly efficient for popular base generative models like Gaussians or hidden Markov models. Moreover, apart from the expectation-maximization algorithm, the proposed recursive estimation has several advantages including the lack of need for a pre-determined mixture order and robustness to the choice of initial parameters. We demonstrate the benefits of the proposed approach on a comprehensive set of evaluations consisting of diverse time-series classification problems in semi-supervised scenarios.

A Positioning DB Generation Algorithm Applying Generative Adversarial Learning Method of Wireless Communication Signals

  • Ji, Myungin;Jeon, Juil;Cho, Youngsu
    • Journal of Positioning, Navigation, and Timing
    • /
    • 제9권3호
    • /
    • pp.151-156
    • /
    • 2020
  • A technology for calculating the position of a device is very important for users who receive positioning services, regardless of various indoor/outdoor or with/without any positioning infrastructure existence environments. One of the positioning resources widely used at present, LTE, is a typical infrastructure that can overcome the space limitation, however its positioning method based on the position of the LTE base station has low accuracy. A method of constructing a radio wave map of an LTE signal has been proposed as a method for overcoming the accuracy, but it takes a lot of time and cost to perform high-density collection in a wide area. In this paper, we describe a method of creating a high-density DB for the entire region by using vehicle-based partial collection data. To create a positioning database, we applied the idea of Generative Adversarial Network (GAN), which has recently been in the spotlight in the field of deep learning, and learned the collected data. Then, a virtually generated map which having the smallest error from the actual data is selected as the optimum DB. We verified the effectiveness of the positioning DB generation algorithm using the positioning data obtained from un-collected area.

Generative Interactive Psychotherapy Expert (GIPE) Bot

  • Ayesheh Ahrari Khalaf;Aisha Hassan Abdalla Hashim;Akeem Olowolayemo;Rashidah Funke Olanrewaju
    • International Journal of Computer Science & Network Security
    • /
    • 제23권4호
    • /
    • pp.15-24
    • /
    • 2023
  • One of the objectives and aspirations of scientists and engineers ever since the development of computers has been to interact naturally with machines. Hence features of artificial intelligence (AI) like natural language processing and natural language generation were developed. The field of AI that is thought to be expanding the fastest is interactive conversational systems. Numerous businesses have created various Virtual Personal Assistants (VPAs) using these technologies, including Apple's Siri, Amazon's Alexa, and Google Assistant, among others. Even though many chatbots have been introduced through the years to diagnose or treat psychological disorders, we are yet to have a user-friendly chatbot available. A smart generative cognitive behavioral therapy with spoken dialogue systems support was then developed using a model Persona Perception (P2) bot with Generative Pre-trained Transformer-2 (GPT-2). The model was then implemented using modern technologies in VPAs like voice recognition, Natural Language Understanding (NLU), and text-to-speech. This system is a magnificent device to help with voice-based systems because it can have therapeutic discussions with the users utilizing text and vocal interactive user experience.