• 제목/요약/키워드: Generative Model

검색결과 351건 처리시간 0.026초

생성적 대립쌍 신경망을 이용한 깊이지도 기반 연무제거 (Single Image Dehazing Based on Depth Map Estimation via Generative Adversarial Networks)

  • 왕야오;정우진;문영식
    • 인터넷정보학회논문지
    • /
    • 제19권5호
    • /
    • pp.43-54
    • /
    • 2018
  • 연무가 있는 상황에서 촬영된 영상은 낮은 대비로 인해 시인성이 낮아지는 문제가 있다. 이렇게 연무로 인해 흐릿한 영상에서 연무의 효과를 제거하는 과정을 연무제거라고 한다. 연무제거에서 가장 중요한 문제 중 하나는 전달지도 (transmission map) 또는 깊이지도 (depth map)를 정확하게 추정하는 것이다. 본 논문에서는 정확한 깊이지도 추정을 위해 생성적 대립쌍 신경망 (Generative Adversarial Network: GAN)을 이용한 정확한 깊이 영상 추정 방법을 제안한다. 제안된 GAN 모델은 흐릿한 입력영상과 이에 상응하는 깊이지도 간의 비선형 매핑을 학습한다. 그리고 연무제거단계에서는 훈련된 모델을 사용하여 입력영상의 깊이지도를 추정하고 이것을 전달지도를 계산하는데 사용한다. 이어서 guided filter를 사용하여 전달지도를 다듬는다. 마지막으로 대기 산란 모델을 기반으로 연무가 제거된 영상을 복원한다. 제안된 GAN 모델은 합성실내영상으로 훈련되었다. 하지만 실제 연무영상에 대해서도 적용할 수 있다. 이를 실험을 통해 증명하였다. 또한 실험에서 제안된 방법이 이전에 연구된 방법에 비해 시각적 및 정량적 측면에서 우수한 결과를 나타냈다.

생성적 적대 신경망(Generative Adversarial Network)을 이용하여 획득한 18F-FDG Brain PET/CT 인공지능 영상의 비교평가 (Comparative Evaluation of 18F-FDG Brain PET/CT AI Images Obtained Using Generative Adversarial Network)

  • 김종완;김정열;임한상;김재삼
    • 핵의학기술
    • /
    • 제24권1호
    • /
    • pp.15-19
    • /
    • 2020
  • 본 연구는 최근에 활발히 연구되고 있는 딥러닝 기술인 생성적 적대 신경망(GAN)을 핵의학 영상에 적용하여 잠재적으로 유용성이 있는지 확인해보고자 하였다. 본원에서 18F-FDG Brain PET/CT검사를 진행한 30명의 환자를 대상으로 하였고 List모드로 15분 검사한 후 이를 1, 2, 3, 4, 5분 초기획득시간 이미지로 재구성하였다. 이 중 25명의 환자를 GAN모델의 학습을 위한 트레이닝 이미지로 사용하고 5명의 환자를 학습된 GAN모델의 검증을 위한 테스트 이미지로 사용하였다. 학습된 GAN모델에 입력으로 1, 2, 3, 4, 5분의 초기획득 이미지를 넣고 출력으로 15분 인공지능 표준획득 이미지를 획득한 후 이를 기존의 15분 표준획득시간 검사 이미지와 비교 평가하였다. 평가에는 정량화된 이미지 평가방법인 평균제곱오차, 최대신호 대 잡음비, 구조적 유사도 지수를 이용하였다. 평가 결과 초기획득시간 이미지에서 1에서 5분으로 갈수록 실제 표준획득시간 이미지에 가까운 평균제곱오차, 최대신호 대 잡음비, 구조적 유사도 지수 수치를 나타내었다. 이러한 연구를 통해 앞으로 인공지능 기술이 핵의학 분야에서 의료영상의 획득시간 단축과 관련하여 중요한 영향을 미칠 수 있을 것으로 사료된다.

적대적 생성 신경망과 딥러닝을 이용한 교량 상판의 균열 감지 (Crack Detection on Bridge Deck Using Generative Adversarial Networks and Deep Learning)

  • 지봉준
    • 한국건설순환자원학회논문집
    • /
    • 제9권3호
    • /
    • pp.303-310
    • /
    • 2021
  • 교량의 균열은 교량의 상태를 나타내는 중요한 요소이며 주기적인 모니터링 대상이다. 그러나 전문가가 육안으로 점검하는 것은 비용, 시간, 신뢰성 면에서 문제가 있다. 따라서 최근에는 이러한 문제를 극복하기 위해 자동화 가능한 딥러닝 모델을 적용하기 위한 연구가 시작되었다. 딥러닝 모델은 예측할 상황에 대한 충분한 데이터가 필요하지만 교량 균열 데이터는 상대적으로 얻기가 어렵다. 특히 교량의 설계, 위치, 공법에 따라 교량 균열의 형상이 달라질 수 있어 특정 상황에서 많은 양의 균열 데이터를 수집하기 어려움이 따른다. 본 연구에서는 적대적 생성 신경망(Generative Adversarial Network, GAN)을 통해 불충분한 균열 데이터를 생성하고 학습하는 균열 탐지 모델을 개발했다. 본 연구에서는 GAN을 이용하여 주어진 균열 데이터와 통계적으로 유사한 데이터를 성공적으로 생성했으며, 생성된 이미지를 사용하지 않을 때보다 생성된 이미지를 사용할 때 약 3% 더 높은 정확도로 균열 감지가 가능했다. 이러한 접근 방식은 교량의 균열 검출이 필요하지만 균열 데이터는 충분하지 않거나 하나의 클래스에 대한 데이터가 상대적으로 적을 때 감지 모델의 성능을 효과적으로 향상시킬 것으로 기대된다.

적대적 학습 기반 오토인코더(ATAE)를 이용한 다차원 상수도관망 데이터 생성 (Multidimensional data generation of water distribution systems using adversarially trained autoencoder)

  • 김세형;전상훈;정동휘
    • 한국수자원학회논문집
    • /
    • 제56권7호
    • /
    • pp.439-449
    • /
    • 2023
  • 최근 계측 기술의 발전으로 압력계와 유량계 등 다양한 센서를 설치하여 상수도관망의 상태를 효과적으로 파악할 수 있게 되었으나, 도시가 광범위하게 개발됨에 따라 계측 신뢰도에 영향을 미치는 변수는 다양해지고 있다. 특히 상수도관망 분석에 중요한 영향력을 가지는 수요 데이터의 경우 직접 계측의 난이도가 높고 결측이 발생하기 쉬운 것으로 알려져 데이터 생성의 중요도가 증가하고 있다. 본 논문에서는 상수도관망에서 누락된 데이터를 정확하게 생성하기 위해 생성적 딥러닝 모델에 기반한 적대적 학습 기반 오토인코더(ATAE) 모델을 제안한다. 제안된 모델은 판별 신경망과 생성 신경망의 두 가지 신경망의 적대적 학습을 사용하여 압력 데이터로부터 수요 데이터를 생성한다. 학습이 완료된 ATAE 모델의 생성 신경망은 관망의 계측되는 압력 데이터가 존재하는 경우, 그로부터 추정된 관망 수요 데이터를 제공할 수 있다. ATAE 모델은 미국 텍사스주 오스틴의 실제 상수도망에 적용되어 성능이 검증되었다. 수요 및 압력 시계열 데이터의 불확실성 정도에 따른 ATAE 예측 결과의 정확도를 비교하여 데이터 불확실성의 영향을 분석하였으며, 또한 수요 수준에 따른 데이터 수집 기간별 생성 결과를 비교하여 이에 따른 데이터 생성 성능을 검토하였다.

생성형 인공지능의 수학 문제 풀이에 대한 성능 분석: ChatGPT 4, Claude 3 Opus, Gemini Advanced를 중심으로 (Analysis of generative AI's mathematical problem-solving performance: Focusing on ChatGPT 4, Claude 3 Opus, and Gemini Advanced)

  • 오세준;윤정은;정유진;조윤주;심효섭;권오남
    • 한국수학교육학회지시리즈A:수학교육
    • /
    • 제63권3호
    • /
    • pp.549-571
    • /
    • 2024
  • 디지털·AI 기반 교수·학습이 강조됨에 따라 생성형 AI의 교육적 활용에 대한 논의가 활발해지고 있다. 본 연구는 고등학교 1학년 수학 교과서 5종의 예제와 문제 풀이에 대한 ChatGPT 4, Claude 3 Opus, Gemini Advanced의 수학적 성능을 분석하였다. 총 1,317개 문항에 대해 전체 정답률과 기능별 특징을 살펴본 결과, ChatGPT 4의 전체 정답률이 0.85로 가장 높았고, Claude 3 Opus가 0.67, Gemini Advanced가 0.42 순으로 나타났다. 기능별로는 함수 구하기와 증명하기에서 세 모델 모두 높은 정답률을 보였으나, 설명하기와 그래프 그리기에서는 상대적으로 낮은 정답률을 보였다. 특히 경우의 수 세기에서 ChatGPT 4와 Claude 3 Opus가 1.00의 정답률을 보인 반면, Gemini Advanced는 0.56으로 낮았다. 또한 모든 모델이 벤 다이어그램을 이용한 설명하기와 이미지 생성이 필요한 문제에서 어려움을 겪었다. 연구 결과를 바탕으로 교사들은 각 AI 모델의 강점과 한계를 파악하고 이를 수업에 적절히 활용할 수 있을 것이다. 본 연구는 생성형 AI의 수학적 성능을 분석함으로써, 실제 수학 수업에서의 생성형 AI의 활용 가능성을 제시했다는 점에서 의의가 있다. 또한 인공지능시대의 수학 교육에서 교사의 역할을 재정립하는 데 중요한 시사점을 제공하였다. 향후 생성형 AI와 교사의 협력적 교육 모델 개발, AI를 활용한 개별화 학습 방안 연구 등이 필요할 것이다.

A hybrid approach of generative design methods for designing tall-buildings form

  • Tofighi Pouria;Ekhlassi, Ahmad;Rahbar, Morteza
    • Advances in Computational Design
    • /
    • 제7권2호
    • /
    • pp.153-171
    • /
    • 2022
  • The present study aimed to find a way to create forms that can simultaneously meet several architectural requirements by applying generative design methods specifically focused on cellular automata. In other words, it is tried to find various forms of architecture that all have common features. Because of the useful features of cellular automata, we decided to use it to generate various forms, but make a relation between the discrete nature of cellular automata and the continuous nature of architecture, was the major problem of our project. To achieve this goal, three consecutive stages were designed. In the first stage, independent variables including the location of the building, the height of the building, and the building area were considered as the inputs of the model. In the second stage, after locating the building, the building's main shell was designed as a hidden geometry for the cellular automata and then the cellular automata were determined based on this shell. The main result of this research is establishing a logical relationship between the discrete geometry of the cellular automata and the continuous search space such that it creates various optimized forms. Although we specify the site plan of this project at Iran-Tehran, this research can be generalized to various design sites as well as different projects, allowing the architectsto alter the cell dimensions, cell density, etc., based on their opinion and project needs.

A Framework to Automate Reliability-based Structural Optimization based on Visual Programming and OpenSees

  • Lin, Jia-Rui;Xiao, Jian;Zhang, Yi
    • 국제학술발표논문집
    • /
    • The 8th International Conference on Construction Engineering and Project Management
    • /
    • pp.225-234
    • /
    • 2020
  • Reliability-based structural optimization usually requires designers or engineers model different designs manually, which is considered very time consuming and all possibilities cannot be fully explored. Otherwise, a lot of time are needed for designers or engineers to learn mathematical modeling and programming skills. Therefore, a framework that integrates generative design, structural simulation and reliability theory is proposed. With the proposed framework, various designs are generated based on a set of rules and parameters defined based on visual programming, and their structural performance are simulated by OpenSees. Then, reliability of each design is evaluated based on the simulation results, and an optimal design can be found. The proposed framework and prototype are tested in the optimization of a steel frame structure, and results illustrate that generative design based on visual programming is user friendly and different design possibilities can be explored in an efficient way. It is also reported that structural reliability can be assessed in an automatic way by integrating Dynamo and OpenSees. This research contributes to the body of knowledge by providing a novel framework for automatic reliability evaluation and structural optimization.

  • PDF

Design Structure Matrix: A Model Proposal and Implementation on Harbor and Building Design Project

  • Akram, Salman;Kim, Jeonghwan;Pi, Seungwoo;Seo, Jongwon
    • 한국건설관리학회논문집
    • /
    • 제14권1호
    • /
    • pp.144-152
    • /
    • 2013
  • Design is an iterative, generative, and multidisciplinary process by its nature. Iteration occurs often in most of the engineering design and development projects including construction. Design iterations cause rework, and extra efforts are required to get the optimal sequence and to manage the projects. Contrary to simple design, isolation of the generative iterations in complex design systems is very difficult, but reduction in overall iterations is possible. Design depends upon the information flow within domain and also among various design disciplines and organizations. Therefore, it is suggested that managers should be aware about the crucial iterations causing rework and optimal sequence as well. In this way, managers can handle design parameters related to such iterations pro-actively. There are a number of techniques to reduce iterations for various kinds of engineering designs. In this paper, parameter based Design Structure Matrix (DSM) is chosen. To create this DSM, a survey was performed and then partitioned using a model. This paper provides an easy approach to those companies involved in or intend to be involved in "design and build projects".

Semi-Supervised Spatial Attention Method for Facial Attribute Editing

  • Yang, Hyeon Seok;Han, Jeong Hoon;Moon, Young Shik
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권10호
    • /
    • pp.3685-3707
    • /
    • 2021
  • In recent years, facial attribute editing has been successfully used to effectively change face images of various attributes based on generative adversarial networks and encoder-decoder models. However, existing models have a limitation in that they may change an unintended part in the process of changing an attribute or may generate an unnatural result. In this paper, we propose a model that improves the learning of the attention mask by adding a spatial attention mechanism based on the unified selective transfer network (referred to as STGAN) using semi-supervised learning. The proposed model can edit multiple attributes while preserving details independent of the attributes being edited. This study makes two main contributions to the literature. First, we propose an encoder-decoder model structure that learns and edits multiple facial attributes and suppresses distortion using an attention mask. Second, we define guide masks and propose a method and an objective function that use the guide masks for multiple facial attribute editing through semi-supervised learning. Through qualitative and quantitative evaluations of the experimental results, the proposed method was proven to yield improved results that preserve the image details by suppressing unintended changes than existing methods.

Conditional GAN을 이용한 SAR 표적영상의 해상도 변환 (Resolution Conversion of SAR Target Images Using Conditional GAN)

  • 박지훈;서승모;최여름;유지희
    • 한국군사과학기술학회지
    • /
    • 제24권1호
    • /
    • pp.12-21
    • /
    • 2021
  • For successful automatic target recognition(ATR) with synthetic aperture radar(SAR) imagery, SAR target images of the database should have the identical or highly similar resolution with those collected from SAR sensors. However, it is time-consuming or infeasible to construct the multiple databases with different resolutions depending on the operating SAR system. In this paper, an approach for resolution conversion of SAR target images is proposed based on conditional generative adversarial network(cGAN). First, a number of pairs consisting of SAR target images with two different resolutions are obtained via SAR simulation and then used to train the cGAN model. Finally, the model generates the SAR target image whose resolution is converted from the original one. The similarity analysis is performed to validate reliability of the generated images. The cGAN model is further applied to measured MSTAR SAR target images in order to estimate its potential for real application.