• Title/Summary/Keyword: 이미지 생성형 인공지능

Search Result 15, Processing Time 0.028 seconds

A Study on the use of generative AI in creative and artistic fields (창작·예술 분야의 생성형 aI 활용 방법에 대한 연구)

  • Dong-Hoo Lee
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2023.07a
    • /
    • pp.569-572
    • /
    • 2023
  • 최근 하루가 다르게 발전하고 있는 생성형 AI가 창작과 예술 분야에 어떤 영향을 미칠 수 있는지, 새롭게 등장하고 있는 다양한 분야에서 활용 가능한 획기적인 기능 등을 살펴보고 이를 바탕으로 새로운 창작 방향을 제시할 수 있는 방법들을 살펴보려 한다. 최근, 작곡가와 소설가들은 물론, 디지털 아티스트들까지도 생성형 AI를 활용하여 독특한 음악, 글, 그리고 이미지를 창조하는데 성공했다는 사례들이 속속 드러나고 있고 영상, 게임, 웹툰 등 많은 산업현장에서 직접적인 활용방법에 대한 연구결과가 등장하고 실제 적용 사례도 늘어나고 있다. 이미지 생성기인 미드저니와 스테이블디퓨전 같은 도구들은 혁신적인 방법으로 빠르게 높은 퀄리티의 이미지를 생성하고 다양한 아이디어를 제공 받을 수 있는 도구로 창작과 예술 분야에서 큰 관심을 받고 있다. 이러한 발전은 창작과 예술 분야에서 생성형 AI의 무한한 가능성을 보여주는 한편, 인간의 창의성 침해와 예술가들의 노력 희석에 대한 비판적 시각을 불러일으키기도 한다. 본 연구는 이런 다양한 관점에서 창작·예술 분야의 생성형 AI 활용을 깊이 있게 탐구한다. 그 과정에서 여러 생성형 AI 도구들, 특히 이미지 생성기 미드저니와 스테이블디퓨전의 기능과 활용 방안, 그로 인한 사회적, 윤리적 측면을 분석하며, 창작·예술 분야에서의 생성형 AI 활용의 적절한 방향성과 미래 전망을 제시해 보고자 한다.

  • PDF

Utilization Strategies of Generative AI Platforms for CG Education (CG 교육을 위한 생성형 인공지능 플랫폼 활용 방안)

  • Donghee Suh
    • Journal of Practical Engineering Education
    • /
    • v.15 no.2
    • /
    • pp.357-364
    • /
    • 2023
  • Due to the rapid advancement of AI technology, generative artificial intelligence platforms are experiencing innovative applications in various fields. In this paper, it examines research cases involving the utilization of AI in education, explore instances where generative AI platforms are applied in the realm of creative endeavors, and discuss the direction of utilizing generative AI in educational contexts. In the field of computer graphics, this study introduced generative AI platforms that are applicable for image creation, editing, and video editing. It also proposed platforms that can be utilized in the video editing production process. These generative AI platforms not only offer advantages in terms of efficiency, by reducing the efforts of creators and saving time in the production process, but they also present positive aspects in enhancing individual capabilities. It is advocated that their swift integration into education is necessary, considering these benefits. This study aims to provide direction for the expansion of creative education utilizing generative AI platforms.

Implementation of Hair Style Recommendation System Based on Big data and Deepfakes (빅데이터와 딥페이크 기반의 헤어스타일 추천 시스템 구현)

  • Tae-Kook Kim
    • Journal of Internet of Things and Convergence
    • /
    • v.9 no.3
    • /
    • pp.13-19
    • /
    • 2023
  • In this paper, we investigated the implementation of a hairstyle recommendation system based on big data and deepfake technology. The proposed hairstyle recommendation system recognizes the facial shapes based on the user's photo (image). Facial shapes are classified into oval, round, and square shapes, and hairstyles that suit each facial shape are synthesized using deepfake technology and provided as videos. Hairstyles are recommended based on big data by applying the latest trends and styles that suit the facial shape. With the image segmentation map and the Motion Supervised Co-Part Segmentation algorithm, it is possible to synthesize elements between images belonging to the same category (such as hair, face, etc.). Next, the synthesized image with the hairstyle and a pre-defined video are applied to the Motion Representations for Articulated Animation algorithm to generate a video animation. The proposed system is expected to be used in various aspects of the beauty industry, including virtual fitting and other related areas. In future research, we plan to study the development of a smart mirror that recommends hairstyles and incorporates features such as Internet of Things (IoT) functionality.

Development of integrated data augmentation automation tools for deep learning (딥러닝 학습용 집적화된 데이터 증강 자동화 도구 개발)

  • Jang, Chan-Ho;Lee, Seo-Young;Park, Goo-Man
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • fall
    • /
    • pp.283-286
    • /
    • 2021
  • 4차 산업혁명을 맞이해 최근 산업 및 기술 영역에서는 인공지능을 이용한 생산력 향상, 자동화 등 딥러닝의 보편화가 빠르게 진행되고 있다. 또한, 딥러닝의 성능을 도출하기 위해서는 수많은 양의 학습용 데이터가 필요하며 그 데이터의 양은 딥러닝 모델의 성능과 정비례한다. 이에 본 작품은 최신형 영상처리 Library인 Albumentations를 이용하여 영상처리 알고리즘을 이용하여 이미지를 증강하고, 이미지 데이터 크롤링 기능을 통해 Web에서 영상 데이터를 수집을 자동화하며, Label Pix를 연동하여 수집한 데이터를 라벨링 한다. 더 나아가 라벨링 된 데이터의 증강까지 포함하여 다양한 증강 자동화를 한 인터페이스에 집적시켜 딥러닝 모델을 생성할 때 데이터 수집과 전처리를 수월하게 한다. 또한, Neural Net 기반의 AdaIN Transfer를 이용하여 이미지를 개별적으로 학습하지 않고 Real time으로 이미지의 스타일을 옮겨올 수 있도록 하여 그림 데이터의 부족 현상을 해결한다.

  • PDF

A Study on the Method of Creating Realistic Content in Audience-participating Performances using Artificial Intelligence Sentiment Analysis Technology (인공지능 감정분석 기술을 이용한 관객 참여형 공연에서의 실감형 콘텐츠 생성 방식에 관한 연구)

  • Kim, Jihee;Oh, Jinhee;Kim, Myeungjin;Lim, Yangkyu
    • Journal of Broadcast Engineering
    • /
    • v.26 no.5
    • /
    • pp.533-542
    • /
    • 2021
  • In this study, a process of re-creating Jindo Buk Chum, one of the traditional Korean arts, into digital art using various artificial intelligence technologies was proposed. The audience's emotional data, quantified through artificial intelligence language analysis technology, intervenes in various object forms in the projection mapping performance and affects the big story without changing it. If most interactive arts express communication between the performer and the video, this performance becomes a new type of responsive performance that allows the audience to directly communicate with the work, centering on artificial intelligence emotion analysis technology. This starts with 'Chuimsae', a performance that is common only in Korean traditional art, where the audience directly or indirectly intervenes and influences the performance. Based on the emotional information contained in the performer's 'prologue', it is combined with the audience's emotional information and converted into the form of images and particles used in the performance to indirectly participate and change the performance.

A Study on Generative Artificial Intelligence-Based Data Augmentation Techniques for Enhancing Object Detection Performance (객체 탐지 성능 향상을 위한 생성형 인공지능 기반 데이터 증강 기법 연구)

  • Dohee Kim;Myongho Kim
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2023.07a
    • /
    • pp.51-54
    • /
    • 2023
  • 최근 딥러닝 기술의 발달로 물체 탐지를 위한 객체 인식 분야가 기계학습을 접목한 연구가 급격히 증가하고 있다. 하지만, 탐지하려는 물체가 다른 객체에 가려진 경우와 같이 특수한 상황에 대한 데이터의 수량이 부족하여 성능 저하를 야기한다는 점과, 객체 탐지 수행 과정에서 작은 객체의 탐지가 어렵다는 한계점이 있다. 본 연구는 전술한 문제점을 보완할 방법을 제안한다. 데이터 증강 기법을 이용하여 클래스가 부족한 데이터의 양을 늘려 학습 데이터를 증강시켰다. 한편, SRGAN을 사용하여 작은 객체를 확대시킨 뒤 이미지를 합성시켜 데이터를 구성하였다. 제안된 방법은 PyTorch 환경에서 YOLOv5를 수행한 결과, 객체 탐지 성능이 향상되는 것을 확인할 수 있었다.

  • PDF

Research on Generative AI for Korean Multi-Modal Montage App (한국형 멀티모달 몽타주 앱을 위한 생성형 AI 연구)

  • Lim, Jeounghyun;Cha, Kyung-Ae;Koh, Jaepil;Hong, Won-Kee
    • Journal of Service Research and Studies
    • /
    • v.14 no.1
    • /
    • pp.13-26
    • /
    • 2024
  • Multi-modal generation is the process of generating results based on a variety of information, such as text, images, and audio. With the rapid development of AI technology, there is a growing number of multi-modal based systems that synthesize different types of data to produce results. In this paper, we present an AI system that uses speech and text recognition to describe a person and generate a montage image. While the existing montage generation technology is based on the appearance of Westerners, the montage generation system developed in this paper learns a model based on Korean facial features. Therefore, it is possible to create more accurate and effective Korean montage images based on multi-modal voice and text specific to Korean. Since the developed montage generation app can be utilized as a draft montage, it can dramatically reduce the manual labor of existing montage production personnel. For this purpose, we utilized persona-based virtual person montage data provided by the AI-Hub of the National Information Society Agency. AI-Hub is an AI integration platform aimed at providing a one-stop service by building artificial intelligence learning data necessary for the development of AI technology and services. The image generation system was implemented using VQGAN, a deep learning model used to generate high-resolution images, and the KoDALLE model, a Korean-based image generation model. It can be confirmed that the learned AI model creates a montage image of a face that is very similar to what was described using voice and text. To verify the practicality of the developed montage generation app, 10 testers used it and more than 70% responded that they were satisfied. The montage generator can be used in various fields, such as criminal detection, to describe and image facial features.

A New Image Processing Scheme For Face Swapping Using CycleGAN (순환 적대적 생성 신경망을 이용한 안면 교체를 위한 새로운 이미지 처리 기법)

  • Ban, Tae-Won
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.26 no.9
    • /
    • pp.1305-1311
    • /
    • 2022
  • With the recent rapid development of mobile terminals and personal computers and the advent of neural network technology, real-time face swapping using images has become possible. In particular, the cycle generative adversarial network made it possible to replace faces using uncorrelated image data. In this paper, we propose an input data processing scheme that can improve the quality of face swapping with less training data and time. The proposed scheme can improve the image quality while preserving facial structure and expression information by combining facial landmarks extracted through a pre-trained neural network with major information that affects the structure and expression of the face. Using the blind/referenceless image spatial quality evaluator (BRISQUE) score, which is one of the AI-based non-reference quality metrics, we quantitatively analyze the performance of the proposed scheme and compare it to the conventional schemes. According to the numerical results, the proposed scheme obtained BRISQUE scores improved by about 4.6% to 14.6%, compared to the conventional schemes.

Controllable data augmentation framework based on multiple large-scale language models (복수 대규모 언어 모델에 기반한 제어 가능형 데이터 증강 프레임워크)

  • Hyeonseok Kang;Hyuk Namgoong;Jeesu Jung;Sangkeun Jung
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.3-8
    • /
    • 2023
  • 데이터 증강은 인공지능 모델의 학습에서 필요한 데이터의 양이 적거나 편향되어 있는 경우, 이를 보완하여 모델의 성능을 높이는 데 도움이 된다. 이미지와는 달리 자연어의 데이터 증강은 문맥이나 문법적 구조와 같은 특징을 고려해야 하기 때문에, 데이터 증강에 많은 인적자원이 소비된다. 본 연구에서는 복수의 대규모 언어 모델을 사용하여 입력 문장과 제어 조건으로 프롬프트를 구성하는 데 최소한의 인적 자원을 활용한 의미적으로 유사한 문장을 생성하는 방법을 제안한다. 또한, 대규모 언어 모델을 단독으로 사용하는 것만이 아닌 병렬 및 순차적 구조로 구성하여 데이터 증강의 효과를 높이는 방법을 제안한다. 대규모 언어 모델로 생성된 데이터의 유효성을 검증하기 위해 동일한 개수의 원본 훈련 데이터와 증강된 데이터를 한국어 모델인 KcBERT로 다중 클래스 분류를 수행하였을 때의 성능을 비교하였다. 다중 대규모 언어 모델을 사용하여 데이터 증강을 수행하였을 때, 모델의 구조와 관계없이 증강된 데이터는 원본 데이터만을 사용하였을 때보다 높거나 그에 준하는 정확도를 보였다. 병렬 구조의 다중 대규모 언어 모델을 사용하여 400개의 원본 데이터를 증강하였을 때에는, 원본 데이터의 최고 성능인 0.997과 0.017의 성능 차이를 보이며 거의 유사한 학습 효과를 낼 수 있음을 보였다.

  • PDF

Coexistence Direction of AI and Webtoon Artist

  • Bo-Ra Han
    • Journal of the Korea Society of Computer and Information
    • /
    • v.29 no.2
    • /
    • pp.87-99
    • /
    • 2024
  • This study aims to identify the competencies required for webtoon artists to survive in the future era of AI commercialization. It explores the current and future use of AI in webtoons, and predicts the role of artists in the future webtoon industry. The study finds that AI will replace human workers in some areas, but human empathy-related fields can be sustained. Artist roles like story projectors, Visual directors, and AI editors were identified as potential models for the changing role of artists. To address terminology ambiguity, a three-step AI categorization mechanical type AI, humanoid type AI, and transcendent type AI was proposed for a more realistic separation of AI capabilities. The researcher suggested these findings as guidelines for developing skills in emerging artists or re-skilling existing ones, emphasizing collaboration with AI for mutual growth rather than a negative acceptance of new technology.