• Title/Summary/Keyword: 텍스트생성

Search Result 672, Processing Time 0.029 seconds

An Exploratory Study of Success Factors for Generative AI Services: Utilizing Text Mining and ChatGPT (생성형AI 서비스의 성공요인에 대한 탐색적 연구: 텍스트 마이닝과 ChatGPT를 활용하여)

  • Ji Hoon Yang;Sung-Byung Yang;Sang-Hyeak Yoon
    • Information Systems Review
    • /
    • v.25 no.2
    • /
    • pp.125-144
    • /
    • 2023
  • Generative Artificial Intelligence (AI) technology is gaining global attention as it can automatically generate sentences, images, and voices that humans previously generated. In particular, ChatGPT, a representative generative AI service, shows proactivity and accuracy differentiated from existing chatbot services, and the number of users is rapidly increasing in a short period of time. Despite this growing interest in generative AI services, most preceding studies are still in their infancy. Therefore, this study utilized LDA topic modeling and keyword network diagrams to derive success factors for generative AI services and to propose successful business strategies based on them. In addition, using ChatGPT, a new research methodology that complements the existing text-mining method, was presented. This study overcomes the limitations of previous research that relied on qualitative methods and makes academic and practical contributions to the future development of generative AI services.

Automatic Generating Stopword Methods for Improving Topic Model (토픽모델의 성능 향상을 위한 불용어 자동 생성 기법)

  • Lee, Jung-Been;In, Hoh Peter
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2017.04a
    • /
    • pp.869-872
    • /
    • 2017
  • 정보검색(Information retrieval) 및 텍스트 분석을 위해 수집하는 비정형 데이터 즉, 자연어를 전처리하는 과정 중 하나인 불용어(Stopword) 제거는 모델의 품질을 높일 수 있는 쉽고, 효과적인 방법 중에 하나이다. 특히 다양한 텍스트 문서에 잠재된 주제를 추출하는 기법인 토픽모델링의 경우, 너무 오래되거나, 수집된 문서의 도메인이나 성격과 무관한 불용어의 제거로 인해, 해당 토픽 모델에서 학습되어 생성된 주제 관련 단어들의 일관성이 떨어지게 된다. 따라서 분석가가 분류된 주제를 올바르게 해석하는데 있어 많은 어려움이 따르게 된다. 본 논문에서는 이러한 문제점을 해결하기 위해 일반적으로 사용되는 표준 불용어 대신 관련 도메인 문서로부터 추출되는 점별 상호정보량(PMI: Pointwise Mutual Information)을 이용하여 불용어를 자동으로 생성해주는 기법을 제안한다. 생성된 불용어와 표준 불용어를 통해 토픽 모델의 품질을 혼잡도(Perplexity)로써 측정한 결과, 본 논문에서 제안한 기법으로 생성한 30개의 불용어가 421개의 표준 불용어보다 더 높은 모델 성능을 보였다.

Design of a Waste Generation Model based on the Chat-GPT and Diffusion Model for data balance (데이터 균형을 위한 Chat-GPT와 Diffusion Model 기반 폐기물 생성모델 설계)

  • Siung Kim;Junhyeok Go;Jeonghyeon Park;Nammee Moon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.05a
    • /
    • pp.667-669
    • /
    • 2023
  • 데이터의 균형은 객체 인식 분야에서 영향을 미치는 요인 중 하나이다. 본 논문에서는 폐기물 데이터 균형을 위해 Chat-GPT와 Diffusion model 기반 데이터 생성 모델을 제안한다. Chat-GPT를 사용하여 폐기물의 속성에 해당하는 단어를 생성하도록 질문하고, 생성된 단어는 인코더를 통해 벡터화시킨다. 이 중 폐기물과 관련 없는 단어를 삭제 후, 남은 단어들을 결합하는 전처리 과정을 거친다. 결합한 벡터는 디코더를 통해 텍스트 데이터로 변환 후, Stable Diffusion model에 입력되어 텍스트와 상응하는 폐기물 데이터를 생성한다. 이 데이터는 AI Hub의 공공 데이터를 활용하며, 객체 인식 모델인 YOLOv5로 학습해 F1-score와 mAP로 평가한다.

Automatic Pronunciation Generator Using Selection Procedure for Exceptional Pronunciation Words (예외 단어 선별 작업을 이용한 자동 발음열 생성 시스템)

  • 안주은;김순협;김선희
    • The Journal of the Acoustical Society of Korea
    • /
    • v.23 no.3
    • /
    • pp.248-252
    • /
    • 2004
  • Cultural, social, economic and other various environmental factors affect our language and different words and terminology are used and coined for different contexts, resulting in quantitative change of vocabulary. This paper presents an automatic pronunciation generator using selection procedure for exceptional pronunciation words from added text corpus, which reflects this dynamic nature of language. For our experiment, we used the text corpus released by ETRI for speech recognition. consisting or 53,750 sentences (740.497 Eojols), and obtained a 100% performance level of the proposed automatic pronunciation generator.

Transformation of XMT-$\Omega$ into SMIL (XMT-$\Omega$의 SMIL로의 변환 기법)

  • 임영순;김희선;김상욱;이숙영
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2003.05b
    • /
    • pp.342-345
    • /
    • 2003
  • XMT (Extensible MPEG-4 Textual Format)는 텍스트 형식의 MPEG-4 씬 디스크립션으로 방송용 오디오/비디오 편집 및 이동 단말기 사용자 중심의 미디어 컨텐츠 개발에 활용될 수 있다. 본 논문에서는 다양한 재생 환경에서 컨텐츠의 상호 교환을 지원하는 XMT 저작도구를 개발하고 XMT의 2가지 파일 포맷인 XMT-A와 XMT-$\Omega$를 생성한다. 생성된 파일 포맷 중 XMT-$\Omega$를 이용하여 다양한 객체(비디오, 오디오, 이미지, 텍스트, 기하객체 등)의 시간공적인 특성들을 SMIL 파일로 변환하는 기법에 대해 제시하고 다양한 환경에서 멀티미디어의 상호교환성을 제공한다.

  • PDF

Dictionary Based Hyper e-Mail Document Generator (사전 기반의 하이퍼 e-Mail 문서 생성기)

  • 최지연;민수홍;조동섭
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2003.05b
    • /
    • pp.720-723
    • /
    • 2003
  • E-Mai1 서비스는 현재 가장 많이 쓰이는 WWW 시스템의 가장 기본적인 기능이다. 그러나 현 e-mai1 서비스는 텍스트 기반 구조를 통한 비동기적인 형태의 서비스를 계속 유지하고 있어, 동기적인 표현방법이 요구되는 실정이다 따라서 단순한 정보의 제공을 위한 서비스로서가 아니라, 사용자가 직접 설정하여 서비스를 받는 형태의 e-mai1 을 제안하고자 한다. 사용자가 지정해놓은 사전을 기반으로 HTML 문서가 재생산되어, 색 지정 기능과 하이퍼 텍스트 기능을 제공하는 한편, 사전에 등록된 정보를 바탕으로 개체에 대한 정보가 tooltip으로 표시될 수 있도록 하는 사전기반 하이퍼 문서 생성기능을 지원하도록 한다

  • PDF

Text mining based GPT utilization technique for research trend analysis (연구 동향 분석을 위한 텍스트 마이닝 기반 GPT 활용 기법)

  • Jeong-Hoon Ha;Bong-Jun Choi
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2023.07a
    • /
    • pp.369-370
    • /
    • 2023
  • 새로운 연구를 시작하기 위해서는 과거의 연구 동향을 분석해야 한다. 이를 위해 많은 양의 과거 연구 데이터를 조사해야 하는데, 모든 데이터를 직접 분류하는 방법은 많은 시간과 노력이 필요하기 때문에 비효율적이며, 텍스트 마이닝 기법을 활용한 키워드분석만으로는 연구 동향을 이해하기에 어려움이 존재한다. 이러한 전통적인 키워드 추출 방법의 한계점을 보완하기 위해 본 논문에서는 텍스트 마이닝 기반 GPT 활용 기법을 제안한다. 본 연구에서는 특정 도메인에 대해 텍스트 마이닝 기법을 활용하여 키워드를 추출하고, 이러한 키워드를 해당 도메인의 데이터로 미세 조정(fine-tuning)된 GPT의 입력으로 사용한다. GPT 결과로 생성된 문장을 텍스트 마이닝으로 나온 결과와 비교 분석한다. 이를 통해 연구 분야의 동향 분석을 보다 쉽게 할 수 있을 것으로 기대된다.

  • PDF

Foreign Language Self Study Learning System Using Generative Artificial Intelligence (생성형 인공지능을 활용한 외국어 작문 자가 학습 시스템)

  • Ji - Woong-Kim;Jeong - Joon Lee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.11a
    • /
    • pp.587-588
    • /
    • 2023
  • 최근 텍스트 생성형 인공지능인 ChatGPT가 화두가 되면서 생성형 인공지능을 이용한 서비스에 사람들의 관심이 높아졌다. 이를 활용하여 시간과 비용이 많이 드는 분야인 외국어 작문 학습을 자기 주도적으로 학습할 수 있을 것이라 조망하였다. 따라서 텍스트 생성형 인공지능인 ChatGPT API를 활용하여 사용자가 자기 주도적으로 외국어를 학습할 수 있는 방향성을 제시하고 더욱 쉽고 저렴한 비용으로 외국어를 익힐 수 있도록 하는 시스템을 개발한다.

An Optimization Technique for File Generator Module of MPEG-4 Authoring Tool for PDA (PDA환경에서 MPEG-4 컨텐츠 저작도구의 파일생성묘듈에 대한 최적화 기법)

  • 이송록;임영순;김상욱
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.619-621
    • /
    • 2004
  • 유비쿼터스 컴퓨팅에 대한 연구가 활발하게 전개되고 있는 지금, PC에서뿐만 아니라 언제 어디서나 가능한 모바일 환경에서 다양한 사용자 인터랙션에 중점을 두고 떨러 가지 기하객체들과 이미지, 텍스트 객체 등을 지원함으로써 PDA의 고유의 특성을 이용하고 또 이에 알맞은 PDA환경에서 전문적인 저작도구를 개발하는 것이 필요하다. 따라서 PDA와 같은 제한된 스크린 사이즈와 메모리 공간에서 작은 메모리를 사용하여 얼마나 풍부한 컨텐츠가 저작가능한가 하는 것이 아주 중요하다 본 논문은 PDA환경에서 기하객체와 텍스트, 이미지 등 객체들을 이용하여 MPEG-4 컨텐츠 저작함에 있어서 기존의 저작도구의 기초 위에서 PDA환경의 고유 특성을 고려하여 BIFS 텍스트 생성 모듈, BIFS 인코더 모듈. 멀티플렉서 모듈에 대한 최적화 기법을 연구하며 더 나아가서 PDA환경에 보다 적합하면서도 직접적이고도 시각적인 저작이 가능한 MPEG-4 컨텐츠 저작시스템을 제안하고 그 개발 결과를 보인다.

  • PDF

The Extraction of Effective Index Database from Voice Database and Information Retrieval (음성 데이터베이스로부터의 효율적인 색인데이터베이스 구축과 정보검색)

  • Park Mi-Sung
    • Journal of Korean Library and Information Science Society
    • /
    • v.35 no.3
    • /
    • pp.271-291
    • /
    • 2004
  • Such information services source like digital library has been asked information services of atypical multimedia database like image, voice, VOD/AOD. Examined in this study are suggestions such as word-phrase generator, syllable recoverer, morphological analyzer, corrector for voice processing. Suggested voice processing technique transform voice database into tort database, then extract index database from text database. On top of this, the study suggest a information retrieval model to use in extracted index database, voice full-text information retrieval.

  • PDF