What Concerns Does ChatGPT Raise for Us?: An Analysis Centered on CTM (Correlated Topic Modeling) of YouTube Video News Comments

ChatGPT는 우리에게 어떤 우려를 초래하는가?: 유튜브 영상 뉴스 댓글의 CTM(Correlated Topic Modeling) 분석을 중심으로

  • Song, Minho (Dept. of Media & Communication, Incheon National University ) ;
  • Lee, Soobum (Dept. of Media & Communication, Incheon National University)
  • Received : 2024.02.02
  • Accepted : 2024.03.08
  • Published : 2024.03.31


This study aimed to examine public concerns in South Korea considering the country's unique context, triggered by the advent of generative artificial intelligence such as ChatGPT. To achieve this, comments from 102 YouTube video news related to ethical issues were collected using a Python scraper, and morphological analysis and preprocessing were carried out using Textom on 15,735 comments. These comments were then analyzed using a Correlated Topic Model (CTM). The analysis identified six primary topics within the comments: "Legal and Ethical Considerations"; "Intellectual Property and Technology"; "Technological Advancement and the Future of Humanity"; "Potential of AI in Information Processing"; "Emotional Intelligence and Ethical Regulations in AI"; and "Human Imitation."Structuring these topics based on a correlation coefficient value of over 10% revealed 3 main categories: "Legal and Ethical Considerations"; "Issues Related to Data Generation by ChatGPT (Intellectual Property and Technology, Potential of AI in Information Processing, and Human Imitation)"; and "Fear for the Future of Humanity (Technological Advancement and the Future of Humanity, Emotional Intelligence, and Ethical Regulations in AI)."The study confirmed the coexistence of various concerns along with the growing interest in generative AI like ChatGPT, including worries specific to the historical and social context of South Korea. These findings suggest the need for national-level efforts to ensure data fairness.

본 연구는 ChatGPT로부터 촉박된 생성형 인공지능에 대해 국내의 특수성을 고려한 대중의 우려를 살펴보고자 하였다. 이를 위해 유튜브에서 102개의 윤리 관련 뉴스 영상에 포함된 댓글을 파이썬 스크래퍼를 개발하여 수집하였으며, 텍스톰을 통해 형태소 분석 및 전처리를 통해 15,735개 댓글을 대상으로 상관토픽모델(CTM)을 통해 분석하였다. 분석 결과, 뉴스 영상에 포함된 댓글의 주요 토픽은 '법적 및 윤리적 고려 사항', '지적 재산권 및 기술', '기술 발전과 인류 미래, 정보 처리에서 인공지능의 잠재력', 'AI에서의 감정 지능 및 윤리적 규제', '인간모방' 등 6개로 확인되었다. 또한 6개의 토픽을 10% 이상의 상관계수 값을 보이는 관계로 구조화한 결과 '법적 및 윤리적 고려 사항', 'ChatGPT의 데이터 생성 관련 이슈(지적 재산권 및 기술, 정보 처리에서의 인공지능의 잠재력, 인간모방', '인류 미래에 대한 두려움(기술 발전과 인류 미래, AI에서의 감정 지능 및 윤리적 규제)' 등 3개로 구조화할 수 있었다. 이를 바탕으로 ChatGPT로 인해 촉발된 생성형 인공지능에 관한 관심과 더불어 다양한 우려가 공존하고 있는 것을 확인하였고, 국내의 역사적 및 사회적 맥락을 반영한 특수성을 가진 우려도 존재하고 있음을 확인하였다. 이러한 결과를 통해 데이터 공정성에 대한 국가 주도의 노력이 필요함을 제안하였다.



This work was supported by Incheon National University Research Grant in 2022


