• 제목/요약/키워드: 토픽분석

검색결과 660건 처리시간 0.029초

빅데이터 분석에 기반한 평화교육과 통일교육의 토픽 모델링 및 네트워크 분석 (Topic Modeling and Network Analysis of Peace Education and Unification Education Based on Big Data Analysis)

  • 김병만
    • 융합정보논문지
    • /
    • 제12권3호
    • /
    • pp.25-37
    • /
    • 2022
  • 본 연구에서는 빅데이터 분석에 기반한 평화교육과 통일교육의 주제적 특징을 도출하여 정책과 담론, 교육방향과 내용, 사회적 쟁점 등의 동향을 총체적으로 점검하는데 그 목적이 있다. 본 연구의 결과를 요약해 보면, 첫째, 평화교육과 통일교육에서 '평화', '통일', '교육', '연구', '학생', '학교', '교사', '대상', '한반도' 등은 공통적으로 중요한 키워드로 나타났다. 둘째, 평화교육의 상위토픽은 '평화교육과 시민교육', 통일교육의 상위토픽은 '통일교육의 공감과 참여'로 나타났다. 셋째, 평화교육에서 정부별로 상승추세를 나타내는 토픽으로는 '세계평화와 인권', '평화교육의 대상과 방향', 통일교육에서 정부별로 상승추세를 나타내는 토픽으로는 '통일교육의 주체'로 나타났다. 넷째, 평화교육에서 '평화', '교육', '학생', '학교', '평화교육' 등의 중심성이 높았고, 통일교육에서는 '통일교육, '통일', '교육', '통일부', '학교', '교사'의 중심성이 높았다. 본 연구를 통해 평화교육과 통일교육에 대한 이해의 지평을 확장할 수 있었고, 관련 정책 수립 및 후속 연구 수행에 의미 있는 시사점을 제공하였다.

LDA 기법을 이용한 미세먼지 이슈의 토픽모델링 분석 (Topic Modeling on Fine Dust Issues Using LDA Analysis)

  • 윤순욱;김민철
    • 에너지공학
    • /
    • 제29권2호
    • /
    • pp.23-29
    • /
    • 2020
  • 본 연구에서는 최근 10년간의 미세먼지 관련 뉴스 데이터를 수집하여 LDA 분석을 통해 최적 토픽을 도출하였다. 최적 토픽으로 선별된 80개의 이슈를 미세먼지 정책의 시각에서 해석하였다. 연구결과, 기온과 같은 날씨와 관련된 정보와 미세먼지 농도가 관련되어서 이슈화되는 경향이 있었다. 다음으로 미세먼지 저감 대책의 일환으로 노후경유차 운행 제한 제도와 저감 장치 부착과 같은 이슈의 빈도수가 높았다. 국민에 대한 제도 변경 안내를 포함하여 시민과 운수업자와의 갈등도 주요한 토픽으로 나타났다. 미세먼지 문제의 해결을 위한 수소차 보급과 같은 대안도 주요 토픽으로 분석되었다. 또한 미세먼지 관련 공기청정기 등 제품 관련 주제, 취약계층을 미세먼지로부터 보호하는 정책과 관련된 주제, 연구개발을 통한 미세먼지 저감 관련 주제가 주요 화두로 제기되었다. 미세먼지 대책은 사회 이슈로 정부 정책과 밀접한 관련이 있다고 볼 수 있다. 또한 본 연구를 통해 토픽 상에서는 거시적인 정부정책 자체보다는 시민의 안전, 시혜적인 정책이나 이해관계자간의 갈등이 정부정책 변화와 연동하여 중요한 의미를 지니는 것으로 나타났다.

토픽모델링을 활용한 대학생의 중도탈락 데이터 분석 (Data Analysis of Dropouts of University Students Using Topic Modeling)

  • 정도헌;박주연
    • 한국정보통신학회논문지
    • /
    • 제25권1호
    • /
    • pp.88-95
    • /
    • 2021
  • 본 연구의 목적은 대학생의 중도탈락 현상 데이터를 실증적으로 분석하여 대학의 학생지원정책을 수립하기 위한 시사점을 제공하는 데 있다. 이를 위해 D대학의 2017~2019년 입학생 데이터를 토픽모델링 LDA(Latent Dirichlet Allocation)를 활용하여 재학생과 제적생으로 나누어 분석하였다. 연구결과 제적생에서 특징있게 나타난 토픽은 '학적'관련하여 '학기등록 1회', '전공'관련하여 '어문계열학과', '학점'관련하여 '학사경고'이고, '대학생활'관련하여 '비교과 프로그램'에 대한 토픽은 나타나지 않았다. 다음으로 '재학생 토픽'과 '제적생 토픽'의 상호 식별 성능을 측정한 결과, SVM(Support Vector Machines)이 가장 우수한 식별 성능을 보여주었다. 이러한 실험을 통해 기계학습을 활용한 인공지능 기반의 학생 데이터 분류 기법 연구의 가능성을 확인할 수 있었다.

텍스트 마이닝과 토픽 모델링을 기반으로 한 트위터에 나타난 사회적 이슈의 키워드 및 주제 분석 (Keywords and Topic Analysis of Social Issues on Twitter Based on Text Mining and Topic Modeling)

  • 곽수정;김현희
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권1호
    • /
    • pp.13-18
    • /
    • 2019
  • 본 연구는 커뮤니케이션이 활발한 SNS 속에서 사회적 이슈가 어떤 주제별로 나뉘어져 있고, 어떤 키워드들이 유기적으로 연결되었는지 그 연결 관계를 알아보고자 하였다. '미투'라는 새로운 단어가 생겨남과 동시에 큰 운동으로 번지고 있는 '미투운동'을 사회적 이슈로 간주하였고, 여러 SNS 중 특히 실시간 소통이 가장 활발한 트위터를 중심으로 분석을 실시하였다. 우선 키워드를 '미투'로 하여 관련된 키워드를 각 날짜별로 추출하였고, 주요 키워드를 파악한 후 토픽 모델링을 수행하였다. 이를 통해 사회적 이슈를 둘러싼 키워드들이 시간의 흐름에 따라 어떻게 변화하였는지 파악하고, 각 토픽 내의 키워드를 종합하여 토픽별 사회적 이슈의 다양한 관점을 해석하였다.

몽골에 대한 국내 뉴스 토픽 모델링: 한몽 수교 이후 양국 관계 보도 양상 변화를 중심으로 (Modeling Domestic News Topics for Mongolia: Focusing on Changes in Press on Diplomatic Relations between the two countries after the establishment of Diplomatic ties between Korea and Mongolia)

  • 윤지수;김현미
    • 한국콘텐츠학회논문지
    • /
    • 제22권4호
    • /
    • pp.37-46
    • /
    • 2022
  • 본 연구는 한국과 몽골이 수교 이후부터 지금까지 외교관계 격상을 이루는 동안 국내에서는 어떤 분야에 관심을 가져왔는지 확인하고자 몽골과 관련된 국내 언론 보도를 중심으로 빅데이터 분석을 실시하였다. '몽골' 키워드로 검색된 13만여 개의 기사를 분석 대상으로 삼고, 관계 격상일을 기준으로 4개의 시기로 나누어 토픽 모델링을 실시하였다. 시기별 주요 토픽을 도출하여 살펴본 결과, 관계 격상에 따라 사라지는 이슈도 있었으나 초기에 나타났던 이슈들이 상당수 유지되면서 여러 분야의 이슈가 추가되어 나타나는 양상을 보였다. 즉, 기존의 정치, 역사 위주의 협력에서 문화, 교육, 보건, 항공, 기후 등으로 분야가 다양화되고 있었으며, 특히 민간교류 측면에서 토픽이 더욱 세분화되어 발전하는 양상을 보였다. 본 연구는 양국 간 외교 관계 연구에서 기존에 시도되지 않았던 새로운 분석 방법을 시도함으로써 막대한 양의 데이터를 바탕으로 결론의 신뢰성을 높이고 기존 연구에 새로운 시각을 제공하고 있다.

토픽맵 모델링을 위한 한국 관련 미국기록물의 주제분석 연구: 국내 주요 소장기관 중심으로 (Topic Analysis of the United States' Historical Records about Korea for Modeling of Topic Map: Focused on Major Archives in Korea)

  • 권민정;최상희
    • 한국기록관리학회지
    • /
    • 제22권2호
    • /
    • pp.95-116
    • /
    • 2022
  • 이 연구에서는 웹사이트를 통해 한국 관련 해외기록물을 서비스하고 있는 기관인 국가기록원, 국립중앙도서관, 국사편찬위원회, 국방부 국방편찬연구소 4개의 기관을 연구 대상으로 선정하여 국내 기관에 분산되어 있는 서비스 되고 있는 기록물을 이용자들이 쉽게 기록물의 내용을 파악할 수 있도록 하고 통합하여 검색할 수 있는 방안을 제안하였다. 이를 위해 총 163,874건을 수집하여 이용자가 다각적으로 기록의 내용을 훑어볼 수 있도록 하는 방안으로 주제분석을 하였고 패싯과 토픽을 도출하였다. 도출된 패싯과 토픽을 기반으로 토픽맵을 구성하였다.

의미적 토픽 기반 지식모델의 통합에 관한 연구 (A study on integration of semantic topic based Knowledge model)

  • 전승수;이상진;배상태
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(B)
    • /
    • pp.181-183
    • /
    • 2012
  • 최근 자연어 및 정형언어 처리, 인공지능 알고리즘 등을 활용한 효율적인 의미 기반 지식모델의 생성과 분석 방법이 제시되고 있다. 이러한 의미 기반 지식모델은 효율적 의사결정트리(Decision Making Tree)와 특정 상황에 대한 체계적인 문제해결(Problem Solving) 경로 분석에 활용된다. 특히 다양한 복잡계 및 사회 연계망 분석에 있어 정적 지표 생성과 회귀 분석, 행위적 모델을 통한 추이분석, 거시예측을 지원하는 모의실험(Simulation) 모형의 기반이 된다. 본 연구에서는 이러한 의미 기반 지식모델을 통합에 있어 텍스트 마이닝을 통해 도출된 토픽(Topic) 모델 간 통합 방법과 정형적 알고리즘을 제시한다. 이를 위해 먼저, 텍스트 마이닝을 통해 도출되는 키워드 맵을 동치적 지식맵으로 변환하고 이를 의미적 지식모델로 통합하는 방법을 설명한다. 또한 키워드 맵으로부터 유의미한 토픽 맵을 투영하는 방법과 의미적 동치 모델을 유도하는 알고리즘을 제안한다. 통합된 의미 기반 지식모델은 토픽 간의 구조적 규칙과 정도 중심성, 근접 중심성, 매개 중심성 등 관계적 의미분석이 가능하며 대규모 비정형 문서의 의미 분석과 활용에 실질적인 기반 연구가 될 수 있다.

인공지능 스피커의 세대별 온라인 리뷰 분석을 통한 사용자 경험 요인 탐색 (Exploring user experience factors through generational online review analysis of AI speakers)

  • 박정은;양동욱;김하영
    • 한국융합학회논문지
    • /
    • 제12권7호
    • /
    • pp.193-205
    • /
    • 2021
  • 인공지능 스피커 시장은 꾸준히 성장하고 있지만, 실제 스피커 사용자들의 만족도는 42%에 그치고 있다. 따라서, 본 연구에서는 인공지능 스피커의 세대별 토픽 변화와 감성 변화를 통해 사용자 경험을 저해하는 요소는 무엇인지 분석해 보고자 한다. 이를 위해 아마존 에코 닷 3세대와 4세대 모델에 대한 리뷰를 수집하였다. 토픽모델링 분석 기법을 사용하여 세대별로 리뷰를 이루는 주제 및 주제의 변화를 찾아내고, 딥러닝 기반 감성 분석을 통해 토픽에 대한 사용자 감성이 세대에 따라 어떻게 변화되었는지 살펴보았다. 토픽모델링 결과, 세대별로 5개의 토픽이 도출되었다. 3세대의 경우 스피커의 일반적 속성을 나타내는 토픽은 제품에 긍정적 반응 요인으로 작용했고, 사용자 편의 기능은 부정적 반응 요인으로 작용했다. 반대로 4세대에서는 일반적 속성은 부정적으로, 사용자 편의 기능은 긍정적으로 도출되었다. 이와 같은 분석은 방법론 측면에서 어휘적 특징뿐 아니라 문장 전체의 문맥적 특징이 고려된 분석결과를 제시할 수 있다는 것에 그 의의가 있다.

토픽 성장 분석을 통한 오픈액세스 분야 연구 동향 분석 (Understanding Research Trends of Open Access via Topic Growth Analysis)

  • 정재민;김완종
    • 정보관리학회지
    • /
    • 제39권4호
    • /
    • pp.75-97
    • /
    • 2022
  • 전통적인 학술 커뮤니케이션 체제의 문제점을 해결하기 위한 대안으로 오픈액세스 패러다임에 대한 국제적 관심과 확산이 지속되고 있다. 하지만 데이터 기반의 정량적인 방법을 통해 오픈액세스 분야의 글로벌한 동향이나 성장 추세를 파악하려는 노력은 아직까지 부족한 실정이다. 본 연구는 오픈액세스 분야의 학술논문 데이터에 토픽 모델링을 적용하여 세부 연구토픽을 식별하고, 성장곡선을 적합하여 각 연구토픽의 성숙도와 예상 잔여수명을 계산한다. 본 연구는 오픈 사이언스의 세 가지 핵심요소인 오픈액세스, 오픈데이터, 오픈협업과 관련된 14개 토픽들을 식별하였으며, 오픈액세스 분야가 앞으로 약 65년간 꾸준히 성장할 것으로 예상하였다. 본 연구의 분석 결과는 연구자들과 정책 의사결정자들이 오픈액세스 분야의 동향과 성장 추세를 이해하는 데 도움을 줄 수 있을 것으로 기대된다.

LDA와 BERTopic을 이용한 토픽모델링의 증강과 확장 기법 연구 (Topic Model Augmentation and Extension Method using LDA and BERTopic)

  • 김선욱;양기덕
    • 정보관리학회지
    • /
    • 제39권3호
    • /
    • pp.99-132
    • /
    • 2022
  • 본 연구의 목적은 LDA 토픽모델링 결과와 BERTopic 토픽모델링 결과를 합성하는 방법론인 Augmented and Extended Topics(AET)를 제안하고, 이를 사용해 문헌정보학 분야의 연구주제를 분석하는 데 있다. AET의 실제 적용결과를 확인하기 위해 2001년 1월부터 2021년 10월까지의 Web of Science 내 문헌정보학 학술지 85종에 게재된 학술논문 서지 데이터 55,442건을 분석하였다. AET는 서로 다른 토픽모델링 결과의 관계를 WORD2VEC 기반 코사인 유사도 매트릭스로 구축하고, 매트릭스 내 의미적 관계가 유효한 범위 내에서 매트릭스 재정렬 및 분할 과정을 반복해 증강토픽(Augmented Topics, 이하 AT)을 추출한 뒤, 나머지 영역에서 코사인 유사도 평균값 순위와 BERTopic 토픽 규모 순위에 대한 조화평균을 통해 확장토픽(Extended Topics, 이하 ET)을 결정한다. 최적 표준으로 도출된 LDA 토픽모델링 결과와 AET 결과를 비교한 결과, AT는 LDA 토픽모델링 토픽을 한층 더 구체화하고 세분화하였으며 ET는 유효한 토픽을 발견하였다. AT(Augmented Topics)의 성능은 LDA 이상이었으며 ET(Extended Topics)는 일부 경우를 제외하고 대부분 LDA와 유사한 수준의 성능을 나타내었다.