• Title/Summary/Keyword: 연구 토픽

검색결과 715건 처리시간 0.025초

LDA 토픽 모델링을 활용한 SNS 분석 (SNS Analysis Using LDA Topic Modeling)

  • 장민수;임선영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.402-403
    • /
    • 2023
  • 본 연구의 목적은 LDA 토픽 모델링을 활용하여 한국어 SNS데이터에 분석을 통해 우리나라의 여가활동, 일과 직업, 주거와 생활의 동향을 살펴보는 것이다. AI Hub에서 제공하는 한국어 SNS데이터를 수집하고 형태소 분석, 전처리 과정을 거친 후 coherence score을 토대로 최적의 토픽 수를 결정하여 토픽을 추출하였다. 도출한 트렌드를 바탕으로 경영, 마케팅 분야에 미치는 영향을 예측할 수 있을 것으로 기대한다.

LDA 토픽모델링을 활용한 국내 치유시설과 치유프로그램 연구 동향 (Research Trends in Korean Healing Facilities and Healing Programs Using LDA Topic Modeling)

  • 이주홍;이경진;성정한
    • 한국조경학회지
    • /
    • 제51권3호
    • /
    • pp.95-106
    • /
    • 2023
  • 국내 치유 연구는 치유에 대한 사회적 관심 증가와 함께 최근 20년 동안 발전해왔다. 치유를 연구하는 분야는 다양하며, 법제화된 자연-기반(natural-based) 치유를 포함한다. 본 연구에서는 KCI와 RISS에 게재된 2,202편의 학술지, 석·박사학위논문 초록을 수집하여 분석하였다. 연구방법은 LDA 토픽모델링을 활용하여 연구의 주제를 분류하였고, 시계열적 논문 발행 추이를 살펴보았다. 연구 결과, 국내 치유 연구의 주제가 5개의 유형과 4개의 매개어로 연결되었음을 규명하였다. 5개의 연구 유형은 "치유관광", "마음·예술치유", "산림치유", "치유공간", "청소년회복치유"였고, 4개의 매개 단어는 "산림", "자연", "문화", "교육"이었다. 또한 국내 치유 연구에서 법제화된 치유 연구만 추출하여 토픽을 분석하였다. 그 결과, 법제화된 치유 연구의 주제 유형이 4개로 분류되었다. 4개의 연구 유형은 "공간환경계획치유", "치유요법실험", "농업교육체험치유", "치유관광요인"이었다. 법제화된 치유에서 연구의 양이 가장 많은 산림치유, 식물을 매개로 유사한 프로그램을 운영하는 치유농업과 정원치유, 해양자원을 활용하는 해양치유의 연구 토픽 또한 분석하였다. 그 결과, 개별 치유 연구만의 독특한 특성을 보여주는 토픽과 모든 치유 연구에서 범용되는 것으로 생각되는 토픽을 도출하였다. 본 연구는 텍스트마이닝의 LDA 토픽모델링을 활용하여 국내 치유시설과 치유프로그램 연구의 전반적 경향을 파악하였다는 데 의의가 있다.

정보를 표현하는 기법으로서의 RDF와 토픽맵(Topic maps)과의 비교 (A Comparison on RDF and Topic Maps, as the Standards for Representing Information)

  • 이혜원
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2005년도 제12회 학술대회 논문집
    • /
    • pp.99-106
    • /
    • 2005
  • 효율적이고 체계적인 정보관리를 위해 최근 연구들은 시멘틱웹(semantic web), 지식관리, 메타데이터의 통합 등에 많은 관심을 두고 있다. 그러한 연구들은 자원(resources)의 기술을 어떻게 표현할 것인가에 대한 기술구조와 그 구조를 표현하기 위한 기계 언어 등을 다루고 있다. 특히 자원의 기술을 어떻게 표현할 것인가에 대한 기술적인 구조로 가장 널리 사용되는 것은 RDF와 토픽맵(Topic Maps)을 들 수 있다. 정보조직이나 시멘틱웹 등의 연구에서 자주 등장하는 위의 개념들을 정확하게 이해하고 무엇보다 그 개념들 간의 관계를 알아보는 것이 중요할 것이다. 본 연구에서는 RDF와 토픽맵에서, 정보 즉 표현하고자 하는 대상을 표현하는 방법을 살펴보고, 두 기법간의 상호운용성에 대한 선행연구로 RDF와 토픽맵의 유사점과 차이점을 비교하고자 한다.

  • PDF

텍스트 마이닝을 이용한 리빙랩 연구동향 분석 (Research Trend Analysis on Living Lab Using Text Mining)

  • 김성묵;김영준
    • 디지털융복합연구
    • /
    • 제18권8호
    • /
    • pp.37-48
    • /
    • 2020
  • 본 연구는 텍스트 마이닝을 활용하여 리빙랩 연구의 동향을 파악하고 연구 방향 정립에 필요한 함의를 도출하고자 하였다. 리빙랩 관련 연구가 발표되기 시작한 2011년부터 2019년 11월까지의 논문 166편의 키워드와 초록을 대상으로 네트워크 분석 및 토픽 모델링 기법을 사용하여 분석하였다. 키워드 중 혁신, 지역, 사회, 기술, 스마트시티 등의 출현빈도가 높았고, 중심도 분석결과 현재까지 리빙랩 연구가 혁신, 사회, 기술, 개발, 사용자 등의 키워드를 중심으로 이루어짐을 파악하였다. 토픽 모델링 결과 지역혁신과 사용자지원, 정부 사회정책사업, 스마트시티 플랫폼구축, 기업기술혁신모델 및 시스템전환 참여 등 5개 토픽을 추출하였으며 토픽을 이어주는 키워드는 혁신, 기술, 사용자, 참여인것으로 분석하였다. 2017년 KNoLL 출범 후 토픽별 비중은 고른 분포로 연구 주제가 다양화됨을 확인하였다. 텍스트마이닝을 이용한 리빙랩 연구동향 분석과 방향 제시는 연구와 정책방향 수립에 유용한 자료를 제공할 수 있다.

토픽 모델링을 활용한 국내 초등 정보교육 연구동향 분석 (Analysis of Research Trends in Elementary Information Education in Korea using Topic Modeling)

  • 심재권
    • 정보교육학회논문지
    • /
    • 제25권2호
    • /
    • pp.347-354
    • /
    • 2021
  • 초등학생을 대상으로 인공지능교육에 대한 관심이 증대되면서 기존에 수행된 초등 정보교육 연구를 거시적인 관점에서 분석하여 현재의 상황을 이해하고 후속연구의 시사점을 제공하기 위한 노력이 필요한 시점이라 할 수 있다. 본 연구는 우리나라 초등 정보교육의 연구동향을 조망하고자 하는 목적으로 정보교육학회논문지를 분석하였다. 분석을 위한 데이터는 정보교육학회논문지의 창간호에서 2020년까지 출간된 논문을 모두 선정하였고, 토픽모델링하여 연구주제 11개를 도출하였다. 연구결과, 가장 높은 비중인 토픽 T1은 약 38%을 차지하는 것으로 분석되었고, 토픽 T1에 기여도 순에 따라 교육, 연구, 분석, 초등, 정보의 키워드가 도출었다. 토픽들의 연도별 회귀분석 결과, 연구의 트랜드가 컴퓨팅사고력, 소프트웨어교육, 인공지능교육 등으로 변화하고 있는 것으로 나타났다. 본 연구의 의의는 초등 정보교육과 관련된 텍스트 데이터를 객관적으로 클러스터링하였다는 점에서 의미가 있다고 할 수 있다.

LDA, Top2Vec, BERTopic 모형의 토픽모델링 비교 연구 - 국외 문헌정보학 분야를 중심으로 - (A Comparative Study on Topic Modeling of LDA, Top2Vec, and BERTopic Models Using LIS Journals in WoS)

  • 이용구;김선욱
    • 한국문헌정보학회지
    • /
    • 제58권1호
    • /
    • pp.5-30
    • /
    • 2024
  • 이 연구는 토픽모델링 모형인 LDA, Top2Vec, BERTopic을 대상으로 실험데이터에서 토픽을 추출하고, 그 결과를 비교 분석함으로써 각각의 모형 간의 특성과 차이를 파악하는데 목적이 있다. 실험데이터는 Web of Science(WoS)에 등재된 문헌정보학 분야 학술지 85종에 게재된 논문 55,442편을 대상으로 하였다. 실험 과정으로 우선 각 모형의 파라미터를 기본값 그대로 이용하여 1차 토픽모델링 결과를 얻었고, 최적의 토픽 수를 설정하여 각 모형의 2차 토픽모델링 결과를 얻었으며, 이들을 각 모형과 단계별로 비교분석하였다. 1차 토픽모델링 단계에서는 LDA, Top2Vec, BERTopic 모형이 각각 100개, 350개, 550개의 토픽을 생성하여 세 모형은 각각 매우 다른 크기의 토픽 개수를 가져왔으며, LDA 모형에 비해 Top2Vec이나 BERTopic 모형이 토픽을 3배, 5배 더 세분화하였다. 또한 세 모형은 토픽 당 문서 수의 평균이나 표준편차에서도 많은 차이가 났다. 구체적으로 LDA 모형은 비교적 적은 수의 토픽에 많은 문서를 부여하는 반면, BERTopic 모형은 반대의 경향을 보였다. 25개의 토픽 수를 생성하는 2차 토픽모델링 단계에서는 다른 모형에 비해 Top2Vec 모형이 평균적으로 토픽 당 많은 문서를 부여하고 토픽간에 고르게 문서를 할당하여 상대적으로 편차가 작았다. 또한 모형간의 유사 토픽의 생성여부를 비교하면, LDA와 Top2Vec 모형이 전체 25개 중에 18개(72%)의 공통된 토픽을 생성하여 BERTopic 모형에 비해 두 모형이 더 유사한 결과를 보였다. 향후 토픽모델링 결과에서 각 토픽과 부여된 문서들이 주제적으로 올바르게 형성되었는지에 대한 전문가의 평가를 통해 보다 완전한 분석이 필요하다.

토픽모델링을 활용한 Z세대의 애플리케이션 효용성에 대한 분석: 이용자의 에세이 데이터를 중심으로 (Analysis of the Utilization of Mobile Applications by Generation Z using Topic Modeling :Focusing on Users' Essay Data)

  • 박주연;정도헌
    • 산업융합연구
    • /
    • 제20권1호
    • /
    • pp.43-51
    • /
    • 2022
  • 본 연구는 이용자 중심 관점에서 Z세대의 애플리케이션 사용의 효용성을 분석하여 Z세대에 대한 이해를 돕고 Z세대를 위한 모바일 서비스 마케팅 전략 수립, 교육서비스 개발, 공학교육 등에 필요한 기초 정보를 제공하는데 목적이 있다. 이를 위해 Z세대인 대학생의 애플리케이션 사용경험에 대한 에세이를 177건 수집하였고, 토픽모델링을 활용하여 주요 토픽들을 분석하고, 이를 워드 클라우드 분석을 통해 시각화하였다. 연구 결과 주요 토픽들은 이동, 대중교통 등과 같은 '교통', 일정관리, 금융관리, 음식관리 등과 같은 '개인적 관리', 계산, 모임, 구매, 외식 등과 같은 '거래', 여행, 스터디, 문화 등과 같은 '여가활용' 과 관련된 것으로 나타났다. 그리고 시간, 생각, 사람, 생활, 버스, 정보, 확인, 결제, 카카오톡 등의 용어가 높은 빈도를 보였다. 또한, 단과대학별로 분석한 결과 토픽 간 차이가 나타났다. 본 연구는 비정형데이터인 에세이를 수집하여 애플리케이션 효용성을 토픽모델링을 통해 실증적으로 분석하였다는 점에서 의의가 있다.

신문기사를 이용한 미세먼지 이슈의 토픽 분석 (A Topic Analysis of Fine Particle Matter by Using Newspaper Articles)

  • 양지연
    • 한국콘텐츠학회논문지
    • /
    • 제22권6호
    • /
    • pp.1-14
    • /
    • 2022
  • 본 연구는 미세먼지 관련 기사의 토픽을 추출하고 토픽별 특징 및 시계열 추이를 검토한다. 1990~2021년 중앙지의 기사를 빅카인즈에서 추출하였고, 잠재디리슐레할당 모델링을 이용하여 총 18개의 토픽을 발견하였다. 추가적으로 군집분석을 통해 유사한 토픽들을 병합하여 11개의 클러스터를 도출하였다. 최근 상승하는 토픽들로는 미세먼지 관련 제품/거주지, 국외 요인(중국), 국내 요인 중 발전소 관련 이슈, 전국의 비상조감조치, 국제협력, 관련 정치적 이슈, 세계 각국의 현황 및 대응, 관련 제품의 소비경향 논의로 나타났다. 반면 최근 하락하는 토픽들은 오염농도 기준, 실내 공기질 개선과 관련된 토픽으로 나타났다. 사회적으로 큰 관심사인 미세먼지의 언론보도 양상을 검토함으로써, 미세먼지와 관련한 정책방향과 대응전략을 추론하거나 파악하는 데 유용할 것이다. 미세먼지 관련 제품들의 시장규모가 확대됨에 따라 향후 실효적인 소비자보호정책을 확대하고, 근본적인 문제 해결을 위해 정치적 논쟁보다 국민의 건강과 안전을 목적으로 하는 정책 수립이 요구된다. 또한 국민 공감대와 국제사회 협력을 확대할 수 있는 정책수립이 필요한 것으로 판단된다.

다이나믹토픽모델링을 활용한 문헌정보학 분야의 토픽 변화 분석 (Analysis of Research Topic Trend in Library and Information Science Using Dynamic Topic Modeling)

  • 김선욱;양기덕;이혜경
    • 한국도서관정보학회지
    • /
    • 제53권2호
    • /
    • pp.265-284
    • /
    • 2022
  • 본 연구는 2001년부터 2020년까지 문헌정보학 SSCI 85종 학술지에 게재된 55,442편의 학술논문의 논문제목과 초록을 기반으로 다이나믹토픽모델링을 수행하여, 문헌정보학 분야의 연도별 흐름에 따른 연구 주제 추이를 분석하였다. 그 결과, 10개의 토픽에서 도서관경영(장서개발 및 관리, 도서관평가, 도서관 지식경영, 기획 및 활성화), 정보학(계량정보학, 정보이용행태·이용자연구, 의료정보, 정보시스템), 도서관 서비스(도서관교육·정보리터러시), 도서관체계(도서관 시책 및 정책)에 따른 4개의 대분류를 파악하였다. 연도별 흐름에 따라 정보학 영역의 경우, 계량정보학 연구 주제가 학술지단위에서 논문단위로 변화되고 있었으며, 최근 도서관경영 영역의 경우, 이용자의 의견과 감정에 관련한 연구가 최근 등장하였다. 도서관서비스 연구영역은 20년간 안정적인 연구 주제로 그 양상이 보다 심화되고 견고해졌음을 확인할 수 있었다. 그리고 최근에는 모바일과 소셜미디어와 관련한 연구가 진행 중인 것으로 나타났다. 한편, 정보학영역 하위주제로 의료정보와 관련한 연구가 비중 있게 등장해, 문헌정보학의 간학문적인 특징이 잘 나타난 결과라 판단하였다.

텍스트 마이닝 방법을 활용한 국내 학습상담 연구 동향 분석 (Analysis of Trends in Domestic Learning Counseling Research Using Text Mining Methods)

  • 현용찬;양지혜;박정환
    • 융합정보논문지
    • /
    • 제12권3호
    • /
    • pp.302-310
    • /
    • 2022
  • 본 연구는 청소년의 학습상담 관련 연구 동향을 텍스트 마이닝 방법을 활용하여 얻어진 결과를 살펴보고 후속 연구 방향을 제시하였다. 한국 청소년 고민의 상위 1, 2위는 학습과 진로이다. '학습상담', '학업상담'키워드로 RISS를 통하여 KCI 등재 후보 이상의 학술논문 201편을 대상으로 연구자의 주관과 편견을 최소화할 수 있는 텍스트 마이닝 기법으로 모델링 분석하였다. 학습상담 토픽 결과 상담 경험[토픽1], 집단상담 연구[토픽2], 부모상담[토픽3], 학습기술 프로그램 개발[토픽4]로 나타났다. 학습상담 관련 연구는 정서적인 안정을 위한 상담, 집단상담, 부모상담과 학습기술 프로그램이 개발되고 있다. 청소년의 고민을 해결하기 위한 학습상담은 심리 정서, 부모상담, 학습기술 전문가의 협업을 통한 통합적인 지원을 위한 연구가 지속되기를 기대한다.