• 제목/요약/키워드: 토픽분석

검색결과 677건 처리시간 0.026초

성격유형과 흥미유형에 따른 독서 감상문 토픽 분석 연구 (A Study on the Topic Modeling Analysis of Book Reports on Personality Types and Interest Types)

  • 임정훈
    • 정보관리학회지
    • /
    • 제40권1호
    • /
    • pp.175-198
    • /
    • 2023
  • 본 연구에서는 성격유형과 흥미유형에 따른 독서 감상문에 나타난 독서에 대한 반응의 차이를 탐구하였다. 이를 위해 대전의 D과학고등학교 3학년 학생 81명을 대상으로 성격유형분석 데이터, 흥미유형분석 데이터, 교과독서 활동으로 작성된 독서 감상문 데이터를 수집하였다. 수집된 독서 감상문의 토픽 분석을 수행하고, 성격유형(사고형, 감정형)과 흥미유형(탐구형, 탐구형 외)에 따른 독서 감상문의 토픽 발현 확률을 통계적으로 검증하였다. 이어서 키워드 네트워크 분석을 통해 단어들의 개념 연결 구조를 측정하고, 중심성 지표를 통해 토픽모델링의 분석 결과를 보완하였다. 연구 결과, 토픽 회귀분석을 통해 토픽2(이해와 공부)와 토픽3(읽기와 사고)에서 사고형(T)과 감정형(F) 간에 통계적으로 유의한 차이를 확인할 수 있었으며, 토픽2(이해와 공부)에서 탐구형과 탐구형 외 간에 통계적으로 유의한 차이가 확인되었다. 본 연구의 결과는 맞춤형 도서 추천이나 개인화를 고려한 독서교육의 기초자료로 활용될 수 있을 것이다.

기업근로자 경력성공 인식의 다차원성과 차이: 토픽모델링의 적용 (Differences and Multi-dimensionality of the Perception of Career Success among Korean Employees: A Topic Modeling Approach)

  • 이재은;채충일
    • 한국콘텐츠학회논문지
    • /
    • 제19권6호
    • /
    • pp.58-71
    • /
    • 2019
  • 이 연구는 우리나라 기업근로자가 인식하는 경력성공의 다차원성과 개인특성에 따른 차이를 토픽모델링 방법을 적용하여 탐색하고자 하는 목적으로 수행되었다. 연구목적을 달성하기 위해 경력성공에 대한 인식을 개방형 설문을 통해 수집하였으며 126명의 기업근로자들의 응답자료를 바탕으로 R 프로그램을 활용하여 분석하였다. 분석결과 한국 근로자의 경력성공 인식에 대한 5가지 토픽이 도출되었다. 구체적으로, 토픽1은 사회적으로 인정받는 직장에 다니는 것(사회적 인정), 토픽 2는 조직 내에서 자신의 업무에 충실하며 견디는 것(조직 내 근속), 토픽 3은 자기 분야에 지식과 노하우를 갖고 전문성을 갖는 것(전문성), 토픽 4는 일한 만큼 경제적 보상과 성과를 얻는 것(경제적 보상), 토픽 5는 일을 통해 보람과 성취감 같은 개인적 의미를 추구하는 것(개인적 의미 추구)으로 나타났다. 또한, 성별, 연령, 학력에 따른 각 토픽별 발현비율 차이가 확인되었다. 이 연구를 통해 경력성공 인식의 다차원성과 개인특성에 따른 경력성공 인식 차이를 확인하였으며, 개방형 설문자료와 같은 비정형 데이터 분석에서 토픽모델링 방법을 활용가능성을 제시하였다.

'블록체인 활용' 관련 빅데이터를 활용한 토픽 분석: 신문기사를 중심으로 (Topic Analysis Using Big Data Related to 'Blockchain usage': Focused on Newspaper Articles)

  • 김성애;전수진
    • 산업융합연구
    • /
    • 제18권1호
    • /
    • pp.73-78
    • /
    • 2020
  • 이 연구에서는 블록체인 기술의 활용과 관련된 주요 토픽을 분석하기 위해 신문기사에 나타난 '블록체인 기술 활용' 빅데이터를 토픽 모델링기법을 적용하였다. 이를 위해 2013년부터 2019년까지, 21개의 신문사로부터 15,617건을 대상으로 토픽을 추출하고 주요 트렌트를 시기별로 구분하여 분석하였다. 분석결과 블록체인기술 활용과 관련된 기사는 2015년부터 기하급수적으로 증가하였으며 IT_과학 분야와 경제 분야에 집중되었다. 기간에 따라 차이는 있지만 암호화폐, 비트코인, 가상화폐와 관련된 키워드의 가중치가 높았다. 금융거래에 집중되었던 블록체인기술은 빅데이터, 사물인터넷, 인공지능으로 점차 확대되었다. 이에 따라 기업의 토픽 변화도 함께 이루어져 금융거래를 위한 은행에서 다양한 분야로 확대되면서 대기업과 글로벌기업으로 집중되었다. 이 연구를 통해 블록체인기술의 활용과 관련한 신문기사의 주요 토픽과 함께 이러한 토픽들이 어떠한 변화추이를 보이고 있는지에 대해 확인할 수 있었다.

소상공인 연구 동향 분석 (Investigating the Trends of Research for the Small Business Owners)

  • 방미현;이영민
    • 한국콘텐츠학회논문지
    • /
    • 제22권7호
    • /
    • pp.73-80
    • /
    • 2022
  • 본 연구는 지난 20여 년간의 국내 소상공인 선행연구 280편을 주제어 네트워크와 LDA 토픽 모델링 분석을 통해 종합적으로 분석하고, 학계에서의 전반적인 시각과 동향을 살펴보았다. 핵심 주제어는 서로 상충 되지만 안정적이고 지속적인 성장을 위해서 필수적인 요소인 '영업'과 '보호'를 선정하였고, 7개의 토픽(토픽 1: 창업, 토픽 2: 디지털, 토픽 3: 세제, 토픽 4: 역량, 토픽 5: 상생, 토픽 6: 규제, 토픽 7: 자금)을 도출하였다. 분석 결과를 토대로, 소상공인들의 지속적인 성장과 발전을 위한 디지털 성숙도 향상의 필요성을 제기하였고, 소상공인들의 직면한 경제적 타격 문제 해결을 위해 범부처 차원의 대응과 새로운 정권 이후에도 존속될 수 있는 기능 수행 조직의 안정성을 제시하였다. 또한, 장기적, 신속성, 세밀성, 새로운 방식으로의 정부 지원 방향에 대한 주목과 선 허용 후, 규제를 하는 네거티브 방식으로의 유연한 접근을 제언하였다.

LDA를 사용한 COVID-19 관련 국내 논문의 연구 토픽 분석 (Research Topic Analysis of the Domestic Papers Related to COVID-19 Using LDA)

  • 김은회;서유화
    • 한국정보전자통신기술학회논문지
    • /
    • 제15권5호
    • /
    • pp.423-432
    • /
    • 2022
  • 본 논문은 학술연구자들이 COVID-19 관련 논문의 전체적인 연구 동향을 파악할 수 있도록 한다. KCI 사이트에서 수집한 2020년 1월부터 2022년 7월까지 총 10,599편의 COVID-19 관련 논문 정보를 LDA 토픽 모델링으로 분석한 결과를 제시한다. 또한 학술연구자들이 자신의 관심 연구분야의 토픽을 쉽게 파악할 수 있도록 LDA 토픽 모델링의 결과를 주요 연구 카테고리별로 분석하고, 토픽별로 연구가 많이 이루어지는 세부 연구 카테고리 정보를 분석한다. 학술연구자들이 시간의 흐름에 따른 연구 토픽의 추세(trend)를 파악하는 것은 연구 동향을 파악하는데 매우 중요하다. 따라서 이를 위해 본 논문에서는 시계열 분해를 사용하여 토픽들의 추세(trend)를 분석하여 제시한다.

토픽 모델을 이용한 방송 대본 분석 사례 연구 (A case study of a broadcast script by using topic model)

  • 노윤석;곽창욱;김선중;박성배;이상조
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.228-230
    • /
    • 2015
  • 방송 대본은 방송 콘텐츠에 대해 얻을 수 있는 가장 주요한 텍스트 데이터 중에 하나이다. 본 논문에서는 토픽 모델을 통해 방송 대본 분석을 수행하고 그 결과를 제시한다. 방송 대본을 토픽 모델로 학습하기 위해 대본의 장면 단위로 문서를 구성하여 학습하여 대본의 장면을 분석하고 등장인물 단위로 문서를 구성하여 등장인물을 분석하여 그 특징을 살펴본다. 토픽 모델을 사용하여 방송 대본을 분석하는 과정에서 방송 대본이 가지는 특징을 분석하고 그로부터 향후 연구방향에 대해 논의한다.

  • PDF

감성분석과 토픽모델링을 활용한 농촌태양광 관련 이슈 연구 : 언론 기사와 블로그 포스트 비교 (Application of Sentiment Analysis and Topic Modeling on Rural Solar PV Issues : Comparison of News Articles and Blog Posts)

  • 기재홍;안승혁
    • 디지털융복합연구
    • /
    • 제18권9호
    • /
    • pp.17-27
    • /
    • 2020
  • 사회적 의제 설정 영향력을 지닌 미디어인 언론 기사와 블로그 포스트에서 농촌태양광이 어떻게 다루어지고 있는지 분석하기 위해 텍스트 마이닝 방법을 활용하였다. 농촌태양광을 키워드로 웹스크래핑을 통해 기사와 블로그 포스트의 텍스트 자료를 수집하고, 이에 대해 감성분석과 토픽모델 기법을 적용하여 연구를 수행했다. 감성분석 결과 농촌태양광에 대한 텍스트에서 두 매체 모두 긍정적인 입장을 가지는 비율이 높았는데, 블로그의 경우 기사에 비해 부정적인 내용을 담은 텍스트의 비중이 훨씬 낮은 것을 확인할 수 있었다. 그리고 토픽모델링 결과로 긍정 기사는 정부의 보급계획 관련 토픽들의 비중이 컸고, 부정 기사는 다양한 토픽들의 비중이 고르게 분포하였다. 블로그는 긍정 포스트의 경우 농촌 지역 설치 관련 토픽들이, 부정 포스트는 환경 피해 관련 토픽들이 가장 큰 부분을 차지했다. 기존에 별개로 이루어지던 감성분석과 토픽모델링을 결합하는 연구 방식을 제시함으로써 농촌태양광에 대한 이슈를 효과적으로 파악할 수 있었다.

국내 기록관리학 연구동향 분석을 위한 토픽모델링 기법 비교 - LDA와 HDP를 중심으로 - (Comparison of Topic Modeling Methods for Analyzing Research Trends of Archives Management in Korea: focused on LDA and HDP)

  • 박준형;오효정
    • 한국도서관정보학회지
    • /
    • 제48권4호
    • /
    • pp.235-258
    • /
    • 2017
  • 본 연구에서는 최근 각광을 받고 있는 텍스트마이닝 기법인 LDA 토픽모델링과 이를 변형한 HDP 토픽모델링을 적용하여 국내 기록관리학의 연구동향을 분석하고자 한다. 이를 위해 국내 기록관리학 관련 학술지 2종과 문헌정보학 관련 학술지 4종에서 1997년부터 2016년까지 발표된 기록관리학 관련 논문 1,027건을 수집하고 적절한 전처리과정을 거친 후 LDA 토픽모델링과 HDP 토픽모델링을 각각 수행하였다. 또한 토픽모델링 시각화 도구인 LDAvis를 활용하여 토픽별 거리를 가시적으로 표현하고 세부 대표 키워드를 분석하였다. 두 토픽모델링을 비교한 결과, LDA 토픽모델링은 전반적으로 해당 도메인을 대표하는 주요 키워드로 빈도수에 영향을 많이 받았으며, HDP 토픽모델링은 각 토픽별 특징을 파악할 수 있는 특수한 키워드가 많이 도출되었다. 이를 통해 LDA는 국내 기록관리학 내에 거시적으로 대표되는 주제들을, HDP는 세부 주제별 미시적인 핵심 키워드를 도출하는데 효과적임을 알 수 있었다.

소셜 데이터에서 재난 사건 추출을 위한 사용자 행동 및 시간 분석을 반영한 토픽 모델

  • 촐몽 바야르;이경순
    • 정보와 통신
    • /
    • 제34권6호
    • /
    • pp.43-50
    • /
    • 2017
  • 본고에서는 소셜 빅데이터에서 공공안전에 위협되고 사회적으로 이슈가 되는 재난사건을 추출하기 위한 방법으로 소셜 네트워크상에서 사용자 행동 분석과 시간분석을 반영한 토픽 모델링 기법을 알아본다. 소셜 사용자의 글 수, 리트윗 반응, 활동주기, 팔로워 수, 팔로잉 수 등 사용자의 행동 분석을 통하여 활동적이고 신뢰성 있는 사용자를 분류함으로써 트윗에서 스팸성과 광고성을 제외하고 이슈에 대해 신뢰성 높은 사용자가 쓴 트윗을 중요하게 반영한다. 또한, 트위터 데이터에서 새로운 이슈가 발생한 것을 탐지하기 위해 시간별 핵심어휘 빈도의 분포 변화를 측정하고, 이슈 트윗에 대해 감성 표현 분석을 통해 핵심이슈에 대해 사건 어휘를 추출한다. 소셜 빅데이터의 특성상 같은 날짜에 여러 이슈에 대한 트윗이 많이 생성될 수 있기 때문에, 트윗들을 토픽별로 그룹핑하는 것이 필요하므로, 최근 많이 사용되고 있는 LDA 토픽모델링 기법에 시간 특성과 사용자 특성을 분석한 시간상에서의 중요한 사건 어휘를 반영하고, 해당이슈에 대한 신뢰성 있는 사용자가 쓴 트윗을 중요시 반영하도록 토픽모델링 기법을 개선한 소셜 사건 탐지 방법에 대해 알아본다.

LDA 토픽 모델링을 활용한 SNS 분석 (SNS Analysis Using LDA Topic Modeling)

  • 장민수;임선영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.402-403
    • /
    • 2023
  • 본 연구의 목적은 LDA 토픽 모델링을 활용하여 한국어 SNS데이터에 분석을 통해 우리나라의 여가활동, 일과 직업, 주거와 생활의 동향을 살펴보는 것이다. AI Hub에서 제공하는 한국어 SNS데이터를 수집하고 형태소 분석, 전처리 과정을 거친 후 coherence score을 토대로 최적의 토픽 수를 결정하여 토픽을 추출하였다. 도출한 트렌드를 바탕으로 경영, 마케팅 분야에 미치는 영향을 예측할 수 있을 것으로 기대한다.