• 제목/요약/키워드: 토픽분석

검색결과 660건 처리시간 0.034초

비정형 텍스트 기반의 토픽 모델링을 이용한 건설 안전사고 동향 분석 (A Study on the Trends of Construction Safety Accident in Unstructured Text Using Topic Modeling)

  • 이상규
    • 한국산학기술학회논문지
    • /
    • 제19권10호
    • /
    • pp.176-182
    • /
    • 2018
  • 본 연구는 건설 안전사고에 대한 트랜드 분석을 위해 LDA(Latent Dirichlet Allocation) 기반의 토픽모델링(Topic Modeling)을 제시하여 분석하고자 한다. 특히, 건설산업의 안전사고를 예방하기 위해 제시되고 있는 기존의 다양한 정형데이터 분석에서 벗어난 비정형 데이터 분석 기반의 토픽 모델링을 통해 건설 안전사고 주요 핵심 키워드의 흐름에 대해 파악이 가능하다. 본 방법론을 적용하기 위해 540개의 건설 안전사고 관련 뉴스데이터를 수집하였다. 이를 기반으로, 10가지 토픽과 각 토픽 내의 10가지 키워드를 통해 주요 이슈를 도출하였고 각 토픽에 대한 2017년 1월부터 2018년 2월까지의 뉴스 데이터를 월별 시계열 분석을 통해 향후 토픽에 관한 이슈를 예측한다. 본 연구를 바탕으로 향후 건설 안전사고의 다양한 이슈를 선제적으로 예측하고 이를 기반으로 건설 안전사고 정책과 연구에 좋은 방향을 제시할 것으로 판단한다.

토픽모델링을 활용한 Z세대의 애플리케이션 효용성에 대한 분석: 이용자의 에세이 데이터를 중심으로 (Analysis of the Utilization of Mobile Applications by Generation Z using Topic Modeling :Focusing on Users' Essay Data)

  • 박주연;정도헌
    • 산업융합연구
    • /
    • 제20권1호
    • /
    • pp.43-51
    • /
    • 2022
  • 본 연구는 이용자 중심 관점에서 Z세대의 애플리케이션 사용의 효용성을 분석하여 Z세대에 대한 이해를 돕고 Z세대를 위한 모바일 서비스 마케팅 전략 수립, 교육서비스 개발, 공학교육 등에 필요한 기초 정보를 제공하는데 목적이 있다. 이를 위해 Z세대인 대학생의 애플리케이션 사용경험에 대한 에세이를 177건 수집하였고, 토픽모델링을 활용하여 주요 토픽들을 분석하고, 이를 워드 클라우드 분석을 통해 시각화하였다. 연구 결과 주요 토픽들은 이동, 대중교통 등과 같은 '교통', 일정관리, 금융관리, 음식관리 등과 같은 '개인적 관리', 계산, 모임, 구매, 외식 등과 같은 '거래', 여행, 스터디, 문화 등과 같은 '여가활용' 과 관련된 것으로 나타났다. 그리고 시간, 생각, 사람, 생활, 버스, 정보, 확인, 결제, 카카오톡 등의 용어가 높은 빈도를 보였다. 또한, 단과대학별로 분석한 결과 토픽 간 차이가 나타났다. 본 연구는 비정형데이터인 에세이를 수집하여 애플리케이션 효용성을 토픽모델링을 통해 실증적으로 분석하였다는 점에서 의의가 있다.

과학기술용어 간 관계 도출을 위한 토픽 분석 연구 (Research of Topic Analysis for Extracting the Relationship between Science Data)

  • 김무철
    • 한국전자거래학회지
    • /
    • 제21권1호
    • /
    • pp.119-129
    • /
    • 2016
  • 웹의 발달과 함께 많은 정보들이 쏟아지기 시작했다. 그에 따라서 사회 이슈들을 소셜 데이터로부터 추출하고, 이에 대한 해결 방법을 모색하는 연구에 대한 관심이 많아지고 있다. 이에 본 연구에서는 과학기술문헌들을 수집하고, 분석해서 이슈 토픽 별로 군집화 하는 연구를 수행한다. 이를 위해서 보건분야의 주요 용어들을 중심으로 수집하고, 효과적인 분석을 위한 데이터 처리 및 토픽들을 중심으로 군집화 연구를 수행한다. 그 결과, 연구 이슈들을 도출하고 사회 현상에 대한 해결 방안을 마련할 수 있는 토대를 구축하고자 한다.

토픽모델링과 네트워크분석을 활용한 헬스케어 분야의 핵심기술과 기술융합 분석 연구: 특허정보를 중심으로 (Analyzing Core Tehnology and Technological Convergence in Healthcare Using Topic Modeling and Network Analysis: Focus on Patent Information)

  • 김은정;최희진
    • 한국정보통신학회논문지
    • /
    • 제26권5호
    • /
    • pp.763-778
    • /
    • 2022
  • 본 연구는 융합산업으로 각광받고 있는 헬스케어 분야를 중심으로 기술융합을 이루는 요소기술과 핵심기술을 파악하여 기술융합 현상을 분석하고자 하였으며, 이를 위해 2011년부터 2020년까지의 국내 특허 중 헬스케어와 관련 있는 특허 총 376개를 수집하여 토픽모델링과 네트워크 분석을 수행하였다. 첫째, 토픽모델링 분석 결과 "데이터수집·분석", "생체신호측정", "건강관리", "디지털정보 수집 및 전송", "진단·치료", "측정 진단장치" 총 6개의 주요 토픽이 도출되었다. 둘째, 앞서 분석한 토픽별로 네트워크 분석을 수행하여 기술간 연결망 구조를 파악한 후 기술융합 특성을 확인하고, 중심성 지표를 통해 핵심기술을 도출하였다. 본 연구의 핵심인 국내 헬스케어의 핵심·요소기술동향 및 기술융합도 분석결과는, 기업의 신규 가치창출을 위한 제품·서비스개발 방향성을 수립하거나, 학계 및 정부의 헬스케어 산업을 육성·지원하기 위한 전략 및 정책적인 방향성을 수립하는데 기초자료로 활용될 수 있을 것이다.

토픽모델을 활용한 택배 서비스 소비자와 종사자의 불만 사항 분석 (Analysis regarding Complaints of Courier Consumers and Workers in the Parcel Delivery Service by using Topic Model)

  • 신진규
    • 융합정보논문지
    • /
    • 제10권2호
    • /
    • pp.39-48
    • /
    • 2020
  • 택배 업계의 서비스 품질 향상과 고객 만족에 영향을 미치는 요인들을 다양한 차원에서 분석한 연구가 많이 이루어져 왔다. 이러한 연구의 대부분은 한정된 응답자를 대상으로 설문조사나 인터뷰 등의 질적 방법이 사용되어 자료의 형식과 내용, 응답자의 범위가 제한적이라는 한계가 있다. 이에 본 연구에서는 장기간에 축적된 불특정 다수의 소비자 상담 사례와 업계 종사자의 불만이 반영된 기사문을 대상으로 삼아 택배 서비스에서 소비자와 공급자가 지적하는 불만에 관한 주요 토픽을 탐색하고 분석하여 선행 연구의 미비점을 보완하고자 하였다. 또한, 이러한 토픽이 시점에 따라 어떻게 변화하는지 흐름을 분석함으로써 최근에 제기된 새로운 토픽을 발굴하고 시사점을 제시하고자 하였다. 이 결과 지연/분실/오배송 토픽과 택배 산업 경쟁 심화 토픽이 중심을 이루는 것으로 나타났다. 토픽 트렌드 분석 결과 최근 국제 택배 상담 내용이 다소 늘었고, 아파트 택배 배송과 관련된 갈등이 많이 다루어져 이를 정부 정책에 반영하거나 연구 주제로 다루어 볼 수 있을 것이다. 연구 결과 나타난 토픽은 선행 연구에서 다루어진 내용이 주를 이루지만 내밀한 상담사례와 학술 문헌 등 다른 자료와 분석 방법을 추가하면 더 새롭고 가치있는 토픽을 도출할 수 있을 것이라고 기대한다.

게임사들의 이슈 대응 방식에 대한 사용자들의 반응 분석: 토픽모델링 분석을 중심으로 (Analyzing user reactions to how game companies respond to issues: Focusing on Topic Modeling Analysis)

  • 김유현;김유섭
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.727-729
    • /
    • 2022
  • 본 연구는 2021 게임업계 연쇄 파동을 통해 게임사 이슈 대응에 대한 사용자들의 인식이 바뀐 것에 주목하여 메이플스토리 확률 조작 사건에서 나타난 사용자들의 반응을 토픽모델링으로 분석하였다. 이를 위해 사건의 발단이 된 메이플스토리 테스트 월드 업데이트 내용이 업로드된 2021년 2월 18일 17시를 기점으로 국내 온라인 게임 커뮤니티 중 하나인 인벤의 자유게시판에서 총 10만 개의 게시물을 수집하고 토픽모델링 분석을 실시하였다. 이후 도출된 주제별 주요 단어를 10개씩 확인하여 주제를 정의했다. 각 토픽을 비교하며 관련성을 확인했고 이를 통해 사용자들의 반응을 분석한 결과 확률 조작으로 인한 보상으로 환불을 원하고 있다는 것과 아이템의 확률을 조작했다는 것에 대한 사용자들의 분노, 디렉터 본인의 직접적인 사과문과 사용자와의 소통 요구, 또 다른 게임으로의 이탈을 확인할 수 있었다.

온톨로지 언어의 비교 연구: W3C OWL과 ISO 토픽맵을 중심으로 (A Comparison of Ontology Languages: Focusing on W3C OWL and ISO Topic Maps)

  • 오삼균
    • 한국비블리아학회지
    • /
    • 제15권2호
    • /
    • pp.71-96
    • /
    • 2004
  • 이 연구의 목적은 국제표준 온톨로지 언어로 간주되고 있는 W3C의 웹 온톨로지 언어(OWL)와 ISO 토픽맵(Topic Map)의 핵심개념을 상세히 기술하고, 각 언어의 의미표현력에 대해서 비교분석하는 것이다. 본 논문의 구성은, 첫째 온톨로지의 기반을 이루고 있는 URI와 네임스페이스에 대해서 기술하는 것이고, 둘째 토픽맵의 핵심 개념인 토픽(Topic), 연계(Association), 어커런스(Occurrence) 등에 대한 상세한 설명을 제공하는 것이고, 셋째 토픽맵이 검색결과를 의미 있는 그룹으로 묶어서 보여 주어야 한다는 목록의 제2목적을 효율적으로 성취하는 방법에 대해서 기술하는 것이고, 마지막으로 토픽맵과 OWL의 의미표현력의 차이점에 대해서 상세하게 비교분석한 내용으로 되어 있다.

  • PDF

신문기사를 이용한 미세먼지 이슈의 토픽 분석 (A Topic Analysis of Fine Particle Matter by Using Newspaper Articles)

  • 양지연
    • 한국콘텐츠학회논문지
    • /
    • 제22권6호
    • /
    • pp.1-14
    • /
    • 2022
  • 본 연구는 미세먼지 관련 기사의 토픽을 추출하고 토픽별 특징 및 시계열 추이를 검토한다. 1990~2021년 중앙지의 기사를 빅카인즈에서 추출하였고, 잠재디리슐레할당 모델링을 이용하여 총 18개의 토픽을 발견하였다. 추가적으로 군집분석을 통해 유사한 토픽들을 병합하여 11개의 클러스터를 도출하였다. 최근 상승하는 토픽들로는 미세먼지 관련 제품/거주지, 국외 요인(중국), 국내 요인 중 발전소 관련 이슈, 전국의 비상조감조치, 국제협력, 관련 정치적 이슈, 세계 각국의 현황 및 대응, 관련 제품의 소비경향 논의로 나타났다. 반면 최근 하락하는 토픽들은 오염농도 기준, 실내 공기질 개선과 관련된 토픽으로 나타났다. 사회적으로 큰 관심사인 미세먼지의 언론보도 양상을 검토함으로써, 미세먼지와 관련한 정책방향과 대응전략을 추론하거나 파악하는 데 유용할 것이다. 미세먼지 관련 제품들의 시장규모가 확대됨에 따라 향후 실효적인 소비자보호정책을 확대하고, 근본적인 문제 해결을 위해 정치적 논쟁보다 국민의 건강과 안전을 목적으로 하는 정책 수립이 요구된다. 또한 국민 공감대와 국제사회 협력을 확대할 수 있는 정책수립이 필요한 것으로 판단된다.

토픽 모형 및 사회연결망 분석을 이용한 한국데이터정보과학회지 영문초록 분석 (Analysis of English abstracts in Journal of the Korean Data & Information Science Society using topic models and social network analysis)

  • 김규하;박철용
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권1호
    • /
    • pp.151-159
    • /
    • 2015
  • 이 논문에서는 텍스트마이닝 (text mining) 기법을 이용하여 한국데이터정보과학회지에 게재된 논문의 영어초록을 분석하였다. 먼저 다양한 방법을 통해 단어-문서 행렬 (term-document matrix)을 생성하고 이를 사회연결망 분석 (social network analysis)을 통해 시각화하였다. 또한 토픽을 추출하기 위한 방법으로 LDA (latent Dirichlet allocation)와 CTM (correlated topic model)을 사용하였다. 토픽의 수, 단어-문서 행렬의 생성방법에 따라 엔트로피 (entropy)를 통해 토픽 추출 모형들의 성능을 비교하였다.

온라인 주식 포럼의 핫토픽 탐지를 위한 감성분석 모형의 개발 (Development of Sentiment Analysis Model for the hot topic detection of online stock forums)

  • 홍태호;이태원;리징징
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.187-204
    • /
    • 2016
  • 소셜 미디어를 이용하는 사용자들이 직접 작성한 의견 혹은 리뷰를 이용하여 상호간의 교류 및 정보를 공유하게 되었다. 이를 통해 고객리뷰를 이용하는 오피니언마이닝, 웹마이닝 및 감성분석 등 다양한 연구분야에서의 연구가 진행되기 시작하였다. 특히, 감성분석은 어떠한 토픽(주제)를 기준으로 직접적으로 글을 작성한 사람들의 태도, 입장 및 감성을 알아내는데 목적을 두고 있다. 고객의 의견을 내포하고 있는 정보 혹은 데이터는 감성분석을 위한 핵심 데이터가 되기 때문에 토픽을 통한 고객들의 의견을 분석하는데 효율적이며, 기업에서는 소비자들의 니즈에 맞는 마케팅 혹은 투자자들의 시장동향에 따른 많은 투자가 이루어지고 있다. 본 연구에서는 중국의 온라인 시나 주식 포럼에서 사용자들이 직접 작성한 포스팅(글)을 이용하여 기존에 제시된 토픽들로부터 핫토픽을 선정하고 탐지하고자 한다. 기존에 사용된 감성 사전을 활용하여 토픽들에 대한 감성값과 극성을 분류하고, 군집분석을 통해 핫토픽을 선정하였다. 핫토픽을 선정하기 위해 k-means 알고리즘을 이용하였으며, 추가로 인공지능기법인 SOM을 적용하여 핫토픽 선정하는 절차를 제시하였다. 또한, 로짓, 의사결정나무, SVM 등의 데이터마이닝 기법을 이용하여 핫토픽 사전 탐지를 하는 감성분석을 위한 모형을 개발하여 관심지수를 통해 선정된 핫토픽과 탐지된 핫토픽을 비교하였다. 본 연구를 통해 핫토픽에 대한 정보 제공함으로써 최신 동향에 대한 흐름을 알 수 있게 되고, 주식 포럼에 대한 핫토픽은 주식 시장에서의 투자자들에게 유용한 정보를 제공하게 될 뿐만 아니라 소비자들의 니즈를 충족시킬 수 있을 것이라 기대된다.