• 제목/요약/키워드: 토픽 추출

검색결과 213건 처리시간 0.026초

소셜 빅데이터를 이용한 영화 흥행 요인 분석 (Movie Box-office Analysis using Social Big Data)

  • 이오준;박승보;정다울;유은순
    • 한국콘텐츠학회논문지
    • /
    • 제14권10호
    • /
    • pp.527-538
    • /
    • 2014
  • 수요 예측은 영화 산업에서 매우 중요한 문제이다. 최근 들어 트위터(Twitter), 페이스북(Facebook)과 같은 소셜미디어의 비정형 텍스트 데이터를 이용하여 영화 흥행을 예측하고 분석하는 시도들이 활발하게 이루어지고 있다. 기존에는 주로 데이터의 주기별 변화량을 측정하여 데이터 양과 영화 흥행간의 상관성을 분석하거나 데이터에 대해 감성의 극성 값을 부여하는 오피니언 마이닝을 통해 영화의 흥행 추이를 예측하였다. 하지만 이러한 정량적 접근만으로는 관객들이 영화를 선택하게 된 근거나 영화의 어떤 속성을 선호하는지를 알 수 없기 때문에 영화의 흥행 요인을 밝히는데 한계가 있었다. 따라서 본 연구는 트위터 데이터를 수집한 후 빈도수 측정을 통해 트윗의 내용을 대표하는 토픽(topic) 키워드를 추출하여 관객들의 관심을 반영하는 영화적 속성들이 무엇인지를 밝히고, 그 속성들에 대한 관객들의 반응을 분석함으로써 영화의 흥행에 영향을 미친 요인들을 제시한다.

온라인 쇼핑몰에서 소셜 네트워크 데이터를 고려한 상품 트렌드 분석 (Item Trend Analysis Considering Social Network Data in Online Shopping Malls)

  • 박수빈;최도진;유재수;복경수
    • 한국콘텐츠학회논문지
    • /
    • 제20권2호
    • /
    • pp.96-104
    • /
    • 2020
  • 온라인 쇼핑몰의 활성화로 소비자들의 소비 활동이 활발해짐에 따라 기업들은 매출 증대를 위해 소비자의 상품 트렌드 분석을 수행하고 있다. 기존의 상품 트렌드 분석 기법들은 온라인 쇼핑몰 사용자의 활동만을 고려하여 분석하기 때문에 구매 이력이 없거나 새로운 상품에 대한 트렌드를 파악하기 어렵다. 본 논문에서는 쇼핑몰에서 사용자의 트렌드와 잠재적 고객의 트렌드를 분석하기 위해 온라인 쇼핑몰 데이터와 소셜 네트워크 데이터를 결합한 트렌드 분석 기법을 제안한다. 제안하는 기법은 서비스 내 데이터 분석을 위해 사용자의 활동로그를 분석하고 활동 로그가 없는 잠재적인 사용자들의 관심도를 반영하기 위해 소셜 네트워크 데이터에서 단어 집합 추출을 통해 생성한 핫 토픽을 결합하였다. 최종적으로 상품 지수와 소셜 네트워크에서의 언급수를 활용하여 시간에 따른 상품 트렌드 변화를 탐지한다. 소셜 네트워크 데이터를 활용한 성능 평가를 통해 제안하는 기법의 우수성을 입증한다.

텍스트 내용 지식 기반의 철학 온톨로지 구축 (Implementation a Philosophy Ontology based on Knowledge of Text Contents)

  • 김정민;최병일;김형주
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제11권3호
    • /
    • pp.275-283
    • /
    • 2005
  • 시맨틱 웹이나 지식기반 시스템에서 지식 검색의 핵심 컴포넌트는 온톨로지이다. 하지만 현재 실용적인 온톨로지가 구축된 경우를 찾아보기는 어렴다. 실용적인 온톨로지 구축을 위해서는 특정 도메인의 지식 전문가에 의한 지식의 개념화와 온톨로지 설계자에 의한 지식의 명세화가 필요하며 이를 바탕으로 개발 팀원들 사이에 공유할 수 있는 자세한 온톨로지 생성 가이드라인이 필요하다. 그러나 기존의 온톨로지 생성 방법론은 은톨로지 구축 프로세스의 단계들을 상위 수준에서 나열하는 절차 중심의 방법론이다 본 논문에서는 철학 학문의 지식을 구조화하는 실용적인 온톨로지를 구축하는 방법으로서 텍스트 내용에 들어있는 지식을 온톨로지로 생성하는 토픽맵 기반의 덱스트 온톨로지 방법론을 제시하였다. 이 방법론은 지식 자원으로부터 지식을 분석하고 추출하는 온톨로지 모델링 단계와 형식 언어와 데이타 모델을 이용하여 온톨로지를 생성하는 온톨로지 구현 단계로 구성된다. 방법론과 함께 본 논문에서는 철학 온톨로지에 기반한 철학 지식 검색의 효율성을 보이기 위해 철학 지식 포털을 구현하였다.

SNS 빅데이터 분석을 활용한 국립과학관에 대한 이미지 분석과 경영전략 제안 (Image Analysis and Management Strategy for The National Science Museum Utilizing SNS Big Data Analysis)

  • 신성연
    • 한국산학기술학회논문지
    • /
    • 제21권1호
    • /
    • pp.81-89
    • /
    • 2020
  • 본 연구의 목적은 대중들이 지각하는 과학관에 대한 인식의 분석을 바탕으로 효과적인 과학관 경영전략을 제시하는 것이며, 이를 위해 연구문제들을 설정하여 분석을 진행하였다. 자료의 수집과 분석은 질적연구방법과 양적연구방법을 융합하여 이미지 분석에 대한 새로운 접근방식을 통해 진행되었다. 먼저 면담(Interviewing)을 통한 질적연구방법을 통해 면접 대상자들(대학생, 대학원생 및 일반인)로부터 과학이라는 개념에 대한 이미지를 도출한 후 텍스트 분석을 실시하였다. 그리고 국립과학관과 관련하여 국내 대형 포털사이트 검색결과 중 블로그 포스팅 12,920건의 제목에서 추출한 63,987개의 단어에 대한 LDA기반 토픽 모델링(Latent Dirichlet Allocation Topic modeling)을 통한 양적연구방법을 융합하여 연구가 진행되었다. 분석결과, 응답자 특성에 따라 과학에 대한 인식은 차이가 있는 것으로 확인되었다. 국립과학관에 대한 포털사이트 검색결과는 20개의 토픽으로 도출되었고 7개의 요인으로 분류되었다. 본 연구의 결론에는 이에 대한 논의와 과학관 경영전략을 제시하고 있다.

선박가치 변화요인에 관한 중요도 평가 연구 (A Study on the Evaluation of Importance of Factors Affecting the Vessel Value)

  • 최정석;남궁호
    • 해양환경안전학회지
    • /
    • 제28권1호
    • /
    • pp.91-99
    • /
    • 2022
  • 해운산업은 선박이라는 재화를 이용하여 화물을 운송하고 운임을 수취하여 사업을 영위하는 서비스산업이다. 따라서 선박운영을 위해 대규모 자본투자가 필요한 환경 속에서 선박의 가치가 불확실하다면 해운경영상의 리스크는 클 수 밖에 없다. 본 연구는 선박가치 변화에 영향을 미치는 변화요인을 파악하고 각 변화요인에 대한 중요도를 분석하고자 하였다. 이를 위해 텍스트마이닝과 토픽모델링 기법을 활용하여 선박가치 변화요인을 추출하고 구조화하여 3개의 주요인과 12개의 보조요인으로 계층적 구조를 설정하였다. 이를 대상으로 AHP분석을 통해 연구를 진행하여 각 요인별 상대적 중요도를 분석하였다. 분석 결과 선박가치 변화에 가장 큰 영향을 미치는 주요요인은 Shipping Factor였으며, 그 뒤를 Investment Factor와 Environment Factor가 차지하였다. 보조요인 가운데는 Volatility of Shipping Market와 Volatility of Shipping Freight 등 해운시장의 변동성과 관련된 요인들이 가장 큰 영향을 미치는 것으로 분석되었다.

LDA와 LSTM를 응용한 뉴스 기사 기반 선물가격 예측 (Futures Price Prediction based on News Articles using LDA and LSTM)

  • 주진현;박근덕
    • 산업융합연구
    • /
    • 제21권1호
    • /
    • pp.167-173
    • /
    • 2023
  • 경제지표를 분석하는 방법으로 회귀 분석이나, 인공지능을 활용하여 미래의 데이터를 예측하는 연구가 발표되었다. 본 연구에서는 토픽모델링을 사용하여 과거 뉴스 기사로부터 얻은 주제 확률 데이터를 이용한 인공지능으로 미래 선물 가격을 예측하는 시스템을 구상하였다. 과거 뉴스 기사로부터 비지도학습을 통한 문서의 주제를 추출할 수 있는 LDA 방법으로 각 뉴스 기사 주제 확률 분포 데이터를 얻을 수 있고, 해당 데이터를 인공지능의 RNN의 파생 구조인 LSTM의 입력 데이터로 활용함으로써 미래 선물 가격을 예측하였다. 본 연구에서 제안한 방법에서는 선물 가격의 추세를 예측할 수 있었고, 이를 활용하여 추후 옵션 상품 등의 파생 상품에 대한 가격 추세도 예측할 수 있을 것으로 보인다. 다만, 일부 데이터에 대해 오차가 발생하는 것이 확인되어 정확도 향상을 위한 추가적인 연구가 필요하다.

키워드 분석을 활용한 인공지능 교육 정책의 시사점 연구 (A Study on Implications of AI Education Policy using Keyword Analysis)

  • 이재호;정홍원
    • 정보교육학회논문지
    • /
    • 제26권5호
    • /
    • pp.397-406
    • /
    • 2022
  • 본 연구에서는 2020년 정부에서 발표한 "인공지능시대 교육정책방향과 핵심과제"에서 제시한 3대 정책 추진 방향을 확인하고, '20-'22년 발표된 인공지능 교육 관련 정부 정책 자료들로부터 키워드를 추출해 방향과 핵심과제가 정책으로 어떻게 반영되고 있는지 분석하였다. 텍스트 마이닝 빈도 분석 결과 정부가 추진하는 다양한 정책 방향을 확인하였고, 매트릭스 데이터에서 핵심 추진과제로 설정된 교육의 방향을 분석하였다. 토픽 분석 결과 인공지능 분야의 인재 양성을 위한 다양한 형태의 교육활동을 확인하였고, 개정 교육과정이 적용되기 전 다양한 콘텐츠가 개발되고 있는 것도 확인하였다. 최종적으로 정부의 정책 방향은 '25년 개정 교육과정을 본격적으로 적용하는 동시에 인공지능 교육 정책을 고도화, 활성화하고 현장에 자연스럽게 안착하도록 하는 쪽으로 움직일 것이며 교육과정이 적용되는 시기가 점점 다가올수록 현장 안착과 관련된 정책과 과제들이 점점 더 많이 등장할 것으로 예측할 수 있었다.

WTO에서 한국은 무슨 말을 해왔나?: 각료회의 대표발언문 분석을 중심으로 (What has Korea told in the WTO? : An analysis on the Ministerial Conference Statements)

  • 서정민
    • 무역학회지
    • /
    • 제48권1호
    • /
    • pp.29-53
    • /
    • 2023
  • 본 연구는 WTO 최고 의사결정기구인 WTO 각료회의(MC)에서 회원국 대표들의 발언을 분석하여 지난 27년 동안 한국이 WTO에 대해 보여준 입장과 태도를 살펴본다. 이를 위해 WTO 문서 데이터베이스에서 회원국이 작성한 약 1,800개의 성명서 문서를 추출하여 텍스트 데이터셋을 구축한 후, 다른 회원국과 비교하여 한국 발언의 특징을 파악하기 위해 텍스트 마이닝 기법을 적용한다. 발언 수, 발언 길이 등 형식적 특징을 통해 한국의 WTO에 대한 관심 지속성, WTO에 대한 관심 정도 등 기본적인 태도를 측정하는 한편, 실체적 특징으로 LDA 토픽 모델을 통한 한국 발언의 주제들을 분류하고, 다른 회원국 발언과의 비교분석을 통해 각료회의 회기별 한국 대표 발언의 키워드를 분석한다.

텍스트 마이닝 기법을 이용한 정보시스템 분야 연구 동향 분석 (Exploring Dynamics of Information Systems Research Trend Using Text Mining Approach)

  • 안정국;김소담;김희웅
    • 경영정보학연구
    • /
    • 제18권3호
    • /
    • pp.73-96
    • /
    • 2016
  • 최근 정보통신기술(Information and Communication Technology) 및 사물인터넷 시대가 도래함에 따라 융복합 환경에 따른 다양한 기술의 발전이 이루어지고 있다. 이에 따라 관련 학문에 대한 이론 및 활용 기술에 대한 관심이 고조되고 있는 상황이다. 이러한 패러다임의 변화는 학문들 간의 급격한 융복합 현상을 초래하였으며, 특히 정보시스템학(Information Systems)은 이러한 변화를 선도해 왔다. 정보시스템학은 다른 학문들과의 관계에 있어서 분화적(Divergence) 역할에서 나아가 융합적(Convergence) 역할까지 수행하고 있으나, 이러한 연구 동향에 관한 연구는 부족한 실정이다. 따라서, 본 연구에서는 시간 경과에 따른 정보시스템의 연구동향을 비교 분석하여 핵심 개념들을 살펴봄으로써 향후 정보시스템학 연구의 방향에 대한 시사점을 찾고자 한다. 구체적으로, 1980년부터 2015년까지의 경영 정보학의 상위 국제저널 48,102개의 논문제목, 저자, 초록, 키워드 분석을 통해 저자들의 공동 연구 네트워크 분석 및 연구 토픽 추출 결과를 연대별로 비교 분석하여 시각화하였다. 본 연구의 결과가 정보시스템 분야의 연구자들에게 정보시스템의 정체성에 대한 폭넓은 이해와 향후 연구 방향에 대한 새로운 시사점을 주기를 기대한다.

홈쇼핑 사이트의 정보를 검색하기 위한 온톨로지 설계 (Ontology Modelling for the Information Retrieval of Home Shopping Sites)

  • 구미숙;황정희;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.238-240
    • /
    • 2004
  • 현재의 웹은 사용자가 원하는 정보를 정확하고 빠르게 검색 결과를 보여주지 못하는 단점이 있다. 그러므로 사용자에게 정확한 정보 전달을 해 주고자 시맨틱 웹이 등장하게 되었다. 시맨틱 웹은 기계가 이해할 수 있는 온톨로지를 구성하여 사용자가 원하는 정보를 정확하게 전달해 줄 수 있다는 점에서 미래의 웹으로 각광을 받게 될 것이다. 시맨틱 웹의 기반이 되고 있는 온톨로지는 어떤 특정 도메인에서 사용되는 정보들과 그 정보들 간의 관계를 정의해 놓은 것으로 관련 도메인 전문가들과 협의에 의하여 개념들과 관계들의 구조를 정하고 이를 기반으로 구축된다. 실제의 응용 시스템에서는 도메인마다의 구체적인 지식을 포함하는 온톨로지 설계가 필요하다. 이 논문에서는 택배회사가 홈쇼핑사이트 업체를 대상으로 효율적인 마케팅을 하기 위친 홈쇼핑사이트에 대한 기본정보를 추출하는 것을 목적으로 한다. 온톨로지를 구축하는 온톨로지 언어에는 RDF, RDF(S), DAML+OIL, OWL. Topic Map등이 있다. 이 논문에서는 토픽맵을 사용하여 홈쇼핑 사이트 정보를 검색하기 위한 홈쇼핑 사이트에 대한 온톨로지를 설계하였다.

  • PDF