• 제목/요약/키워드: topic mining

검색결과 503건 처리시간 0.023초

텍스트 마이닝 기반 사용자 경험 분석 및 관리: 스마트 스피커 사례 (User Experience Analysis and Management Based on Text Mining: A Smart Speaker Case)

  • 연다인;박가연;김희웅
    • 경영정보학연구
    • /
    • 제22권2호
    • /
    • pp.77-99
    • /
    • 2020
  • 스마트 스피커는 인공지능을 활용하여 음악, 일정, 날씨, 상품 등 다양한 정보와 콘텐츠들을 검색, 이용할 수 있는 대화형 음성 기반 서비스를 제공하는 기기이다. 인공지능 기술은 데이터가 축적될수록 이를 활용하여 더욱 정교하고 최적화된 서비스를 이용자에게 제공한다. 따라서 스마트 스피커 제조사들은 초기에 공격적인 마케팅을 통해 플랫폼 구축에 힘썼다. 하지만 스마트 스피커의 사용빈도는 월 1회 미만이 전체의 3분의 1 이상을 차지하고, 사용자 만족도도 49%에 그치는 것으로 나타났다. 이에 지속적인 이용활성화와 만족도 증진을 위해 스마트 스피커의 사용자 경험을 강화할 필요성이 대두되었다. 이에 본 연구에서는 스마트 스피커의 사용자 경험을 분석하고, 이를 바탕으로 스마트 스피커의 사용자 경험 강화 방안을 제시하고자 한다. 본 연구는 사용자가 직접 작성한 실제 리뷰 데이터를 수집하여 스마트 스피커 사용자 경험 차원을 기반으로 분석 결과를 해석했다는 점에서 의의가 있다. 또한 스마트 스피커 사용자 경험 차원을 개발하여 텍스트 마이닝 결과를 해석한 것에서 학술적 의의가 있다. 본 연구 결과를 통해 스마트 스피커 제조사에게 실무적으로 사용자 경험 강화를 위한 전략을 제안할 수 있다.

디지털 인문학에서 비정형 데이터 분석을 이용한 사조 분류 방법 (Mining Intellectual History Using Unstructured Data Analytics to Classify Thoughts for Digital Humanities)

  • 서한솔;권오병
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.141-166
    • /
    • 2018
  • 최근 디지털 인문학 (Digital humanities) 연구분야의 등장으로 정보기술을 활용하여 인문학 연구의 효율성 제고에 기여하고 있다. 특히 인문학 연구에서 특정한 인물 혹은 문서가 어떠한 사상 (idea)을 담고 있는지와 다른 사상과의 어떤 연결성을 가지는지를 자동적인 방법으로 분석하는 것은 지성사(intellectual history)를 파악하는 데 중요한 도전이 될 것이다. 본 연구의 목적은 책이나 논문, 기사와 같은 비정형 데이터 (unstructured data)에 포함된 주장을 파악하고 이를 다른 주장이나 사상과 어떠한 관련이 있는지를 자동으로 분석하는 방법을 제안하는 것이다. 특히 본 연구에서는 주장과 주장 사이의 영향관계를 밝히는 히스토리 마이닝 (History Mining)이라는 방법도 제안하였다. 이를 위해 딥러닝 기법 (deep learning method)을 포함한 분류알고리즘 기법 (classification algorithm)을 활용하였다. 본 연구가 제안하는 방법론의 성능을 검증하기 위하여 철학 사조 중에서 대표적으로 대비되는 경험주의와 합리주의 관련 철학자들을 선정하고 관련된 저서 혹은 인터넷 상의 글을 수집하였다. 분류 알고리즘의 성능은 Recall, Precision, F-Score 및 Elapsed Time으로 측정하였으며 DNN, Random Forest, 그리고 앙상블 등이 우수한 성능을 보였다. 선정된 분류 알고리즘으로 특정 철학자의 글에 대해 합리주의 혹은 경험주의로 분류하였으며, 그 철학자의 활동 연도를 고려하여 히스토리 맵을 생성할 수 있었다.

텍스트마이닝 기법을 이용한 국내 농식품유통 연구동향 분석 (A Trend Analysis of Agricultural and Food Marketing Studies Using Text-mining Technique)

  • 유리나;황수철
    • 한국산학기술학회논문지
    • /
    • 제18권10호
    • /
    • pp.215-226
    • /
    • 2017
  • 이 연구는 1984~2015년간 국내 농식품 유통분야 연구동향을 파악하기 위해 텍스트마이닝 기법을 이용한 분석 결과이다. 텍스트마이닝은 빅데이터 분석방법의 일환으로, 많은 정보를 객관적으로 처리하여 연구주제 분류와 트렌드 분석에 이용할 수 있다. 실제분석에는 빈도분석, 토픽분석, 연관성분석을 수행하였다. 자료는 농업부문 4개 학술지 수록논문과 연구보고서 중 농식품 유통 관련 연구 제목를 이용하였다. 그 결과, 농식품 유통분야의 논문 1,126건은 6개 주제로 분류되었다. 2000년대를 기점으로 이전에는 도매와 산지연구가 활발했던 반면 이후에는 소비, 식품, 수출입 연구가 활발한 것으로 나타났다. 또한 로컬푸드와 학교급식 영역의 연구가 증가했다. 농산물 수급연구는 정책 연구보고서에서만 주기적으로 이루어졌으며, 학술논문에서는 2000년대 이후 관심주제에서 멀어지는 경향을 보였다. 2010년대 이후로는 특히 소비연구가 주류를 이루었고, 크게 소비트렌드와 소비자 행동에 관한 다양한 연구가 이루어졌다. 이 결과를 바탕으로 더 정확한 연구동향 분석을 하기위해서는, 정밀한 주제 분류기법으로 방법론을 보완하고 이용 자료를 키워드와 논문초록으로 확대함으로써 구체적인 결과를 도출해야 할 것이다.

텍스트마이닝 기법을 활용한 국내외 장소성 관련 연구동향 분석 (Analyzing the Study Trends of 'Sense of Place' Using Text Mining Techniques)

  • 이인아;김혜진
    • 한국비블리아학회지
    • /
    • 제30권2호
    • /
    • pp.189-209
    • /
    • 2019
  • 주경로 분석(Main Path Analysis, MPA)은 문헌의 인용정보를 기반으로 지식이 전달되는데 기여한 핵심 문헌을 추출하는 텍스트마이닝 기법 중 하나이다. 본 연구는 1990년부터 2018년까지 국내외에서 발행된 장소성 관련 논문의 인용정보와 초록을 토대로 주경로 분석과 단어동시출현빈도 연관어 네트워크 분석을 적용하여 연구동향을 파악하였다. 1990년부터 2018년까지 수집된 문헌을 5년씩 기간 구분하여 (마지막 기간은 3년) 각 기간 별로 국내외에서 장소성 관련 연구가 전반적으로 어떻게 진행되었는지 비교 분석하여 제시하였다. 주경로 분석 결과, 1990년부터 해외의 장소성 관련 연구는 개인 정체성, 공공 토지 관리, 환경 교육, 도시 개발 분야 순으로 진행되어 온 것으로 나타났다. 단어동시출현을 기반으로 한 연관어 네트워크를 통해서는 국내의 경우 도시 개발, 문화, 문학, 역사 등 다양한 차원에서 장소성이 논의되는 격변기를 겪는 것으로 해석할 수 있었다. 반면 국외에서는 건강, 정체성, 경관, 도시 개발 관련 논의가 90년대부터 꾸준히 이루어지고 있는 것으로 파악되었다. 본 연구는 장소성 연구동향을 기존의 특정 영역에 장소성 개념을 적용하여 분석하는 미시적 관점의 분석이 아닌 다양한 텍스트마이닝 기법을 적용하여 장소성을 주제로 삼고 있는 논문의 전반적인 흐름을 파악하는 통시적 접근의 방법을 제시하였다는 점에서 시사점을 지닌다.

인과관계문형 기반 사회이슈 발생원인 도출 방법 연구 (A study on the method of deriving the cause of social issues based on causal sentences)

  • 이남연;이재형
    • 디지털융복합연구
    • /
    • 제19권3호
    • /
    • pp.167-176
    • /
    • 2021
  • 최근 빅데이터 분석 기술이 발전하면서 사회 이슈를 분석하기 위해 그 동안 많은 텍스트 마이닝 기법을 활용한 연구들이 진행되어왔다. 사회이슈를 도출하기 위한 기존의 연구들을 살펴보면 다량의 텍스트 데이터를 뉴스, SNS 등으로부터 수집하여 토픽 모델링, 네트워크 분석 등의 기법을 이용하여 데이터로부터 이슈를 추출하고 분석하는 방식으로 연구들이 이루어져왔다. 사회 이슈는 다양한 사회현상들이 누적되어 나타나는 결과물이다. 하지만 기존 연구들이 가지는 한계점은 사회적으로 나타나는 이슈, 즉 결과에 대한 분석에 초점이 맞춰져 있어 해당 이슈의 발생 원인을 밝히는 것에는 한계를 가진다는 것이다. 사회이슈에 적절하게 대응하기 위해서는 어떠한 사회이슈가 존재하는지를 확인하는 것뿐만 아니라 사회이슈의 발생 원인을 파악하는 것이 필요하다. 이러한 한계점을 극복하기 위해서 본 연구에서는 사회 이슈와 관련한 텍스트로부터 사회이슈의 원인이 되는 요인을 도출하는 방법을 국어학의 품사이론을 기반으로 제안하였다. 이를 위해서 2017년 1월부터 2019년 12월까지의 3년 동안의 사회이슈와 관련한 뉴스데이터를 수집하여 수집된 텍스트 내 단어들의 인과관계를 인과문형을 찾아 분석한 후 기존 텍스트마이닝 기법 접목하여 사회이슈의 원인 단어들을 찾는 방법론을 제안하였다.

텍스트마이닝을 활용한 아동, 청소년 대상 소비관련 연구 키워드 분석 (Keyword Analysis of Research on Consumption of Children and Adolescents Using Text Mining)

  • 진현정
    • 한국가정과교육학회지
    • /
    • 제33권4호
    • /
    • pp.1-13
    • /
    • 2021
  • 본 연구는 텍스트마이닝 기법으로 최근 20년간 아동, 청소년 대상 소비 관련 연구의 주요어를 분석하여 소비 관련 연구의 동향을 파악하고자 하였다. 이를 위하여 KCI 등재/등재후보 학술지에 게재된 아동, 청소년의 소비관련 연구 869편의 주요어를 분석하였다. 빈도분석 결과 가장 빈도가 높은 주요어는 청소년, 청소년소비자, 소비자교육, 과시소비, 소비행동, 캐릭터, 경제교육, 윤리적소비 순으로 나타났다. 5년 단위로 주요어의 빈도를 분석한 결과, 2006년~2010년에는 소비자교육의 빈도가 월등하게 높아 이 시기에 소비자교육에 관한 연구가 많이 이루어졌음을 확인할 수 있었다. 2011년 이후 윤리적소비에 관한 연구가 활발해졌으며, 최근 5년 동안은 두드러지는 주요어가 없는 대신 다양한 주제로 연구가 이루어졌음을 알 수 있었다. TF-IDF 기준으로 주요어를 살펴보면 2001년~2005년 사이에는 환경과 인터넷 관련 단어가 주요 키워드였다. 2006년~2010년에는 미디어이용, 광고 교육, 인터넷아이템, 2011년~2015년에는 공정무역, 녹색성장, 녹색소비, 북한이탈청소년, 소셜미디어, 2016~2020년에는 텍스트마이닝, 지속가능발전교육, 메이커교육, 2015개정교육과정이 중요한 용어로 등장하였다. 토픽모델링 결과, 소비자교육, 대중매체/또래문화, 합리적 소비, 한류/문화산업, 소비자역량, 경제교육, 교수학습방법, 친환경/윤리적소비의 8개의 토픽이 도출되었다. 동시 출현 빈도를 활용한 네트워크 분석을 통해 아동, 청소년 관련 소비 연구에서 과시소비와 소비자교육이 중요한 연구주제임을 알 수 있었다.

텍스트마이닝을 활용한 종분포모형의 국내 연구 동향 파악 (Trends identification of species distribution modeling study in Korea using text-mining technique)

  • 김동주;권용성;한나연;이도훈
    • 환경생물
    • /
    • 제41권4호
    • /
    • pp.413-426
    • /
    • 2023
  • 종분포모형은 생물다양성 보전 및 기후변화 영향평가 등을 위해 활발히 이용되는 방법론이며, 국내에서도 다양한 연구가 진행되고 있으나, 관련 연구 현황과 최근의 동향을 파악하고 시사점을 논의하여 미래 연구에 유용한 정보를 제공하는 연구는 부족한 실정이다. 본 연구에서는 국내의 학술지에서 출판된 학술논문을 대상으로 종분포모형의 활용 동향과 흐름을 파악하여 향후 관련 연구에서 활용될 수 있는 기초적인 정보를 제공하고자 하였다. 우리는 국내의 관련 학술논문을 수집하여 문헌학적 방법과 텍스트마이닝을 통해 분석했고 이를 토대로 종분포모형 관련 연구현황과 최근의 동향을 파악하였다. 국내 종분포모형 관련 학술논문은 1998년부터 2023년까지 총 148편이 출판되었으며, 그중 115편(77.7%)은 2015년 이후 출판된 것으로 나타났다. 다양한 알고리즘 중 MaxEnt 모델이 가장 많이 활용되었으며(44.5%), 식물을 대상으로 한 연구와 생물종 분포 및 평가, 기후변화와 관련된 주제가 주요 주제로 다루어졌다. 텍스트마이닝 분석에서 가장 많이 출현한 핵심어는 "Climate change"로 다양한 연구 주제에서 기후변화로 인한 생물다양성 변화를 고려하였다. 향후 종분포모형의 활용에는 다양한 조건에 따른 최적의 모형 선택, 모형 간 연계, 정량적인 입력 변수의 개발 등을 고려할 필요가 있으며, 현지 조사 자료의 수집 체계 개선 등을 도모하면 생물 다양성 보전과 기후 대응 등 국가 정책 수요에 유용하게 활용될 수 있는 과학적 도구로써 기여가 가능할 것으로 판단된다.

텍스트마이닝 기법을 활용한 미국산업응용수학 학회지의 연구 현황 및 동향 분석 (Analysis on Status and Trends of SIAM Journal Papers using Text Mining)

  • 김성연
    • 한국콘텐츠학회논문지
    • /
    • 제20권7호
    • /
    • pp.212-222
    • /
    • 2020
  • 본 연구의 목적은 전 세계 산업수학의 흐름을 주도하는 미국산업응용수학 학회에서 출판하는 논문들의 연구현황 및 동향을 거시적으로 파악하는 데 있다. 이를 위해 2016년부터 2019년까지 6,255편의 논문 제목 및 초록을 수집하였으며, LDA 기법을 활용한 토픽모델링과 시계열회귀모형 분석을 수행하였다. 분석 결과 첫째, 산업수학 분야는 해석학을 중심으로 기하학, 대수학, 위상수학, 이산수학, 확률 및 통계 등 다양한 분야에서 연구가 진행되었다. 둘째, 시간이 흐름에 따라 상승하는 연구 주제는 수리유체역학, 그래프이론, 확률미분방정식이었으며, 하강하는 연구 주제는 계산이론과 고전기하로 나타났다. 연구 결과는 산업수학 분야의 지적 구조에 대한 전체적인 흐름 및 변화에 대한 이해를 바탕으로 연구자들에게는 향후 연구 방향에 대해서, 그리고 교육 현장에는 시대 변화를 반영한 산업수학 교육과정을 수립하는데 시사점을 제공할 것이다.

소셜미디어를 통한 우울 경향 이용자 담론 주제 분석 (An Analysis of the Discourse Topics of Users who Exhibit Symptoms of Depression on Social Media)

  • 서하림;송민
    • 정보관리학회지
    • /
    • 제36권4호
    • /
    • pp.207-226
    • /
    • 2019
  • 우울증은 전 세계적으로 많은 사람들이 겪고 있으며, 최근 다양한 분야에서 꾸준히 우울증에 대한 연구가 수행되고 있다. 특히 사람들이 본인의 스트레스나 감정 상태에 대해 소셜미디어에 공유한 글을 통해 그들의 심리나 정신건강에 대해 파악해보고자 하는 맥락에서 소셜미디어를 활용한 연구 역시 유의미하게 받아들여지고 있다. 이에 본 연구에서는 우울 경향의 이용자와 그렇지 않은 이용자들의 2016년부터 2019년 2월까지의 트위터 데이터를 수집하여 어떤 주제적, 어휘 사용의 특성을 보이는지 보고자 하였으며, 우울 경향의 시기별로도 어떤 차이를 보이는지 살펴보기 위해 우울 경향 관측 날짜를 기준으로 하여 이전(before) 시기와 이후(after) 시기를 구분하여 실험을 수행하였다. 토픽모델링, 동시출현 단어분석, 감성분석 방법을 통해 우울 경향과 비(非)우울 경향 이용자의 텍스트의 주제적 차이를 살펴보았고, 감성 반응에 따라 사용한 어휘에 대해서도 살펴봄으로써 어떠한 특성이 있는지 확인해 보았다. 데이터 수집 단계에서 '우울' 표현을 포함한 텍스트 데이터 수집방법을 통해 비교적 긴 기간, 많은 양의 데이터를 수집할 수 있었고, 또한 우울 경향의 여부와 시기적 구분에 따른 관심 주제에 대한 차이도 확인할 수 있었다는 점에서 유의미하다고 볼 수 있다.

Semi Automatic Ontology Generation about XML Documents

  • Gu Mi Sug;Hwang Jeong Hee;Ryu Keun Ho;Jung Doo Yeong;Lee Keum Woo
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2004년도 Proceedings of ISRS 2004
    • /
    • pp.730-733
    • /
    • 2004
  • Recently XML (eXtensible Markup Language) is becoming the standard for exchanging the documents on the web. And as the amount of information is increasing because of the development of the technique in the Internet, semantic web is becoming to appear for more exact result of information retrieval than the existing one on the web. Ontology which is the basis of the semantic web provides the basic knowledge system to express a particular knowledge. So it can show the exact result of the information retrieval. Ontology defines the particular concepts and the relationships between the concepts about specific domain and it has the hierarchy similar to the taxonomy. In this paper, we propose the generation of semi-automatic ontology based on XML documents that are interesting to many researchers as the means of knowledge expression. To construct the ontology in a particular domain, we suggest the algorithm to determine the domain. So we determined that the domain of ontology is to extract the information of movie on the web. And we used the generalized association rules, one of data mining methods, to generate the ontology, using the tag and contents of XML documents. And XTM (XML Topic Maps), ISO Standard, is used to construct the ontology as an ontology language. The advantage of this method is that because we construct the ontology based on the terms frequently used documents related in the domain, it is useful to query and retrieve the related domain.

  • PDF