• 제목/요약/키워드: Topic Keywords

검색결과 378건 처리시간 0.027초

TF-IDF의 변형을 이용한 전자뉴스에서의 키워드 추출 기법 (Keyword Extraction from News Corpus using Modified TF-IDF)

  • 이성직;김한준
    • 한국전자거래학회지
    • /
    • 제14권4호
    • /
    • pp.59-73
    • /
    • 2009
  • 키워드 추출은 정보검색, 문서 분류, 요약, 주제탐지 등의 텍스트 마이닝 분야에서 기반이 되는 기술이다. 대용량 전자문서로부터 추출된 키워드들은 텍스트 마이닝을 위한 중요 속성으로 활용되어 문서 브라우징, 주제탐지, 자동분류, 정보검색 시스템 등의 성능을 높이는데 기여한다. 본 논문에서는 인터넷 포털 사이트에 게재되는 대용량 뉴스문서집합을 대상으로 키워드 추출을 수행하여 분야별 주제를 제시할 수 있는 키워드를 추출하는 새로운 기법을 제안한다. 기본적으로 키워드 추출을 위해 기존 TF-IDF 모델을 고찰, 이것의 6가지 변형식을고안하여 이를 기반으로 각 분야별 후보 키워드를 추출한다. 또한 분야별로 추출된 단어들의 분야간 교차비교분석을 통해 불용어 수준의 의미 없는 단어를 제거함으로써 그 성능을 높인다. 제안 기법의 효용성을 입증하기 위해 한글 뉴스 기사 문서에서 추출한 키워드의 질을 비교하였으며, 또한 주제 변화를 탐지하기 위해 시간에 따른 키워드 집합의 변화를 보인다.

  • PDF

TLS 마이닝을 이용한 '정보시스템연구' 동향 분석 (Analysis on the Trend of The Journal of Information Systems Using TLS Mining)

  • 윤지혜;오창규;이종화
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제31권1호
    • /
    • pp.289-304
    • /
    • 2022
  • Purpose The development of the network and mobile industries has induced companies to invest in information systems, leading a new industrial revolution. The Journal of Information Systems, which developed the information system field into a theoretical and practical study in the 1990s, retains a 30-year history of information systems. This study aims to identify academic values and research trends of JIS by analyzing the trends. Design/methodology/approach This study aims to analyze the trend of JIS by compounding various methods, named as TLS mining analysis. TLS mining analysis consists of a series of analysis including Term Frequency-Inverse Document Frequency (TF-IDF) weight model, Latent Dirichlet Allocation (LDA) topic modeling, and a text mining with Semantic Network Analysis. Firstly, keywords are extracted from the research data using the TF-IDF weight model, and after that, topic modeling is performed using the Latent Dirichlet Allocation (LDA) algorithm to identify issue keywords. Findings The current study used the summery service of the published research paper provided by Korea Citation Index to analyze JIS. 714 papers that were published from 2002 to 2012 were divided into two periods: 2002-2011 and 2012-2021. In the first period (2002-2011), the research trend in the information system field had focused on E-business strategies as most of the companies adopted online business models. In the second period (2012-2021), data-based information technology and new industrial revolution technologies such as artificial intelligence, SNS, and mobile had been the main research issues in the information system field. In addition, keywords for improving the JIS citation index were presented.

빅데이터를 활용한 영화흥행 요인 분석: 영화 <기생충>의 SNS 활용지수와 토픽키워드 중심으로 (Analyzing Factors of Success of Film Using Big Data : Focusing on the SNS Utilization Index and Topic Keywords of the Film )

  • 김진욱
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제14권4호
    • /
    • pp.145-153
    • /
    • 2020
  • 빠르게 변화하고 있는 4차 산업 시대에 빅데이터는 다양한 분야에 활용되고 있다. 최근 문화예술콘텐츠 전반에도 빅데이터의 활용은 급속도로 적용되고 있고, 그중에서도 영화는 자본이 많이 드는 예술장르로서 빅데이터의 활용은 매우 유용한 분석 수단이다. 본 연구는 2019년 제72회 칸 영화제의 황금종려상과 아카데미 시상식에서 4관왕(작품상, 감독상, 각본상, 외국어 영화상)을 차지하며 한국영화의 가치를 보여준 영화 <기생충>을 대상으로 빅데이터 분석기법을 적용하여 실시하였다. 이렇게 분석된 값은 데이터의 주기별 변화량과 감성의 값을 부여하는 오피니언 마이닝을 통해 영화 흥행을 예측하고, 페이스북(Facebook), 트위터(Twitter) 등 SNS의 활용지수와 토픽 키워드를 추출하여 관객들의 관심을 반영하는 영화적 요인들이 무엇인지를 살펴보았다. 이처럼 빅데이터를 활용한 영화흥행 요인분석으로 모델 구축 및 모형 개발로 흥행예측이 가능해지면 영화제작 과정의 효율성을 극대화하면서 제작비용과 영화실패에 따른 리스크를 최소화 할 것이다.

토픽모델링과 네트워크분석을 활용한 친환경농업 이슈분석에 관한 연구 (Analyzing Issues on Environment-Friendly Agriculture Using Topic Modeling and Network Analysis)

  • 신예은;신은서;김상범;최진아;김명현;한석준;안경진
    • 농촌계획
    • /
    • 제29권4호
    • /
    • pp.35-53
    • /
    • 2023
  • This study attempts to identify the flow of key topics and issues of research trends related to environment-friendly agriculture conducted around the 2000s in South Korea and compare them with the environment-friendly agriculture promotion plan to seek the level of consistency and the direction of future development of environment-friendly agriculture. For the analysis of environment-friendly agriculture research trends and policy consistency, 'topic modeling', which is suitable for subject classification of large amounts of unstructured data, and 'text network analysis', which visualizes the relationship between keywords as a network and interprets its characteristics, were utilized. Overall, active discussions were held on 'technical discussions for the production and cultivation of environment-friendly agricultural products' and 'food safety & consumer awareness', and keywords such as production, cultivation, consumption, and safety were consistently linked to other keywords regardless of time. In addition, it was found that the issue of environment-friendly agriculture was partially consistent with the policy direction of the period. Considering the fact that the ongoing '5th Environment-Friendly Agriculture Promotion Phase' emphasizes the strengthening of rural environment management and aims to ensure the continuous quantitative and qualitative development of environment-friendly agriculture, active discussions and research on its environmental contributions and management methods are needed.

LDA 토픽 모델링 기법을 활용한 무용공연의 연구 동향 분석 (Trend Analysis of Dance Performance Research Using Keywords and Topic Modeling of LDA Techniques)

  • 시유
    • 산업융합연구
    • /
    • 제22권3호
    • /
    • pp.13-25
    • /
    • 2024
  • 본 연구는 빅데이터를 기반으로 국내에서 발표된 무용공연 관련 연구 주제를 탐색하고, 시대 흐름에 따라 변화하는 연구동향을 살펴본다. 토픽모델링 분석하여 도출한 결과는 다음과 같다. (1)무용공연 마케팅전략 및 발전방안 연구, (2)무용공연 공간 및 공연만족 재관람요인 연구, (3)무대환경이 무용공연의 대중성 활성화와 기여도 연구, (4)무용공연 현황 및 무용단 운영사례 융합 연구, (5)다양한 소셜미디어 활용한 무용공연 확정성 연구, (6)기술적용 무용공연 콘텐츠 방향 및 개발 연구 6개의 주요 토픽이 도출되었다. 이에 무용공연을 비롯해 무용 분야 관련 연구의 시기, 사회 변화에 따른 연구 트렌드와 주제를 파악하고, 연구자들의 변화 관심 주제의 주요 핵심어를 추출해 키워드를 분석하였으며 시기별 주요 키워드를 비교 분석하였다. 이에 다각화되고 융합되면서 신기술이 적용되는 최신 연구 동향에 대한 발전적 연구의 필요성을 고민하고 제시하였다.

소셜 네트워크 환경에서 변형된 TF-IDF를 이용한 핫 토픽 예측 기법 (Hot Topic Prediction Scheme Using Modified TF-IDF in Social Network Environments)

  • 노연우;임종태;복경수;유재수
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권4호
    • /
    • pp.217-225
    • /
    • 2017
  • 최근 실시간으로 생성되는 대용량의 SNS 데이터로부터 유의미한 정보를 찾아내고 분석하는 것이 중요해지면서 핫 토픽 예측에 대한 관심도 크게 증가하고 있다. 기존 핫 토픽 검출 기법은 시간적 속성을 고려하지 않기 때문에 빠르게 변화하는 사회에서 이슈화되는 핫 토픽을 예측하기에는 부적합하다. 본 논문에서는 소셜 네트워크 환경에서 변형된 TF-IDF를 통한 핫 토픽 예측 기법을 제안한다. 변형된 TF-IDF을 이용하여 과거의 IDF 값에 대한 현재의 IDF값의 비율로 순간적으로 이슈화되는 후보 키워드 집합을 추출한다. 추출된 후보 키워드에 사용자의 영향력과 전문성을 고려한 가중치를 부여하여 핫 토픽예측 지수를 계산한다. 제안하는 기법의 우수성을 보이기 위해 기존의 핫 토픽 검출 기법과의 성능평가를 수행한다. 또한 제안하는 기법이 핫 토픽을 정확히 예측하는지를 보이기 위해 네이버 한글 뉴스 기사를 통한 핫 토픽 예측 기법의 질을 평가한다.

아동의 작업 연구주제어의 사회연결망 분석 (Social Network Analysis on Research Keywords of Child-Occupation Studies)

  • 하성규;박강현
    • 재활치료과학
    • /
    • 제12권4호
    • /
    • pp.39-51
    • /
    • 2023
  • 목적 : 본 연구는 국내 학술지를 대상으로 아동의 작업과 관련된 연구주제어의 사회연결망 분석을 통해 아동의 작업과 관련된 연구들의 지적 구조를 규명하고자 한다. 연구방법 : 2003년 8월부터 2023년 8월까지 한국학술지인용색인(Korean Citation Index)에 "아동 and 작업" 키워드를 가진 270편의 연구에서 3,364개의 키워드를 추출하여 분석하였다. 분석도구는 넷마이너(NetMiner) 프로그램을 활용하였다. 결과 : 연구 시기별 아동의 작업 관련 연구주제어의 변화는 없었으며 다만 과거 10년에는 97편의 연구가 있었고 최근 10년에는 173편의 연구가 게재되어 양적 변화가 있었다. 아동의 작업 관련 주제어에서 가장 높은 연결 중심성(degree centrality)을 가진 단어는 Task (0.055), Group therapy (0.040), Working memory (0.037), Intervention (0.033), Performance (0.030), Language (0.026), Ability (0.026), Skill (0.024), Program (0.023) 순이었다. 단어동시 발생 네트워크(Word network)에서 가장 가중치가 높은 단어는 Evaluation-Tool (30), School-Student (15), Activity-Participation (15)이었고, topic modeling에서 각 주제들의 첫 번째 키워드는 Activity (0.295), Disability (0.604), Education (0.356), Skill (0.478), School (0.317), Function (0.462), Disorder (0.324), Language (0.310), Comprehension (0.412), Training (0.511)으로 나타났다. 결론 : 본 연구는 국내 아동의 작업 관련 연구 분야의 경향을 설명했다. 따라서 국외와 국내 연구 흐름을 비교하는 후속 연구가 뒤따라야 할 것이며, 이러한 노력은 국내 연구와 국외 연구의 격차를 해명함으로써 국내 아동의 작업관련 연구 분야에 대한 귀중한 통찰력을 제공할 것이다.

인공지능과 간호에 관한 언론보도 기사의 키워드 네트워크 분석 및 토픽 모델링 (Keyword Network Analysis and Topic Modeling of News Articles Related to Artificial Intelligence and Nursing)

  • 하주영;박효진
    • 대한간호학회지
    • /
    • 제53권1호
    • /
    • pp.55-68
    • /
    • 2023
  • Purpose: The purpose of this study was to identify the main keywords, network properties, and main topics of news articles related to artificial intelligence technology in the field of nursing. Methods: After collecting artificial intelligence-and nursing-related news articles published between January 1, 1991, and July 24, 2022, keywords were extracted via preprocessing. A total of 3,267 articles were searched, and 2,996 were used for the final analysis. Text network analysis and topic modeling were performed using NetMiner 4.4. Results: As a result of analyzing the frequency of appearance, the keywords used most frequently were education, medical robot, telecom, dementia, and the older adults living alone. Keyword network analysis revealed the following results: a density of 0.002, an average degree of 8.79, and an average distance of 2.43; the central keywords identified were 'education,' 'medical robot,' and 'fourth industry.' Five topics were derived from news articles related to artificial intelligence and nursing: 'Artificial intelligence nursing research and development in the health and medical field,' 'Education using artificial intelligence for children and youth care,' 'Nursing robot for older adults care,' 'Community care policy and artificial intelligence,' and 'Smart care technology in an aging society.' Conclusion: The use of artificial intelligence may be helpful among the local community, older adult, children, and adolescents. In particular, health management using artificial intelligence is indispensable now that we are facing a super-aging society. In the future, studies on nursing intervention and development of nursing programs using artificial intelligence should be conducted.

A Process-Centered Knowledge Model for Analysis of Technology Innovation Procedures

  • Chun, Seungsu
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제10권3호
    • /
    • pp.1442-1453
    • /
    • 2016
  • Now, there are prodigiously expanding worldwide economic networks in the information society, which require their social structural changes through technology innovations. This paper so tries to formally define a process-centered knowledge model to be used to analyze policy-making procedures on technology innovations. The eventual goal of the proposed knowledge model is to apply itself to analyze a topic network based upon composite keywords from a document written in a natural language format during the technology innovation procedures. Knowledge model is created to topic network that compositing driven keyword through text mining from natural language in document. And we show that the way of analyzing knowledge model and automatically generating feature keyword and relation properties into topic networks.

토픽모델링을 활용한 응급구조사 관련 연구동향 (Identifying research trends in the emergency medical technician field using topic modeling)

  • 이정은;김무현
    • 한국응급구조학회지
    • /
    • 제26권2호
    • /
    • pp.19-35
    • /
    • 2022
  • Purpose: This study aimed to identify research topics in the emergency medical technician (EMT) field and examine research trends. Methods: In this study, 261 research papers published between January 2000 and May 2022 were collected, and EMT research topics and trends were analyzed using topic modeling techniques. This study used a text mining technique and was conducted using data collection flow, keyword preprocessing, and analysis. Keyword preprocessing and data analysis were done with the RStudio Version 4.0.0 program. Results: Keywords were derived through topic modeling analysis, and eight topics were ultimately identified: patient treatment, various roles, the performance of duties, cardiopulmonary resuscitation, triage systems, job stress, disaster management, and education programs. Conclusion: Based on the research results, it is believed that a study on the development and application of education programs that can successfully increase the emergency care capabilities of EMTs is needed.