• 제목/요약/키워드: Keywords Reorganization

검색결과 5건 처리시간 0.017초

토픽 식별성 향상을 위한 키워드 재구성 기법 (Keyword Reorganization Techniques for Improving the Identifiability of Topics)

  • 윤여일;김남규
    • 한국IT서비스학회지
    • /
    • 제18권4호
    • /
    • pp.135-149
    • /
    • 2019
  • Recently, there are many researches for extracting meaningful information from large amount of text data. Among various applications to extract information from text, topic modeling which express latent topics as a group of keywords is mainly used. Topic modeling presents several topic keywords by term/topic weight and the quality of those keywords are usually evaluated through coherence which implies the similarity of those keywords. However, the topic quality evaluation method based only on the similarity of keywords has its limitations because it is difficult to describe the content of a topic accurately enough with just a set of similar words. In this research, therefore, we propose topic keywords reorganizing method to improve the identifiability of topics. To reorganize topic keywords, each document first needs to be labeled with one representative topic which can be extracted from traditional topic modeling. After that, classification rules for classifying each document into a corresponding label are generated, and new topic keywords are extracted based on the classification rules. To evaluated the performance our method, we performed an experiment on 1,000 news articles. From the experiment, we confirmed that the keywords extracted from our proposed method have better identifiability than traditional topic keywords.

텍스트마이닝을 활용한 주요 대기업 신년사 분석 (Study on CEO New Year's Address: Using Text Mining Method)

  • 김유경;조대곤
    • 한국IT서비스학회지
    • /
    • 제22권2호
    • /
    • pp.93-127
    • /
    • 2023
  • This study analyzed the CEO New Year's addresses of major Korean companies, extracting key topics for employees via text mining techniques. An intended contribution of this study is to assist reporters, analysts, and researchers in gaining a better understanding of the New Year's addresses by elucidating the implicit and implicative features of messages within. To this end, this study collected and analyzed 545 New Year's addresses published between 2012 and 2021 by the top 66 Korean companies in terms of market capitalization. Research methodologies applied include text clustering, word embedding of keywords, frequency analysis, and topic modeling. Our main findings suggest that the messages in the New Year's addresses were categorized into nine topics-organizational culture, global advancement, substantial management, business reorganization, capacity building, market leadership, management innovation, sustainable management, and technology development. Next, this study further analyzed the managerial significance of each topic and discussed their characteristics from the perspectives of time, industry, and corporate groups. Companies were typically found to emphasize sound management, market leadership, and business reorganization during economic downturns while stressing capacity building and organizational culture during market transition periods. Also, companies belonging to corporate groups tended to emphasize founding philosophy and corporate culture.

북한 영어 교과서 어휘의 통시적 분석 (A Diachronic Lexical Analysis of the North Korean English Textbooks)

  • 김지영;이제영;김정렬
    • 한국콘텐츠학회논문지
    • /
    • 제17권4호
    • /
    • pp.331-341
    • /
    • 2017
  • 본 연구는 북한의 영어 교과서에 나타난 어휘의 시대적인 변화를 파악하기 위해 통시적인 관점에서 코퍼스 기반 어휘 분석을 실시하였다. 이를 위해 통일부의 북한자료센터에 소장되어 있는 북한의 중등학교 영어 교과서 중 1996년 교육과정이 적용된 시기를 기준으로 김정일 시대 이전과 이후의 교과서를 구분지어 코퍼스를 구축한 후, 워드스미스 툴스 7.0을 통해 해당 코퍼스를 분석하여 각 교과서들의 어휘 변화 양상을 살펴보았다. 연구 결과 해당 교과서들의 어휘 규모는 개편 후의 교과서가 개편 전에 비해 증가했지만, 어휘 유형과 어휘 다양성은 감소하였다. 교육과정 개편 이전에 비해 개편 이후의 교과서에서 더 자주 등장하는 핵심어(keyword)를 분석한 결과 김정일 체제를 확고히 하기 위한 관련 이념 어휘와 북한의 경제 및 생활상을 반영하는 어휘들이 나타남을 확인할 수 있었다. 또한 다빈도 어휘 100개 목록과 핵심어를 비교한 결과 북한의 영어 교과서의 어휘가 문법과 문어체 위주의 텍스트에서 조금씩 실질적인 의사소통과 관련된 구어체 내용이 증가하고 있었다.

A Big Data Analysis of Public Interest in Defense Reform 2.0 and Suggestions for Policy Completion

  • Kim, Tae Kyoung;Kang, Wonseok
    • Journal of East Asia Management
    • /
    • 제4권1호
    • /
    • pp.1-22
    • /
    • 2023
  • This study conducted a big data analysis study through text mining and semantic network analysis to explore the perception of defense reform 2.0. The collected data were analyzed with the top 70 keywords as the appropriate range for network visualization. Through word frequency analysis, connection centrality analysis, and an N-gram analysis, we identified issues that received much attention such as troop reduction, shortening of military service period, dismantling of the border area unit, and returning wartime operational control. In particular, the results of clustering words through CONCOR analysis showed that there was a great interest in pursuing the technical group, concerns about military capacity reduction, and reorganization of manpower structure. The results of the analysis through text mining techniques are as follows. First, it was found that there was a lack of awareness about measures to reinforce the reduced troops while receiving much attention to the reduction of troops in Defense Reform 2.0. Second, it was found that it is necessary to actively communicate with the local community due to the deconstruction and movement of the border area units, such as the decrease of the population of the region and the collapse of the local commercial area. Third, it was judged that it is necessary to show substantial results through the promotion of barracks culture and the defense industry, which showed that there was less interest than military structure and defense operation from the people and the introduction of active policies. Through this study, we analyzed the public's interest in defense reform 2.0, which is a representative defense policy, and suggested a plan to draw support for national policy.

언어네트워크 분석을 적용한 국가직무능력표준(NCS) 연구 동향 분석 (Analysis on the Trends of Studies Related to the National Competency Standard in Korea throughout the Semantic Network Analysis)

  • 임윤진;손다미
    • 대한공업교육학회지
    • /
    • 제41권2호
    • /
    • pp.48-68
    • /
    • 2016
  • 이 연구의 목적은 국가직무능력표준(NCS) 관련 연구 동향에 대하여 언어네트워크 분석을 적용하여 연구 핵심어의 구명 및 핵심어간의 연결 속성, 그리고 핵심어간의 확장에 대해 살펴보고 향후 NCS관련 연구의 발전 방안에 대하여 모색하고자 수행되었다. 이 연구의 대상은 한국교육학술정보원에서 제공하는 학위논문 및 학술지 논문지 가운데 국가직무능력표준 또는 NCS를 키워드로 하는 논문이며, 총 345편의 논문으로 선정하였다. 연구동향의 분석 방법으로는 언어네트워크 분석방법을 적용하였으며, 이를 위하여 논문의 제목에 나타난 용어에서 핵심어를 도출하였다. 빈도분석을 위하여 KrKwic을 사용하였으며, 연결망 분석을 위하여 UCINET6.0, 연결망의 시각화를 위하여 NetDraw를 활용하였다. 이 연구를 통해 도출된 결과를 제시하면 다음과 같다. 첫째, 국가직무능력표준(NCS) 관련 연구는 2002년부터 시작되어 점진적으로 증가되어 오다가 2014년 이후 큰 폭의 성장세를 이루고 있다. 둘째, 키워드 네트워크 분석 결과 '국가직무능력표준(NCS), 개발, 교육과정, 분석, 활용, 직무, 대학, 교육' 등이 중점 키워드로 나타났다. 셋째, 국가직무능력표준(NCS) 관련 연구의 하위 군집분석 결과 4개의 군집으로 분류되었으며 이는 '국가직무능력표준(NCS)의 취지와 목적을 실현하기 구체적인 전략 등에 관한 연구', '국가직무능력표준(NCS)을 활용하여 직업기초능력 향상과 대학생의 취업 관련 가능성에 탐색적 연구', '전문대학 중심의 전문교과의 교육과정 및 개편을 위한 실무적 연구', '고등학교 수준의 직업교육과정에 요구 및 인식에 관한 분석'으로 볼 수 있었다. 넷째, 국가직무능력표준(NCS)에 관한 국내 연구물의 키워드간의 연결 형성과정은 '직무${\rightarrow}$직무능력${\rightarrow}$국가직무능력표준(NCS)${\rightarrow}$교육${\rightarrow}$과정, 교육과정${\rightarrow}$개발, 대학${\rightarrow}$분석, 활용${\rightarrow}$자격, 적용, 개선${\rightarrow}$방안, 운영, 산업${\rightarrow}$설계${\rightarrow}$평가'의 형태로 확장되고 있었다.