• 제목/요약/키워드: Keyword Topic Information

검색결과 161건 처리시간 0.022초

텍스트마이닝을 활용한 정보보호 키워드 기반 소셜미디어 빅데이터 분석 (Social Media Bigdata Analysis Based on Information Security Keyword Using Text Mining)

  • 정진명;박영호
    • 한국산업정보학회논문지
    • /
    • 제27권5호
    • /
    • pp.37-48
    • /
    • 2022
  • 디지털 기술의 발전으로 사회적 이슈들이 SNS와 같은 디지털 기반 플랫폼을 통해서 소통되고 여론을 형성하기도 한다. 본 연구에서는 소셜미디어를 통해서 공유되고 있는 정보보호 이슈관련 여론을 살펴보기 위하여 대표적인 단문 소셜네트워크서비스인 트위터 빅데이터 분석을 진행하였다. 2021년 1년간 14개 정보보호 관련 키워드를 중심으로 데이터를 수집한 후, 데이터마이닝 기술을 활용하여 용어 빈도(TF)분석과 피어슨 계수를 활용한 상관분석을 통해 키워드간의 상관관계를 밝혔다. 또한 잠재적 확률기반 LDA 토픽모델링을 실시하여 정보보호분야에 많은 관심을 받았던 6개의 주요 토픽을 도출하였다. 이러한 결과는 관련 산업의 전략수립이나, 정부 정책수립 시 주요 키워드를 도출하는 기초데이터로 활용될 수 있을 것으로 기대된다.

Patent Technology Trends of Oral Health: Application of Text Mining

  • Hee-Kyeong Bak;Yong-Hwan Kim;Han-Na Kim
    • 치위생과학회지
    • /
    • 제24권1호
    • /
    • pp.9-21
    • /
    • 2024
  • Background: The purpose of this study was to utilize text network analysis and topic modeling to identify interconnected relationships among keywords present in patent information related to oral health, and subsequently extract latent topics and visualize them. By examining key keywords and specific subjects, this study sought to comprehend the technological trends in oral health-related innovations. Furthermore, it aims to serve as foundational material, suggesting directions for technological advancement in dentistry and dental hygiene. Methods: The data utilized in this study consisted of information registered over a 20-year period until July 31st, 2023, obtained from the patent information retrieval service, KIPRIS. A total of 6,865 patent titles related to keywords, such as "dentistry," "teeth," and "oral health," were collected through the searches. The research tools included a custom-designed program coded specifically for the research objectives based on Python 3.10. This program was used for keyword frequency analysis, semantic network analysis, and implementation of Latent Dirichlet Allocation for topic modeling. Results: Upon analyzing the centrality of connections among the top 50 frequently occurring words, "method," "tooth," and "manufacturing" displayed the highest centrality, while "active ingredient" had the lowest. Regarding topic modeling outcomes, the "implant" topic constituted the largest share at 22.0%, while topics concerning "devices and materials for oral health" and "toothbrushes and oral care" exhibited the lowest proportions at 5.5% each. Conclusion: Technologies concerning methods and implants are continually being researched in patents related to oral health, while there is comparatively less technological development in devices and materials for oral health. This study is expected to be a valuable resource for uncovering potential themes from a large volume of patent titles and suggesting research directions.

네트워크 분석과 동적 토픽모델링을 활용한 국내 인공지능 분야 연구동향 분석 (Analyzing Research Trends of Domestic Artificial Intelligence Research Using Network Analysis and Dynamic Topic Modelling)

  • 정우진;오찬희;주영준
    • 한국문헌정보학회지
    • /
    • 제55권4호
    • /
    • pp.141-157
    • /
    • 2021
  • 본 연구는 국내 인공지능 분야 연구동향을 파악하기 위해 국내 학술지에 발표된 인공지능 분야 논문들을 대상으로 네트워크 분석 및 동적 토픽 모델링 분석을 진행하였다. 2020년까지 KCI(한국학술지인용색인)에 등록된 논문 중 '인공지능'과 'artificial intelligence' 두 개의 키워드 중 하나 또는 하나 이상이 논문 제목 또는 색인 키워드에 포함한 2,552개 논문들의 메타데이터 및 초록을 수집하였다. 키워드, 소속기관, 주제 분야, 초록의 추출 및 전처리 작업을 진행하였고 키워드를 활용한 키워드 동시 출현 네트워크 구축 및 분석으로 국내 인공지능 분야의 주요 키워드를 확인하였으며, 소속기관 정보를 활용한 기관 협력 네트워크를 통해 국내외 산학기관들의 협력 정 도 및 특징을 파악하였다. 또한 연구 대상 논문들 중 한글로 작성된 1845개의 초록 들을 대상으로 동적 토픽 모델링을 진행하였으며, 주제어들을 토대로 13개의 주제를 레이블링하였다. 레이블링 된 13개의 주제를 통해 국내 인공지능 연구 분야의 시기별 주제 동향을 파악하였다. 본 연구는 기존의 선행연구들에서 시도하지 않은 저자 소속기관 등을 활용한 기관 협력 네트워크 및 초록을 활용한 동적 토픽 모델링을 통해 국내 인공지능 분야 연구동향 파악의 시야를 확장하는 것으로 학술적 의의를 지닌다. 또한, 본 연구의 결과가 인공지능 시대에 부합하는 국가 정책 수립 기여라는 실질적 함의를 시사한다.

토픽모델링을 활용한 4차 산업혁명 분야의 국내 연구 동향 분석 (A Study on the Research Trends in the Fourth Industrial Revolution in Korea Using Topic Modeling)

  • 김지영;노동조
    • 한국비블리아학회지
    • /
    • 제34권4호
    • /
    • pp.207-234
    • /
    • 2023
  • 4차 산업혁명이 등장한 이래로 산업 분야를 비롯한 다양한 분야에서 관련 연구들이 수행되었다. 본 연구에서는 4차 산업혁명에 대한 국내의 연구 동향을 분석하기 위하여 2016년 1월부터 2023년 8월까지 KCI에 수록된 2,115건의 논문을 대상으로 핵심어 분석 및 LDA 알고리즘에 기반한 토픽모델링 분석을 실시하였다. 본 연구의 결과 첫째, 4차 산업혁명 관련 학술 논문이 많이 게재된 학술지는 디지털융복합연구, 인문사회 21, e-비즈니스연구, 학습자중심교과교육연구 등의 순이었다. 둘째, 토픽모델링 분석 결과, '인간과 인공지능', '데이터와 개인정보 관리', '교육과정의 변화', '기업의 변화와 혁신', '교육의 변화와 일자리', '문화예술과 콘텐츠', '정보와 기업의 정책과 대응'의 7개 토픽이 선정되었다. 셋째, 4차 산업혁명과 관련한 공통 연구주제는 '교육과정의 변화', '인간과 인공지능', '문화예술과 콘텐츠'이며, 공통 키워드는 '기업', '정보', '보호', '스마트', '시스템' 등이 있다. 넷째, 연구 전반기(2016-2019)에는 교육 분야의 주제가 상위에 등장했으나 후반기(2020-2023)에는 기업과 스마트, 디지털, 서비스 혁신에 관한 주제들이 상위로 나타났다. 다섯째, 연구 후반기로 가면서 연구 주제들이 보다 구체화되거나 세분화되는 경향을 보였다. 이러한 동향은 코로나 팬데믹 이후 4차 산업혁명 분야의 핵심 기술들이 다양한 산업 분야에 활용됨에 따라 발생하는 사회경제적 변화에 따른 것으로 해석된다. 본 연구의 결과는 4차 산업혁명 분야의 연구 동향 파악과 전략 수립 및 후속 연구에 유용한 정보를 제공할 수 있을 것으로 기대한다.

디지털 정보격차 관련 국내 연구 동향 분석 (Research Trend Analysis of Digital Divide in South Korea)

  • 고정현;강우진;이종욱
    • 한국도서관정보학회지
    • /
    • 제52권4호
    • /
    • pp.179-203
    • /
    • 2021
  • 본 연구의 목적은 디지털 정보격차 관련 국내 연구의 주요 이슈와 경향을 살펴보는 것이다. 이를 위해 2003년부터 2020년까지의 관련 논문 488건을 대상으로 연도별 논문 건수과 학술지 주제 영역을 분석하였으며, 추가적으로 토픽모델링과 단어네트워크 분석을 통해 연구 주제를 파악하였다. 분석 결과를 살펴보면, 첫째, 2007년까지 논문 건수가 증가하다가 이후 10년간 증감을 반복한 후 2019년부터 급증하는 것으로 나타났으며, 둘째, 사회과학, 복합학, 공학, 예술체육학 등 다양한 학문분야에서 연구가 이뤄지고 있으나, 최근 연구를 주도하는 분야는 사회과학과 복합학 분야인 것으로 나타났다. 셋째, 토픽모델링과 단어 네트워크 분석을 통해 연구의 주제는 '지역 간 디지털 정보격차', '장애인 디지털 정보격차', '디지털 정보격차의 기술적 환경', '디지털 정보 활용과 영향 격차', '디지털 정보격차의 법·제도적 환경', '노인 디지털 정보격차' 등 6개로 분류되었다. 넷째, 최근 들어 '디지털 정보 활용과 영향 격차', '디지털 정보격차의 기술적 환경'에 관련된 주제가 관심을 많이 받고 있는 것으로 나타났다.

인터넷 채팅 도메인에서의 감성정보를 이용한 타관점 사용자 선호도 학습 방법 (Multi-perspective User Preference Learning in a Chatting Domain)

  • 신욱현;정윤재;맹성현;한경수
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권1호
    • /
    • pp.1-8
    • /
    • 2009
  • 개인화 서비스와 같은 지능정보 시스템을 위해서는 사용자 선호도의 학습은 중요한 연구 분야이다. 본 연구에서는 채팅 도메인에서의 사용자 선호도를 학습하는 방법을 제시하며, 기존의 평면적인 사용자 선호도 모델의 문제점을 해결하기 위한 사용자 선호도 모델을 제안한다. 사용자가 선호도 학습의 대상에 대하여 얼마나 관심이 있는가를 나타내는 관심도와 대상에 대한 감성을 나타내는 호감도 라는 요소로 모델링 할 수 있다. 자연어 처리를 통해 현재 대화에서의 주제 탐지와 호감도 분석을 하고, 이를 이용하여 사용자의 선호도와 호감도를 학습한다. 시간의 흐름에 따라 변하는 사용자 선호도의 특징을 고려하여, 사용자 선호도를 세션, 단기, 장기 선호도로 나누어 계산한다. 사용자선호도 학습의 대상이 되는 키워드와 주제에 대하며 시간에 따라 변하는 사용자의 선호도 변화를 고려하여 선호도 결정을 한다 사용자 선호도 학습 효과의 검증을 위하여 사용자 평가를 하였으며 주제 선호도, 키워드 선호도, 키워드 호감도에 대하여 각각 86.52%, 86.28%, 87.22%의 성능을 보였다.

사회문제 해결형 기술수요 발굴을 위한 키워드 추출 시스템 제안 (A Proposal of a Keyword Extraction System for Detecting Social Issues)

  • 정다미;김재석;김기남;허종욱;온병원;강미정
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.1-23
    • /
    • 2013
  • 융합 R&D가 추구해야 할 바람직한 방향은 이종 기술 간의 결합에 의한 맹목적인 신기술 창출이 아니라, 당면한 주요 문제를 해결함으로써 사회적 니즈를 충족시킬 수 있는 기술을 개발하는 것이다. 이와 같은 사회문제 해결형 기술 R&D를 촉진하기 위해서는 우선 우리 사회에서 주요 쟁점이 되고 있는 문제들을 선별해야 한다. 그런데 우선적이고 중요한 사회문제를 분별하기 위해 전문가 설문조사나 여론조사 등 기존의 사회과학 방법론을 사용하는 것은 참여자의 선입견이 개입될 수 있고 비용이 많이 소요된다는 한계를 지닌다. 기존의 사회과학 방법론이 지닌 문제점을 보완하기 위하여 본 논문에서는 사회적 이슈를 다루고 있는 대용량의 뉴스기사를 수집하고 통계적인 기법을 통하여 사회문제를 나타내는 키워드를 추출하는 시스템의 개발을 제안한다. 2009년부터 최근까지 3년 동안 10개 주요 언론사에서 생산한 약 백 30만 건의 뉴스기사에서 사회문제를 다루는 기사를 식별하고, 한글 형태소 분석, 확률기반의 토픽 모델링을 통해 사회문제 키워드를 추출한다. 또한 키워드만으로는 정확한 사회문제를 파악하기 쉽지 않기 때문에 사회문제와 연관된 키워드와 문장을 찾아서 연결하는 매칭 알고리즘을 제안하다. 마지막으로 사회문제 키워드 비주얼라이제이션 시스템을 통해 시계열에 따른 사회문제 키워드를 일목요연하게 보여줌으로써 사회문제를 쉽게 파악할 수 있도록 하였다. 특히 본 논문에서는 생성확률모델 기반의 새로운 매칭 알고리즘을 제안한다. 대용량 뉴스기사로부터 Latent Dirichlet Allocation(LDA)와 같은 토픽 모델 방법론을 사용하여 자동으로 토픽 클러스터 세트를 추출할 수 있다. 각 토픽 클러스터는 연관성 있는 단어들과 확률값으로 구성된다. 그리고 도메인 전문가는 토픽 클러스터를 분석하여, 각 토픽 클러스터의 레이블을 결정하게 된다. 이를 테면, 토픽 1 = {(실업, 0.4), (해고, 0.3), (회사, 0.3)}에서 토픽 단어들은 실업문제와 관련있으며, 도메인 전문가는 토픽 1을 실업문제로 레이블링 하게 되고, 이러한 토픽 레이블은 사회문제 키워드로 정의한다. 그러나 이와 같이 자동으로 생성된 사회문제 키워드를 분석하여 현재 우리 사회에서 어떤 문제가 발생하고 있고, 시급히 해결해야 될 문제가 무엇인지를 파악하기란 쉽지 않다. 따라서 제안된 매칭 알고리즘을 사용하여 사회문제 키워드를 요약(summarization)하는 방법론을 제시한다. 우선, 각 뉴스기사를 문단(paragraph) 단위로 세그먼트 하여 뉴스기사 대신에 문단 세트(A set of paragraphs)를 가지게 된다. 매칭 알고리즘은 각 토픽 클러스터에 대한 각 문단의 확률값을 측정하게된다. 이때 토픽 클러스터의 단어들과 확률값을 이용하여 토픽과 문단이 얼마나 연관성이 있는지를 계산하게 된다. 이러한 과정을 통해 각 토픽은 가장 연관성이 있는 문단들을 매칭할 수 있게 된다. 이러한 매칭 프로세스를 통해 사회문제 키워드와 연관된 문단들을 검토함으로써 실제 우리 사회에서 해당 사회문제 키워드와 관련해서 구체적으로 어떤 사건과 이슈가 발생하는 지를 쉽게 파악할 수 있게 된다. 또한 매칭 프로세스와 더불어 사회문제 키워드 가시화를 통해 사회문제 수요를 파악하려는 전문가들은 웹 브라우저를 통해 편리하게 특정 시간에 발생한 사회문제가 무엇이며, 구체적인 내용은 무엇인지를 파악할 수 있으며, 시간 순서에 따른 사회이슈의 변동 추이와 그 원인을 알 수 있게 된다. 개발된 시스템을 통해 최근 3년 동안 국내에서 발생했던 다양한 사회문제들을 파악하였고 개발된 알고리즘에 대한 평가를 수행하였다(본 논문에서 제안한 프로토타입 시스템은 http://dslab.snu.ac.kr/demo.html에서 이용 가능함. 단, 구글크롬, IE8.0 이상 웹 브라우저 사용 권장).

A Study on the Strategic Globalization Performance of 'Journal of Distribution Science'

  • YANG, Hoe-Chang;CHU, Wujin;HWANG, Hee-Joong;YOUN, Myoung-Kil
    • 유통과학연구
    • /
    • 제20권3호
    • /
    • pp.59-69
    • /
    • 2022
  • Purpose: The purpose of this study is to provide information for other journals as well as the continuous development of distribution science research by confirming the globalization performance of the Journal of Distribution Science (JDS), the main journal of KODISA. Research Design, Data, and Methodology: A total of 863 papers published in JDS from 2011 to 2021 searched by scienceON were divided into 4 periods and analyzed under the headings of submission system, standardity, collaboration, and degree of achievement of publication goals. SPSS 24.0 and R 4.1.1 package were used to perform the publication frequency analysis, crosstab-analysis, keyword frequency analysis, and LDA topic modeling were performed. In addition, trend analysis with weight applied to each word was performed. Results: It was found that the ratio of English-written papers, which is the indicator of a journal's starndardity, is continuously increasing, and the ratio of overseas authors, which is the indicator of collaboration, is also continuously increasing. It was confirmed through keyword trend analysis by period and LDA topic modeling results - which were weighted to confirm the degree of achievement of the journal's publication goal - that the articles published by the journal has been in agreement with monthly research topic proposed by JDS. Conclusion: By examining the five criteria for globalization, it can be concluded that JDS's efforts for globalization are achieving significant results and providing effective directions for other academic journals. However, in order for JDS to become a top academic journal, it was suggested that efforts should be made to establish a system for collaborative research by domestic and foreign authors, as well as to provide a clear definition for the monthly research topics and classification of sub-topics.

국내 기록분야 연구주제 분석: 2002~2023년간 기록관리학, 문헌정보학, 역사학 학술논문을 중심으로 (Analysis of Research Topics in Archival Studies: Focusing on Academic Papers in Archival Science, Library and Information Science, and History from 2002 to 2023)

  • 김선욱
    • 한국기록관리학회지
    • /
    • 제23권4호
    • /
    • pp.91-111
    • /
    • 2023
  • 본 연구의 목적은 국내 기록관리학, 문헌정보학, 역사학 학술논문의 서지정보를 분석함으로써 기록분야 연구주제를 분석하는데 있다. 이를 위해 1,173편의 학술논문을 수집한 뒤, 저자키워드 데이터로부터 네트워크 분석을 시행하고 초록 데이터로부터 토픽모델링을 진행하고 분석 결과를 시간의 흐름에 따라 정리하였다. 저자키워드로부터의 네트워크 분석 결과에 따르면, 주요 법령과 정책의 변화에 따라 연구주제 네트워크가 적극적으로 변화하는것이 확인되었다. 초록으로부터의 토픽모델링 결과에 따르면, 전체 학술논문의 주제는 '레코드매니지먼트', '아카이빙', '국가기록정책' 으로 구분된다. 2002~2009년 동안은 '레코드매니지먼트'와 '국가기록정책'이 상대적으로 우세하였으나 2009년부터 균형적인 양적 성장을 이루며 2019년에 정점을 이루었다.

키워드 네트워크 분석을 이용한 연구데이터 관련 국내 연구 동향 분석 (An Analysis of Domestic Research Trend on Research Data Using Keyword Network Analysis)

  • 한상우
    • 한국도서관정보학회지
    • /
    • 제54권4호
    • /
    • pp.393-414
    • /
    • 2023
  • 본 연구는 연구데이터 관련 국내 연구의 동향을 파악하기 위하여 RISS에서 연구데이터 관련 논문을 수집하였으며, 데이터 정제 후 총 58건의 연구논문을 대상으로 134개의 저자 키워드를 추출하여 키워드 네트워크 분석을 수행하였다. 분석 결과, 첫째, 아직까지 국내에서 연구데이터 관련 연구의 수가 58건에 지나지 않아 추후 많은 관련 연구가 진행될 필요가 있음을 알 수 있었다. 둘째, 연구데이터 관련 연구 분야는 대부분 복합학 중 문헌정보학에 집중되어 있었다. 셋째, 연구데이터 관련 저자 키워드의 빈도분석 결과 '연구데이터관리', '연구데이터공유', '데이터리포지터리', '오픈사이언스' 등이 다빈도 주요 키워드로 분석되어 연구데이터 관련 연구는 위의 키워드를 중심으로 진행되고 있음을 알 수 있었다. 키워드 네트워크 분석 결과에서도 다빈도 키워드는 연결 중심성 및 매개 중심성에서 중심적인 위치를 차지하며 관련 연구에서 핵심 키워드에 위치하고 있음을 알 수 있었다. 본 연구의 결과를 통하여 최근의 연구데이터 관련 동향을 파악할 수 있었고, 향후 집중적으로 연구해야 하는 분야를 확인할 수 있었다.