• 제목/요약/키워드: Topic analysis

검색결과 2,058건 처리시간 0.026초

2000년 이후 국내 한의학 암 관련 연구 동향 분석 - Latent Dirichlet Allocation 기반 토픽 모델링 및 연관어 네트워크 분석 (Cancer Research Trends in Traditional Korean Medical Journals since 2000 - Topic Modeling Using Latent Dirichlet Allocation and Keyword Network Analysis)

  • 배겨레
    • 대한한방내과학회지
    • /
    • 제43권6호
    • /
    • pp.1075-1088
    • /
    • 2022
  • Objectives: The aim of this study is to analyze cancer research trends in traditional Korean medical journals indexed in the Korea Citation Index since 2000. Methods: Cancer research papers published in traditional Korean medical journals were searched in databases from inception to October 2022. The numbers of publications by journal and by year were descriptively assessed. After natural language processing, topic modeling (based on Latent Dirichlet allocation) and keyword network analysis were conducted. Results: This research trend analysis involved 1,265 papers. Six topics were identified by topic modeling: case reports on symptom management, literature reviews, experiments on apoptosis, herbal extract treatments of breast carcinoma cell lines, anti-proliferative effects of herbal extracts, and anti-tumor effects. Keyword network analysis found that the effects of herbal medicine were assessed in clinical and experimental studies, while acupuncture was mainly mentioned in clinical reports. Conclusions: Cancer research papers in traditional Korean medical journals have contributed to evidence-based medicine. Further experimental studies are needed to elucidate the effects of on different hallmarks of cancer. Rigorous clinical studies are needed to support clinical guidelines.

Overseas Research Trends Related to 'Research Ethics' Using LDA Topic Modeling

  • YANG, Woo-Ryeong;YANG, Hoe-Chang
    • 연구윤리
    • /
    • 제3권1호
    • /
    • pp.7-11
    • /
    • 2022
  • Purpose: The purpose of this study is to derive clues about the development direction of research ethics and areas of interest which has recently become a social issue in Korea by confirming overseas research trends. Research design, data and methodology: We collected 2,760 articles in scienceON, which including 'research ethics' in their paper. For analysis, frequency analysis, word clouding, keyword association analysis, and LDA topic modeling were used. Results: It was confirmed that many of the papers were published in medical, bio, pharmaceutical, and nursing journals and its interest has been continuously increasing. From word frequency analysis, many words of medical fields such as health, clinical, and patient was confirmed. From topic modeling, 7 topics were extracted such as ethical policy development and human clinical ethics. Conclusions: We founded that overseas research trends on research ethics are related to basic aspects than Korea. This means that a fundamental approach to ethics and the application of strict standards can become the basis for cultivating an overall ethical awareness. Therefore, academic discussions on the application of strict standards for publishing ethics and conducting researches in various fields where community awareness and social consensus are necessary for overall ethical awareness.

토픽모델링을 활용한 해운물류 뉴스 분석 (Analysis of Shipping and Logistics News Articles using Topic Modeling)

  • 윤희영;곽일엽
    • 무역학회지
    • /
    • 제46권4호
    • /
    • pp.61-76
    • /
    • 2021
  • This study focuses on three logistics-related news (Logistics Newspaper, Korea Shipping Gadget, and Korea Shipping Newspaper) in order to present changes in logistics issues, centering on Corona 19, which has recently had the greatest impact in the world. For data collection, two-year news articles in 2019 and 2020 (title, article, content, date, article classification, article URL) were collected through web crawling (using Python's BeautifulSoup, requests module) on the homepages of three representative logistics-related media companies. As for the data analysis methods, fundamental statistical analysis, Latent Dirichlet Allocation (LDA) for topic modeling, and Scattertext were performed. The analysis results were as follows. First, among the three news media related to logistics, the Korea Shipping Newspaper was carrying out the most active media activities. Second, through topic modeling with LDA, eight logistics-related topics were identified, and keywords and significant issues of each topic were presented. Third, the keywords were visually expressed through Scattertext. This is the first study to present changes in the logistics field, focusing on articles from representative logistics-related media in 2019 and 2020. In particular, 2019 and 2020 can be divided into before and after the outbreak of Corona 19, which has had a great impact not only on the logistics field but also on our lives as a whole. For future work, a multi-faceted approach is required, such as comparative studies of logistics issues between countries or presenting implications based on long-term time-series articles.

다이나믹 토픽모델링 및 네트워크 분석 기법을 통한 블록체인 관련 국내 연구 동향 분석 (Analyzing Research Trends in Blockchain Studies in South Korea Using Dynamic Topic Modeling and Network Analysis)

  • 김동훈;오찬희;주영준
    • 정보관리학회지
    • /
    • 제38권3호
    • /
    • pp.23-39
    • /
    • 2021
  • 본 연구에서는 국내 블록체인 연구의 전반적인 동향 및 시간에 따른 주제를 파악하기 위해 대학 및 기관 협력 네트워크 분석, 키워드 동시출현 네트워크 분석, 다이나믹 토픽모델링 기법을 활용한 시계열 주제 분석을 실시하였다. 대학 및 기관 협력 네트워크 분석 결과, 숭실대학교, 순천향대학교, 고려대학교, 한국과학기술원 등이 블록체인 연구의 주요 대학으로 나타났으며 대학 이외의 기관으로는 국방부, 한국철도기술연구원, 삼일회계법인, 한국전자통신연구원 등이 주요 연구기관으로 나타났다. 키워드 동시출현 네트워크 분석 결과, 가상자산(암호화폐, 비트코인, 이더리움, 가상화폐), 블록체인 기술(분산원장, 분산원장기술), 금융(스마트계약), 정보보안(보안, 프라이버시, 개인정보) 등에 대한 키워드들이 주요하게 나타났으며, 모든 네트워크 중심성 지표에서 스마트계약이 가장 높은 수치를 나타내어 주요한 주제임을 확인할 수 있었다. 마지막으로 시계열 주제분석 결과, 블록체인기술, 블록체인생태계, 블록체인 적용분야1(무역, 온라인투표, 부동산), 블록체인 적용분야2(식품, 관광, 유통, 미디어), 블록체인 적용분야3(경제, 금융) 등 다섯 개의 주요 주제들을 도출하였으며, 각 주제별 대표 키워드들의 비율변화를 통해 주제별 변화를 관찰할 수 있었다. 본 연구는 기존의 국내 블록체인 연구동향 연구들과 크게 세 가지 관점(데이터, 방법론, 해석)에서 차이점을 나타내고 있다. 1) 최근 2년 사이 급증한 블록체인 연구를 포함하였고, 2) 대학 및 기관 네트워크 분석과 시계열 주제분석이라는 새로운 분석기법 및 연구방법을 활용하였으며, 3) 이를 통해 블록체인 연구를 주도하는 대학 및 기관을 식별하고 국내 블록체인 연구 트렌드를 파악하였다. 끝으로, 연구결과가 블록체인 관련 연구 협력 및 정책 수립과 관련 기술 개발 계획에 활용될 수 있다는 점에서 실질적인 함의를 시사한다.

온톨로지 언어의 비교 연구: W3C OWL과 ISO 토픽맵을 중심으로 (A Comparison of Ontology Languages: Focusing on W3C OWL and ISO Topic Maps)

  • 오삼균
    • 한국비블리아학회지
    • /
    • 제15권2호
    • /
    • pp.71-96
    • /
    • 2004
  • 이 연구의 목적은 국제표준 온톨로지 언어로 간주되고 있는 W3C의 웹 온톨로지 언어(OWL)와 ISO 토픽맵(Topic Map)의 핵심개념을 상세히 기술하고, 각 언어의 의미표현력에 대해서 비교분석하는 것이다. 본 논문의 구성은, 첫째 온톨로지의 기반을 이루고 있는 URI와 네임스페이스에 대해서 기술하는 것이고, 둘째 토픽맵의 핵심 개념인 토픽(Topic), 연계(Association), 어커런스(Occurrence) 등에 대한 상세한 설명을 제공하는 것이고, 셋째 토픽맵이 검색결과를 의미 있는 그룹으로 묶어서 보여 주어야 한다는 목록의 제2목적을 효율적으로 성취하는 방법에 대해서 기술하는 것이고, 마지막으로 토픽맵과 OWL의 의미표현력의 차이점에 대해서 상세하게 비교분석한 내용으로 되어 있다.

  • PDF

토픽 모델링을 이용한 건설현장 추락재해 분석 (Falling Accidents Analysis in Construction Sites by Using Topic Modeling)

  • 류한국
    • 한국융합학회논문지
    • /
    • 제10권7호
    • /
    • pp.175-182
    • /
    • 2019
  • 본 연구는 기계학습 기법 중 토픽 모델링을 활용하여 건설현장에서 발생하는 추락재해에 대한 토픽을 분류하고 각 토픽에 따른 재해요인을 분석하였다. 잠재 디리클레 할당 기반의 토픽 모델링을 적용하기 위해 텍스트 데이터의 전처리를 하였고 Perplexity 점수로 평가하여 모형의 신뢰성을 높였다. 각 토픽에서 공통으로 도출된 추락재해의 대부분은 소규모 사업장에 속한 일용직 작업자들에게 발생하였다. 추락재해의 대부분의 원인은 안전장비 미착용, 현장 정리 정돈 미흡, 안전장비의 성능 및 착용 상태로 인해 제대로 작동하지 않은 것으로 판단되었다. 추락재해를 예방하고 절감하기 위해서는 소규모 사업장에 맞는 안전교육과 작업장의 정리 정돈과 개인 안전장비의 적절한 착용 상태 및 성능을 확인하는 것이 중요한 것으로 도출되었다.

토픽맵 모델링을 위한 한국 관련 미국기록물의 주제분석 연구: 국내 주요 소장기관 중심으로 (Topic Analysis of the United States' Historical Records about Korea for Modeling of Topic Map: Focused on Major Archives in Korea)

  • 권민정;최상희
    • 한국기록관리학회지
    • /
    • 제22권2호
    • /
    • pp.95-116
    • /
    • 2022
  • 이 연구에서는 웹사이트를 통해 한국 관련 해외기록물을 서비스하고 있는 기관인 국가기록원, 국립중앙도서관, 국사편찬위원회, 국방부 국방편찬연구소 4개의 기관을 연구 대상으로 선정하여 국내 기관에 분산되어 있는 서비스 되고 있는 기록물을 이용자들이 쉽게 기록물의 내용을 파악할 수 있도록 하고 통합하여 검색할 수 있는 방안을 제안하였다. 이를 위해 총 163,874건을 수집하여 이용자가 다각적으로 기록의 내용을 훑어볼 수 있도록 하는 방안으로 주제분석을 하였고 패싯과 토픽을 도출하였다. 도출된 패싯과 토픽을 기반으로 토픽맵을 구성하였다.

Detecting Knowledge structures in Artificial Intelligence and Medical Healthcare with text mining

  • Hyun-A Lim;Pham Duong Thuy Vy;Jaewon Choi
    • Asia pacific journal of information systems
    • /
    • 제29권4호
    • /
    • pp.817-837
    • /
    • 2019
  • The medical industry is rapidly evolving into a combination of artificial intelligence (AI) and ICT technology, such as mobile health, wireless medical, telemedicine and precision medical care. Medical artificial intelligence can be diagnosed and treated, and autonomous surgical robots can be operated. For smart medical services, data such as medical information and personal medical information are needed. AI is being developed to integrate with companies such as Google, Facebook, IBM and others in the health care field. Telemedicine services are also becoming available. However, security issues of medical information for smart medical industry are becoming important. It can have a devastating impact on life through hacking of medical devices through vulnerable areas. Research on medical information is proceeding on the necessity of privacy and privacy protection. However, there is a lack of research on the practical measures for protecting medical information and the seriousness of security threats. Therefore, in this study, we want to confirm the research trend by collecting data related to medical information in recent 5 years. In this study, smart medical related papers from 2014 to 2018 were collected using smart medical topics, and the medical information papers were rearranged based on this. Research trend analysis uses topic modeling technique for topic information. The result constructs topic network based on relation of topics and grasps main trend through topic.

한국과학교육학회지는 44년간 어떤 주제로 어떻게 변화했는가? -잠재 디리클레 할당(LDA)을 활용한 토픽모델링 분석- (How the Journal of the Korean Association for Science Education(JKASE) Changed for the Past 44 Years?: Topic Modeling Analysis Using Latent Dirichlet Allocation)

  • 장진아;나지연
    • 한국과학교육학회지
    • /
    • 제42권2호
    • /
    • pp.185-200
    • /
    • 2022
  • 이 연구에서는 LDA 기반의 토픽모델링 분석을 통해 한국과학교육학회지에 게재된 연구 논문들이 어떤 주제로 어떻게 변화했는지 탐색하였다. 이를 위해, 1978년부터 2021년 5월까지 한국과학교육학회지에 게재된 논문들의 영문초록 총 2,115개에 대한 LDA 기반 토픽모델링분석을 실시하였다. 분석 결과, 총 23개의 토픽을 추출하였으며 각 토픽들을 관련된 키워드 및 세부 연구주제들과 함께 제시하였다. 다음으로, 시간에 따른 토픽들의 변화 추이를 살펴보기 위해, 4년 주기에 대한 각 토픽들의 평균 비중값의 변화를 히트맵으로 시각화하였다. 이를 통해, 시간이 지남에 따라 상승해온 주제와 하락해온 주제들을 밝혔다. 이 연구의 결과들은 꾸준히 연구되어온 전통적인 연구 주제들, 교육 철학이나 연구방법의 변화, 사회나 정책적 요구에 따라 달라져온 연구 주제들을 드러냄으로써 한국의 과학교육연구에 새로운 통찰을 제공할 것으로 기대된다.

국내 기록관리학 연구동향 분석을 위한 토픽모델링 기법 비교 - LDA와 HDP를 중심으로 - (Comparison of Topic Modeling Methods for Analyzing Research Trends of Archives Management in Korea: focused on LDA and HDP)

  • 박준형;오효정
    • 한국도서관정보학회지
    • /
    • 제48권4호
    • /
    • pp.235-258
    • /
    • 2017
  • 본 연구에서는 최근 각광을 받고 있는 텍스트마이닝 기법인 LDA 토픽모델링과 이를 변형한 HDP 토픽모델링을 적용하여 국내 기록관리학의 연구동향을 분석하고자 한다. 이를 위해 국내 기록관리학 관련 학술지 2종과 문헌정보학 관련 학술지 4종에서 1997년부터 2016년까지 발표된 기록관리학 관련 논문 1,027건을 수집하고 적절한 전처리과정을 거친 후 LDA 토픽모델링과 HDP 토픽모델링을 각각 수행하였다. 또한 토픽모델링 시각화 도구인 LDAvis를 활용하여 토픽별 거리를 가시적으로 표현하고 세부 대표 키워드를 분석하였다. 두 토픽모델링을 비교한 결과, LDA 토픽모델링은 전반적으로 해당 도메인을 대표하는 주요 키워드로 빈도수에 영향을 많이 받았으며, HDP 토픽모델링은 각 토픽별 특징을 파악할 수 있는 특수한 키워드가 많이 도출되었다. 이를 통해 LDA는 국내 기록관리학 내에 거시적으로 대표되는 주제들을, HDP는 세부 주제별 미시적인 핵심 키워드를 도출하는데 효과적임을 알 수 있었다.