• 제목/요약/키워드: Co-occurrence of Keywords

검색결과 91건 처리시간 0.025초

키워드 네트워크 분석을 활용한 국내 공공도서관 연구 동향 분석 (An Analysis of Research Trends on Public Libraries in Korea Using Keyword Network Analysis)

  • 장로사
    • 한국비블리아학회지
    • /
    • 제34권4호
    • /
    • pp.285-302
    • /
    • 2023
  • 본 연구는 키워드 네트워크 분석을 활용하여 국내 공공도서관 분야 연구 동향을 파악하였다. 2003년부터 2022년까지 20년 동안 우리나라 문헌정보학 분야 유수 4대 학술지에 출판된 공공도서관 관련 논문 총 752편을 대상으로 하였다. 연구결과는 다음과 같다. 첫째, 2003년부터 2022년까지 연평균 37.6편이 간행되었으며, 상승과 하락을 반복하는 출판양상을 보였다. 둘째, '서비스'와 '문화' 키워드는 출현 빈도와 연결중심성 및 매개중심성 분석결과 모두에서 상위 5위 이내로 파악됨으로써 가장 논의가 많이 된 핵심 키워드로 확인되었다. 셋째, 키워드 쌍의 동시 출현 빈도 분석결과에서 교육-프로그램 키워드 쌍과 서비스-이용자와 서비스-어린이 및 서비스-장애 키워드 쌍이 주목되었다.

Word2Vec 기반의 의미적 유사도를 고려한 웹사이트 키워드 선택 기법 (Web Site Keyword Selection Method by Considering Semantic Similarity Based on Word2Vec)

  • 이동훈;김관호
    • 한국전자거래학회지
    • /
    • 제23권2호
    • /
    • pp.83-96
    • /
    • 2018
  • 문서를 대표하는 키워드를 추출하는 것은 문서의 정보를 빠르게 전달할 수 있을 뿐만 아니라 문서의 검색, 분류, 추천시스템 등의 자동화서비스에 유용하게 사용 될 수 있어 매우 중요하다. 그러나 웹사이트 문서에서 출현하는 단어의 빈도수, 단어의 동시출현관계를 통한 그래프 알고리즘 등의 기반으로 키워드를 추출할 경우 웹페이지 구조상 잠재적으로 주제와 관련이 없는 다양한 단어를 포함하고 있는 문제점과 한국어 형태소 분석의 정확성이 떨어지는 형태소 분석기 성능의 한계점 때문에 의미적인 키워드를 추출하는데 어려움이 존재한다. 따라서 본 논문에서는 의미적 단어 위주로 구축된 후보키워드들의 집합과 의미적 유사도 기반의 후보 키워드를 선택하는 방법으로써 의미적 키워드를 추출하지 못하는 문제점과 형태소 분석의 정확성이 떨어지는 문제점을 해결하고 일관성 없는 키워드를 제거하는 필터링 과정을 통해 최종 의미적 키워드를 추출하는 기법을 제안한다. 실 중소기업 웹페이지를 통한 실험 결과, 본 연구에서 제안한 기법의 성능이 통계적 유사도 기반의 키워드 선택기법보다 34.52% 향상된 것을 확인하였다. 따라서 단어 간의 의미적 유사성을 고려하고 일관성 없는 키워드를 제거함으로써 문서에서 키워드를 추출하는 성능을 향상시켰음을 확인하였다.

연명의료 관련 신문 기사의 텍스트네트워크분석 (Text Network Analysis of Newspaper Articles on Life-sustaining Treatments)

  • 박은준;안대웅;박찬숙
    • 지역사회간호학회지
    • /
    • 제29권2호
    • /
    • pp.244-256
    • /
    • 2018
  • Purpose: This study tried to understand discourses of life-sustaining treatments in general daily and healthcare newspapers. Methods: A text-network analysis was conducted using the NetMiner program. Firstly, 572 articles from 11 daily newspapers and 258 articles from 8 healthcare newspapers were collected, which were published from August 2013 to October 2016. Secondly, keywords (semantic morphemes) were extracted from the articles and rearranged by removing stop-words, refining similar words, excluding non-relevant words, and defining meaningful phrases. Finally, co-occurrence matrices of the keywords with a frequency of 30 times or higher were developed and statistical measures-indices of degree and betweenness centrality, ego-networks, and clustering-were obtained. Results: In the general daily and healthcare newspapers, the top eight core keywords were common: "patients," "death," "LST (life-sustaining treatments)," "hospice palliative care," "hospitals," "family," "opinion," and "withdrawal." There were also common subtopics shared by the general daily and healthcare newspapers: withdrawal of LST, hospice palliative care, National Bioethics Review Committee, and self-determination and proxy decision of patients and family. Additionally, the general daily newspapers included diverse social interest or events like well-dying, euthanasia, and the death of farmer Baek Nam-ki, whereas the healthcare newspapers discussed problems of the relevant laws, and insufficient infrastructure and low reimbursement for hospice-palliative care. Conclusion: The discourse that withdrawal of futile LST should be allowed according to the patient's will was consistent in the newspapers. Given that newspaper articles influence knowledge and attitudes of the public, RNs are recommended to participate actively in public communication on LST.

독후감 텍스트의 언어 네트워크 분석에 관한 기초연구 (A Preliminary Study on the Semantic Network Analysis of Book Report Text)

  • 이수상
    • 한국도서관정보학회지
    • /
    • 제47권3호
    • /
    • pp.95-114
    • /
    • 2016
  • 이 연구의 목적은 특정한 독후감 사례들을 수집하고, 독후감 텍스트를 구성하는 키워드들을 대상으로 언어 네트워크를 구성하여, 독후감에 담겨있는 의미적 특성을 파악하는데 있다. 분석대상의 독후감은 전체 23편이며, 중등부 6편, 고등부 9편, 일반부 8편으로 구성된다. 3집단과 전체, 그리고 특정한 개별 독후감을 대상으로 키워드들을 선정하고, 동시출현관계를 바탕으로 하는 5가지 키워드 네트워크들을 구성하고 분석하였다. 분석결과는 다음과 같다. 첫째, 각 집단 및 개별 독후감의 키워드 네트워크들은 서로 다른 구조적인 특성을 나타내었다. 둘째, 3가지 중심성(연결정도 중심성, 근접 중심성, 매개 중심성)의 분석 결과 각 네트워크마다 중심성이 높은 키워드들이 다르게 나타났다. 이러한 특성은 독후감의 키워드 네트워크 분석이 개별 독후감뿐만 아니라 집단별 독후감들의 특성을 파악하는데 유용하다는 의미가 된다.

퍼지추론을 이용한 소수 문서의 대표 키워드 추출 (Representative Keyword Extraction from Few Documents through Fuzzy Inference)

  • 노순억;김병만;허남철
    • 한국지능시스템학회논문지
    • /
    • 제11권9호
    • /
    • pp.837-843
    • /
    • 2001
  • 본 논문은 사용자의 관심 내용을 포함하는 소수 문서들로부터 대표 용어들을 추출하고 가중치를 부여하는 새로운 방법을 제시한다. 대표 용어들의 추출 방법에서는 우선 예제 문서들로부터 후보 용어들을 추출하고 퍼지 추론을 적용하여 초기 대표 용어들을 선택한 수 예제 문서 내에서의 이들 용어들과 후보 용어들의 발생 빈도의 유사성을 이용하여 가중치를 재산정하고 대표 용어들을 자동 확장하였다. 제안 방법의 성능은 초기 대표 용어들을 선책하는 방법에 의해 영향을 크게 받는다. 따라서 문서집합에서 대표 용어를 추출하는 문제는 불확실성을 내포하고 있으므로 이러한 문제 해결에 효과적인 퍼지 추론을 초기 대표 용어의 선택 방법에 적용하였다. 본 논문에서 다루는 문제는 문서 집합의 중심 벡터를 계산하는 것으로 볼 수가 있다. 성능 평가를 위해 기존의 대표적인 Rocchio 알고리즘과 Widrow-Hoff 알고리즘과의 문서 분류 실험을 하였다. 실험 결과 우수한 성능을 보여줌으로서 제안 방법의 유용성을 확인 할 수 있었다.

  • PDF

웹사이트에 제공된 만성폐쇄성폐질환 건강정보와 연구문헌에 나타난 환자의 건강정보 요구의 지식구조: 텍스트 네트워크 분석 활용 (Knowledge Structure of Chronic Obstructive Pulmonary Disease Health Information on Health-Related Websites and Patients' Needs in the Literature Using Text Network Analysis)

  • 최자윤;임수연;윤소영
    • 대한간호학회지
    • /
    • 제51권6호
    • /
    • pp.720-731
    • /
    • 2021
  • Purpose: The purpose of this study was to identify the knowledge structure of health information (HI) for chronic obstructive pulmonary disease (COPD). Methods: Keywords or meaningful morphemes from HI presented on five health-related websites (HRWs) of one national HI institute and four hospitals, as well as HI needs among patients presented in nine literature, were reviewed, refined, and analyzed using text network analysis and their co-occurrence matrix was generated. Two networks of 61 and 35 keywords, respectively, were analyzed for degree, closeness, and betweenness centrality, as well as betweenness community analysis. Results: The most common keywords pertaining to HI on HRWs were lung, inhaler, smoking, dyspnea, and infection, focusing COPD treatment. In contrast, HI needs among patients were lung, medication, support, symptom, and smoking cessation, expanding to disease management. Two common sub-topic groups in HI on HRWs were COPD overview and medication administration, whereas three common sub-topic groups in HI needs among patients in the literature were COPD overview, self-management, and emotional management. Conclusion: The knowledge structure of HI on HRWs is medically oriented, while patients need supportive information. Thus, the support system for self-management and emotional management on HRWs must be informed according to the structure of patients' needs for HI. Healthcare providers should consider presenting COPD patient-centered information on HRWs.

사회과학 중독연구 분야의 지적구조에 관한 네트워크 분석 : 2019년도 KCI 등재 논문을 기반으로 (Network Analysis of the Intellectual Structure of Addiction Research in Social Sciences: Based on the KCI Articles Published in 2019)

  • 이세림;전종설
    • 한국콘텐츠학회논문지
    • /
    • 제21권10호
    • /
    • pp.21-37
    • /
    • 2021
  • 본 연구는 동시출현단어 네트워크 분석을 활용하여 사회과학 중독 분야의 국내 최신 연구 경향을 반영하는 지적구조를 규명하고자 했다. KCI 데이터베이스에서 연구시작일 기준 최신 1년인 2019년에 발간된 중독 주제의 논문 총 172건을 수집하여 총 432개의 키워드를 추출하였다. 이후 Bibexcel, COOC, WNET, NodeXL 프로그램을 통해 네트워크 분석을 실시했다. 연구 결과, 중독 유형, 연구대상, 연구방법, 연구변수 관련 키워드가 나타났으며 20개 군집을 파악했다. 또한 세부적으로 전역중심, 지역, 매개 중심 네트워크 분석을 통해 각 키워드 간 관계를 살펴보고 논의했다. 이를 통해 스마트폰 중독을 중심으로 하는 최신 이슈를 분석하고, 향후 보완되어야 할 관계 중독, 음식 중독, 일 중독 주제영역의 연구와 실천에 대한 기초자료 및 시사점을 제공했다. 그리고 마약 중독의 범죄와의 관련성, 알코올 중독에서의 가족의 관련성, 도박 중독에서의 동기의 관련성 및 질적연구의 필요성 등에 대해 논의하였다.

멸종위기 야생생물 민원 텍스트 마이닝 연구 - LDA 토픽 모델링과 네트워크 분석을 통한 주요 이슈 발굴 - (A Text Mining Study on Endangered Wildlife Complaints - Discovery of Key Issues through LDA Topic Modeling and Network Analysis -)

  • 김나영;남희정;박용수
    • 한국환경복원기술학회지
    • /
    • 제26권6호
    • /
    • pp.205-220
    • /
    • 2023
  • This study aimed to analyze the needs and interests of the public on endangered wildlife using complaint big data. We collected 1,203 complaints and their corresponding text data on endangered wildlife, pre-processed them, and constructed a document-term matrix for 1,739 text data. We performed LDA (Latent Dirichlet Allocation) topic modeling and network analysis. The results revealed that the complaints on endangered wildlife peaked in June-August, and the interest shifted from insects to various endangered wildlife in the living area, such as mammals, birds, and amphibians. In addition, the complaints on endangered wildlife could be categorized into 8 topics and 5 clusters, such as discovery report, habitat protection and response request, information inquiry, investigation and action request, and consultation request. The co-occurrence network analysis for each topic showed that the keywords reflecting the call center reporting procedure, such as photo, send, and take, had high centrality in common, and other keywords such as dung beetle, know, absence and think played an important role in the network. Through this analysis, we identified the main keywords and their relationships within each topic and derived the main issues for each topic. This study confirmed the increasing and diversifying public interest and complaints on endangered wildlife and highlighted the need for professional response. We also suggested developing and extending participatory conservation plans that align with the public's preferences and demands. This study demonstrated the feasibility of using complaint big data on endangered wildlife and its implications for policy decision-making and public promotion on endangered wildlife.

Analysis of Laughter Therapy Trend Using Text Network Analysis and Topic Modeling

  • LEE, Do-Young
    • 웰빙융합연구
    • /
    • 제5권4호
    • /
    • pp.33-37
    • /
    • 2022
  • Purpose: This study aims to understand the trend and central concept of domestic researches on laughter therapy. For the analysis, this study used total 72 theses verified by inputting the keyword 'laughter therapy' from 2007 to 2021. Research design, data and methodology: This study performed the development and analysis of keyword co-occurrence network, analyzed the types of researches through topic modeling, and verified the visualized word cloud and sociogram. The keyword data that was cleaned through preprocessing, was analyzed in the method of centrality analysis and topic modeling through the 1-mode matrix conversion process by using the NetMiner (version 4.4) Program. Results: The keywords that most appeared for last 14 years were laughter therapy, depression, the elderly, and stress. The five topics analyzed in thesis data from 2007 to 2021 were therapy, cognitive behavior, quality of life, stress, and the elderly. Conclusions: This study understood the flow and trend of research topics of domestic laughter therapy for last 14 years, and there should be continuous researches on laughter therapy, which reflects the flow of time in the future.

COVID-19 관련 연구 동향에 대한 분석 - MEDLINE 등재 국내 의학 학술지를 중심으로 - (Analysis of Research Trends about COVID-19: Focusing on Medicine Journals of MEDLINE in Korea)

  • 서미진;이지수
    • 한국비블리아학회지
    • /
    • 제34권3호
    • /
    • pp.135-161
    • /
    • 2023
  • 본 연구는 국내 의학 학술지에 발행된 COVID-19(Coronavirus Disease 2019) 논문의 연구 동향을 분석하였다. 연구 대상은 MEDLINE에 등재된 의학 분야 학술지 25종으로 총 800건을 선정하였으며, 이를 대상으로 저자 분석, 빈도 분석, 주제 분석, 토픽모델링을 수행하였다. 연구 결과, 저자의 소속 기관은 국내 기관이 76.96%였으며, 국외 기관 저자의 비율은 소폭 감소하였다. 저자의 전공은 '내과학'(32.85%), '예방의학/직업환경의학'(16.23%), '방사선과학'(5.74%), '소아과학'(5.50%) 순이었으며, 공동 연구가 진행된 논문은 435건(54.38%)이었다. 저자 키워드는 'COVID19'(674번), 'SARSCoV2'(245번), 'Coronavirus'(81번), 'Vaccine'(80번) 등이 상위 키워드로 도출되었다. 전체 기간 등장한 단어는 'COVID19', 'SARSCoV2', 'Coronavirus', 'Korea', 'Pandemic', 'Mortality' 등 6개이다. MeSH 용어와 저자 키워드를 대상으로 동시 출현 네트워크 분석을 실시하였으며, 공통적으로 'covid-19', 'sars-cov-2', 'public health' 등의 중심 주제어가 도출되었다. 토픽모델링에서는 '백신 접종', 'COVID-19 발생 현황', '오미크론 변이 바이러스', '정신 건강, 방역 조치', '국내 감염의 전파 및 관리' 등 총 5가지의 토픽이 확인되었다. 이 연구를 통하여 '국제적 공중보건 비상사태'(Public Health Emergency of International Concern, PHEIC) 기간 동안 발행된 국내 COVID-19 논문의 연구 영역과 연도별 주요 키워드를 파악할 수 있었다.