• 제목/요약/키워드: Frequently used keywords

검색결과 146건 처리시간 0.023초

텍스트마이닝을 활용한 숭례문 관련 기사의 트렌드 분석 (Trend Analysis of News Articles Regarding Sungnyemun Gate using Text Mining)

  • 김민정;김철주
    • 한국콘텐츠학회논문지
    • /
    • 제17권3호
    • /
    • pp.474-485
    • /
    • 2017
  • 국보 제1호인 숭례문은 2008년 2월 10일 화재로 일부가 소실되었으나 화재 이후 복구 작업을 통해 2013년 5월 4일 시민에게 공개되었다. 이로 인해 숭례문은 국가적으로 큰 이슈가 되어 언론의 관심을 받으며 동시에 많은 연구의 대상이 되었다. 본 연구는 문화재로서 숭례문을 키워드로 하여 2002년부터 2016년까지 신문 기사에 대한 빈도분석을 통해 숭례문 관련 어떤 키워드들이 자주 나타나고 있는지에 대해 파악하였다. 또한 추출된 숭례문 관련 키워드들간 연관관계 분석을 통해 키워드간 연결의 맥락을 파악하고 분석하였다. 다음으로 숭례문 화재 전후, 언론사별 주요 키워드 추출을 통해 공통점과 차이점을 보여줌으로써 관점의 다양성을 제공하였다. 본 연구를 통해 문화재로서 숭례문 관련 키워드는 화재 이후에 나타난 키워드가 전체 기사에서 고빈도어로 나타남을 알 수 있었고 몇 가지 키워드간 상관관계가 높게 나타났다. 또한 화재 전후 키워드에는 명확한 차이를 보이고 있었으며 언론사별 키워드에서 상위 키워드들은 명확한 차이는 보여주지 않았지만 차상위 키워드들은 차이가 발생하여 언론사별로 주로 다루어진 기사들의 내용은 차이가 있다는 것을 발견했다. 본 연구는 문화재로서 숭례문 관련 기사에 대해 텍스트마이닝 기법을 활용하여 다량의 데이터를 분석하였음에 의미가 있으며 정보생산자 및 정보소비자들에게 숭례문 관련 기사의 동향과 정보를 제공할 수 있을 것이라 기대한다.

텍스트 데이터 분석을 위한 근접성 데이터의 생성과 군집화 (Creation and clustering of proximity data for text data analysis)

  • 정민지;신상민;최용석
    • 응용통계연구
    • /
    • 제32권3호
    • /
    • pp.451-462
    • /
    • 2019
  • 문서-용어 빈도행렬은 텍스트 마이닝 분야에서 보편적으로 사용되는 데이터의 한 유형으로, 여러 개체들이 제공하는 문서를 기반으로 만들어진다. 그러나 대다수의 연구자들은 개체 정보에 무게를 두지 않고 여러 문서에서 공통적으로 등장하는 공통용어 중 핵심적인 용어를 효과적으로 찾아내는 방법에 집중하는 경향을 보인다. 공통용어에서 핵심어를 선별할 경우 특정 문서에서만 등장하는 중요한 용어들이 공통용어 선정단계에서부터 배제될 뿐만 아니라 개별 문서들이 갖는 고유한 정보가 누락되는 등의 문제가 야기된다. 본 연구에서는 이러한 문제를 극복할 수 있는 데이터를 근접성 데이터라 정의한다. 그리고 근접성 데이터를 생성할 수 있는 12가지 방법 중 개체 군집화의 관점에서 가장 최적화된 방법을 제안한다. 개체 특성 파악을 위한 군집화 알고리즘으로는 다차원척도법과 K-평균 군집분석을 활용한다.

Big Data Analysis on the Perception of Home Training According to the Implementation of COVID-19 Social Distancing

  • Hyun-Chang Keum;Kyung-Won Byun
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제15권3호
    • /
    • pp.211-218
    • /
    • 2023
  • Due to the implementation of COVID-19 distancing, interest and users in 'home training' are rapidly increasing. Therefore, the purpose of this study is to identify the perception of 'home training' through big data analysis on social media channels and provide basic data to related business sector. Social media channels collected big data from various news and social content provided on Naver and Google sites. Data for three years from March 22, 2020 were collected based on the time when COVID-19 distancing was implemented in Korea. The collected data included 4,000 Naver blogs, 2,673 news, 4,000 cafes, 3,989 knowledge IN, and 953 Google channel news. These data analyzed TF and TF-IDF through text mining, and through this, semantic network analysis was conducted on 70 keywords, big data analysis programs such as Textom and Ucinet were used for social big data analysis, and NetDraw was used for visualization. As a result of text mining analysis, 'home training' was found the most frequently in relation to TF with 4,045 times. The next order is 'exercise', 'Homt', 'house', 'apparatus', 'recommendation', and 'diet'. Regarding TF-IDF, the main keywords are 'exercise', 'apparatus', 'home', 'house', 'diet', 'recommendation', and 'mat'. Based on these results, 70 keywords with high frequency were extracted, and then semantic indicators and centrality analysis were conducted. Finally, through CONCOR analysis, it was clustered into 'purchase cluster', 'equipment cluster', 'diet cluster', and 'execute method cluster'. For the results of these four clusters, basic data on the 'home training' business sector were presented based on consumers' main perception of 'home training' and analysis of the meaning network.

텍스트 마이닝을 이용한 소셜 미디어의 패션 비평에 관한 탐색적 연구 - 유튜브의 패션쇼 Panel discussion을 중심으로 - (An exploratory study on fashion criticism in social media using text mining - Focusing on panel discussion of fashion show in YouTube -)

  • 정다울;김세진
    • 복식문화연구
    • /
    • 제32권2호
    • /
    • pp.215-231
    • /
    • 2024
  • The changing media landscape has diversified how and what is discussed about fashion. This study aims to examine expert discussions about fashion shows on social media from the perspective of fashion criticism. To achieve this goal objectively, a text mining program, Leximancer, was used. In total, 58 videos were collected from the panel discussion section of Showstudio from S/S 21 to S/S 24, and the results of text mining on 24,080 collected texts after refinement are detailed here. First, the researchers examined the frequency of keywords by season. This revealed that in 2021-2022, digital transformation, diversity, and fashion films are now commonly used to promote fashion collections, often replacing traditional catwalk shows. From 2023, sustainability and virtuality appeared more frequently, and fashion brands focused on storytelling to communicate seasonal concepts. In S/S 2024, the rise of luxury brand keywords and an increased focus on consumption has been evident. This suggests that it is influenced by social and cultural phenomena. Second, the overall keywords were analyzed and categorized into five concepts: formal descriptions and explanations of the collection's outfits, sociocultural evaluations of fashion shows and designers, assessments of the commerciality and sustainability of the current fashion industry, interpretations of fashion presentations, and discussions of the role of fashion shows in the future. The significance of this study lies in its identification of the specificity of contemporary fashion criticism and its objective approach to critical research.

우울증에 대한 한약물 치료 문헌적 고찰 - 무작위 대조군 임상연구를 중심으로 - (A Review of Clinical Studies with Herbal Medicine for Depression - Based on Randomized Controlled Clinical Trial -)

  • 이재은;권용주;조성훈
    • 동의신경정신과학회지
    • /
    • 제22권4호
    • /
    • pp.31-39
    • /
    • 2011
  • Objectives : This study aimed to investigate frequently used herbal materials among herbal prescription for depression focusing on randomized controlled trial. Methods : Every article relevant to depression was initially obtained from China National Infrastructure(CNKI), Korean database and book hand-searching. Searching keywords were 'depression', 'herbal medicine' and 'randomized controllled trial(RCT)'. Results : Among comorbidity with depression, the most accompanied disease was that of circulatory system. Among sixty-five articles, depression with cerebral vascular disease was twenty-eight. Article about mood disorder was twenty-four. High frequently used herbal materials were Bupleuri Radix(41times), Curcumae Radix(34 times), Acori Graminei Rhizoma and Cnidii Rhizoma(24 times). Conclusions : According to this study, we could know select frequent-used herbal medicine. In a clinical treatment, herbal materials can be added herbal prescription related to depression. As these results, it can be helpful to develop new drugs.

비정형 텍스트 데이터 분석을 활용한 기록관리 분야 연구동향 (Research Trends in Record Management Using Unstructured Text Data Analysis)

  • 홍덕용;허준석
    • 한국기록관리학회지
    • /
    • 제23권4호
    • /
    • pp.73-89
    • /
    • 2023
  • 본 연구에서는 텍스트 마이닝 기법을 활용하여 국내 기록관리 연구 분야의 비정형 텍스트 데이터인 국문 초록에서 사용된 키워드 빈도를 분석하여 키워드 간 거리 분석을 통해 국내기록관리 연구 동향을 파악하는 것이 목적이다. 이를 위해 한국학술지인용색인(Korea Citation Index, KCI)의 학술지 기관통계(등재지, 등재후보지)에서 대분류(복합학), 중분류 (문헌정보학)으로 검색된 학술지(28종) 중 등재지 7종 1,157편을 추출하여 77,578개의 키워드를 시각화하였다. Word2vec를 활용한 t-SNE, Scattertext 등의 분석을 수행하였다. 분석 결과, 첫째로 1,157편의 논문에서 얻은 77,578개의 키워드를 빈도 분석한 결과, "기록관리" (889회), "분석"(888회), "아카이브"(742회), "기록물"(562회), "활용"(449회) 등의 키워드가 연구자들에 의해 주요 주제로 다뤄지고 있음을 확인하였다. 둘째로, Word2vec 분석을 통해 키워드 간의 벡터 표현을 생성하고 유사도 거리를 조사한 뒤, t-SNE와 Scattertext를 활용하여 시각화하였다. 시각화 결과에서 기록관리 연구 분야는 두 그룹으로 나누어졌는데 첫 번째 그룹(과거)에는 "아카이빙", "국가기록관리", "표준화", "공문서", "기록관리제도" 등의 키워드가 빈도가 높게 나타났으며, 두 번째 그룹(현재)에는 "공동체", "데이터", "기록정보서비스", "온라인", "디지털 아카이브" 등의 키워드가 주요한 관심을 받고 있는 것으로 나타났다.

뇌졸중 후 배뇨장애 침치료의 임상연구에 대한 고찰 (Review of Clinical Research on Acupuncture Treatment of Voiding Difficulty in Stroke Patients)

  • 박봉우;윤종민;문병순
    • 대한한방내과학회지
    • /
    • 제36권2호
    • /
    • pp.153-164
    • /
    • 2015
  • Objectives: The aim of this study was to collect and analyze studies on acupuncture therapies for treatment of voiding difficulty in stroke patients and to suggest methods of study for acupuncture therapies. Methods: Electronic searches were performed on search sites including NDSL, 국회도서관, RISS4U, DBPIA, KISS, KMBASE, KoreaMed, 한국전통지식포탈, OASIS, Pubmed, CNKI, using the search words ‘중풍’, ‘뇌졸중’, ‘stroke’, ‘배뇨장애’, ‘voiding’, ‘urinary’, ‘incontinence’, ‘retention’, ‘ ’, ‘침치료’, and ‘acupuncture’ as single or combined keywords, from January 1990 to August 2013 with language limitation, Korean, English, Chinese. Also, quality of the studies were evaluated using Jadad score. Results: The searches identified 16 studies for selection and analysis. In the present study, voiding difficulty includes urinary incontinence and urinary retention. The acupuncture points CV4, SP6, and CV3 were the most frequently used. Treatments were most frequently applied daily. The times and terms of acupuncture treatment, were most frequently 30 minutes per treatment for 4 weeks Conclusions: The acupuncture therapies were effective in the treatment of voiding difficulty in stroke patients, but the study of acupuncture therapy as a treatment for this issue in stroke patients needs to be standardized and high-quality study models should be introduced.

태음인 비만의 치료에 대한 임상 논문 분석 (A Review Study of Treatments for Taeeumin Obesity)

  • 허한솔;강오석
    • 사상체질면역의학회지
    • /
    • 제31권4호
    • /
    • pp.28-40
    • /
    • 2019
  • Objectives The purpose of this study is to analyze how obesity of Taeeumin have been treated. Methods We searched clinical studies from the databases including Koreanstudies Information Service System(KISS), Oriental medicine Advanced Searching Integrated System(OASIS), Research Information Sharing Service(RISS), National Discovery for Science Leader(NDSL), Korea Citation Index(KCI) and pubmed with the keywords relevant to treatment of Taeeumin obesity. Results A total of 14 studies were analyzed. Herbal medicines were mostly used, and the most frequently used prescription was Taeeumjowi-tang. And concurrent therapies such as diet therapy, exercise therapy, electroacupuncture were performed. Several evaluation methods were used, and patient's body weight was the most used. Conclusion Through this literature review, we could find out tendencies of Korean medicine treatments of obesity of taeeumin up to date and some points that may have clinical significance.

워드임베딩을 활용한 복압성 요실금 관련 연구 동향에 관한 융합 연구 (A Convergence Study of the Research Trends on Stress Urinary Incontinence using Word Embedding)

  • 김준희;안선희;곽경태;원영수;유화익
    • 한국융합학회논문지
    • /
    • 제12권8호
    • /
    • pp.1-11
    • /
    • 2021
  • 본 연구의 목적은 '복압성 요실금'을 키워드로 검색된 연구들의 경향과 특성을 단어 빈도를 통해 분석하고, 워드 임베딩을 사용하여 그 관계를 모델링 하고자 하였다. 의학 서지 데이터베이스인 MEDLINE에 등록되어 있는 복압성 요실금 연구 9,868개 논문들의 초록 문자 데이터를 Python 프로그램을 이용하여 추출하였다. 그런 다음 빈도 분석을 통해 10개의 키워드를 선택하였다. 키워드 관련 단어들의 유사도는 Word2Vec 머신러닝 알고리즘으로 분석하였다. 그리고, t-SNE 기법을 사용하여 단어의 위치와 거리가 시각화하였고, 이에 따라 그룹을 분류하여 이를 분석하였다. 복압성 요실금과 관련된 연구는 1980년대 이후 빠르게 증가했다. 키워드 분석을 통해 논문 초록에서 가장 많이 사용된 키워드는 '여성', '요도', '수술'로 나타났다. Word2Vec 모델링을 통해 복압성 요실금 관련 연구에서 주요 키워드들과 가장 높은 연관성을 나타내는 단어들에는 '여성', '절박', '증상' 등이 있었다. 그리고, t-SNE 기법을 통해 키워드와 관련 단어들은 복압성 요실금의 증상, 신체 기관의 해부학적 특성, 그리고 수술적 중재를 중심으로 하는 3개의 그룹으로 분류될 수 있었다. 본 연구는 초록을 구성하는 단어들의 키워드 빈도 분석 및 워드임베딩 방식을 이용하여 복압성 요실금 관련 연구들의 동향을 살펴본 최초의 연구이다. 본 연구의 결과는 향후 연구자들이 복압성 요실금 관련 연구 분야의 주제와 방향성을 선택하는 데 있어 기초자료로 활용될 수 있을 것이다.

국내 뉴스 보도 연구 동향에 관한 주제어 연결망 분석 (Examining News Report Research Trends Using Keyword Network Analyses)

  • 조이영;안도현
    • 한국콘텐츠학회논문지
    • /
    • 제16권8호
    • /
    • pp.278-291
    • /
    • 2016
  • 이 연구는 2006년부터 2015년까지 최근 10년간 뉴스 보도를 다룬 국내 학술 논문의 주제어에 대한 연결망을 통해 연구의 흐름과 경향을 살펴보았다. 총 1,108편의 논문에 제시된 4,410건의 주제어 연결망 분석을 실시한 결과, 국내 언론 보도를 다룬 연구에서 프레임, 의제설정, 제삼자효과, 선택적노출, 이용과충족 등이 주요 이론으로 다뤄진 것으로 나타났다. 이중 프레임에 대한 연구가 압도적으로 많았다. 연구영역으로는 정치, 경제, 과학보도, 국제뉴스 및 관광 등을 다루었으나, 문화, 스포츠 및 생활뉴스 등의 분야에 대한 연구는 나타나지 않았다. 매체별로는 전통매체와 새로운 매체에 대한 연구가 모두 활발하게 이뤄졌다. 특히 방송뉴스와 온라인뉴스 및 소셜미디어에 대한 연구가 빈번하게 나타났다.