• 제목/요약/키워드: Text Mining Method

검색결과 448건 처리시간 0.026초

우울과 스트레스에 관한 국내 연구 분석 : 치료와 대상자를 중심으로 (Analysis of Domestic Research on Depression and Stress : Focused on the Treatment and Subjects)

  • 조남희;나은영
    • 융합정보논문지
    • /
    • 제7권6호
    • /
    • pp.53-59
    • /
    • 2017
  • 본 연구는 우울 및 스트레스와 관련된 국내 연구를 파악하기 위해 시도되었다. 분석대상은 2016년 11월 30일을 기준으로 우울, 스트레스 키워드로 검색된 1,875편의 국회도서관 등재 학위논문으로 하였다. 분석방법은 텍스트마이닝 기법의 하나인 워드 클라우드로 비정형 자료를 시각화하였다. 또한, 치료와 대상자를 분류하기 위해서는 잠재디리클레 할당(LDA), R의 LDA패키지를 사용하였다. 분석 결과, 치료 관련 키워드를 가지고 있는 논문은 전체 논문 중 233건(12.4%)이었다. 치료방법의 적용은 미술치료, 음악치료, 원예치료, 인지행동치료, 임상미술치료, 인지치료, 심리치료, 우울증치료, 집단치료, 웃음치료 순으로 나타났다. 연구 대상자는 청소년, 노인, 환자, 어머니, 아동, 여성, 부모, 대학생 순으로 나타났다. 청소년을 대상으로 한 LDA 토픽분석 결과 자아지지, 치료프로그램, 관계효과, 변인연구의 4개의 토픽으로 분류되었다. 본 연구 결과는 우울과 스트레스 관련 향후 연구에서 연구 대상자와 주제의 다양화 및 새로운 치료방법의 적용과 개발을 탐색하는 기초자료로 활용될 수 있을 것으로 기대된다.

비정형유방증식에 대한 최근 중의 약물치료 동향에 대한 문헌연구 (A Literature Review on the Recent Tendency of the Treatment about Atypical Hyperplasia of Breast on the Chinese Herbal Medicine)

  • 김준희;이인선
    • 대한한방부인과학회지
    • /
    • 제33권1호
    • /
    • pp.36-58
    • /
    • 2020
  • Objectives: We conducted a literature study on the treatment trends in China to find out the possibility of Oriental medicine treatment of atypical hyperplasia of breast (AHB). Methods: RCTs (randomized controlled trial) on AHB were collected from CNKI (China National Knowledge Infrastructure). The search words were "乳腺增生", "乳腺囊性增生", "乳癖", "中医", "中药" and "中西医结合". The search period was limited from July 2006 to May 2017. Finally, we selected 107 RCTs which were clinical studies to find out the effectiveness of Chinese herbal medicine in comparison with Western medicine. After reviewing, we investigated Chinese herbal medication guide, Chinese treatment method and prescriptions. And the correlation between the treatments and the medicinal herbs was investigated to be useful in the clinical practice. Results: 1. The administration of herbal medicine was 58.9 percent in 63 cases, followed by menstrual cycles, and 41.1 percent in 44 cases, regardless of menstrual cycles. 2. In the basic frequency analysis between the treatment and the medicinal herb, the frequency of dissipate binds (散結) was the highest. Next, there was a high frequency of therapies such as activating blood-activating (活血), relieve pain (止痛), soothe the liver (疏肝), regulate qi (理氣), resolve phlegm (化痰), soften hardness (軟堅), resolve depression (解鬱), move qi (行氣) of frequency was high. In herbal medicine, bupleuri radix (柴胡), cyperi rhizoma (香附子), angelicae gigantis radix (當歸), fritillaria thunbergii bulb (貝母), paeoniae radix alba (白芍藥), prunellae spica (夏枯草), corydalis rhizoma (玄胡索) showed high frequency. 3. We finded out the correlation between the frequent treatment methods and the medicinal herbs using Text Mining. Conclusions: These findings are thought to help implement Korean traditional medicine treatments for AHB.

토픽 모델링 기반 비대면 강의평 분석 및 딥러닝 분류 모델 개발 (Analyzing Students' Non-face-to-face Course Evaluation by Topic Modeling and Developing Deep Learning-based Classification Model)

  • 한지영;허고은
    • 한국문헌정보학회지
    • /
    • 제55권4호
    • /
    • pp.267-291
    • /
    • 2021
  • 2020년 신종 코로나바이러스 감염증(코로나19)으로 인한 전 세계적인 팬데믹으로 교육 현장에도 큰 변화가 있었다. 대학에서는 보조 교육 수단으로 생각했던 원격수업을 전면 도입하였고 비대면 수업이 일상화되어 교수자와 학생들은 새로운 교육환경에 적응하기 위해 큰 노력을 기울이고 있다. 이러한 변화 속에서 비대면 강의의 질적 향상을 위하여 강의 만족도 영향요인에 관한 연구가 필요하다. 본 연구는 코로나 전과 후로 변화된 대학 강의 만족도 영향요인을 파악하기 위해 빅데이터를 활용한 새로운 방법론을 제시하고자 한다. 토픽 모델링을 활용하여 코로나 전과 후의 강의평을 분석하고 이를 통해 강의 만족도 영향요인을 파악하여 대학교육이 나아가야 할 방향성을 제언하였다. 또한, 딥러닝 언어 모델인 KoBERT를 기반으로 0.84의 F1-score를 보이는 토픽 분류 모델을 구축함으로써 강의의 만족, 불만족 요인을 다각도로 파악할 수 있으며 이를 통해 강의 만족도의 지속적인 질적 향상에 기여할 수 있다.

특허와 뉴스 기사를 이용한 가상현실 기술에 관한 탐색적 연구 (An Exploratory Study of VR Technology using Patents and News Articles)

  • 김성범
    • 디지털융복합연구
    • /
    • 제16권11호
    • /
    • pp.185-199
    • /
    • 2018
  • 이 연구의 목적은 가상현실(VR)의 핵심기술을 특허 분석을 통해서 도출하고 VR에 대한 사회와 대중의 관심을 뉴스 분석을 통해서 탐색하는 것이다. 연구1에서는 특허 텍스트의 단어 출현 빈도를 이용하여 핵심 키워드를 도출하고 업체별, 연도별, 기술 분류별 비교를 하였으며, 네트워크 분석 프로그램인 넷마이너를 사용하여 특허의 IPC 코드를 분석하였다. 연구2에서는 뉴스 기사의 텍스트를 내용분석 도구인 T-LAB 프로그램을 사용하여 분석하였다. 키워드 선정을 위해 TF-IDF를 사용하였고, 카이제곱과 연관지수(Association index) 알고리즘을 사용하여 VR과 관련성이 높은 단어를 추출하였다. 이 연구를 통해 VR 기술이 광학과 머리착용디스플레이(HMD), 데이터 분석, 전기, 전자 기술을 포함하는 융합기술임을 확인하였고, 광학기술이 중심적 기술임을 발견하였다. 뉴스 기사를 통해서는 대중은 VR 공급업체와 시장의 형성과 성장에 관심을 가지며 VR은 사용자 경험에 기초해서 개발되어야 함을 도출하였다.

토픽 모델링 기반 과학적 지식의 불확실성의 흐름에 관한 연구 (The Stream of Uncertainty in Scientific Knowledge using Topic Modeling)

  • 허고은
    • 정보관리학회지
    • /
    • 제36권1호
    • /
    • pp.191-213
    • /
    • 2019
  • 과학적 지식을 얻는 과정은 연구자의 연구를 통해 이루어진다. 연구자들은 과학의 불확실성을 다루고 과학적 지식의 확실성을 구축해나간다. 즉, 과학적 지식을 얻기 위해서 불확실성은 반드시 거쳐가야 하는 필수적인 단계로 인식되고 있다. 현존하는 불확실성의 특성을 파악하는 연구는 언어학적 접근의 hedging 연구를 통해 소개되었으며 컴퓨터 언어학에서 수작업 기반으로 불확실성 단어 코퍼스를 구축해왔다. 기존의 연구들은 불확실성 단어의 단순 출현 빈도를 기반으로 특정 학문 영역의 불확실성의 특성을 파악해오는데 그쳤다. 따라서 본 연구에서는 문장 내 생의학적 주장이 중요한 역할을 하는 생의학 문헌을 대상으로 불확실성 단어 기반 과학적 지식의 패턴을 시간의 흐름에 따라 살펴보고자 한다. 이를 위해 생의학 온톨로지인 UMLS에서 제공하는 의미적 술어를 기반으로 생의학 명제를 분석하였으며, 학문 분야의 패턴을 파악하는데 용이한 DMR 토픽 모델링을 적용하여 생의학 개체의 불확실성 기반 토픽의 동향을 종합적으로 파악하였다. 시간이 흐름에 따라 과학적 지식의 표현은 불확실성이 감소하는 패턴으로 연구의 발전이 이루어지고 있음을 확인하였다.

Methodology for Search Intent-based Document Recommendation

  • Lee, Donghoon;Kim, Namgyu
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권6호
    • /
    • pp.115-127
    • /
    • 2021
  • 방대한 데이터 가운데 사용자가 원하는 정보를 단번에 찾아내는 것은 결코 쉬운 일이 아니다. 이로 인해 사용자의 문서 열람 이력을 바탕으로 사용자 선호를 고려해 문서를 추천하는 다양한 방법들이 제안되었다. 하지만 기존에 활용된 문서 열람 이력 기반 문서 추천 방법론은 문서를 누가 열람했는지의 정보만을 활용할 뿐, 사용자가 해당 문서를 열람하게 된 의도(Intent)를 충분히 활용하지 못했다는 한계를 갖는다. 따라서 본 연구에서는 해당 문서를 누가(Who) 읽었는지의 정보가 아닌 해당 문서를 왜(Why) 읽었는지의 정보를 활용하는 검색 의도 기반 문서 추천 방안을 제시하고자 한다. 제안 방법론의 우수성을 확인하기 위해 국내 전자상거래 플랫폼 기업인 'C' 사의 실제 사용자 검색 이력 239,438건을 분석한 실험을 수행하였으며, 실험 결과 제안 방법론이 기존의 내용 기반 추천 모델 및 단순 열람 이력 기반 추천 모델에 비해 우수한 성능을 보임을 확인하였다.

외국인 관광객 재방문율 향상과 소비 활성화를 위한 빅데이터 기반의 탐색적 연구 (Exploratory research based on big data for Improving the revisit rate of foreign tourists and invigorating consumption)

  • 안성현;박성택
    • 산업융합연구
    • /
    • 제18권6호
    • /
    • pp.19-25
    • /
    • 2020
  • 빅데이터 분석은 오늘날 다양한 산업 및 공공분야에서 필수적으로 활용되고 있다. 이에 본 연구에서는 빅데이터 분석을 활용하여 국내 관광 서비스 개선 방안을 LDA분석 방법을 통해 모색하고자 한다. 특히 외국인 방문객이 가장 많은 서울을 중심으로 관광객의 만족도를 높이고 이를 통해 재방문을 향상시킬 수 있고 서비스를 개선할 수 있는 탐색적 접근을 시도하였다. 본 연구에서는 서울시와 한국관광공사의 통계 자료 및 SNS 등의 인터넷 정보들을 R을 통해 수집 및 분석을 진행하였다. 그리고 LDA를 포함한 텍스트 마이닝 기법을 활용하였다. 분석 결과 외국인들의 한국을 방문하는 목적 중 하나는 식도락 관광이었다. 이에 식도락 관광을 중심으로 서비스의 질을 높이기 위한 방안을 도출하고자 한다.

워드 클라우드 기법을 이용한 국내 융복합 학술연구 트렌드 분석 (A Study on Trend Analysis in Convergence Research Applying Word Cloud in Korea)

  • 김준환;문형진;이항
    • 디지털융복합연구
    • /
    • 제19권2호
    • /
    • pp.33-38
    • /
    • 2021
  • 융복합 트렌드는 4차 산업혁명의 핵심이며, 이런 기대와 가능성으로 인해 여러 분야에서 다양한 대응책이 모색되고 있다. 본 연구는 최근 10년 간 융복합 연구동향을 파악하기 위하여 정량적인 분석을 시행하였다. 구체적으로 주요 연구의 키워드를 추출하여, 워드 클라우드 기법을 적용하고 시각화하여 융복합에 대한 학술 연구동향을 파악하였다. 이를 위해 '디지털융복합연구'에 게재된 2012년-2020년간의 연구논문을 대상으로 조사하였다. 분석기간은 전반부 4년(2012년-2015년)과 후반부 4년(2016년-2019년) 두 기간으로 나눠서 비교분석하여 연구동향의 차이를 확인하였다. 추가적으로 코로나19 사태로 인한 최근 1년의 연구동향에 대한 변화를 보다 명확하게 파악하기 위해 2020년의 연구논문들을 대상으로 분석하였다. 본 연구의 결과는 융복합 분야의 핵심 주제어로 연구동향을 파악하고 추후 연구를 위한 유용한 기초자료로 활용될 수 있다는 점에서 의의를 갖는다.

초록데이터를 활용한 국내외 통계학 분야 연구동향 (Research trends in statistics for domestic and international journal using paper abstract data)

  • 양종훈;곽일엽
    • 응용통계연구
    • /
    • 제34권2호
    • /
    • pp.267-278
    • /
    • 2021
  • 시간이 갈 수록, 정부, 기업, 국내, 해외를 막론하고 데이터의 양이 증가하고 있다. 이에따라 학계에서도 빅데이터에 대한 연구들이 늘어나고 있다. 통계학은 빅데이터 연구의 중심이 되는 학문들 중 하나이며, 늘어나는 통계학 분야 논문 빅데이터를 통해 통계학의 연구동향을 파악해 보는 것도 재미있을 것이다. 본 연구에서는 국내와 해외의 통계학 논문들의 초록데이터를 통해 어떤 연구들이 이루어지고 있는지 분석을 진행하였다. 저자들이 선정한 논문들의 키워드 데이터 빈도를 통해 국내외 연구 동향을 분석하였고, Word Embedding 방법을 통해 해당 키워드들의 관계성을 시각화 하였다. 여기서 저자들이 선정한 키워드들 외에 Textrank를 통해 선정된 통계학 분야 논문들에서 중요하게 사용되는 단어들도 추가적으로 시각화 하였다. 마지막으로 초록 데이터에 LDA 기법을 적용하여 10가지 토픽을 알아보았다. 각 토픽들에 대한 분석을 통해 어떤 연구 주제들이 자주 연구되며, 어떤 단어들이 중요하게 사용되는지 알아보았다.

코로나-19관련 웨이보 정서 분석을 통한 중국 주식시장의 주판 및 차스닥의 민감도 예측 기법 (Sensitivity of abacus and Chasdaq in the Chinese stock market through analysis of Weibo sentiment related to Corona-19)

  • 이가기;오하영
    • 한국정보통신학회논문지
    • /
    • 제25권1호
    • /
    • pp.1-7
    • /
    • 2021
  • 최근 코로나 19발생과 동시에 소셜 미디어의 투자자 정서가 증시 가격 움직임을 주도해 관심을 모으고 있다. 본 연구는 행동금융 이론 기반 빅 데이터 분석을 활용하여 소셜 미디어에서 추출한 정서가 중국 증시의 실시간 및 단기적 가격 모멘텀을 예측하는데 활용될 수 있는 기법을 제안한다. 이를 위해, COVID-19와 관련 200만 건 이상의 시나 웨이보 빅 데이터를 키워드 방식으로 수집 및 분석하고 시간이 따른 영향력이 높은 감정 요인을 추출한다. 최종 결과 도출을 위해 다양한 지도 및 비지도 학습 모델을 다 각도에서 구현 및 성능평가를 비교 분석 후, BiLSTM mdoel이 최적의 결과를 낼 수 있음을 증명했다. 또한, 제안하는 기법을 통해 주가변동과 심리요인 간에도 비슷한 움직임을 보이고 있음을 제안했고 소셜미디어에서 추출한 공공분위기가 어느 정도 투자자들의 심리를 대변할 수 있고, 주식시장에 영향을 미칠 수 있는 특수행사에 몰두할 때 증시변동에 차이를 만들 수 있음을 증명했다.