• 제목/요약/키워드: Text Mining Method

검색결과 448건 처리시간 0.023초

텍스트마이닝을 활용한 국외 노인작업치료의 연구동향 분석 (Study on the Research Trend of Overseas Elderly Occupational Therapy Using Text Mining)

  • 김아람;이태권;정인재;박혜연
    • 재활치료과학
    • /
    • 제10권1호
    • /
    • pp.7-17
    • /
    • 2021
  • 목적 : 본 연구는 텍스트마이닝을 활용하여 국외 노인 작업치료의 양적 변화와 현황 파악을 정량적으로 분석하고자 하였다. 연구 방법 : 2009~2019년까지 PubMed를 활용하여 Elderly, Health, Occupational therapy가 들어간 제목과 초록이 존재하는 연구논문을 분석대상으로 선정하여 초록의 단어들을 수집하였다. 수집된 정보를 통해 연도별 발생 논문 편수, 핵심어 분석, 연도별 핵심어 분석, 단어들 간의 관계성을 분석하였다. 결과 : 2009-2019년에 발표된 논문은 9,941편이며, 2009년부터 점차적으로 증가하여 2017년 또는 2018년에 최다 빈도를 보인 후 2019년에 감소하는 추이를 보였다. 최근 5년간 빈도수가 많은 단어는 Care, Group, Intervention, Pain, Treatment, Work이었다. 최근 11년간 평균적인 빈도수를 기준으로 단어 간의 관계성을 파악한 결과, Function, Health, Intervention, Participation이 단어들 간의 높은 관계성을 보였다. 결론 : 본 연구는 텍스트마이닝이라는 새로운 연구방법을 적용하여 작업치료의 동향을 실증적, 체계적으로 분석하여 거시적이고 종합적인 결과를 제시했다는 점에 의의가 있다. 이를 토대로 노인과 관련된 작업치료 임상 및 연구 현장에서 새로운 연구방향을 설정하는데 도움이 될 것으로 기대한다.

텍스트 마이닝 기법을 이용한 유튜브 추천 알고리즘의 필터버블 현상 분석 (An Analysis of Filter Bubble Phenomenon on YouTube Recommendation Algorithm Using Text Mining)

  • 신유진;이상우
    • 한국콘텐츠학회논문지
    • /
    • 제21권5호
    • /
    • pp.1-10
    • /
    • 2021
  • 이 연구에서는 필터버블 현상의 주요 요인인 추천 알고리즘의 정치적 편향성(추천 알고리즘이 이용자가 선호하는 정치 성향의 영상을 제한적으로 제공하는 것)과, 이용자들의 선택적 노출(이용자가 자신이 선호하는 정치 성향의 영상을 자발적으로 선택하는 것)을 실증적으로 검증하고자 하였다. 이를 위해 새로운 유튜브 계정 2개를 개설하여 각각의 계정을 보수/진보 계정으로 일주일 동안 훈련시켰고, 각 계정에서 추천받은 영상들은 이틀 간격으로 수집하였다. 텍스트 마이닝(Text Mining) 방법을 통해 보수 계정에서는 보수 성향의 영상이 더욱 추천되는지, 진보 계정에서는 진보 성향의 영상이 더욱 추천되는지를 알아보았다. 또한 각각의 계정에서 정치적으로 편향된 주제들이 다뤄지고 있는지를 관찰하였다. 설문조사를 통해 유튜브로 정치 및 뉴스 영상을 소비하는 이용자들에게 보수/진보 계정에서 6일째에 추천된 영상 리스트를 제공하여 이용자들이 선택적 노출을 보이는지를 알아보았다. 연구결과, 시간이 지날수록 보수 계정에서는 보수 성향의 영상과 채널이 더욱 추천되고, 진보 계정에서는 진보 성향의 영상과 채널이 더욱 추천되었으며, 보수 계정과 진보 계정에서 추천된 영상들은 대부분 정치적으로 편향된 주제를 다루고 있는 것으로 나타났다. 응답자들의 약 77%는 자신이 선호하는 정치 성향의 영상에 선택적으로 노출되어 보이는 것으로 나타났다.

텍스트마이닝을 활용한 아동, 청소년 대상 소비관련 연구 키워드 분석 (Keyword Analysis of Research on Consumption of Children and Adolescents Using Text Mining)

  • 진현정
    • 한국가정과교육학회지
    • /
    • 제33권4호
    • /
    • pp.1-13
    • /
    • 2021
  • 본 연구는 텍스트마이닝 기법으로 최근 20년간 아동, 청소년 대상 소비 관련 연구의 주요어를 분석하여 소비 관련 연구의 동향을 파악하고자 하였다. 이를 위하여 KCI 등재/등재후보 학술지에 게재된 아동, 청소년의 소비관련 연구 869편의 주요어를 분석하였다. 빈도분석 결과 가장 빈도가 높은 주요어는 청소년, 청소년소비자, 소비자교육, 과시소비, 소비행동, 캐릭터, 경제교육, 윤리적소비 순으로 나타났다. 5년 단위로 주요어의 빈도를 분석한 결과, 2006년~2010년에는 소비자교육의 빈도가 월등하게 높아 이 시기에 소비자교육에 관한 연구가 많이 이루어졌음을 확인할 수 있었다. 2011년 이후 윤리적소비에 관한 연구가 활발해졌으며, 최근 5년 동안은 두드러지는 주요어가 없는 대신 다양한 주제로 연구가 이루어졌음을 알 수 있었다. TF-IDF 기준으로 주요어를 살펴보면 2001년~2005년 사이에는 환경과 인터넷 관련 단어가 주요 키워드였다. 2006년~2010년에는 미디어이용, 광고 교육, 인터넷아이템, 2011년~2015년에는 공정무역, 녹색성장, 녹색소비, 북한이탈청소년, 소셜미디어, 2016~2020년에는 텍스트마이닝, 지속가능발전교육, 메이커교육, 2015개정교육과정이 중요한 용어로 등장하였다. 토픽모델링 결과, 소비자교육, 대중매체/또래문화, 합리적 소비, 한류/문화산업, 소비자역량, 경제교육, 교수학습방법, 친환경/윤리적소비의 8개의 토픽이 도출되었다. 동시 출현 빈도를 활용한 네트워크 분석을 통해 아동, 청소년 관련 소비 연구에서 과시소비와 소비자교육이 중요한 연구주제임을 알 수 있었다.

텍스트 마이닝을 활용한 황해 관련 연구동향 분석연구 (Analysis of Research Trends in Relation to the Yellow Sea using Text Mining)

  • 황규원;김진경;강승구;강길모
    • 해양환경안전학회지
    • /
    • 제29권7호
    • /
    • pp.724-739
    • /
    • 2023
  • 황해는 지정학적으로 한국, 중국, 북한 사이 해역에 위치하고 있으며, 최근 해양공간 이용이 확대되어 사회적·경제적 가치가 증가하고 있다. 또한 기후변화로 인한 해양환경 변화, 대기오염물질 이동 등 한·중 공동 대응 및 협력의 필요성이 증가되고 있다. 본 연구에서는 황해(Yellow Sea) 키워드의 연구논문을 대상으로 핵심주제(Topic)을 도출하고, 저자 네트워크 분석을 수행하여 연구동향을 탐색하였다. 연구대상으로 1984년부터 2021년 사이에 게재된 Web of Science DataBase의 황해 관련 연구논문을 추출하고, 한중 어업협정, 해양환경공동조사 등 한국과 중국의 주요 이벤트를 중심으로 4개의 시기로 구분하였다. 연구방법으로 텍스트 마이닝(Text Mining)의 일종인 토픽모델링(Topic Modeling)을 활용하여 Topic을 도출하였다. 또한 저자 네트워크를 분석하여 해당 분야의 주요 연구 그룹(Community)과 연구자 및 연구기관의 영향력을 파악하고 시사점을 제시하였다. 분석결과 황해 연구논문의 핵심주제는 1기 퇴적물, 해양생물, 2기 산성화, 미세먼지, 3기 수산양식, 지진, 4기 탄소요인, 해양생태계 등으로 변화하였고, 시기별로 핵심 연구자를 중심의 연구자 그룹이 증가하였다. 연구결과를 토대로 황해 관련 연구 동향과 주요 연구자 및 연구기관을 파악함으로써 향후 한국과 중국 간의 황해 연구협력에 기여하고자 한다.

Towards Effective Entity Extraction of Scientific Documents using Discriminative Linguistic Features

  • Hwang, Sangwon;Hong, Jang-Eui;Nam, Young-Kwang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권3호
    • /
    • pp.1639-1658
    • /
    • 2019
  • Named entity recognition (NER) is an important technique for improving the performance of data mining and big data analytics. In previous studies, NER systems have been employed to identify named-entities using statistical methods based on prior information or linguistic features; however, such methods are limited in that they are unable to recognize unregistered or unlearned objects. In this paper, a method is proposed to extract objects, such as technologies, theories, or person names, by analyzing the collocation relationship between certain words that simultaneously appear around specific words in the abstracts of academic journals. The method is executed as follows. First, the data is preprocessed using data cleaning and sentence detection to separate the text into single sentences. Then, part-of-speech (POS) tagging is applied to the individual sentences. After this, the appearance and collocation information of the other POS tags is analyzed, excluding the entity candidates, such as nouns. Finally, an entity recognition model is created based on analyzing and classifying the information in the sentences.

신재생에너지 동향 파악을 위한 토픽 모형 분석 (Topic Model Analysis of Research Trend on Renewable Energy)

  • 신규식;최회련;이홍철
    • 한국산학기술학회논문지
    • /
    • 제16권9호
    • /
    • pp.6411-6418
    • /
    • 2015
  • 기후변화 및 환경오염에 대응하기 위해 신재생에너지 정책 연구가 증가하고 있다. 신재생에너지는 녹색산업과 녹색기술로 대표되는 새로운 성장 동력 기술이다. 현재 우리나라는 태양광, 풍력, 수소연료전지 등 3대 전략부분에 신재생에너지 보급 및 기술개발사업에 대한 투자가 이루어지고 있지만 아직은 초기 단계로, 연구 방향 및 투자 분야에 대한 불확실성을 줄이는 것이 무엇보다도 시급한 실정이다. 따라서 본 연구는 빅데이터(big data) 분석방법 중 텍스트 마이닝(Text mining method)과 토픽 모델링 기법(multinominal topic model)을 신재생에너지와 관련된 최근 10년간의 우리나라 언론기사에 적용하여 국가 정책의 핵심이슈 및 세계적인 연구 트렌드를 분석하고, 성장 가능성이 있는 신재생에너지 분야를 예측하였다. 정보통신기술을 바탕으로 한 연구결과는 신재생에너지 분야에 활발히 적용될 것으로 예측된다.

텍스트 데이터 분석을 위한 근접성 데이터의 생성과 군집화 (Creation and clustering of proximity data for text data analysis)

  • 정민지;신상민;최용석
    • 응용통계연구
    • /
    • 제32권3호
    • /
    • pp.451-462
    • /
    • 2019
  • 문서-용어 빈도행렬은 텍스트 마이닝 분야에서 보편적으로 사용되는 데이터의 한 유형으로, 여러 개체들이 제공하는 문서를 기반으로 만들어진다. 그러나 대다수의 연구자들은 개체 정보에 무게를 두지 않고 여러 문서에서 공통적으로 등장하는 공통용어 중 핵심적인 용어를 효과적으로 찾아내는 방법에 집중하는 경향을 보인다. 공통용어에서 핵심어를 선별할 경우 특정 문서에서만 등장하는 중요한 용어들이 공통용어 선정단계에서부터 배제될 뿐만 아니라 개별 문서들이 갖는 고유한 정보가 누락되는 등의 문제가 야기된다. 본 연구에서는 이러한 문제를 극복할 수 있는 데이터를 근접성 데이터라 정의한다. 그리고 근접성 데이터를 생성할 수 있는 12가지 방법 중 개체 군집화의 관점에서 가장 최적화된 방법을 제안한다. 개체 특성 파악을 위한 군집화 알고리즘으로는 다차원척도법과 K-평균 군집분석을 활용한다.

텍스트 마이닝 기법을 이용한 경찰청 업무 트렌드 분석 (Analysis of the National Police Agency business trends using text mining)

  • 선현석;임창원
    • 응용통계연구
    • /
    • 제32권2호
    • /
    • pp.301-317
    • /
    • 2019
  • 최근 통계적인 기법을 이용하여 대량으로 생산되고 있는 텍스트 데이터를 통해 다양한 인사이트 발굴을 하기 위한 연구가 활발히 진행되고 있다. 본 연구는 경찰청에서 생산하는 텍스트 데이터를 통해 연도별 경찰청의 업무 트렌드를 파악하고, 각 지방청별로 생산되는 문서에서 주요 키워드를 파악하여 지방청 간의 업무 특성을 비교하고자 하였다. 의미 있는 결론을 도출하기 위해 각 자료 특성에 맞는 전처리 과정을 시행하고 문서별 단어 빈도수를 계산하였다. 문서에 나타난 키워드의 단순 출현 빈도로는 해당 키워드가 문서에서 갖는 중요도를 설명하기 힘들기 때문에 단어-역문서 가중치를 이용하여 각 단어에 대한 빈도수를 새롭게 계산하였고 단어의 문서별 및 연도별 빈도 비교를 위해 L2 정규화 기법을 이용하였다. 이러한 분석은 향후 경찰청 업무 개선 정책에 새롭게 활용될 수 있는 기초 자료로 사용될 수 있으며, 경찰청 업무 효율성 향상 및 청내 업무 개선 수요 파악을 위한 방법으로 활용될 수 있다.

소셜미디어 분석을 통한 전고체 배터리 감성분석과 이슈 탐색 (Sentiment Analysis and Issue Mining on All-Solid-State Battery Using Social Media Data)

  • 이지연;이병희
    • 한국콘텐츠학회논문지
    • /
    • 제22권10호
    • /
    • pp.11-21
    • /
    • 2022
  • 전고체 배터리는 차세대 배터리의 유력 후보 중 하나로 특히 미래 전기차 산업을 이끌 핵심 부품으로 주목받고 있다. 본 연구에서는 글로벌 소셜미디어인 레딧(Reddit)의 전고체 배터리 관련 댓글 10,280건을 분석하여 전고체 배터리와 관련된 정책 이슈 및 대중의 관심사를 파악한다. 수집된 글로벌 데이터에 빈도분석, 연관규칙분석, 토픽모델링 등 텍스트마이닝 기법과 감성분석을 적용하여 세계적 동향을 읽고, 이를 우리 정부의 전고체 배터리 발전전략과 비교 및 관련 국가R&D의 정책적 방향을 제시하고자 한다. 분석 결과, 2016년부터 2021년까지의 전고체 배터리 이슈에 대한 전반적인 감성은 긍정이 50.5%, 부정이 39.5%로 긍정인 것으로 나타났다. 또한 세부 감성을 분석한 결과, 대중들은 전고체 배터리에 대해 신뢰와 기대를 가지고 있음과 동시에 해결되지 않은 기술적 문제들에 대한 두려움과 우려의 감정이 공존함을 알 수 있었다. 본 연구에서는 전고체 배터리와 관련된 핵심 이슈 도출을 위한 텍스트마이닝 분석 방법을 적용하였고, 정부 정책 분석을 바탕으로 한 하향식 접근방법과 대중의 인식을 분석하는 상향식 접근방법을 수용하여, 보다 포괄적인 동향 분석 방법을 제시하였다.

제품 특징화를 위한 오피니언 문서의 클러스터링 기법 (An Opinion Document Clustering Technique for Product Characterization)

  • 장재영
    • 한국전자거래학회지
    • /
    • 제19권2호
    • /
    • pp.95-108
    • /
    • 2014
  • 오피니언 마이닝은 문서로부터 의견을 추출하는 텍스트 마이닝의 응용분야로 현재 활발한 연구가 진행되고 있다. 대부분의 관련 연구는 특정 제품군에 대해서 주어진 특징별로 긍정과 부정 평가를 나누는 감성분류에 초점을 맞추고 있다. 하지만 제품별로 강조되는 특성들을 구별해내는 연구는 거의 이루어지고 있지 않다. 본 논문에서는 특성별로 오피니언 문서들을 분류하고, 이를 이용하여 특정 제품군에 대해서 제품별로 강조되는 특성들을 선별하는 기법을 제안한다. 제안된 기법에서는 텍스트 클러스터링을 활용하였으며, 새로운 유사도 계산 방식을 사용하였다. 또한 실험을 통하여 제안된 방법의 유용성을 증명하였다.