• 제목/요약/키워드: 워드 클라우드 분석

검색결과 120건 처리시간 0.032초

텍스트마이닝을 활용한 노인 헬스케어 앱 사용 추이 및 동향 분석 (A Study on the Current Situation and Trend Analysis of The Elderly Healthcare Applications Using Big Data Analysis)

  • 변현;전상완;이은석
    • 한국융합학회논문지
    • /
    • 제13권5호
    • /
    • pp.313-325
    • /
    • 2022
  • 본 연구의 목적은 노인 헬스케어앱 시장의 변화 추이를 텍스트 마이닝 분석을 통해 살펴보고 노인 헬스케어앱 활성화를 위한 기초자료를 제시하고자 한다. 데이터 수집은 네이버, 다음, 블로그 웹, 까페를 대상으로 이루어졌으며, 연구방법은 빅데이터 분석 프로그램인 텍스톰(Textom)과 Ucinet6를 이용하여 텍스트마이닝, TF-IDF(Term frequency-inverse document frequency), 감성분석, 의미연결망분석을 실시하였다. 워드 클라우드를 실시한 결과 빈도 순으로 현장교육, 헬스케어, 전신재활운동기구, 서비스, 운동 등으로 나타났으며, TF-IDF 순위로는 현장교육, 헬스케어, 재활운동기구, 서비스, 건강 순으로 나타났다. 노인 스포츠 어플리케이션에 대한 감성분석을 실시한 결과 긍정비율로 81.3%, 부정비율이 18.7%로 나타났으며, 헬스케어앱 정보격차 해소, 융복합 헬스케어기술, 확산매체, 노인헬스케어앱 산업, 사회적 배경, 콘텐츠로 총 6개의 범주가 최종적으로 도출되었다. 결론적으로 노인 헬스케어앱이 노인들에게 수용 및 활용되기 위해 확산 인프라가 잘 갖추어져 있어야 하며, 융복합 기술의 적극적인 도입과 노인도 쉽게 사용할 수 있는 콘텐츠 개발을 통해 헬스케어 앱의 효과를 극대화하여야 한다.

텍스트마이닝을 활용한 해양스포츠에 대한 언론 보도기사 분석: 요트, 조정, 카누를 중심으로 (Text Mining Analysis of Media Coverage of Maritime Sports: Perceptions of Yachting, Rowing, and Canoeing)

  • 김지현;김보경
    • 해양환경안전학회지
    • /
    • 제29권6호
    • /
    • pp.609-619
    • /
    • 2023
  • 본 연구는 국내 해양스포츠의 사회적 인식이 어떻게 형성되었는지를 알아보고자 수행되었다. 이를 위해 해양스포츠의 대표적 종목인 요트, 조정, 카누와 관련된 최근 10년간 국내 언론 보도기사의 키워드 및 토픽을 활용하여 빅데이터 분석 방법 중 텍스트 마이닝 분석을 실시하였으며, 도출된 결과는 다음과 같다. 첫째, TF 분석과 워드 클라우드 분석 결과 해양, 대회, 체험, 관광, 세계, 요트, 카누, 레저, 참여등이 상위 키워드로 나타났다. 둘째, 의미연결망 분석 결과 요트는 해양, 산업, 대회, 레저, 관광, 보트, 시설, 사업 등과 상관관계가 나타났고, 조정은 대회, 충주 등과, 카누는 해양, 대회, 체험, 레저, 관광 등과 상관관계가 나타났다. 셋째, 토픽모델링 분석 결과 요트, 조정, 카누가 엘리트 체육과 해양레저스포츠로서 인식이 형성된 것을 알 수 있었으나 시간의 변화에 따라 사회전반적인 쟁점과 의견의 흐름 및 사회적 변화는 미미한 것으로 나타났다. 이상의 결과를 종합하면 요트와 카누는 엘리트 체육이라는 인식에서 해양레저스포츠로 점차 인식이 형성되어 해양레저산업에 중요한 요소로 활용되고 있다는 것을 알 수 있었으며, 조정은 엘리트 체육 중심의 사회적 인식이 크게 변하지 않아 해양레저스포츠로서 대중화가 아직은 미미한 것으로 사료된다.

중학교 가정과 소비생활 영역의 핵심 교육내용 분석 - 1차 교육과정부터 2009 개정 교육과정의 교과서 내용을 중심으로 - (The Analysis of Core Contents in Comsumer Area from 1st to 2009 Revised Middle School Home Economics Textbooks)

  • 주수언;박명숙
    • 한국가정과교육학회지
    • /
    • 제27권4호
    • /
    • pp.37-50
    • /
    • 2015
  • 본 연구는 중학교 가정과 교과서 중 소비생활 영역의 교육내용 변천 및 내용특성을 분석하고, 시사점을 도출하여 소비생활 영역의 교육과정 편성 및 교육내용 선정을 위한 기초자료를 제공하는데 그 목적이 있다. 본 연구의 분석 대상은 1차 교육과정부터 2009 개정 교육과정의 가정과 교과서 중 소비생활 영역이며, 분석 방법은 내용분석법과 워드 클라우드 기법을 사용하여 각 시기별 소비생활 영역의 교육내용 변천 및 특성을 심층적으로 분석하였다. 본 연구에서 설정한 연구문제는 다음과 같다. 연구문제 1: 교육과정 시기에 따른 가정과 교과서 소비생활 영역의 핵심 교육내용은 무엇인가? 연구문제 2: 교육과정 시기에 따른 가정과 교과서 소비생활 영역의 내용특성은 어떻게 변천하였는가? 분석결과 시기별 소비생활 영역의 교육내용 변천과 특성을 요약하면 다음과 같다. 첫째, 1차시기는 경제생활 중심의 절약과, 2-4차시기는 가사노동 및 자원관리를 교육내용으로 강조하고 있다. 이는 시기적으로 볼 때 우리나라가 1962년 경제개발 5개년 계획을 시작으로 자원관리를 통한 근검절약을 강조하는 시기와 교육내용을 함께하고 있다고 볼 수 있다. 둘째, 4차시기 교과서에 소비생활 단원이 중단원으로 도입되고 5차시기에 소비생활 영역이 독립단원으로 분리되어 강조되었다. 이는 1987년 소비자보호법이 개정되고, 한국소비자보원이 설립되는 등 정부차원에서 소비자보호에 대한 관심이 성숙단계에 이른 시기이다. 이를 바탕으로 6-7차 시기에는 청소년의 소비생활이 강조되었다. 셋째, 2007개정 교육과정 시기는 2007년 소비자보호법이 소비자기본법으로 전환되고, 소비자 주권을 강조하는 등 소비자교육 패러다임이 전환된 시기로 소비자권리와 함께 책무가 강조되고 있다.

텍스트 마이닝 알고리즘을 이용한 기상청 기상연감 자료 분석 (Analysis of the Yearbook from the Korea Meteorological Administration using a text-mining agorithm)

  • 선현석;임창원;이영섭
    • 응용통계연구
    • /
    • 제30권4호
    • /
    • pp.603-613
    • /
    • 2017
  • 최근 들어 많은 사람들이 자신의 관심사를 SNS에 게시하거나 인터넷과 컴퓨터의 기술 발달로 디지털 형태의 문서저장이 가능하게 됨으로써 생성되는 텍스트 자료의 양이 폭발적으로 증가하게 되었다. 이에 따라 수많은 문서 자료로부터 가치 있는 정보를 창출하기 위한 기술의 요구 또한 증가하고 있다. 그러나 대부분 비정형 형태로 구성되어 있는 텍스트 기반의 자료는 기존의 통계 분석이나 데이터 마이닝 기법을 적용하기에 부적합하기 때문에 텍스트 마이닝 기법이 사용되고 있다. 본 연구에서는 비정형 자료 분석 기법 중 하나인 텍스트 마이닝 기법으로 기상청 기상연감 자료를 분석하였다. 먼저 전처리 과정을 통하여 용어사전을 구축하고, 용어-문서 행렬을 생성하였다. 그리고 이것을 사용하여 연도별 용어 빈도수를 계산하고, 자주 나타나는 단어들에 대하여 상대도수의 변화를 관찰하였다. 또한 회귀 분석 기법을 사용하여 증가추세와 감소추세를 보이는 용어들을 파악하였다. 이러한 분석으로 기상청 기상연감 문서에서의 트렌드를 파악하고, 이를 통해 이슈가 되었던 기상 관련 소식과 기상현황, 그리고 기상청이 중점으로 하고 있는 업무 현황의 트렌드를 파악하였다. 본 연구를 통해 기상업무 분석 및 효율화에 도움을 주고 기상정책에 반영할 수 있는 유용한 정보를 이끌어내고자 하였다.

텍스트 마이닝을 활용한 온라인 교육에 대한 소비자 인식 변화 분석: COVID-19 전후를 중심으로 (A Study on Consumer perception changes of online education before and after COVID-19 using text mining)

  • 손민성;임미자;박경환
    • 디지털융복합연구
    • /
    • 제19권1호
    • /
    • pp.29-43
    • /
    • 2021
  • COVID-19 이후 국내는 물론, 전 세계적으로 온라인 교육은 절대적으로 필요하며 대체 불가한 교육 형태가 되었다. 온라인 교육이 급부상 하면서 교육 형태에 대해 사람들이 가지는 인식은 어떠한지, 만약 변화가 있다면 어떻게 변화했는지는 매우 궁금증을 자아내는 질문이다. 본 연구는 온라인 교육에 대한 소비자 인식의 변화 추이를 빅데이터를 활용하여 조사하였다. 이를 위해 코로나 이전(2019년 11월-12월), 코로나 촉발 이후(2020년 1월-2월), 온라인 개강직후(2020년 3월-4월), 온라인 교육을 일정 정도 경험한 이후(2020년 5월-6월)의 4개의 구간으로 구분하고, 텍스트 마이닝 즉, 키워드 빈도분석, 워드클라우드 분석, 네트워크 분석, 감성 분석을 수행하였다. 시기별로 온라인 교육 관련 키워드의 출현빈도는 코로나 이전에는 학점은행제, 평생교육, 블로그 등에서 코로나 이후 학교 개강이 시작되면서 온라인 개학, 비대면 교육, 실시간, 콘텐츠 제작, 유튜브 등으로 변화하였다. 감성분석 결과, 코로나 사태 이전에는 공지안내, 정보교류 등의 중립글이 대부분이었으나, 코로나 발생을 계기로 온라인 교육에 대한 사람들의 인식과 평가에 대한 긍정 및 부정의 의견이 논의되기 시작하였다. 또한 미래 온라인 교육시장의 확산과 전망 등 방향성에 대해서도 관심이 증대되었다. 온라인 교육은 발전가능성이 높은 만큼 앞으로 개선해야 할 부분들이 많겠으나, 교육 정책입안자, 현장에서 일하는 교육자들에게 온라인 교육 품질 개선 및 향후 나아갈 방향 수립에 도움을 줄 수 있을 것이다.

텍스트마이닝 기법을 활용한 교육관점에서의 메타버스 관련 이슈 탐색 - 뉴스 빅데이터를 중심으로 (Exploring Issues Related to the Metaverse from the Educational Perspective Using Text Mining Techniques - Focusing on News Big Data)

  • 박주연;정도헌
    • 산업융합연구
    • /
    • 제20권6호
    • /
    • pp.27-35
    • /
    • 2022
  • 본 연구는 뉴스 빅데이터에 나타난 메타버스 관련 이슈들을 교육관점에서 분석하여 그 특징을 탐색하고, 메타버스의 교육적 활용가능성 및 미래교육에 대한 시사점을 제공하는데 목적이 있다. 이를 위해 포털사이트에서 검색되는 메타버스 관련 뉴스 데이터를 41,366건 수집하였고, 대표적인 용어 가중치 모델인 TF-IDF를 이용하여 추출된 모든 키워드의 가중치 값을 계산하여 순위화한 후, 워드클라우드로 시각화 분석을 수행하였다. 또한 정교한 확률기반 텍스트마이닝 기법인 토픽모델링(LDA)을 활용하여 주요 토픽들을 분석하였다. 연구결과 교육관점에서 메타버스의 핵심 이슈로는 플랫폼 산업, 미래인재, 기술의 확산 등과 같은 주제가 도출되었다. 또한, 기술, 직업, 교육이라는 세 개의 핵심 주제로 2차 데이터 분석을 실시한 결과 미래교육에서 메타버스는 교육플랫폼의 혁신, 미래 직업의 혁신, 미래 역량의 혁신과 관련한 이슈를 갖는 것으로 나타났다. 본 연구는 방대한 양의 뉴스 빅데이터를 단계적으로 분석하여 교육관점에서 이슈를 도출하고 미래교육에 대한 시사점을 제공하였다는 데 의의가 있다.

소셜 빅데이터 텍스트 마이닝을 활용한 전국장애인체육대회 분석 연구 (Study on the Analysis of National Paralympics by Utilizing Social Big Data Text Mining)

  • 김대경;이현수
    • 한국체육학회지인문사회과학편
    • /
    • 제55권6호
    • /
    • pp.801-810
    • /
    • 2016
  • 본 연구는 전국장애인체육대회 관련 키워드를 분석하여 객관적인 시각을 통한 비장애인의 인식 전환과 인터넷 웹 브라우저를 활용한 전국장애인체육대회 참여율 향상을 위한 기초자료로 제시하는데 목적이 있다. 연구목적을 네이버, 다음, 구글 사이트에서 제공하는 뉴스 기사, 블로그를 통하여 수집된 전국장애인체육대회, 전국장애인체전 관련 소셜 빅데이터를 대상으로 하였다. 자료처리는 R-3.3.1 Version Program을 이용하여 워드클라우드, 연관성 분석, 사회연결망 분석을 사용하였다. 이상과 같은 연구방법 및 자료분석의 결과를 통해 도출된 결론은 다음과 같다. 첫째, 제33회~제35회에 대한 전국장애인체육대회 키워드에서는 경기결과, 종목, 선수단 참가, 개최지역 소식이 중점적으로 나타났다. 둘째, 제33회~제36회에 대한 전국장애인체육대회 연관성 분석을 통하여 네이버, 다음 등 웹 검색에서의 연관 검색어와 유사함을 나타냈다. 셋째, 전국장애인체육대회, 장애인체육, 장애인, 체육 키워드 간의 높은 근접 중심성을 나타내고 있으며, 생활체육, 참여, 연구, 발전, 스포츠-장애인, 연구-장애인, 생활체육-참여, 장애인-참여, 생활체육-장애인, 개최-전국장애인생활체육대회 키워드 간의 연결 중심성과 매개 중심성이 비례하게 나타났다.

스포츠시설에 관한 연구 동향 분석: SCOPUS DB를 중심으로 (Analysis on Research Trends in Sport Facilities: Focusing on SCOPUS DB)

  • 김일광;박성택;박수선;김미숙;박종철
    • 산업융합연구
    • /
    • 제19권6호
    • /
    • pp.11-19
    • /
    • 2021
  • 본 연구의 목적은 "스포츠시설" 관련 국내외 연구의 동향을 탐색적으로 파악하여 향후 연구 방향을 모색하는 데 있다. 이를 위해 2016년부터 2020년까지 SCOPUS DB에서 "스포츠시설"이 포함된 논문의 초록을 수집하였으며, 그 결과 총 1,801편이 자료 분석에 사용되었다. 자료 분석 수행을 위해 LDA 기반 토픽 모델링 기법과 TD-IDF 기법을 활용하였으며, Tagxedo를 활용한 워드클라우드 분석을 수행하였다. 분석 결과, 8가지 토픽이 최적으로 결정되었으며, 각 토픽의 주요 키워드로는 "sports", "facilities", "health", "physical", "data" 및 "using" 등이 도출되었다. 이를 통해 최근에 국내외적으로 스포츠시설과 관련하여 신체활동, 건강 및 시설 이용 등을 주제로 한 연구들이 활발하게 이루어져 왔음을 확인할 수 있었다. 이는 최근 SCOPUS 논문들은 건강 증진과 삶의 질 향상 등과 같은 스포츠시설의 도구적 가치에 주목하고 있음을 의미한다. 따라서, 건강한 삶을 위해 스포츠시설을 이용하는 참여자들에게 도움이 될 수 있는 다양한 연구들이 향후 지속적으로 수행되어야 할 것이다.

토픽 모델링을 활용한 코로나19 초기 생활체육 이슈 분석 (Trend Analysis of Sports for All-Related Issues in Early Stage of COVID-19 Using Topic Modeling)

  • 정연길;서수민;강현민
    • 지능정보연구
    • /
    • 제28권3호
    • /
    • pp.57-79
    • /
    • 2022
  • 지난 2019년 12월 시작된 코로나19는 정치, 경제, 사회, 문화 등 우리 삶의 전반에 많은 영향을 끼쳐 왔으며, 스포츠, 공연 예술 등의 분야 역시 이로 인해 큰 폭으로 활동이 위축되었다. 스포츠 분야의 경우 참여스포츠를 대표하는 생활체육 분야에서의 변화가 특히 크게 나타났으며, 헬스장, 탁구장, 배드민턴 동호회 등 국민 삶과 밀접한 장소에서의 확진자 발생은 코로나19의 확산에 대한 사회적 공포감을 증폭시키는 원인이 되기도 하였다. 이에 본 연구에서는 코로나19가 최초 확산한 시기의 생활체육 관련 국내 언론 기사를 분석하여, 코로나19 사태로 인해 생활체육 분야에서 어떤 이슈들이 현장에서 등장하고 있으며 어떠한 논의들이 이루어지고 있는지 살펴본다. 구체적으로 본 연구는 국내 대표적인 포털 뉴스 사이트로부터 생활체육과 관련된 코로나19 이슈를 다루고 있는 뉴스 기사를 수집한 후, 이에 대한 토픽 모델링(Topic Modeling) 분석을 통해 코로나19 환경에서의 주요 생활체육 이슈를 파악하였다. 분석을 통해 체육시설 코로나 발생, 체육활동 지원, 생활체육활동 변화 등의 의미있는 이슈를 발견하였으며, 이들 주요 이슈에 대한 워드 클라우드(Wordcloud) 분석을 통해 이슈를 시각적으로 이해하고 시간의 흐름에 따라 이러한 이슈가 변화하는 양상을 확인하였다.

공저자 네트워크 및 토픽 모델링 기반 여가레크리에이션 학술 연구 특징 분석 (The Research Features Analysis of Leisure and Recreation based on Co-authors Network and Topic Model)

  • 박성건;박광원;강현욱
    • 한국체육학회지인문사회과학편
    • /
    • 제57권2호
    • /
    • pp.279-289
    • /
    • 2018
  • 본 연구의 목적은 워드 클라우드와 LDA 토픽 모델링을 이용하여 공저자 네트워크 및 토픽 모델링 기반 여가레크리에이션 학술 연구의 특징을 분석하는 것이다. 웹 크롤러로 수집된 논문은 2008년 1월~2017년 3월 최근 10년 간 한국체육학회 홈페이지에 게재된 총 2,697편이며, 분석 대상은 여가레크리에이션 관련 문헌 369편이다. 분석 결과, 여가레크리에이션 분야 연구자들의 주요 관심사는 참가자와의 관계와 관련된 요인 분석, 다른 변인 간의 관계, 집단별 효과 차이 검증, 운동 참여, 스포츠 참여형태에 관한 연구로 나타났다. 연구자 네트워크에 링크된 수는 451개이며, 연구자들은 평균 1.52회의 관계를 맺고 있고, 연구자 간 평균 거리는 2.33로 나타났다. 대표저자의 연결정도 중심성에서 Lee. K. M., Hwang. S. H., Lee. C. S. 순으로 높게 나타났고, 근접 중심성은 Seo. K. B., Han. J. H., Kim. K. J. 순으로 나타났다. 마지막으로 매개 중심성은 Lee. C. W., Seo. K. B. 순으로 높게 나타나 여가레크리에이션과 관련된 학술 논문의 연구자들 사이를 연결해주는 역할을 가장 활발히 하는 것으로 나타났다. 향후 연구에서는 미래 여가 연구의 추이와 방향성에 관련하여 학자들 간의 논의가 필요하다.