Study on the Analysis of National Paralympics by Utilizing Social Big Data Text Mining

소셜 빅데이터 텍스트 마이닝을 활용한 전국장애인체육대회 분석 연구

  • Received : 2016.09.26
  • Accepted : 2016.10.27
  • Published : 2016.11.30

Abstract

The purpose of the study was to conduct a text mining examining keywords related to the National Paralympics and provide the fundamental information that would be used to change perception of people without disabilities toward disabilities and to promote the social participation of people with and without disabilities in the National Paralympics. Social big data regarding the National Paralympics were retrieved from news articles and blog postings identified by search engines, Naver, Daum, and Google. The data were then analysed using R-3.3.1 Version Program. The analysing techniques were cloud analysis, correlation analysis and social network analysis. The results were as follows. First, news were mainly related to game results, sports events, team participation and host avenue of the 33rd ~ 36th National Paralympics. Second, search results about the 33rd ~ 36th National Paralympics between Naver, Daum, and Google were similar to one another. Thirds, the keywrods, National Paralympics, sports for the disabled, and sports, demonstrated a high close centrality. Further, degree centrality and betweenness centrality were associated in the keywords such as sports for all, participation, research, development, sports-disabled, research-disabled, sports for all-participation, disabled-participation, sports for all-disabled, and host-paralympics.

본 연구는 전국장애인체육대회 관련 키워드를 분석하여 객관적인 시각을 통한 비장애인의 인식 전환과 인터넷 웹 브라우저를 활용한 전국장애인체육대회 참여율 향상을 위한 기초자료로 제시하는데 목적이 있다. 연구목적을 네이버, 다음, 구글 사이트에서 제공하는 뉴스 기사, 블로그를 통하여 수집된 전국장애인체육대회, 전국장애인체전 관련 소셜 빅데이터를 대상으로 하였다. 자료처리는 R-3.3.1 Version Program을 이용하여 워드클라우드, 연관성 분석, 사회연결망 분석을 사용하였다. 이상과 같은 연구방법 및 자료분석의 결과를 통해 도출된 결론은 다음과 같다. 첫째, 제33회~제35회에 대한 전국장애인체육대회 키워드에서는 경기결과, 종목, 선수단 참가, 개최지역 소식이 중점적으로 나타났다. 둘째, 제33회~제36회에 대한 전국장애인체육대회 연관성 분석을 통하여 네이버, 다음 등 웹 검색에서의 연관 검색어와 유사함을 나타냈다. 셋째, 전국장애인체육대회, 장애인체육, 장애인, 체육 키워드 간의 높은 근접 중심성을 나타내고 있으며, 생활체육, 참여, 연구, 발전, 스포츠-장애인, 연구-장애인, 생활체육-참여, 장애인-참여, 생활체육-장애인, 개최-전국장애인생활체육대회 키워드 간의 연결 중심성과 매개 중심성이 비례하게 나타났다.

Keywords