DOI QR코드

DOI QR Code

공간통계분석기법을 이용한 소셜 네트워크 유력지역 탐색기법 연구

A Study on Detection Methodology for Influential Areas in Social Network using Spatial Statistical Analysis Methods

  • 이영민 (서울대학교 대학원 건설환경공학부) ;
  • 박우진 (서울대학교 환경정화기술 및 위해성평가 연구센터) ;
  • 유기윤 (서울대학교 대학원 건설환경공학부)
  • Lee, Young Min (Department of Civil & Environmental Engineering, Seoul National University) ;
  • Park, Woo Jin (Center of Environmental Remediation and Risk Assessment, Seoul National University) ;
  • Yu, Ki Yun (Department of Civil & Environmental Engineering, Seoul National University)
  • 투고 : 2014.08.08
  • 심사 : 2014.10.07
  • 발행 : 2014.12.31

초록

최근 소셜 미디어의 활성화로 인해 소셜 네트워크상에서 수많은 자발적 추종자들을 확보한 새로운 형태의 유력자가 대두되고 있다. 소셜 네트워크상에서의 유력자를 탐색하는 연구들이 진행되어 왔고, 관련 서비스가 제공 중에 있으나 이들은 유력자 규명에 있어 위치기반 소셜 네트워크 서비스(LBSNS)가 가지고 있는 위치 정보에 대한 반영이 부족하다는 한계점을 가지고 있었다. 이에 본 연구에서는 공간통계분석기법을 이용하여 LBSNS 데이터를 대상으로 다양한 사회문화적 이슈에 대한 발언에 영향력을 가지는 유력자를 공간적으로 탐색하고, 이를 활용하는 방안을 제시하고자 하였다. 이를 위해 트위터의 지오태깅된 메시지를 분석 데이터로 사용하였으며, 서울시를 공간적 범위로 하여 한 달 동안 총 168,040건의 메시지를 수집하였다. 또한 '정치', '경제', 'IT'를 연구 대상 범주로 설정하고, 데이터 수집 기간 동안 이슈가 되었던 키워드들을 주어진 범주별로 분류하였다. 이를 바탕으로 키워드에 대한 유력자를 파악하기 위한 노출도를 도출하고, 이에 대해 서울시의 행정동을 기준으로 공간결합연산을 실시함으로써 각 키워드에 대한 행정동별 노출도를 산출하였다. 그리고 행정동별로 산출된 노출도의 공간적 의존성을 고려하여 유력지수를 도출하였으며, 키워드별로 상위의 유력지수를 보이는 지역을 유력지역으로 추출하여 이들의 공간적인 분포 특성과 키워드들 간의 공간적 상관성을 분석하였다. 실험 결과, 동일 범주 내에서 키워드 간의 공간적 상관계수는 0.3 이상으로 높은 상관성을 보였으며, 정치범주와 경제범주의 키워드 간 상관계수 역시 평균 0.3으로 비교적 높은 상관성을 보인 반면, 정치범주와 IT범주, 경제범주와 IT범주 키워드 간의 상관계수는 각각 0.18, 0.15로 낮은 상관성을 보였다. 본 연구는 유력자에 대한 연구를 공간 정보의 관점에서 구체화시켰다는 점에서 의의를 가지며, 향후에 gCRM(geographic Customer Relationship Management) 등의 분야에 유용하게 활용될 수 있을 것이다.

Lately, new influentials have secured a large number of volunteers on social networks due to vitalization of various social media. There has been considerable research on these influential people in social networks but the research has limitations on location information of Location Based Social Network Service(LBSNS). Therefore, the purpose of this study is to propose a spatial detection methodology and application plan for influentials who make comments about diverse social and cultural issues in LBSNS using spatial statistical analysis methods. Twitter was used to collect analysis object data and 168,040 Twitter messages were collected in Seoul over a month-long period. In addition, 'politics,' 'economy,' and 'IT' were set as categories and hot issue keywords as given categories. Therefore, it was possible to come up with an exposure index for searching influentials in respect to hot issue keywords, and exposure index by administrative units of Seoul was calculated through a spatial joint operation. Moreover, an influential index that considers the spatial dependence of the exposure index was drawn to extract information on the influential areas at the top 5% of the influential index and analyze the spatial distribution characteristics and spatial correlation. The experimental results demonstrated that spatial correlation coefficient was relatively high at more than 0.3 in same categories, and correlation coefficient between politics category and economy category was also more than 0.3. On the other hand, correlation coefficient between politics category and IT category was very low at 0.18, and between economy category and IT category was also very weak at 0.15. This study has a significance for materialization of influentials from spatial information perspective, and can be usefully utilized in the field of gCRM in the future.

키워드

참고문헌

  1. Cha, M. Y., Haddadi, H., Benevenuto, F. and Gummadi, P. K., 2010, Measuring user influence in Twitter: The million follower fallacy, Proceedings of the 4th International AAAI Conference on Weblogs and Social Media, pp. 10-17.
  2. Java, A., Song, X., Finin, T. and Tseng, B., 2007, Why we twitter: understanding microblogging usage and communities, Proceedings of the 9th WebKDD and 1st SNA-KDD 2007 Workshop on Web Mining and Social Network Analysis, pp. 56-65.
  3. Kim, H. T., Kim, S. S. and An, S. H., 2009, The pattern of urban growth and measurement of spatial structural change in Daejeon metropolitan city, Journal of the Korean Society for GeoSpatial Information System, Vol. 17, No. 3. pp. 41-48.
  4. Korea Internet and Security Agency, Internet & Security Issue, Vol. 2010, No. 3, p. 39.
  5. Lee, S. I., 2001, Developing a bivariate spatial association measure: an integration of Pearson's r and Moran's I, Journal of Geographical Systems, Vol. 3, No. 4, pp. 369-385. https://doi.org/10.1007/s101090100064
  6. Lee, W. T., Cha, M. Y. and Park, H. Y., 2010, Influentials' role in mobile social media, Digital Convergence- based Prospective Study(II), Korea Information Society Development Institute, Vol. 2010, No. 27, pp. 1-123.
  7. Park, H. S., Cha, M. Y. and Moon, S. B., 2010, Influentials ranking in social networks, Journal of Korean Institute of Information Scientists and Engineers, Vol. 28, No. 3, pp. 24-30.
  8. Taylor, R., 1990, Interpretation of the correlation coefficient: a basic review, Journal of Diagnostic Medical Sonography, Vol. 6, No. 1, pp. 35-39. https://doi.org/10.1177/875647939000600106
  9. Weng, J., Lim, E. P., Jiang, J. and He, Q., 2010, Twitterrank: finding topic-sensitive influential twitterers, In Proceedings of the third ACM International Conference on Web Search and Data Mining, pp. 261-270.
  10. Yoo, B. K. and Kim S. H., 2013, Marketing strategies using social network analysis : Twitter's search network, The Journal of The Korea Contents Association, Vol. 13, No. 5, pp. 396-407.