Peer Relationship Analysis Based on Communication History Records

통신이력 데이타에 기반한 교우관계 분석

  • 문양세 (강원대학교 컴퓨터과학과) ;
  • 최훈영 (강원대학교 컴퓨터과학과) ;
  • 김진호 (강원대학교 컴퓨터과학과)
  • Published : 2006.08.01

Abstract

In recent years, bullied students and rogue groups in teenagers make many serious social problems. In this paper we propose a novel approach that more objectively analyzes peer relationships among students. As the data for objective analysis, we use communication history records that are collected from various communication tools such as telephones, e-mails, and messengers. We use the simple intuition that communication history records implicitly contain peer relationship information. And, we adopt data mining techniques for the more systematic analysis. The proposed peer relationship analysis consists of the following steps. First, we formally define the notion of degree of familiarity between friends, and present mathematical equations that compute the degree based on communication history records. In the proposed method, we use the intuition that the degree of familiarity from student x to student y becomes higher as x makes the more communications with y. Second, by using the degree of familiarity between students, we find out the students who are potentially bullied. This procedure is based on the assumption that a bullied student may have a very small number of history records from other students to him. Third, we adopt the clustering technique, one of the most representative data mining techniques, to find out meaningful student groups by using the degree of familiarity. To use the clustering technique, we formally define the notion of similarity between friends based on the degree of familiarity, and perform clustering using the notion. Last, to show the practicality of the proposed method, we have implemented the method and interpreted the meaning of the experimental results. Overall, we believe that our research result provides an effective framework that analyzes peer relationships more objectively and more systematically.

최근 청소년의 교우관계에 있어서 집단 따돌림과 불량 그룹이 사회적으로 큰 문제가 되고 있다. 본 논문에서는 학생들의 교우관계를 보다 객관적으로 분석하는 방법을 제안한다. 분석을 위한 객관적인 데이타로는 교우관계 정보를 묵시적으로 내포하고 있는 통신이력 데이타를 사용하며, 체계적 분석을 위하여 데이타 마이닝 기법을 활용한다. 제안하는 분석 방법은 다음과 같다. 첫째, 교우간 친밀도 (degree of familiarity) 개념을 정형적으로 정의하고, 여러 통신도구에서 발생한 통신이력 데이타를 기반으로 교우 간 친밀도를 수학적으로 계산하는 방법을 제안한다. 제안하는 방법은 학생 x가 y로 통신을 많이 시도할수록, 학생 x 의 y 에 대한 교우간 친밀도가 높다는 직관을 사용한다. 둘째, 계산한 교우간 친밀도를 사용하여 집단 따돌림의 가능성이 높은 학생을 파악한다. 이는 집단 따돌림 가능성이 높은 학생은 다른 학생으로부터의 통신 시도가 적을 것이라는 직관에 기반한다. 셋째, 교우간 친밀도를 데이타 마이닝 기법 중 하나인 클러스터링으로 분석하여 의미 있는 교우집단을 파악한다. 클러스터링 기법을 사용하기 위하여, 본 논문에서는 교우간 친밀도를 기반으로 교우간 유사도 (similarity) 개념을 정형적으로 정의하고, 이를 사용하여 클러스터링을 수행한다. 마지막으로, 제안한 방법의 실용성을 입증하기 위하여, 실제 구현 및 분석 실험을 수행하고, 그 의미를 해석한다. 이 같은 결과를 볼 때, 본 연구는 학생들의 교우관계를 보다 객관적으로 파악할 수 있는 효과적인 방법론이라 사료된다.

Keywords

References

  1. 김선애, '집단따돌림 연구경향 분석', 한국청소년연구, 제39호, pp. 73-107, 2004
  2. 백운학, '학교폭력과 집단 따돌림 현상의 실태와 대응방안', 재활심리연구, 제6권, 제6호, pp. 223-245, 1999
  3. Lee, C., Preventing Bullying in Schools, Sage, 2004
  4. 김경동, 사회학의 이론과 방법론, 한국학술정보, 2003
  5. Chen, M. S., Han, J., and Yu, P. S., 'Data Mining: An Overview from a Database Perspective', IEEE Trans. on Knowledge and Data Engineering, Vol. 8, No.6, pp. 866-883, Dec. 1996 https://doi.org/10.1109/69.553155
  6. Moon, Y.-S., Whang, K.-Y., and Loh, W.-K., 'Efficient Time-Series Subsequence Matching using Duality in Constructing Windows,' Information Systems, Vol. 26, No.4, pp, 279-293, June 2001 https://doi.org/10.1016/S0306-4379(01)00021-7
  7. Guha, S., Rastogi, R., and Shim, K., 'ROCK: A Robust Clustering Algorithm for Categorical Attributes,' In Proc. Int'l Conf. on Data Engineering (ICDE), IEEE, Sydney, Australia, pp. 512-521, March, 1999 https://doi.org/10.1109/ICDE.1999.754967
  8. Zhang, T., Ramakrishnan, R., and Livny, M., 'BIRCH: An Efficient Data Clustering Method for very Large Databases,' In Proc. Ini'l Conf. on Management of Data, ACM SIGMOD, Montreal, Canada, pp. 103-114, June 1996 https://doi.org/10.1145/233269.233324
  9. Hwang, J.-J., Whang, K.-Y., Moon, Y.-S., and Lee, B.-S., 'A Top-down Approach for Density-Based Clustering Using Multidimensional Indexes,' Journal of Systems and Software, Vol. 73, Issue 1, pp. 196-180, Sept. 2004 https://doi.org/10.1016/j.jss.2003.08.237
  10. Ester, M., Kriegel, H.-P., Sander, J., and Xu, X., 'A Density- Based Algorithm for Discovering Clusters in Large Spatial Databases with Noise,' In Proc. the 2nd Int'l Conf. on Knowledge Disco?very and Data Mining, pp. 226-231, Portland, Oregon, Aug. 1996
  11. Agrawal, R., Gehrke, J., Gunopulos, D., and Raghavan, P., 'Automatic Subspace Clustering of High Dimensional Data for Data Mining Applications,' In Proc. Int'l Conf. on Management of Data, ACM SIGMOD, pp. 94-105, June 1998 https://doi.org/10.1145/276304.276314
  12. Gibson, D., Kleinberg, J., and Raghavan, P., 'Clustering Categorical Data: An Approach Based on Dynamical Systems,' The VLDB Journal, Vol. 8, Issue 3-4, pp. 222-236, Feb. 2000 https://doi.org/10.1007/s007780050005
  13. Dutta, M., Mahanta, A. K., and Pujari, A. K., 'QROCK: A Quick Version of the ROCK Algorithm for Clustering of Categorical Data,' Journal of Pattern Recognition Letters, Vol. 26, No. 15, pp. 2364-2373, Nov. 2005 https://doi.org/10.1016/j.patrec.2005.04.008
  14. 강상철, 최건수, '상징적 상호작용론', 교육발전총론, 제9권, 제1호, pp. 23-39, 1988
  15. 최순남, 인간행동과 사회환경(제3판), 법문사, 2005
  16. Snell, H. E., et al., Social Relationships and Peer Support, Paul H. Brooks Pub. Co., 1999
  17. Wajcman, J., Feminism Confronts Technology, Pennsylvania State Univ. Press, 1991
  18. Saltz, J. S., Hiltz, S. R., and Turoff, M., 'Student Social Graphs: Visualizing a Student's Online Social Network,' In Proc. of Conference on Computer Supported Cooperative Work, ACM CSCW, Chicago, Illinois, pp. 596-599, Nov. 2004 https://doi.org/10.1145/1031607.1031709
  19. Ko, T. H. and Berry, N. M., 'Agent-Based Modeling with Social Networks for Terrorist Recruitment,' In Proc. of the 9th National Conference on Artificial Intelligence, San Jose, California, pp. 1016-1017, July 2004
  20. Aalst, W. M. P., and Song, M., 'Mining Social Networks: Uncovering Interaction Patterns in Business Processes,' Lecture Notes in Computer Science, Vol. 3080, pp. 244-260, 2004 https://doi.org/10.1007/978-3-540-25970-1_16
  21. Adamic, L. A., Buyukkokten, O., and Adar, E., 'A Social Network Caught in the Web,' First Monday, Vol. 8, No.6, 2003
  22. Cantu, M., Mastering Borland Delphi 2005, John Wiley & Sons, 2005
  23. 통신비밀보호법, 1993년 제정(법률 제4650호), 2004년 제8차 개정(법률 제7138호)
  24. 개인정보보호법, 1994년 제정(법률 제4743호), 1999년 제1차 개정(법률 제5715호)