Abstract
In recent years, bullied students and rogue groups in teenagers make many serious social problems. In this paper we propose a novel approach that more objectively analyzes peer relationships among students. As the data for objective analysis, we use communication history records that are collected from various communication tools such as telephones, e-mails, and messengers. We use the simple intuition that communication history records implicitly contain peer relationship information. And, we adopt data mining techniques for the more systematic analysis. The proposed peer relationship analysis consists of the following steps. First, we formally define the notion of degree of familiarity between friends, and present mathematical equations that compute the degree based on communication history records. In the proposed method, we use the intuition that the degree of familiarity from student x to student y becomes higher as x makes the more communications with y. Second, by using the degree of familiarity between students, we find out the students who are potentially bullied. This procedure is based on the assumption that a bullied student may have a very small number of history records from other students to him. Third, we adopt the clustering technique, one of the most representative data mining techniques, to find out meaningful student groups by using the degree of familiarity. To use the clustering technique, we formally define the notion of similarity between friends based on the degree of familiarity, and perform clustering using the notion. Last, to show the practicality of the proposed method, we have implemented the method and interpreted the meaning of the experimental results. Overall, we believe that our research result provides an effective framework that analyzes peer relationships more objectively and more systematically.
최근 청소년의 교우관계에 있어서 집단 따돌림과 불량 그룹이 사회적으로 큰 문제가 되고 있다. 본 논문에서는 학생들의 교우관계를 보다 객관적으로 분석하는 방법을 제안한다. 분석을 위한 객관적인 데이타로는 교우관계 정보를 묵시적으로 내포하고 있는 통신이력 데이타를 사용하며, 체계적 분석을 위하여 데이타 마이닝 기법을 활용한다. 제안하는 분석 방법은 다음과 같다. 첫째, 교우간 친밀도 (degree of familiarity) 개념을 정형적으로 정의하고, 여러 통신도구에서 발생한 통신이력 데이타를 기반으로 교우 간 친밀도를 수학적으로 계산하는 방법을 제안한다. 제안하는 방법은 학생 x가 y로 통신을 많이 시도할수록, 학생 x 의 y 에 대한 교우간 친밀도가 높다는 직관을 사용한다. 둘째, 계산한 교우간 친밀도를 사용하여 집단 따돌림의 가능성이 높은 학생을 파악한다. 이는 집단 따돌림 가능성이 높은 학생은 다른 학생으로부터의 통신 시도가 적을 것이라는 직관에 기반한다. 셋째, 교우간 친밀도를 데이타 마이닝 기법 중 하나인 클러스터링으로 분석하여 의미 있는 교우집단을 파악한다. 클러스터링 기법을 사용하기 위하여, 본 논문에서는 교우간 친밀도를 기반으로 교우간 유사도 (similarity) 개념을 정형적으로 정의하고, 이를 사용하여 클러스터링을 수행한다. 마지막으로, 제안한 방법의 실용성을 입증하기 위하여, 실제 구현 및 분석 실험을 수행하고, 그 의미를 해석한다. 이 같은 결과를 볼 때, 본 연구는 학생들의 교우관계를 보다 객관적으로 파악할 수 있는 효과적인 방법론이라 사료된다.