초록
본 논문에서는 위키피디아 사용 데이터를 분석하여 국가별 관심도를 측정하는 기법을 제시하였다. 먼저 해당 국가에 대한 분야별 관심도를 측정하기 위해서 위키피디아 카테고리로부터 개념 계층 구조를 추출하여 관심도 온톨로지를 구축하였다. 관심도 온톨로지는 국가에 대한 관심 분야를 정치, 경제, 사회, 그리고 문화로 분류하고 각 대분류에 대해 다시 세부 분야으로 분류하였다. 다음으로, 특정 국가의 페이지에서 자주 편집된 기사들의 제목을 관심도 온톨로지에 매핑하여 분야별 페이지 뷰를 분석하였다. 마지막으로 한국, 중국, 그리고 일본에 대한 국가별 관심도를 측정하고 국가별로 위키피디아 사용자들의 관심 분야가 다른지 판별하기 위해서 카이 제곱 독립성 검정을 실시하였다. 실험 결과는 위키피디아 사용자들의 관심 분야가 각 국가와 연관성이 있음을 보여준다. 본 연구는 기존의 설문조사 방식으로 국가 이미지를 측정하는 경우보다 적시에 그리고 유연하게 분야별 관심도를 측정할 수 있는 방안을 제시하며, 위키피디아 사용 데이터 분석 결과를 국가 이미지 개선을 위해 분야별로 재고할 방향을 제시한다.
In this paper, we propose an ontology-based approach to measuring degree-of-interest in country by analyzing wikipedia usage data. First, we developed the degree-of-interest ontology called DOI ontology by extracting concept hierarchies from wikipedia categories. Second, we map the title of frequently edited articles into DOI ontology, and we measure degree-of-interest based on DOI ontology by analyzing wikipedia page views. Finally, we perform chi-square test of independence to figure out if interesting fields are independent or not by country. This approach shows interesting fields are closely related to each country, and provides degree of interests by country timely and flexibly as compared with conventional questionnaire survey analysis.