개별 인용 필드의 인용 매칭에 대한 영향력 평가

Evaluating an Influence of Individual Citation Field on Citation Matching

  • 구희관 (한국과학기술정보연구원, 정보기술개발단) ;
  • 강인수 (한국과학기술정보연구원, 정보기술개발단) ;
  • 정한민 (한국과학기술정보연구원, 정보기술개발단) ;
  • 이승우 (한국과학기술정보연구원, 정보기술개발단) ;
  • 성원경 (한국과학기술정보연구원, 정보기술개발단)
  • Koo, HeeKwan (Korea Institute of Science and Technology Information) ;
  • Kang, In-Su (Korea Institute of Science and Technology Information) ;
  • Jung, Hanmin (Korea Institute of Science and Technology Information) ;
  • Lee, Seung-Woo (Korea Institute of Science and Technology Information) ;
  • Sung, Won-Kyung (Korea Institute of Science and Technology Information)
  • 발행 : 2007.11.16

초록

인용 매칭(Citation Matching, CM)은 동일한 논문을 지칭하는 인용레코드(Citation Record)를 군집화하는 방법이다. 일반적으로, 저자, 논문제목, 게재지명이나 출판연도 등의 인용 필드로 구분하는 인용 필드 분해가 인용 매칭 보다 선행하게 된다. 상당히 많은 연구가 인용 매칭과 인용 필드 분해의 문제를 해결하고자 했지만, 인용 필드 분해와 인용 매칭과의 상관관계에 대한 연구는 부족하였다. 인용 매칭에 대한 인용 필드 분해의 여러 측면 중에, 본 논문은 인용 매칭에 가장 영향력이 있는 인용 필드를 밝히고자 한다. 첫 번째 시도로, 수작업으로 인용 필드 분해를 수행한 다양한 크기의 인용 필드 집합에 대하여 인용 매칭의 성능을 비교하였고, 그 결과 많은 인용 필드를 사용한 인용 매칭이 인용 레코드를 더 잘 군집화 할 수 있다는 것을 확인하였다.

Citation matching (CM) is a method for clustering citation records that refer to the same paper. Normally, CM is preceded by citation field segmentation (CFS) which divides a citation record into its fields such as author(s), a title, a title of publication, year, etc. Although many studies have attacked CFS and CM, the relationship between CFS and CM was not sufficiently explored. Among many aspects of the effect of CFS on CM, this study concentrates on what citation fields should identify for CM. As its first attempt, we compared CM performances over different sets of citation fields manually segmented, and confirmed that the use of more citation fields help CM to cluster citation records better.

키워드