온톨로지 구축 지원을 위한 과학기술 문헌으로부터의 인력정보 구축

Construction of Human Resources from Science & Technology Publications for Supporting of Ontology Construction

  • 정한민 (한국과학기술정보연구원 NTIS 사업단) ;
  • 이승우 (한국과학기술정보연구원 NTIS 사업단) ;
  • 강인수 (한국과학기술정보연구원 NTIS 사업단) ;
  • 성원경 (한국과학기술정보연구원 NTIS 사업단)
  • 발행 : 2006.05.26

초록

시멘틱 웹의 발전은 정보의 규격화, 의미화를 통한 지식을 기본으로 요구하며, 온톨로지는 이러한 지식 표현을 위해 필수적으로 사용되는 도구이다. 온톨로지 상에서 Individual들은 식별체계인 URI(Universal Resource Identifier)를 이용하여 유일하게 지칭될 수 있어야 한다. 그렇지만, 현실에서 식별체계를 사용하는 경우를 발견하기가 힘들며, 특히 논문과 같은 과학기술 문헌은 그 적용 대상에서 제외되어 왔다. 이러한 이유로 인해 과학기술 문헌상의 인력정보를 식별체계 기반으로 구축하고자 하는 시도가 미약한 실정이었다. 이에 본 논문은 과학기술 문헌을 포함한 국가 과학기술 R&D 기반정보 온톨로지 구축에서 중심이 되는 인력정보를 URI 기반으로 구축하는 방법을 기술한다. 공저자 관계, 이메일, 출판 연도, 소속기관 등을 이용하여 동명이인 문제를 해소하고, 각 저자 그룹 별 URI 부여를 위해 국가과학기술인력 종합정보시스템을 활용한 사례를 소개한다. 이러한 과정을 통해 7,175건의 논문들로부터 획득한 인력정보는 연구자 네트워크 분석, 성과 통계 등 다양한 시멘틱 웹 응용 분야들에 기초적으로 활용될 것으로 기대한다.

The development of Semantic Web basically requires knowledge induced from the formalization and semantization of information, and thus ontology should be introduced as a knowledgization tool. URI(Universal Resource Identifier) is an indispensible scheme to uniquely indicate individuals on ontology. However, it is difficult to find the use cases of URI in real data including science & technology publications. This paper describes the method to construct human resources based on URI which are the critical components on national R&D reference information ontology. We use co-authors, e-mails, publication date, and affiliation for discriminating authors with the same strings. HRST is referred to acquire human resource URIs. We expect the human resources would be adopted to outcome analysis applications such as researcher network analysis and outcome statistics.

키워드