The Construction of URI-Based Human Resource Information from Science and Technology Papers

과학기술 문헌으로부터의 URI 기반 인력정보 구축

  • 정한민 (한국과학기술정보연구원 정보시스템연구팀) ;
  • 이승우 (한국과학기술정보연구원 정보시스템연구팀) ;
  • 성원경 (한국과학기술정보연구원 정보시스템연구팀) ;
  • 강인수 (한국과학기술정보연구원 정보시스템연구팀)
  • Published : 2006.09.01

Abstract

The development of Semantic Web basically requires knowledge induced from the formalization and semantization of information, and thus ontology should be introduced as a knowledgization tool. URI(Universal Resource Identifier) is an indispensible scheme to uniquely indicate individuals on ontology. However, it is difficult to find the use cases of URI in real data including science and technology papers. This paper describes the method to construct internal and external human resource information based on URI from the papers. We use co-authors, e-mails, publication date, and affiliation for discriminating authors with the same strings. HRST(Human Resources devoted to Science and Technology) is referred to acquire URIs for human resource. We expect the internal and external human resource information would be adopted to outcome analysis applications such as researcher network analysis and outcome statistics.

시맨틱 웹의 발전은 온톨로지를 포함한 언어 자원들에 기초하고 있으며, 온톨로지 상에서 개체(Individual)들은 식별체계인 URI(Universal Resource Identifier)를 이용하여 유일하게 지칭될 수 있도록 구축되어야 한다. 그렇지만, 현실에서 식별체계를 사용하는 경우를 발견하기가 힘들며, 특히 논문과 같은 과학기술 문헌은 그 적용 대상에서 제외되어 왔다. 이러한 이유로 인해 과학기술 문헌상의 인력정보를 식별체계 기반으로 구축하고자 하는 시도가 미약한 실정이었다. 이에 본 논문은 과학기술 문헌으로부터 인력정보를 내부와 외부로 나누어 URI 기반으로 구축하는 방법을 기술한다. 이 때, 인력정보 자동 검증 방법을 적용하여 구축 초기에 참고정보를 제공하거나 구축 후에 인력정보를 검증할 수 있도록 한다. 본 논문은 공저자 관계, 전자우편, 발행년도, 소속기관 등을 이용하여 동명이인 문제를 해소하고, 각 저자 그룹 별 URI 부여를 위해 국가과학기술인력 종합정보시스템을 활용한 사례를 소개하는 방식으로 기술한다. 이러한 과정을 통해 9,484건의 과학기술 문헌들로부터 획득한 외부 인력정보와 KISTI 내부 인력정보는 연구자 네트워크 분석, 성과 통계 등 다양한 시맨틱 웹 응용 분야들에 필수적으로 활용될 것이다.

Keywords