Automatic Construction of a Named Entity Dictionary for Named Entity Recognition

개체명 인식을 위한 개체명 사전 자동 구축

  • Jeon, Wonpyo (Program of Computer and Communication Engineering, College of Information Technology, Kangwon National University) ;
  • Song, Yeongkil (Program of Computer and Communication Engineering, College of Information Technology, Kangwon National University) ;
  • Choi, Maengsik (Program of Computer and Communication Engineering, College of Information Technology, Kangwon National University) ;
  • Kim, Harksoo (Program of Computer and Communication Engineering, College of Information Technology, Kangwon National University)
  • 전원표 (강원대학교, IT대학, 컴퓨터정보통신공학전공) ;
  • 송영길 (강원대학교, IT대학, 컴퓨터정보통신공학전공) ;
  • 최맹식 (강원대학교, IT대학, 컴퓨터정보통신공학전공) ;
  • 김학수 (강원대학교, IT대학, 컴퓨터정보통신공학전공)
  • Published : 2013.10.06

Abstract

개체명 인식기에 대한 연구에서 개체명 사전은 필수적으로 필요하다. 그러나 공개된 개체명 사전은 거의 없기 때문에, 본 논문에서는 디비피디아의 데이터로부터 개체명을 효과적으로 추출하여 자동으로 구축할 수 있는 방법을 제안한다. 제안 방법은 엔트리의 '이름'과 '분류' 정보를 사용한다. 엔트리의 '이름'은 개체명으로 사용하고, 엔트리의 '분류'는 각 개체명 클래스와의 상호정보량을 계산하여 엔트리와 개체명 클래스 사이의 점수를 계산한다. 이렇게 계산된 점수를 이용하여 개체명과 개체명 클래스를 매핑한다. 그 결과 76.7%의 평균 정확률을 보였다.

Keywords