Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))
- 2013.10a
- /
- Pages.82-85
- /
- 2013
- /
- 2005-3053(pISSN)
Automatic Construction of a Named Entity Dictionary for Named Entity Recognition
개체명 인식을 위한 개체명 사전 자동 구축
-
Jeon, Wonpyo
(Program of Computer and Communication Engineering, College of Information Technology, Kangwon National University) ;
-
Song, Yeongkil
(Program of Computer and Communication Engineering, College of Information Technology, Kangwon National University) ;
-
Choi, Maengsik
(Program of Computer and Communication Engineering, College of Information Technology, Kangwon National University) ;
-
Kim, Harksoo
(Program of Computer and Communication Engineering, College of Information Technology, Kangwon National University)
-
전원표
(강원대학교, IT대학, 컴퓨터정보통신공학전공) ;
-
송영길
(강원대학교, IT대학, 컴퓨터정보통신공학전공) ;
-
최맹식
(강원대학교, IT대학, 컴퓨터정보통신공학전공) ;
-
김학수
(강원대학교, IT대학, 컴퓨터정보통신공학전공)
- Published : 2013.10.06
Abstract
개체명 인식기에 대한 연구에서 개체명 사전은 필수적으로 필요하다. 그러나 공개된 개체명 사전은 거의 없기 때문에, 본 논문에서는 디비피디아의 데이터로부터 개체명을 효과적으로 추출하여 자동으로 구축할 수 있는 방법을 제안한다. 제안 방법은 엔트리의 '이름'과 '분류' 정보를 사용한다. 엔트리의 '이름'은 개체명으로 사용하고, 엔트리의 '분류'는 각 개체명 클래스와의 상호정보량을 계산하여 엔트리와 개체명 클래스 사이의 점수를 계산한다. 이렇게 계산된 점수를 이용하여 개체명과 개체명 클래스를 매핑한다. 그 결과 76.7%의 평균 정확률을 보였다.