Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))
- 2013.10a
- /
- Pages.82-85
- /
- 2013
- /
- 2005-3053(pISSN)
Automatic Construction of a Named Entity Dictionary for Named Entity Recognition
개체명 인식을 위한 개체명 사전 자동 구축
- Jeon, Wonpyo (Program of Computer and Communication Engineering, College of Information Technology, Kangwon National University) ;
- Song, Yeongkil (Program of Computer and Communication Engineering, College of Information Technology, Kangwon National University) ;
- Choi, Maengsik (Program of Computer and Communication Engineering, College of Information Technology, Kangwon National University) ;
- Kim, Harksoo (Program of Computer and Communication Engineering, College of Information Technology, Kangwon National University)
- 전원표 (강원대학교, IT대학, 컴퓨터정보통신공학전공) ;
- 송영길 (강원대학교, IT대학, 컴퓨터정보통신공학전공) ;
- 최맹식 (강원대학교, IT대학, 컴퓨터정보통신공학전공) ;
- 김학수 (강원대학교, IT대학, 컴퓨터정보통신공학전공)
- Published : 2013.10.06
Abstract
개체명 인식기에 대한 연구에서 개체명 사전은 필수적으로 필요하다. 그러나 공개된 개체명 사전은 거의 없기 때문에, 본 논문에서는 디비피디아의 데이터로부터 개체명을 효과적으로 추출하여 자동으로 구축할 수 있는 방법을 제안한다. 제안 방법은 엔트리의 '이름'과 '분류' 정보를 사용한다. 엔트리의 '이름'은 개체명으로 사용하고, 엔트리의 '분류'는 각 개체명 클래스와의 상호정보량을 계산하여 엔트리와 개체명 클래스 사이의 점수를 계산한다. 이렇게 계산된 점수를 이용하여 개체명과 개체명 클래스를 매핑한다. 그 결과 76.7%의 평균 정확률을 보였다.