Feature Selection for Chinese Named Entity Recognition using SVM

SVM을 이용한 중국어 고유명사 식별에서의 자질 선택

  • Jin, Feng (Dept. of Graduate School for Information Technology, POSTECH) ;
  • Na, Seung-Hoon (Dept. of Computer Science & Engineering, POSTECH) ;
  • Kang, In-Su (Dept. of Computer Science & Engineering, POSTECH) ;
  • Li, Jin-Ji (Dept. of Computer Science & Engineering, POSTECH) ;
  • Kim, Dong-Il (Language Engineering Institute, YUST) ;
  • Lee, Jong-Hyeok (Dept. of Computer Science & Engineering, POSTECH)
  • 김풍 (포항공대 정보통신대학원 정보처리학과) ;
  • 나승훈 (포항공대 컴퓨터공학과) ;
  • 강인수 (포항공대 컴퓨터공학과) ;
  • 리금희 (포항공대 컴퓨터공학과) ;
  • 김동일 (중국연변과학기술대학 언어공학연구소) ;
  • 이종혁 (포항공대 컴퓨터공학과)
  • Published : 2004.10.08

Abstract

"고유명사 식별"은 사전에 등록되어 있지 않은 고유명사를 찾아내고 분류하는 과정으로 주로 인명, 지명, 조직 명을 처리 대상으로 한다. 처리할 데이터는 점점 많아지고 고유명사는 수시로 생겨나기 때문에 고유명사 식별은 정보검색, 질의응답, 기계번역시스템의 핵심 기술 중의 하나로 부각되었다. 고유명사 식별에 있어 정확률과 더불어 식별속도와 식별모듈의 크기가 시스템의 성능에 미치는 문제도 쟁점이 되고 있다. 본 논문에서는 SVM과 자질선택을 결합한 다양한 실험을 통하여 중국어 고유명사의 식별 효율을 높이는 방법을 연구하였다.

Keywords