Semi-automatic Construction of Training Data using Active Learning

능동 학습을 이용한 학습 데이터 반자동 구축

  • Lee, Chang-Ki (Electronics and Telecommunications Research Institute Knowledge Mining Laboratory) ;
  • Hur, Jeong (Electronics and Telecommunications Research Institute Knowledge Mining Laboratory) ;
  • Wang, Ji-Hyun (Electronics and Telecommunications Research Institute Knowledge Mining Laboratory) ;
  • Lee, Chung-Hee (Electronics and Telecommunications Research Institute Knowledge Mining Laboratory) ;
  • Oh, Hyo-Jung (Electronics and Telecommunications Research Institute Knowledge Mining Laboratory) ;
  • Jang, Myung-Gil (Electronics and Telecommunications Research Institute Knowledge Mining Laboratory) ;
  • Lee, Young-Jik (Electronics and Telecommunications Research Institute Knowledge Mining Laboratory)
  • 이창기 (한국전자통신연구원 음성언어정보연구센터) ;
  • 허정 (한국전자통신연구원 음성언어정보연구센터) ;
  • 왕지현 (한국전자통신연구원 음성언어정보연구센터) ;
  • 이충희 (한국전자통신연구원 음성언어정보연구센터) ;
  • 오효정 (한국전자통신연구원 음성언어정보연구센터) ;
  • 장명길 (한국전자통신연구원 음성언어정보연구센터) ;
  • 이영직 (한국전자통신연구원 음성언어정보연구센터)
  • Published : 2006.02.13

Abstract

본 논문은 정보검색, 정보추출, 번역, 자연어처리 등의 작업을 위한 통계적 방법론에서 필요한 학습 데이터 구축을 효율적으로 하기 위한 학습 데이터 반자동 구축 장치 및 그 방법에 대하여 기술한다. 본 논문에서는 학습 데이터 구축양을 줄이기 위해서 능동 학습을 이용한다. 또한 최근 각광 받고 있는 Conditional Random Fields(CRF)를 능동학습에 이용하기 위해서 CRF를 이용한 Confidence measure를 정의한다.

Keywords