Semi-automatic Construction of Training Data using Active Learning
능동 학습을 이용한 학습 데이터 반자동 구축
-
Lee, Chang-Ki
(Electronics and Telecommunications Research Institute Knowledge Mining Laboratory) ;
-
Hur, Jeong
(Electronics and Telecommunications Research Institute Knowledge Mining Laboratory) ;
-
Wang, Ji-Hyun
(Electronics and Telecommunications Research Institute Knowledge Mining Laboratory) ;
-
Lee, Chung-Hee
(Electronics and Telecommunications Research Institute Knowledge Mining Laboratory) ;
-
Oh, Hyo-Jung
(Electronics and Telecommunications Research Institute Knowledge Mining Laboratory) ;
-
Jang, Myung-Gil
(Electronics and Telecommunications Research Institute Knowledge Mining Laboratory) ;
-
Lee, Young-Jik
(Electronics and Telecommunications Research Institute Knowledge Mining Laboratory)
-
이창기
(한국전자통신연구원 음성언어정보연구센터) ;
-
허정
(한국전자통신연구원 음성언어정보연구센터) ;
-
왕지현
(한국전자통신연구원 음성언어정보연구센터) ;
-
이충희
(한국전자통신연구원 음성언어정보연구센터) ;
-
오효정
(한국전자통신연구원 음성언어정보연구센터) ;
-
장명길
(한국전자통신연구원 음성언어정보연구센터) ;
-
이영직
(한국전자통신연구원 음성언어정보연구센터)
- Published : 2006.02.13
Abstract
본 논문은 정보검색, 정보추출, 번역, 자연어처리 등의 작업을 위한 통계적 방법론에서 필요한 학습 데이터 구축을 효율적으로 하기 위한 학습 데이터 반자동 구축 장치 및 그 방법에 대하여 기술한다. 본 논문에서는 학습 데이터 구축양을 줄이기 위해서 능동 학습을 이용한다. 또한 최근 각광 받고 있는 Conditional Random Fields(CRF)를 능동학습에 이용하기 위해서 CRF를 이용한 Confidence measure를 정의한다.