Text Categorization Using Co-Trained Support Vector Machines

;;

Proceedings of the Korean Information Science Society Conference (한국정보과학회:학술대회논문집)

2002.04b
/
Pages.259-261
/
2002
/
1598-5164(pISSN)

Korean Institute of Information Scientists and Engineers (한국정보과학회)

Text Categorization Using Co-Trained Support Vector Machines

Co-Trained Support Vector Machines을 이용한 문서분류

박성배 (서울대학교 컴퓨터공학부) ;
장병탁 (서울대학교 컴퓨터공학부)

Published : 2002.04.01

PDF

Download PDF

⟨ Previous Next ⟩

Abstract

대부분의 자동문서분류 시스템은 문서에 사용된 단어의 분포만 고려하고, 또 하나의 중요한 정보인 통사 정보는 무시한다. 본 논문에서는 통사정보와 어휘정보를 모두 사용함으로써 대규모의 비구조 문서를 분류하는 방법을 제시한다. 이를 위해, 학습 데이터에 대해 독립된 두 개의 관점을 요구하는 일종의 부분 감독 학습 알고리즘인 co-training 알고리즘을 사용한다. 어휘정보와 통사정보가 각각 문서의 독립된 관점이 될 수 있으므로, 이 두 정보와 레이블이 없는 문서를 사용하여 문서 분류의 성능을 높일 수 있다. Reelers-21578 문서집합과 TREC-7 filtering 문서집합에 대한 실험 결과는 제시된 방법의 유효성을 보인다.

Proceedings of the Korean Information Science Society Conference (한국정보과학회:학술대회논문집)

Text Categorization Using Co-Trained Support Vector Machines

Co-Trained Support Vector Machines을 이용한 문서분류

Abstract

Keywords

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)