전자 카탈로그 자동분류에서 $Na\ddot{i}ve-Bayesian$ Classifier 데이터 모델 확장

Extending Data Model of $Na\ddot{i}ve-Bayesian$ Classifier in e-Catalog Classification

  • 김성환 (서울대학교 대학원 전기컴퓨터 공학부) ;
  • 김현철 (서울대학교 대학원 전기컴퓨터 공학부) ;
  • 이태희 (서울대학교 대학원 전기컴퓨터 공학부) ;
  • 이상구 (서울대학교 대학원 전기컴퓨터 공학부)
  • Kim Sung-hwan (School of Computer Science & Engineering, Seoul National University) ;
  • Kim Hyun-chul (School of Computer Science & Engineering, Seoul National University) ;
  • Lee Tae-hee (School of Computer Science & Engineering, Seoul National University) ;
  • Lee Sang-goo (School of Computer Science & Engineering, Seoul National University)
  • 발행 : 2005.07.01

초록

인터넷 환경에서의 B2B Market Place의 출현은 판매자와 구매자와의 다자간 거래를 가능하게 하였다. 이러한 기반에서 상품정보를 포함하는 전자 카탈로그의 활용은 나날이 증가하고 있다. 그러나 동일한 상품에 대한 분류체계와 기준이 다르므로 전자카탈로그에 대한 재분류는 고비용을 초래하는 필수 불가결한 문제로 남게 되었다. 본 연구에서는 이러한 문제를 해결하기 위해 기계학습 기법을 이용한 $Na\ddot{i}ve$ Bayesian classifier 모델을 사용하였다 학습 데이터를 생성해야 하는 $Na\ddot{i}ve$ Bayesian 알고리즘 적용 시 전자 카탈로그는 일반 문서보다 상대적으로 학습 정보가 적으므로 데이터 모델의 확장을 통해 학습 정보를 생성하여 이러한 단점을 보완하였다. 전자 카탈로그 자동분류에 있어서 효과적이고 풍부한 양의 학습 데이터를 생성하는 것이 분류 정확도 향상에 중요한 영향을 미침을 실험을 통해 확인하였다.

키워드