Attribute-Based Classification Method for Automatic Construction of Answer Set

정답문서집합 자동 구축을 위한 속성 기반 분류 방법

  • 오효정 (한국전자통신연구원 휴먼정보검색연구팀) ;
  • 장문수 (서경대학교 소프트웨어학과) ;
  • 장명길 (한국전자통신연구원 휴먼정보검색연구팀)
  • Published : 2003.08.01

Abstract

The main thrust of our talk will be based on our experience in developing and applying an attribute-based classification technique in the context of an operational answer set driven retrieval system. To alleviate the difficulty and reduce the cost of manually constructing and maintaining answer sets, i.e., knowledge base, we have devised a new method of automating the answer document selection process by using the notion of attribute-based classification, which is in and of itself novel. We attempt to explain through experiments how helpful the proposed method is for the knowledge base construction process.

본 논문에서는 사용자에게 보다 유용한 정보를 제공하기 위하여 개념의 활용분야에 따른 속성 분류 기법이라는 새로운 분류 기법을 제안하고, 이를 활용해 정답문서집합 지식베이스를 자동으로 구축하는 방안을 제시한다. 제안된 방법은 범주간의 구분이 유동적인 속성의 특성을 반영하기 위하여 속성 특징(clue)을 활용함으로써 분류 정확도를 높이고, 개념망에 정의된 개념들 사이의 관계를 참조함으로써 지식베이스를 구축하기 위한 노력과 비용을 최소화하여 점진적인 분류기 생성을 가능하게 한다. 실험을 통해 제안된 방법의 정확도와 효율성을 입증하였으며, 정답문서기반 정보검색 시스템을 위한 정답문서집합 구축과정에 적용시킨 결과를 제시함으로써 방법의 실제 효용성을 보였다.

Keywords

References

  1. Fabrizio Sebastiani, 'Machine Learning in Automatic Text Categorization,' ACM Computing Surveys, 34(1):1-47, 2002 https://doi.org/10.1145/505282.505283
  2. Oh, H. J., Myaeng, S. H., Lee, M. H., 'A Practical Hypertext Categorization Method using Links and Incrementally Available Class Information,' Proc. of the 23rd annual international ACM-SIGIR '2000, pp 264-271, Athens, Greece, 2000
  3. Yong-Bae Lee, Sung Hyon Myaeng, 'Text Genre Classification with Genre-Revealing and Subject-Revealing Features,' Proc. of the 25th annual international ACM-SIGIR '2002, pp 145-150, Tampere, Finland, 2002 https://doi.org/10.1145/564376.564403
  4. Jeong-Mook Lim, Hyo-Jung Oh, Sung-Hyon Myaeng, and Mann-Ho Lee, 'Improving Efficiency with Document Category Information in Link-based Retrieval,' Proc. of the international Workshop on IRAL '99, 1999
  5. Aks $Jeeves^{tm}$, http://www.askjeeves.com
  6. 장명길, 오효정, 장문수 외 3인, '의미기반 정보검색', 정보과학회지, 19(10):7-18, 2001년 10월
  7. Andrew McCallum, Kamal Nigam, et al., 'A Machine Learning Approach to Building Domain-Specific Search Engines,' Proc. of the 16th IJCAI Conference, pp 662-667, 1999
  8. Sanda Harabagiu, Dan Moldovan, et al, 'FALCON: Boosting Knowledge for Answer Engines,' Proc. of Text Retrieval Conference (TREC-9), November, 2000
  9. Marius Pasca and Sanda M. Harabagiu, 'The Informative Role of WordNet in Open-Domain Question Answering,' Proc. of the NAACL 2001 Workshop on WordNet and Other Lexical Resource, pp 138-143, CMU, Pittsburge PA, June 2001
  10. C. Aggarwal, S. C. Gates, P.S.Yu., 'On the merits of using supervised clustering for building categorization systems,' Proc. of the SIGKDD-99 Conference, 1999
  11. Robert E. Schapire and Yoram Singer, 'Boos Texter: A Boosting-based System for Text Categorization,' Machine Learning, 39, pp 135-168, Kluwer Academic Publishers, 2000 https://doi.org/10.1023/A:1007649029923
  12. 정용교, 신승은, 오효정, 장명길, 서영훈, 'Answer set 자동구축을 위한 문서 필터링', 제14회 한글 및 한국어정보처리학회, pp. 253-258, 2002
  13. David D. Lewis, 'Representation and Learning in Information Retrieval,' Ph.D. thesis, Dep. of Computer Science, Univ. of Massachusetts, 1992
  14. Yiming Yang and Xin Liu, 'A Re-examination Of Text Categorization Methods,' Proc. of the 22th annual international ACM-SIGIR '1999, pp 42-49 Berkeley, USA, 1999 https://doi.org/10.1145/312624.312647
  15. Yiming Yang, 'A Study on Thresholding Strategies for Text Categorization,' Proc. of the 24th annual international ACM-SIGIR '2001, pp 139-145, New Orleans, USA, 2001