A Study on the Improvement of Retrieval Effectiveness to Clustered and Filtered Document through Query Expansion

질의어 확장에 기반을 둔 클러스터링 및 필터링 문서의 검색효율 제고에 관한 연구

  • Published : 2003.06.01

Abstract

The purpose of this study is to improve of retrieval effectiveness to clustered and filtered document through query expansion. The result of this research prove that extended queries and documents, information in encyclopedia, clustering and filtering techniques are effective to promote retrieval effectiveness.

인터넷을 비롯한 대다수의 정보검색에서 사용자가 느끼는 공통된 어려움중의 하나는 검색결과가 너무 많다는 것이다. 본 연구는 검색결과를 줄이는 방법의 하나로써 검색 문헌에 대한 정제 방법에 대하여 논의한 것이다. 궁극적으로 종전의 검색시스템에서 제대로 고려하지 않은 개념망을 통한 질의어 확장과 확장 질의어와 전처리된 문서와의 유사도 측정을 통한 문서의 선택, 백과사전 정보에 의한 의미 확장과 클러스터링, 필터링 기법 등이 정보검색의 효율을 향상시키는데 효과적인 방안임을 제안한다.

Keywords

References

  1. 김혜진,문성빈. 2002. 링크기반 클러스터링을 이용한 웹 문서 검색의 성능 향상에 관한 실험적 연구.「제9회 한국정보관리학회학술대회논문집」, 247-252
  2. 노정순. 1999. 탐색결과에 근거한 자연어질의 자동확장 및 응용에 관한 연구 고찰.「정보관리학회지」, 16(2): 49-80
  3. 서휘. 1999. 클러스터링을 이용한 시소러스 브라우저의 설계에 대한 이론적 연구.「한국도서관 · 정보학회지」 30(3):427-456
  4. 박영우, 이은석. 1998. 인터넷상에서의 정보검색을 위한 사용자 적응형 필터링 방법에 관한 연구. 「성균관대학교 논문집-과학기술」, 49(2): 63-74
  5. 백준호, 최준혁, 이정현. 1999. 정보검색 효율향상을 위한 웹 문서 필터링 에이전트시스템 설계. 「산업과학기술연구소 논문집」, 27:511-516
  6. 심지영,김태수. 2002. 음렬 탐색을 위한 주제소절 자동분류에 관한 연구.「정보관리학회지」, 19(3): 5-30
  7. 장문수 외. 2000. 인터넷 질의응답을 위한지식 베이스 구축.「제12회 한글 및 한국어 정보처리학회 학술대회발표논집」, 198-204
  8. 정영미, 이용구. 2002. 필터링 기법을 이용한 도서 추천 시스템 구축. 「정보관리연구」,33 (1): 1-17
  9. 정영미,이재윤. 2001. 지식 분류의 자동화를 위한 클러스터링 모형 연구.「정보관리학회지」, 18(2): 203-230
  10. 정영미, 최상희. 2001. 문장클러스터링에 기반한 자동요약 모형. 「정보관리학회지」,18(3): 159-177
  11. Armstrong. R. and Jocahims. T. 1995. WebWatcher: A Learning Apprentice for the World Wide Web. AAAI Spring Symposium on Information Gathering from Heterogeneous. Distribute Environment
  12. Cutting. D. et al. 1992. Scatter/Gather: A Cluster-based Approach to Browsing Large Document Collections. In Proceedings of the Fifteenth Annual ACM SIGIR Conference on Research and Development in Information Retrieval. 318-329
  13. Cutting, D. et al. 1993. Constant Interaction-time Scatter/Gather Browsing of very Large Document Collections. In Proceedings of the Sixteenth Annual ACM SIGIR Conference on Research and Development in Information Retrieval. 126-134
  14. Joachims, T. and Mitchell, T. 1997. WebWatcher A Tour Guide for the World Wide Web. International Joint Conference on Artificial Intelligence
  15. Lang , K. 1995. NewsWeeder : Learning to Filter News. International Conference on Machine Learning
  16. Larsen , B. and Aone, C. 1999. Fast and Effective Text Mining Using linear-time Document Clustering. In Proceedings of the Fifth ACM SIGKDD International Conference on Knowledge Discovery and Date Mining. 16-22
  17. Lee Kyung-Soon et al. 2001. Reranking Model Based on Document Clusters, Information Prσcessing and Management. 37
  18. Schutze , H. and Silverstein , C. 1997. A Comparison of Projections for Efficient Document Clustering. In Proceedings of the Twentieth Annual ACM SIGIR Conference on Research and Development in Information Retrieval. 74-81
  19. Vaithyanathan, S. and Dom. B. 1999. Generalized Model Selec-tion for Unsupervised Learning in High Dimensions. In Proceedings of the Neural Information Processing System
  20. Wong, Wai Chiu and Fu, A. 2000. Incremental Document Clustering for Wed Page Classification. In Proceedings of the IEEE 2000 International Conference on Information Society in the 21st Century :Emerging Technologies and New Challenges IS2000