DOI QR코드

DOI QR Code

Retrieval Model using Subject Classification Table, User Profile, and LSI

전공분류표, 사용자 프로파일, LSI를 이용한 검색 모델

  • 우선미 (전북대학교 전북지역전자정보사업단)
  • Published : 2005.10.01

Abstract

Because existing information retrieval systems, in particular library retrieval systems, use 'exact keyword matching' with user's query, they present user with massive results including irrelevant information. So, a user spends extra effort and time to get the relevant information from the results. Thus, this paper will propose SULRM a Retrieval Model using Subject Classification Table, User profile, and LSI(Latent Semantic Indexing), to provide more relevant results. SULRM uses document filtering technique for classified data and document ranking technique for non-classified data in the results of keyword-based retrieval. Filtering technique uses Subject Classification Table, and ranking technique uses user profile and LSI. And, we have performed experiments on the performance of filtering technique, user profile updating method, and document ranking technique using the results of information retrieval system of our university' digital library system. In case that many documents are retrieved proposed techniques are able to provide user with filtered data and ranked data according to user's subject and preference.

현재 대부분의 도서관 정보검색 시스템들은 키워드 정합매칭(exacting matching) 방법으로 검색 서비스를 제공하고 있으므로, 검색 결과의 양이 방대하고 비적합한 결과가 많이 포함되어 있다. 따라서 본 논문에서는 키워드기반 검색 엔진의 단점을 보완하고 현재 도서관 검색 환경을 고려하여 보다 적합한 결과를 사용자에게 신속하게 제공하기 위하여 전공분류표와 사용자 프로파일을 이용한 검색 모델 SULRM(Retrieval Model using Subject Classification Table, User Profile & LSI)을 제안한다. SULRM은 키워드 검색 결과로 얻은 자료들을 분류된 자료의 경우와 미분류된 자료의 경우로 나누어, 분류된 자료의 경우에는 전공분류표를 생성하여 자료 필터링을 수행하고, 미분류된 자료의 경우에는 사용자 프로파일과 LSI(Latent Semantic Indexing)을 이용하여 자료의 순위를 결정해서 사용자에게 제시한다. 실험평가는 우리 대학의 디지털 도서관을 실험환경으로 하여 필터링 방법, 사용자 프로파일 갱신 방법, 그리고 문서순위결정 방법의 성능을 측정한다.

Keywords

References

  1. Bracha Shapira et., 'Information Filtering: A New Two-Phase Model Using Stereotypic User Profiling', Journal of Intelligent Information Systems, Vol.8, pp.155-165, 1997 https://doi.org/10.1023/A:1008676625559
  2. Douglas W. OARD, 'The State of the Art in Text filtering,' User modeling and User-adapted Interaction, Vol.7, pp. 141-178, 1997 https://doi.org/10.1023/A:1008287121180
  3. Foltz, P. W, 'Using Latent Semantic Indexing for Information Filtering', Proceedings of the Conference on Office Information Systems, Cambridge, MA, pp.40-47, 1990
  4. Sheth B., Maes P, 'Evolving Agents for Personalized Information Filtering,' In Proceedings of the Ninth IEEE Conference on Artificial Intelligence Applications, 1993 https://doi.org/10.1109/CAIA.1993.366590
  5. Czeslaw Danilowicz, Jaroslaw Bali nski, 'Document Ranking based upon Markov Chains', Information Processing and Management, Vol.37(2001) : pp.623-637 https://doi.org/10.1016/S0306-4573(00)00038-8
  6. Michael Persin, 'Document Filtering for Fast Ranking,' ACM-SIGIR, pp.339-348, 1994
  7. 우선미, 사용자 프로파일과 잠재적 구조 분석을 이용한 검색된 문서의 순위결정 기법, 박사학위논문, 전북대학교 대학원, 2001
  8. Passani, M. and Billsus, D., 'Learning and Revising User Profiles: The Identification of Interesting Web Sites', Machine Learning, Vol.27, pp313-331, 1997 https://doi.org/10.1023/A:1007369909943
  9. Dwi H. Widyantoro, Thomas R. Ioerger, John Yen, 'An Adaptive Algorithm for Learning Changes in User Interests', 8th International Conference on Information and Knowledge Management(CIKM'99), November 2-6, Kansas city, 1999 https://doi.org/10.1145/319950.323230
  10. Crestani, F. et., 'Is This Document Relevant?..Probably: a Survey of Probabilistic Models in Information Retrieval', ACM Computing Surveys, Vol.30, No.4, pp.528-552, 1998 https://doi.org/10.1145/299917.299920
  11. Scott Deerwester, Susan T. Dumais, George W. Furnas, Thomas K. Landauer, Richard Harshman, 'Indexing by Latent Semantic Analysis,' Journal of the American Society for Info rmation Science, Vol.41, No.6, pp.391-407, 1990 https://doi.org/10.1002/(SICI)1097-4571(199009)41:6<391::AID-ASI1>3.0.CO;2-9
  12. Dwi H. Widyantoro, Thomas R. Ioerger, John Yen, 'Learning User Interest Dynamics with a Three-Descriptor Representation', Journal of the American Society for Information Science and Technology, Vol.53, No.3, pp.212-225, 2001 https://doi.org/10.1002/1532-2890(2000)9999:9999<::AID-ASI1615>3.0.CO;2-O
  13. Geoffrey I. Webb, Michael J. Pazzani, Daniel Billsus, 'Machine Learning for User Modeling,' User Modeling and User-Adapted Interaction, VoI.11, pp19-29, 2001 https://doi.org/10.1023/A:1011117102175
  14. Ingrid Zukerman, David W. Albrecht, 'Predictive Statistical Models for User Modeling', User Modeling and User-Adapted Interaction, Vol.11, pp.5-18, 2001 https://doi.org/10.1023/A:1011175525451