개인화 웹 검색 시스템 기반의 문서 요약 시스템

A Document Summary System based on Personalized Web Search Systems

  • 김동욱 (한양대학교 전자컴퓨터통신공학과) ;
  • 강수용 (한양대학교 컴퓨터공학부) ;
  • 김한준 (서울시립대학교 전자전기컴퓨터공학부) ;
  • 이병정 (서울시립대학교 컴퓨터과학부) ;
  • 장재영 (한성대학교 컴퓨터과학부)
  • 투고 : 2010.09.07
  • 심사 : 2010.09.30
  • 발행 : 2010.09.30

초록

개인화 웹 검색 시스템은 사용자의 검색의도에 따라 질의어 확장, 검색 결과의 재순위화 등의 방법을 통하여 사용자에게 개인화된 검색 결과를 제공한다. 이를 위해 검색 시스템은 질의어와 사용자의 프로파일 정보를 활용하여 사용자의 검색 의도를 파악하고 분석하여, 검색 결과 페이지에 반영하여 보여주게 된다. 이때 검색 결과 페이지는 문서의 URL과 문서의 제목, 작은 텍스트 조각을 표시한다. 여기서 작은 텍스트 조각은 검색 질의어가 포함된 문서의 요약이며, 스니펫이라고 알려져 있다. 사용자는 이러한 문서의 요약을 통하여 웹 문서가 자신이 원하는 정보를 가진 문서인지를 판단하거나, 해당 URL에 직접 접속하지 않고도 원하는 정보를 얻을 수 있게 된다. 따라서 문서 요약은 사용자가 문서를 볼 것인지 아닌지에 대한 중요한 판단 기준이 되며, 만약 문서 요약 시스템이 개인화된 요약 결과를 제공한다면 사용자의 만족도는 더욱 증가할 것이다. 본 논문은 전체 웹 검색 시스템에서 검색 속도의 큰 하락없이 사용자의 만족도를 증가시킬 수 있는 개인화 문서 요약 시스템을 제안한다.

Personalized web search engine provides personalized results to users by query expansion, re-ranking or other methods representing user's intention. The personalized result page includes URL, page title and small text fragment of each web document. which is known as snippet. The snippet is the summary of the document which includes the keywords issued by either user or search engine itself. Users can verify the relevancy of the whole document using only the snippet, easily. The document summary (snippet) is an important information which makes users determine whether or not to click the link to the whole document. Hence, if a search engine generates personalized document summaries, it can provide a more satisfactory search results to users. In this paper, we propose a personalized document summary system for personalized web search engines. The proposed system provides increased degree of satisfaction to users with marginal overhead.

키워드

참고문헌

  1. I. Varlamis and S. Stamou, "Semantically driven snippet selection for supporting focused web searches", Data&Knowledge Engineering, 2008.
  2. 김동욱, 강수용, 김한준, 이병정 "폭소노미 기반 개인화 웹 검색 시스템", 디지털콘텐츠학회 논문지 제11권 제1호(2010. 3)
  3. Diaz and Gervas, 2007 A. Diaz and P. Gervas, Usermodel based personalized summarization, Information P rocessing & Management 43 (6) (2007), pp. 1715-1734. https://doi.org/10.1016/j.ipm.2007.01.009
  4. Hovy, E.H. and C-Y. Lin. 1998. Automated Text Su mmarization in SUMMARIST. In I. Mani and M. Maybury (eds), Advances in Automated Text Summarization. MIT Press.
  5. Hahn, U., & Mani, I. (2000). The Challenges of Auto matic Summarization. Computer, 33(11), 29-36
  6. Mani, I. & Bloedorn, I. (1998). Machine learning of generic and user-focused summarization. In Proceeding s of the 15th national conference on artificial intelligence, Menlon Park, California, (pp. 821-826)
  7. X. Shen, B. Tan, and C. Zhai. Implicit user modeling for personalized search. In Proceedings of CIKM '05, pages 824-831, 2005.
  8. Micarelli, A., Gasparetti, F., Sciarrone, F., and Gauch S.: Personalized Search on the World Wide Web. In Brus ilovsky, P., Kobsa, A., Nejdl, W. (eds.): The Adaptive Web: Methods and Strategies of Web Personalization, Lecture Notes in Computer Science, Vol. 4321. Springer -Verlag, Berlin Heidelberg New York (2007) this volume
  9. S. Xu, S. Bao, B. Fei, Z. Su, and Y. Yu. Exploring Folksonomy for Personalized Search. In Proc. of SIGIR' 08, 2008, 155-162.
  10. Goldstein, J., Kantrowitz, M., Mittal, V., and Carbonell, J. 1999. Summarizing Text Documents: Sentence Selection and Evaluation Metrics. SIGIR'99.
  11. Mana, M., Buenaga, M. & Gomez, J. M. (1999). Using and evaluating user directed summaries to improve information access. In Proceedings of the third euopean conference on research and advanced technology for digital libraries (pp. 198-214).
  12. Barroso, L. A., Dean, J., and Urs Holzle, U. 2003. Web search for a planet: The Google cluster architecture. IEEE Micro 23, 2, 22-28. https://doi.org/10.1109/MM.2003.1196112
  13. Mana, M., Buenaga, M., & Go´mez, J. M. (1999). Using and evaluating user directed summaries to improve information access. In Proceedings of the third europe an conference on research and advanced technology for digi tal libraries (pp. 198–214). LNCS 1696: Springer-Verlag.
  14. http://delicious.org/