DOI QR코드

DOI QR Code

Snippet Extraction Method using Fuzzy Implication Operator and Relevance Feedback

연관 피드백과 퍼지 함의 연산자를 이용한 스니핏 추출 방법

  • 박선 (목포대학교 정보산업연구소) ;
  • 심천식 (목포대학교 조선공학과) ;
  • 이성로 (목포대학교 정보전자공학과)
  • Received : 2011.11.09
  • Accepted : 2011.11.16
  • Published : 2012.03.31

Abstract

In information retrieval, search engine provide the rank of web page and the summary of the web page information to user. Snippet is a summaries information of representing web pages. Visiting the web page by the user is affected by the snippet. User sometime visits the wrong page with respect to user intention when uses snippet. The snippet extraction method is difficult to accurate comprehending user intention. In order to solve above problem, this paper proposes a new snippet extraction method using fuzzy implication operator and relevance feedback. The proposed method uses relevance feedback to expand the use's query. The method uses the fuzzy implication operator between the expanded query and the web pages to extract snippet to be well reflected semantic user's intention. The experimental results demonstrate that the proposed method can achieve better snippet extraction performance than the other methods.

정보 검색 시 검색엔진은 사용자에게 웹페이지 순위와 웹페이지의 요약정보를 제공한다. 이중 웹 페이지를 대표 할 수 있는 요약된 정보를 스니핏(snippet)이라한다. 스니핏은 사용자의 웹페이지 방문에 큰 영향을 준다. 정확한 방문 페이지의 정보를 모르고 단지 스니핏 만을 이용할 때에 가끔 사용자의 의도와는 다른 잘못된 웹 페이지를 방문할 수 있다. 이것은 검색엔진에서 지원하는 스니핏에 사용자의 의도를 정확하게 반영하는 것이 어렵기 때문이다. 본 논문은 이러한 문제를 해결하기 위해 연관 피드백과 퍼지 함의 연산자를 이용한 새로운 스니핏 추출 방법을 제안한다. 제안방법은 연관 피드백을 이용하여 사용자의 질의를 확장하고, 확장된 질의와 웹 페이지 사이에 퍼지 함의 연산자를 이용하여 질의와 확장된 질의의 포함관계가 반영된 스니핏을 추출함으로써 사용자의 의도를 스니핏에 더 잘 반영할 수 있다. 실험결과에서 제안방법이 다른 방법보다 스니핏 추출에 더 좋은 성능을 보인다.

Keywords

References

  1. G. Manolache, "Index-based Snippet Generation", Master's Thesis, 2008.
  2. Y. J. Ko, H. K. An, J. Y. Seo, "Pseudo-relevance feedback and statistical query expansion for web snippet generation," Information Processing Letter. Vol. 109, pp.18-22, 2008. https://doi.org/10.1016/j.ipl.2008.08.004
  3. Q. Li, Y. P. Chen, "Personalized text snippet extraction using statistical language models," Pattern Recognition, Vol. 43, pp.378-386, 2010. https://doi.org/10.1016/j.patcog.2009.06.003
  4. T. Penin, H. Wang, T. Tran, Y. Yu, "Snippet Generation for Semantic Web Search Engine," In proceeding of ASWC, LNCS 5367, pp.493-507, 2008.
  5. Y. Huang, Z. Liu, "Query Baised Snippet Generation in XML Search," In proceeding of SIGMOD, pp.??, 2008.
  6. A. Turpin, Y. Tsegay, D. Hawking, H. E. Williams, "Fast Generation of Result Snippets in Web Search," In proceeding of SIGIR, pp.127-134, 2007.
  7. 박선, 조광문, 양후열, 이성로, "의사연관 피드백과 퍼지연관을 이용한 개안화 문서 스니핏 추출 방법", 전자공학회 논문지, 제49권 SP편 제2호, pp.137-142, 2012.
  8. B. Y. Ricardo, R. N. Berthier, "Moden Information Retrieval," ACM Press, 1999.
  9. S. Chakrabarti, "mining the web: Discovering Knowledge from Hypertext Data," Morgan Kaufmann Publishers, 2003.
  10. K. W. Oh and W. Bandler, "Properties of fuzzy implication operatoers", International Journal of Approximate Reasoning, Vol. 1, No. 3, pp.273-285, 1987. https://doi.org/10.1016/S0888-613X(87)80002-6
  11. Bandler, W. and Kohout, L., "Fuzzy Power Sets and Fuzzy Implication Operations," Fuzzy Set and Systems, Vol.4, No.1, pp. 13-30, 1980. https://doi.org/10.1016/0165-0114(80)90060-3
  12. Bandler, W. and Kohout, L., "Semantics of Implication Operators and Fuzzy Relational Products," International Journal of Man-Machine Studies, Vol. 12, pp.89-116, 1980. https://doi.org/10.1016/S0020-7373(80)80055-1
  13. 한경남, 남경완, "한국어정보처리 입문 : 컴퓨터가 우리말을 이해하려면?", 커뮤니케이션북스, 2007.
  14. W. B. Frankes, R. Baeza-Yaes, "Information Retrieval : Data Structure & Algorithms," Prentice-Hall, 1992.
  15. 야후 코리아, www.yhaoo.co.kr, 2011.

Cited by

  1. 퍼지와 의미특징을 이용한 스니핏 추출 향상 방법 vol.16, pp.11, 2012, https://doi.org/10.6109/jkiice.2012.16.11.2374