Development of a Personalized Link-based Search Engine using Fuzzy Concept Network

퍼지 개념 네트워크를 이용한 개인화된 링크기반 검색엔진의 개발

  • 김경중 (연세대학교 컴퓨터과학과) ;
  • 조성배 (연세대학교 컴퓨터과학과)
  • Published : 2001.06.01

Abstract

텍스트 정보만을 이용하는 일반적인 검색엔진들의 한계를 극복하여 향상된 결과를 내기 위하여 링크 구조를 이용해 검색을 수행하는 시스템이 새롭게 등장하고 있다. 링크 구조는 사용자의 질의에 대해 중요한 문서들을 가려준다. 본 논문에서는 한 걸음 더 나아가 링크 정보를 이용하여 검색된 웹 페이지들 중 사용자의 기호에 적절한 결과를 도출하는 방법을 제안한다. 사용자 프로파일에 기반한 퍼지 개념 네트워크로 구축된 퍼지 문서 추출 시스템은 사용자의 성향을 반영하여 링크 기반 검색결과를 개인화 한다. 5명의 사용자에 대한 실험결과, 개발한 시스템이 의미 있는 웹 페이지를 검색함은 물론이고 사용자의 성향을 잘 반영함을 알 수 있었다.

Keywords

References

  1. Yahoo, http://www.yahoo.com
  2. Lycos, http://www.lycos.com
  3. Altavista, http://www.altavista.com
  4. Google, http://www.google.com
  5. The Clever Project, http://www.almaden.ibm.com/c s/k53/clever.html
  6. S. Brin and L. Page, 'The anatomy of a large-scale hypertextual web search engine,' The Sevenh International WWW Conference, 1998, http://www7.scu.edu.au/programme/fullpapers/ 1921/coml921.htm https://doi.org/10.1016/S0169-7552(98)00110-X
  7. J. Kleinberg, 'Authoritative sources in a hyper-linked environment,' IBM Research Report RJ 10076, 1997
  8. S.-M. Chen and Y.-J. Horng, 'Fuzzy query proce ssing for document retrieval based on extended fuzzy concept networks,' IEEE Transactions on Systems, Man, and Cybernetics, vol. 29, no. 1, pp. 96-104, 1999 https://doi.org/10.1109/3477.740169
  9. S.-M. Chen and J.-Y. Wang, 'Document retrieval using knowledge-based fuzzy information retrieval techniques,' IEEE Transactions on Systems, Man, and Cybernetics, vol. 25, no. 5, pp. 793-803, 1995 https://doi.org/10.1109/21.376492
  10. C.-S. Chang and A.L.P. Chen, 'Supporting conceptual and neighborhood queries on the world wide web,' IEEE Transactions on Systems, Man, and Cybernetics, vol. 28, no. 2, pp. 300-308, 1998 https://doi.org/10.1109/5326.669578
  11. L. Introna and H. Nissenbaum, 'Defining the web: The politics of search engines,' IEEE Computer, vol. 33, pp. 54-62, 2000 https://doi.org/10.1109/2.816269
  12. B. Pinkerton, 'Finding what people want: Experiences with the webcrawler,' The Second International WWW Conference, Chicago, USA, 1994, http://www.thinkpink.com/bp/WebCrawler/ WWW94.html
  13. S. Lawrence and C.L. Giles, 'Accessibility of information on the web,' Nature, No. 400, pp. 107-109, 1999 https://doi.org/10.1038/21987
  14. J. Cho, H. Garcia-Molina, and L. Page, 'Efficient crawling through URL ordering,' The Seventh In ternational WWW Conference, 1998, http://www 7.scu.edu.au/programme/fullpapers/1919/coml919. htm https://doi.org/10.1016/S0169-7552(98)00108-1
  15. L. Page, 'PageRank: Bringing order to the web,' Stanford Digital Libraries Working Paper 1997-0072, 1997
  16. O. Zamir and O. Etzioni, 'Grouper: A dynamic clustering interface to web search results,' The Eighth International WWW Conference, Toronto, Canada, 1999
  17. Northern Light Search, http://www.northernlight.com
  18. AliWeb, http://www.aliweb.com
  19. D. Lucarella and R. Morara, 'FIRST: Fuzzy infor mation retrieval system,' Journal of Information Science, vol. 17, no.2, pp. 81-91, 1991 https://doi.org/10.1177/016555159101700202
  20. L.A. Zadeh, 'Fuzzy sets,' Information and Control, vol. 8, pp. 338-353, 1965 https://doi.org/10.1016/S0019-9958(65)90241-X
  21. L.A. Zadeh, 'Fuzzy sets as a basis for a theory of possibility,' Fuzzy Sets and Systems, vol. 1, no. 1, pp. 3-28, 1978 https://doi.org/10.1016/0165-0114(78)90029-5