Cross-Lingual Text Retrieval Based on a Knowledge Base

지식베이스에 기반한 다언어 문서 검색

  • Received : 2009.12.31
  • Published : 2010.02.28

Abstract

User query formation highly acts on the effectiveness of information retrieval when we retrieve documents from the general domain as a web. This thesis proposes a intelligent information retrieval method based on a cross-lingual knowledge base to effectively perform a cross-lingual text retrieval from the web. The inferred knowledge from the cross-lingual knowledge base helps user's word association to make up user query easily and exactly for effective cross-lingual text information retrieval. This thesis develops user's query reformation algorithm and experiments it with Korean and English web. Experimental results show that the algorithm based on the proposed knowledge base is much more effective than without knowledge base in the cross-lingual text retrieval.

웹과 같은 일반 영역을 대상으로 문서를 검색할 때 사용자의 질의 구성은 정보검색 효과에 큰 영향을 준다. 본 논문에서는 일반 사용자들이 웹에서 다언어 문서 검색을 효과적으로 수행할 수 있도록 다언어 지식베이스 기반의 지능형 정보검색 방법을 제안한다. 지식베이스로부터 추론된 지식은 사용자의 연상 작용을 도와 질의를 용이하고 정확하게 구성하여 효과적인 다언어 정보검색을 수행할 수 있도록 한다. 본 논문에서는 이러한 지식베이스 기반의 질의 변경 알고리즘을 개발하고 이를 한국어와 영어 웹 문서를 대상으로 실험하였다. 실험 결과 제안된 질의 변경 알고리즘은 다언어 문서 검색에서 지식베이스를 사용하지 않은 경우에 비해 매우 효과적임을 알 수 있었다.

Keywords

References

  1. Rowena Chau and Chung-Hsing Yeh, Fuzzy Conceptual Indexing for Concept-Based Cross-Lingual Text Retrieval, IEEE INTERNET COMPUTING, pp. 14-21, 2004.
  2. Kim. Y. W.; Kim, J. H. A model of knowledge based information retrieval with hierarchical concept graph, Journal of Documentation, 46(2), pp. 113-136, 1990. https://doi.org/10.1108/eb026857
  3. Rada, R.; Mili, H.; Bicknell, E., & Blettner, M. Development and application of a metric on semantic nets, IEEE Transactions on systems, man, cybernetics, Vol. 19, No. 1, pp. 17-36, January, 1989. https://doi.org/10.1109/21.24528
  4. McMath, C. F.; Tamaru, R. S.; Rada, R. A graphical thesaurus-based information retrieval system, International Journal of Man-Machine Studies, 31(2), pp. 121-147, 1989. https://doi.org/10.1016/0020-7373(89)90024-2
  5. Lee, J. H., Kim, M. H., & Lee, J. H. Ranking documents in thesaurus-based boolean retrieval systems, Information Processing & System. 30(1), pp. 79-91, 1994. https://doi.org/10.1016/0306-4573(94)90025-6
  6. Lucarella, D.; Morara, R. FIRST: Fuzzy information retrieval system, Journal of Information Sciene, Vol. 17, pp. 81-91, 1991. https://doi.org/10.1177/016555159101700202
  7. Chen, S. M.; Wang, J. Y, Document retrieval using knowledge-based fuzzy information retrieval techniques, IEEE Transactions on systems, man, cybernetics, Vol. 25, No. 5, pp. 793-803, 1995. https://doi.org/10.1109/21.376492
  8. Rowena Chau and Chung-Hsing Yeh, Crossing the language barrier using fuzzy logic, Springer-Verlag, pp. 768-773, 2005.
  9. Christopher C. Yang, Chih-Ping Wei, K.W. Li. Cross-lingual for multilingual knowledge management, Decision Support Systems, Vol. 45, pp. 596-605, 2008. https://doi.org/10.1016/j.dss.2007.07.005
  10. ISO 2788, International Organization for Standardization: Guidelines for the Establishment and Development of Monolingual Thesauri, 2nd ed., Geneva, ISO, 1986.
  11. ISO 5964, International Organization for Standardization: Guidelines for the Establishment and Development of Multilingual Thesauri, 2nd ed., Geneva, ISO, 1985.
  12. Zadeh, L. A., Similarity relations and fuzzy orderings, Inforamtion Science, Vol 3, pp. 177-206, 1971. https://doi.org/10.1016/S0020-0255(71)80005-1
  13. http://wordnet.princeton.edu/