A Multi-Strategic Mapping Approach for Distributed Topic Maps

분산 토픽맵의 다중 전략 매핑 기법

  • Published : 2006.01.01

Abstract

Ontology mapping is the task of finding semantic correspondences between two ontologies. In order to improve the effectiveness of ontology mapping, we need to consider the characteristics and constraints of data models used for implementing ontologies. Earlier research on ontology mapping, however, has proven to be inefficient because the approach should transform input ontologies into graphs and take into account all the nodes and edges of the graphs, which ended up requiring a great amount of processing time. In this paper, we propose a multi-strategic mapping approach to find correspondences between ontologies based on the syntactic or semantic characteristics and constraints of the topic maps. Our multi-strategic mapping approach includes a topic name-based mapping, a topic property-based mapping, a hierarchy-based mapping, and an association-based mapping approach. And it also uses a hybrid method in which a combined similarity is derived from the results of individual mapping approaches. In addition, we don't need to generate a cross-pair of all topics from the ontologies because unmatched pairs of topics can be removed by characteristics and constraints of the topic maps. For our experiments, we used oriental philosophy ontologies, western philosophy ontologies, Yahoo western philosophy dictionary, and Yahoo german literature dictionary as input ontologies. Our experiments show that the automatically generated mapping results conform to the outputs generated manually by domain experts, which is very promising for further work.

유사한 지식구조의 분산된 온톨로지들을 통합 및 연결하여 새로운 온톨로지를 생성하거나 확장 지식 검색을 효과적으로 제공하기 위해서는 온톨로지 모델 자체의 구조적 특성이나 제약조건을 고려한 온톨초지 매핑이 중요하다. 그러나 과거의 온톨로지 매핑은 범용성을 높이기 위해 대부분 그래프 모델을 기반으로 노드와 간선 중심의 매핑여부를 계산함으로써 온톨로지 모델의 특성과 제약조건을 매핑에 반영하지 못하는 문제점을 가진다. 본 논문에서는 RDF와 함께 온톨로지 모델로 사용되고 있는 토픽맵의 구문적 특성과 제약조건을 반영한 다중 매핑 전략의 토픽맵 매핑 기법을 제안한다. 다중 매핑 전략에는 토픽명 기반 매핑, 토픽 속성 기반 매핑, 계층 구조 기반 매핑, 연관관계 기반 매핑의 4가지 매핑 전략이 포함되어 있으며 개체들 사이의 매핑 여부를 결정하기 위해 각 매핑의 개별 유사도를 조합한 다음 단일 유사도를 결정하는 하이브리드 방식을 사용한다. 또한 토픽맵의 구문적 특성에 따라 매핑 계산 전에 매핑이 불가능한 개체들을 미리 제거함으로써 탐색 범위를 줄이고 있으며 토픽명 색인과 PSI 색인을 생성하여 매핑 계산의 효율을 높이고 있다. 제안하는 토픽맵 매핑 기법의 성능을 보이기 위해 동, 서양 철학 온톨로지들과 야후 철학 백과사전 및 독일 문학 백과사전을 토픽맵으로 구현하여 실험 데이타로 활용하였으며 그 결과 자동 생성된 매핑 집합이 전문가에 의해 생성된 매핑 집합을 대부분 포함함을 확인하였다.

Keywords

References

  1. T. Berners-Lee, J. Hendler, and O. Lassila. 'The Semantic Web,' Scientific American, 279, 2001
  2. Ora Lassila and Ralph R. Swick. 'Resource Description Framework(RDF) Model and Syntax Specification,' W3C Recommendation 22 February 1999, URL:http://www.w3.org/TR/REV-rdf-syntax
  3. Michel Biezunski, Martin Bryan and Steve Newcomb. ISO/IEC 13250 TopicMaps
  4. D. L. McGuinness and F. Harmelen. 'OWL Web Ontology Language Overview,' W3C Recommendation, 10 February 2003, http://www.w3.org/TR/ owl-features/
  5. 김정민, 최병일, 김형주. '텍스트 내용지식 기반의 철학 온톨로지 구축', 정보과학회논문지(컴퓨팅의 실제), 게재예정.
  6. Steve Pepper and Graham Moore. 'XML Topic Maps(XTM) 1.0,' TopicMaps.Org
  7. L. M. Garshol, 'Living with Topic Mas and RDF,' In Proceedings of the XML Europe 2004 Conference, 2003
  8. E. Rahm and P. Bernstein. 'On Matching Schemas Automatically,' VLDB Journal, 10(4), 2001
  9. H. H. Do and E. Rahm. 'COMA - a system for flexible combination of schema matching approaches,' In Proceedings of VLDB, 2001
  10. J. Madhavan, P. Bernstein, and E. Rahm. 'Generic Schema Matching with Cupid,' In Proceedings of VLDB, 2001
  11. AH. Doan, P. Domingos, and A. Halevy. 'Reconciling schemas of disparate data sources: a machine-learning approach,' In Proceedings ACM SIGMOD Conference, 2001
  12. D. Beneventano, S. Bergamaschi, F. Guerra, and M. Vincini. 'The MOMIS approach to Information Integration,' IEEE and AAAI International Conference on Enterprise Information Systems, 2001
  13. W. Li, C. Clifton, and S. Liu. 'Database Integration using neural network: implementation and experiens,' Knowledge Information Systems. 2(1), 2000
  14. S. Melnik, H. Garcia-Molina, and E. Rahm. 'Similarity flooding: A versatile graph matching algorithm,' In Proceedings of ICDE, 2002
  15. F. Giunchiglia and P. Shvaiko. 'Semantic matching,' In The Knowledge Engineering Review Journal, 18(3), 2004
  16. P. Shvaiko and J. Euzenat. 'A survey of schemabased matching approaches,' University of Trento, ?Technical Report #DIT-04-087, 2004
  17. N, Noy and M. Musen. 'PROMPT: Algorithm and Tool for Automated Ontology Merging and Alignment,' In Proceedings of the National Conference on Artificial Intelligence(AAAI), 2000
  18. N. Noy and M. Musen. 'Anchor-PROMPT: Using Non- Local Context for Semantic Matching,' In Proceedings of the Workshop on Ontologies and Information Sharing at the International Joint Conference on Artificial Intelligence (IJCAI) , 2001
  19. P. Bouquet, L. Serafini, and S. Zanobini. 'Semantic coordination: A new approach and an application,' In Proceedings of ISWC, 2003
  20. Y. Kalfoglou and M. Schorlerruner. 'InformationFlow-based Ontology Mapping,' In Proceedings of the 1st International Conference on Ontologies, Database and Application of Semantics, 2002
  21. G. Sturrune and A. Madche. 'FCA-Merge: Bottomup Merging of Ontologies,' In Proceedings of 17th InternaltionaJ Joint Conference on ArtificiaJ Jntelligence(IJCAI), 2001
  22. M. Ehrig and S. Staab. 'QOM: Quick ontology mapping,' In Proceedings of ISWC, 2004
  23. ISOIIEC JTC1/SC34, 'Topic Maps - Reference Model,' A vaiJable at: http://www.isotopicmaps.org/TMRM/TMRM-latest-clean,html, 2003
  24. L. Maicher and H. F. Witschel. 'Merging of Distributed Topic Maps based on the Subject Identity Measure(SIM) Approach,' In Proceedings of LIT, 2004
  25. 김정민, 박철만, 정준원, 이한준, 민경섭, 김형주, 'K-Box: 토픽맵 기반의 온톨로지 관리 시스템', 정보과학회논문지(컴퓨팅의 실제), 10(1), February 2004