Ontology Alignment based on Parse Tree Kernel usig Structural and Semantic Information

구조 및 의미 정보를 활용한 파스 트리 커널 기반의 온톨로지 정렬 방법

  • 손정우 (경북대학교 컴퓨터공학과) ;
  • 박성배 (경북대학교 컴퓨터공학과)
  • Published : 2009.04.15

Abstract

The ontology alignment has two kinds of major problems. First, the features used for ontology alignment are usually defined by experts, but it is highly possible for some critical features to be excluded from the feature set. Second, the semantic and the structural similarities are usually computed independently, and then they are combined in an ad-hoc way where the weights are determined heuristically. This paper proposes the modified parse tree kernel (MPTK) for ontology alignment. In order to compute the similarity between entities in the ontologies, a tree is adopted as a representation of an ontology. After transforming an ontology into a set of trees, their similarity is computed using MPTK without explicit enumeration of features. In computing the similarity between trees, the approximate string matching is adopted to naturally reflect not only the structural information but also the semantic information. According to a series of experiments with a standard data set, the kernel method outperforms other structural similarities such as GMO. In addition, the proposed method shows the state-of-the-art performance in the ontology alignment.

기존 온톨로지 정렬 기법은 두가지 문제점을 가지고 있다. 먼저 자질을 해당 분야 전문가가 정의하기 때문에 중요한 자질들이 자질셋에 포함되지 않을 수 있다는 것이다. 다음으로는 온톨로지의 의미 정보와 구조 정보를 이용하여 유사도를 따로 계산한 후, 각각의 실험에 의해 정의된 가중치를 이용하여 전체 유사도를 계산한다. 하지만 온톨로지 상에 나타나는 의미 정보와 구조정보의 상대적인 가중치가 실험적인 방법 혹은 사용자에 의해 결정되기 때문에 시스템이 특정 온톨로지에 한정되거나 성능이 떨어질 수 있어 문제이다. 본 논문에서는 온톨로지 정렬을 위한 파스 트리 커널을 제안한다. 온톨로지 상의 개체에 대한 유사도를 계산하기 위해 먼저 온톨로지를 트리 구조로 변환한다 그 후, 변환된 트리 간의 유사도는 온톨로지 정렬을 위해 수정된 파스트리 커널을 이용하여 계산한다. 이때 자질은 명시적으로 나열하지 않는다. 유사도 계산시, 파스 트리 커널에 근사 스트링 매칭 기법을 적용하여 의미 정보를 반영한다. 검증 위한 실험에서 제안한 방법은 기존의 온톨로지 정렬 기법보다 나은 성능을 보였다.

Keywords

References

  1. Hu, W.; Cheng, G.; Zhong, X.; and Qu, Y. 2007. Falcon-AO: Results for OAEI 2007. In Proceedings of ISWC'07 Workshop on Ontology Matching, 160-166
  2. Qu, Y.; Hu, W.; and Cheng, G. 2006. Constructing Virtual Documents for Ontology Matching. In Proceedings of WWW'06, 23-31 https://doi.org/10.1145/1135777.1135786
  3. Stoilos, G.; Stamou, G.; and Kollias, S. 2005. A String Metric for Ontology Alignment. In Proceedings of ISWC'05, 623-637
  4. Hu, W.; Jiang, N.; Qu, Y.; and Wang, Y. 2005. GMO: A Graph Matching for Ontologies. In Proceedings of the K-CAP Workshop on Integrating Ontologies, 41-48
  5. Mao, M., and Peng, Y. 2007. The PRIOR+: Results for OAEI compaign 2007. In Proceedings of ISWC'07 Workshop on Ontology Matching, 208-215
  6. Tan, H. and Lambrix, P. 2007. SAMBO Results for the Ontology Alignment Evaluation Initiative. In Proceedings of ISWC'07 Workshop on Ontology Matching, 225-232
  7. Tang, J.; Li, J.; Liang, B.; Huang, X.; Li, Y.; and Wang, K. 2006. Using Bayesian Decision for Ontology Alignment. Journal of Web Semantics 4(4):243-262 https://doi.org/10.1016/j.websem.2006.06.001
  8. Collins, M., and Duffy, N. 2001. Convolution Kernels for Natural Language. In Proceedings of NIPS 2001, 625-632
  9. Haussler, D. 1999. Convolution Kernels on Discrete Structures. Technical report, UCS-CRL-99-10, UC Santa Cruz
  10. Levenshtein, V. 1965. Binary Codes Capable of Correcting Spurious Insertions and Deletions of ones. Russian Problemy Peredachi Informatsii 1, 12-25
  11. Fellbaum, C. 1998. WordNet: An Electronic Lexical Database. The MIT Press
  12. Resnik, P. 1995. Using Information Content to Evaluate Semantic Similarity. In Proceedings of IJCAI'95, 448-453
  13. Lin, D. 1998. An Information-Theoretic Definition of Similarity. In Proceedings of ICML'98, 296-304
  14. Jiang, J., and Conrath, D. 1997. Semantic Similarity Based on Corpus Statistics and Lexical Taxonomy. In Proceedings of ROCLING X, 19-33