빈발패턴을 이용한 스키마 매핑

Schema Mapping Method using Frequent Pattern Mining

  • 채덕진 (전남대학교 데이터베이스연구실) ;
  • 반경진 (순천대학교 컴퓨터과학과) ;
  • 김응곤 (순천대학교 컴퓨터과학과)
  • 투고 : 2010.01.28
  • 심사 : 2010.02.18
  • 발행 : 2010.02.28

초록

현재, 두 스키마 속성 사이의 효율적인 스키마 매핑 방법을 통해 메타데이터간의 상호운용성을 확보하기 위한 많은 연구가 진행되고 있다. 그러나 기존의 스키마 매핑 연구의 대부분은 몇몇 유사도 값들을 단순히 계산하여 매핑을 선택하기 때문에 정확률이 비교적 낮아 문서변환이나 시스템 통합을 위한 스키마 매핑에 적합하지 않다. 본 논문에서는 데이터 마이닝의 빈발패턴탐사 방법을 이용하여 대화식으로 스키마 매핑을 수행할 수 있는 알고리즘을 제안한다. 메타데이터 표준을 이루는 각 스키마 요소에 정의된 의미 부분을 이용하기 때문에 그 스키마 요소가 어떤 정보를 나타내는지를 알 수 있기 때문에 대화식으로 더 정교한 매핑 처리가 가능하게 된다. 제안하는 방법의 성능 평가를 위해 메타데이터 표준들을 이용하여 정확도에 대한 성능평가를 수행한다.

Currently lots of studies to solve meta-data interoperability in between schema attributes are conducted. But the accuracy in previous schema mapping studies is low since the studies just use the similarity in between attributes. So the studies are not suitable for the schema mapping such as document conversion, system integration, etc. In this paper, we propose a method which can conduct the schema mapping interactively using frequent pattern mining. The method can conduct more accurate mapping process because the method use the description element which is an element among each schema element for the metadata standard. A performance study has been conducted to compare the accuracy performance of the method using metadata standards.

키워드

참고문헌

  1. F. Giunchiglia and P. Shvaiko, "Semantic Matching," In The Knowledge Engineering Review Journal, Vol.18, No.3, 2004.
  2. J. Madhavan, P. Bernstein, and E. Rahm, "Generic Schema Matching with Cupid," In Proceedings of VLDB, 2001.
  3. E. Rahm and P. Bernstein, "On Matching Schemas Automatically," VLDB Journal, Vol.10, No.4, 2001.
  4. S. Sun and E. Rose, "Automated Schema Matching Techniques: An Exploratory Study," Res, Lett. Inf. Math. Sci., pp.113-136, 2004.
  5. P. Shvaiko and J. Euzenat, "A Survey of Schema-based Matching Approaches," Technical Report DIT-04-087, University of Trento, Italy, 2004.
  6. H. Do, S. Melnik, and E. Rahm, "Comparison of Schema Matching Evaluations," In Proceedings of the 2nd Int. Workshop on Web Databases, 2002.
  7. R. Agrawal, T. Imielinski, and A. Swami, "Mining Association Rules between Sets of Items in Large Databases", In Proceedings of ACM SIGMOD Conference on Management of Data, Washington D.C., pp. 207-216, May 1993.
  8. R. Agrawal, R. Srikant, "Fast Algorithms for Mining Association Rules", In Proceedings of the 20th VLDB Conference, Santiago, Chile, Sept., 1994.
  9. J. Han, and M. Kamber, "Data Mining: Concepts and Techniques", The Morgan Kaufmann Series in Data Management Systems, Jim Gray, Series Editor Morgan Kaufmann Publishers, August 2000.
  10. 박종수, 유원경, 홍기형, "연관 규칙 탐사와 그 응용", 한국정보과학회논문지 제16권 제 9호, pp. 37-44, 1998.
  11. 백두권, "정보통신 및 표준화 기술 동향: 데이터 표준화와 메타데이터 레지스트리", TTA 저널 통권 71호, 2000.
  12. C. Blanchi, J. Petrone, "Distributed Interoperable Metadata Registry," D-Lib Magazine, December 2001.
  13. http://www.w3.org/RDF/
  14. http://www.tv-anytime.org/
  15. http://www.dr.dk/metadata