• Title/Summary/Keyword: XML 스키마 매칭

Search Result 21, Processing Time 0.03 seconds

XML Element Matching Algorithm based on Structural Properties and Rules (룰과 구조적 속성에 기반한 XML 엘리먼트 매칭 알고리즘)

  • Park, Hyung;Jeong, Chanki
    • Journal of Information Technology and Architecture
    • /
    • v.10 no.1
    • /
    • pp.71-77
    • /
    • 2013
  • XML schema matching is the task of finding semantic correspondences between elements of two schemas. XML schema matching plays an important role in many application, such as schema integration, data integration, data warehousing, data transformation, peer-to-peer data management, semantic web etc. In this paper, we propose an XML element matching algorithm based on rules and structural properties. The proposed algorithm involves classifying elements as unique or non-unique elements according to the structural properties of XML documents and deciding on element matching in accordance with rules. We present experimental results that demonstrate the effectiveness of the proposed approach.

XML Schema Matching based on Ontology Update for the Transformation of XML Documents (XML 문서의 변환을 위한 온톨로지 갱신 기반 XML 스키마 매칭)

  • Lee, Kyong-Ho;Lee, Jun-Seung
    • Journal of KIISE:Databases
    • /
    • v.33 no.7
    • /
    • pp.727-740
    • /
    • 2006
  • Schema matching is important as a prerequisite to the transformation of XML documents. This paper presents a schema matching method for the transformation of XML documents. The proposed method consists of two steps: preliminary matching relationships between leaf nodes in the two XML schemas are computed based on proposed ontology and leaf node similarity, and final matchings are extracted based on a proposed path similarity. Particularly, for a sophisticated schema matching, the proposed ontology is incrementally updated by users' feedback. furthermore, since the ontology can describe various relationships between concepts, the proposed method can compute complex matchings as well as simple matchings. Experimental results with schemas used in various domains show that the proposed method is superior to previous works, resulting in a precision of 97% and a recall of 83 % on the average. Furthermore, the dynamic ontology increased by 9 percent overall.

A Schema Matching Algorithm for an Automated Transformation of XML Documents (XML문서의 자동변환을 위한 스키마 매칭 알고리즘)

  • Lee Jun-Seung;Lee Kyong-Ho
    • Journal of Korea Multimedia Society
    • /
    • v.7 no.9
    • /
    • pp.1195-1207
    • /
    • 2004
  • Schema matching is prerequisite to an automated transformation of XML documents. Because previous works about schema matching compute all semantically-possible matchings, they produce many-to-many matching relationships. Such imprecise matchings are inappropriate for an automated transformation of XML documents. This paper presents an efficient schema matching algorithm that computes precise one-to-one matchings between two schemas. The proposed algorithm consists of two steps: preliminary matching relationships between leaf nodes in the two schemas are computed and one-to-one matchings are finally extracted based on a proposed path similarity. Specifically, for a sophisticated schema matching, the proposed algorithm is based on a domain ontology as well as a lexical database that includes abbreviations and synonyms. Experimental results with real schemas from an e-commerce field show that the proposed method is superior to previous works, resulting in an accuracy of 97% in average.

  • PDF

An Efficient Selection of XML Schema Matching Parameters using Decision Tree for Structural Document of Bridge (의사결정나무를 활용한 교량 구조계산서의 XML 스키마 매칭 가중치의 효율적 선택방안 연구)

  • Park, Sang-Il;An, Hyun-Jung;Kim, Bong-Geun;Lee, Sang-Ho
    • 한국방재학회:학술대회논문집
    • /
    • 2010.02a
    • /
    • pp.69.1-69.1
    • /
    • 2010
  • 본 연구는 교량 시설물의 재난방지를 위한 정보시스템의 구축에 있어 선행되어야 하는 교량 구조계산서 항목 저장정보의 질적 향상을 위해 XML 스키마 매칭 기법을 효율적으로 활용할 방법에 대해 제시하였다. 이를 위하여 XML 스키마 매칭에 사용되는 가중치 변화에 따른 매칭 정확도를 나타내는 데이터를 구축하고, 이를 활용하여 데이터 마이닝 기법 중 하나인 의사결정나무 모델을 구현하여 교량의 형식, 문서가 포함하고 있는 항목의 수, 문서를 작성한 회사에 따라 달라질 수 있는 최적의 가중치를 지동으로 선정할 수 있는 프로세스를 제안하였다. 의사결정나무 모델을 통해 결정한 매칭 가중치는 이전에 비하여 약 10% 정확도 상승효과가 있음을 알 수 있었다.

  • PDF

Automatic Scheme Matching using Classification and User update (자동분류와 사용자업데이트를 이용한 스키마 매칭)

  • Lee, Myung-Joo;Shin, Hyun-Doo;Park, So-Ra;Hwang, Soo-Chan
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06c
    • /
    • pp.102-104
    • /
    • 2011
  • 서로 다른 XML 스키마를 바탕으로 작성된 XML 문서간의 비교 및 검색을 위해서는 두 스키마 사이의 연관관계를 계산하는 스키마 매칭 과정이 필수적이다. 스키마 매칭방법으로는 구조적 연관성을 비교하는 방법, 의미적 연관성을 계산하는 방법, 타입의 연관성을 계산하는 방법이 존재한다. 또한, 자동분류기법을 사용하여 연관성을 계산하는 방법도 존재한다. 본 논문에서는 XML 문서의 비교을 위한 효율적인 스키마 매칭 방법을 제안한다. 제안된 방법은 두 단계로 구성된다. 먼저 자동분류기법을 사용하여 단말노드 사이의 매칭정도를 계산한다. 또한 의미적, 구조적, 타입의 연관성도 계산하여 최적의 매칭결과를 선택한다. 특히 의미적 연관성은 사용자 피드백에 의해 점증적으로 갱신되는 온톨로지에 기반한다.

An Efficient Schema Matching Algorithm for An Automated Transformation of XML Documents (XML 문서의 자동변환을 위한 효율적인 스키마 매칭 알고리즘)

  • 이준승;이경호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.13-15
    • /
    • 2003
  • 본 논문에서는 XML 문서의 자동변환을 위해 2단계의 상향식 매칭 방법을 제안한다. 제안된 방법은 단말 노드 사이의 유사도 비교를 통해 임계값을 넘는 후보 매칭집합을 결정하고, 단말노드가 포함되어 있는 경로의 유사도 비교를 통해 적절한 일대일 매칭을 추출한다. 특히, 노드 사이의 유사도 비교를 위해 축약어 사전, 일반 동의어 사전, 도메인 온톨로지를 적용한다. 실제 전자상거래용 XML 스키마를 대상으로 실험한 결과 제안된 방법은 평균적으로 97%의 정확률을 보였다.

  • PDF

A data mining approach for efficient matching of engineering document schemata (엔지니어링 문서 스키마의 효율적 매칭을 위한 데이터마이닝 기법의 활용방안)

  • Park, Sang-Il;An, Hyun-Jung;Kim, Hyo-Jin;Lee, Sang-Ho
    • Proceedings of the Computational Structural Engineering Institute Conference
    • /
    • 2010.04a
    • /
    • pp.226-229
    • /
    • 2010
  • 본 연구에서는 데이터 저장의 질적 향상을 도모하는 XML 스키마 매칭의 효율적 활용방안을 제시하였다. 이를 위하여 매칭의 가중치의 변화에 따라 달라지는 정확도 데이터를 수집하고, 수집한 데이터를 활용하여 데이터 마이닝 기법 중 하나인 의사결정나무 모델을 수립하였다. 수립모델을 응용하여 구현한 가중치 자동선정 모듈은 설명변수인 교량의 형식, 문서가 포함하고 있는 요소의 수, 문서를 작성한 회사 등의 값에 따라 의사결정나무 모델의 목표변수인 정확도뿐만 아니라, 가장 높은 정확도를 보일 수 있는 가중치까지 간접적으로 제안가능하다. 본 연구로 구현한 모듈을 통해 제안된 XML 스키마 매칭 가중치를 활용하면 그렇지 않은 경우에 비하여 약 10% 정확도 상승효과가 있음을 알 수 있었다.

  • PDF

An Efficient Algorithm for Clustering XML Schema (XML 스키마 클러스터링을 위한 효율적인 알고리즘)

  • 임태우;이경호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.34-36
    • /
    • 2004
  • 최근 웹상에 산재한 정보들의 효율적인 검색과 이용을 위하여 정보의 구조를 정의하는 스키마들의 통합이 중요시되고 있다. 본 논문에서는 XML 스키마들을 클러스터링하기 위한 방법을 제안한다. 제안된 방법은 두 스키마를 통합하는데 드는 비용이 적을수록 스키마간의 유사도가 높다는 가정하에 스키마 사이의 공통된 구조의 크기를 계산한다 이를 위해서 경로사이에 서로 대응하는 요소의 합이 최대가 되는 경로간의 일대일 매칭을 추출한다. 또한 계산된 유사도값에 기반하여 계층적 클러스터링 방법을 적용한다. 제안된 방법의 성능을 평가하기 위해서 다수의 XML 스키마를 대상으로 실험한 결과, 91%의 정확율과 93%의 재현율로서 기존의 알고리즘보다 우수하였다.

  • PDF

Interactive Approach to Discover Complex Matchings between XML Schemas (XML 스키마간의 복합매칭 추출을 위한 대화형 기법)

  • 이준승;이경호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.55-57
    • /
    • 2004
  • 본 논문은 온톨로지를 활용한 스키마 매칭 알고리즘을 제안한다. 기존의 대부분의 스키마 매칭 방법은 단순매칭을 대상으로 하는 반면, 제안된 방법은 계층적 구조의 온톨로지에 기반하여 복합매칭을 계산할 수 있다. 특히 제안된 온톨로지는 이전의 매칭결과에 대한 사용자의 피드백을 이용하여 자동으로 갱신됨에 따라 적절한 도메인 정보를 유지할 수 있다. 성능평가를 위한 실험결과, 온톨로지의 적용이 매칭 성능을 향상시킴을 확인할 수 있었다.

  • PDF

A Study for XML DTD Matching Method using Inlining Algorithm (Inlining 알고리즘을 이용한 XML DTD 매칭 방법에 관한 연구)

  • Heo, Bo-Jin;Kim, Hyeong-Seok;Kim, Chang-Suk
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.11c
    • /
    • pp.1505-1508
    • /
    • 2003
  • XML DTD 매칭은 데이터 통합이나 데이터 웨어하우스, 웹 마이닝, 전자상거래, 의미적 질의 처리등과 같은 데이터베이스 관련 응용분야에서 수행해야 할 근본적인 연구 분야이다. 웹이 발전됨에 따라 웹 상의 데이터 교환의 표준인 XML로 많은 데이터를 표현하게 되었고, 이 XML DTD에 대한 매칭이 주된 연구 분야로 대두되었다. XML 스키마는 플랫 구조인 기존의 관계형 데이터베이스 스키마와는 달리 계층적인 트리 구조로 이루어져 DTD를 직접 비교하기가 어렵다. 본 논문에서는 계층적 구조인 XML DTD의 계층적 구조 정보와 무결성 제약조건을 추출하여 일차원적인 직렬 구조로 변환한 후, 유사한 DTD를 매칭하는 방법을 제안한다.

  • PDF