• 제목/요약/키워드: XML schema matching

검색결과 17건 처리시간 0.022초

A XML Schema Matching based on Fuzzy Similarity Measure

  • Kim, Chang-Suk;Sim, Kwee-Bo
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2005년도 ICCAS
    • /
    • pp.1482-1485
    • /
    • 2005
  • An equivalent schema matching among several different source schemas is very important for information integration or mining on the XML based World Wide Web. Finding most similar source schema corresponding mediated schema is a major bottleneck because of the arbitrary nesting property and hierarchical structures of XML DTD schemas. It is complex and both very labor intensive and error prune job. In this paper, we present the first complex matching of XML schema, i.e. XML DTD, inlining two dimensional DTD graph into flat feature values. The proposed method captures not only schematic information but also integrity constraints information of DTD to match different structured DTD. We show the integrity constraints based hierarchical schema matching is more semantic than the schema matching only to use schematic information and stored data.

  • PDF

A XML DTD Matching using Fuzzy Similarity Measure

  • Kim, Chang-Suk;Son, Dong-Cheul;Kim, Dae-Su
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제3권1호
    • /
    • pp.32-36
    • /
    • 2003
  • An equivalent schema matching among several different source schemas is very important for information integration or mining on the XML based World Wide Web. Finding most similar source schema corresponding mediated schema is a major bottleneck because of the arbitrary nesting property and hierarchical structures of XML DTD schemas. It is complex and both very labor intensive and error prune job. In this paper, we present the first complex matching of XML schema, i.e. XML DTD. The proposed method captures not only schematic information but also integrity constraints information of DTD to match different structured DTD. We show the integrity constraints based hierarchical schema matching is more semantic than the schema matching only to use schematic information and stored data.

교량 건설 문서의 강화된 XML 스키마 매칭을 위한 인공신경망 기반의 요소 가중치 선정 방안 (Artificial Neural Network-based Weight Factor Determination Method for the Enhanced XML Schema Matching of Bridge Engineering Documents)

  • 박상일;권태호;박준원;서경완;윤영철
    • 한국안전학회지
    • /
    • 제37권1호
    • /
    • pp.41-48
    • /
    • 2022
  • Bridge engineering documents have essential contents that must be referenced continuously throughout a structure's entire life cycle, but research related to the quality of the contents is still lacking. XML schema matching is an excellent technique to improve the quality of stored data; however, it takes excessive computing time when applied to documents with many contents and a deep hierarchical structure, such as bridge engineering documents. Moreover, it requires a manual parametric study for matching elements' weight factors, maintaining a high matching accuracy. This study proposes an efficient weight-factor determination method based on an artificial neural network (ANN) model using the simplified XML schema-matching method proposed in a previous research to reduce the computing time. The ANN model was generated and verified using 580 data of document properties, weight factors, and matching accuracy. The proposed ANN-based schema-matching method showed superiority in terms of accuracy and efficiency compared with the previous study on XML schema matching for bridge engineering documents.

룰과 구조적 속성에 기반한 XML 엘리먼트 매칭 알고리즘 (XML Element Matching Algorithm based on Structural Properties and Rules)

  • 박형;정찬기
    • 정보화연구
    • /
    • 제10권1호
    • /
    • pp.71-77
    • /
    • 2013
  • XML 스키마 매칭은 두 스키마의 엘리먼트들 간의 의미적인 유사성을 찾는 작업이다. XML 스키마 매칭은 스키마 통합, 데이터 통합, 데이터 웨어하우징, 데이터 변환, P2P 데이터 관리, 시멘틱 웹 등과 같은 응용체계에서 중요한 역할을 한다. 본 논문은 룰과 구조적 속성에 기반한 XML 엘리먼트 매칭 알고리즘을 제안한다. 제안한 알고리즘에서는 먼저 XML 문서의 구조적 속성을 이용하여 엘리먼트들이 unique와 non-unique로 분류되며, 이후 룰에 따라 엘리먼트의 매칭여부를 결정한다. 제안 알고리즘의 효과성을 보이기 위해 인터넷에 공개된 XML 스키마를 이용하여 성능을 평가하였다. 또한 제안 알고리즘은 문서의 구조적 속성을 이용함으로써 사용자 주관성을 배제하고 객관성을 보장하며 특정 유형이 아닌 다양한 형태의 XML에 적용이 가능하다.

강박스교 구조계산서 XML 시맨틱 모델의 스키마 매칭 기법 적용 (Applying the Schema Matching Method to XML Semantic Model of Steelbox-bridge's Structural Calculation Reports)

  • 양영애;김봉근;이상호
    • 한국전산구조공학회:학술대회논문집
    • /
    • 한국전산구조공학회 2005년도 춘계 학술발표회 논문집
    • /
    • pp.680-687
    • /
    • 2005
  • This study presents a schema matching technique which can be applied to XML semantic model of structural calculation reports of steel-box bridges. The semantic model of structural calculation documents was developed by extracting the optimized common elements from the analyses of various existing structural calculation documents, and the standardized semantic model was schematized by using XML Schema. In addition, the similarity measure technique and the relaxation labeling technique were employed to develop the schema matching algorithm. The former takes into account the element categories and their features, and the latter considers the structural constraints in the semantic model. The standardized XML semantic model of steel-box bridge's structural calculation documents called target schema was compared with existing nonstandardized structural calculation documents called primitive schema by the developed schema matching algorithm Some application examples show the importance of the development of standardized target schema for structural calculation documents and the effectiveness and efficiency of schema matching technique in the examination of the degree of document standardization in structural calculation reports.

  • PDF

XML 문서의 변환을 위한 온톨로지 갱신 기반 XML 스키마 매칭 (XML Schema Matching based on Ontology Update for the Transformation of XML Documents)

  • 이경호;이준승
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권7호
    • /
    • pp.727-740
    • /
    • 2006
  • 서로 다른 XML 스키마로 작성된 XML 문서간의 변환을 위해서는 두 스키마 사이의 의미적 연관관계를 계산하는 스키마 매칭 과정이 필수적이다. 본 논문에서는 XML 문서의 변환을 위한 효율적인 스키마 매칭 알고리즘을 제안한다. 제안된 알고리즘은 두 단계로 구성된다. 먼저 제안된 온톨로지와 어휘 유사도에 기반하여 단말노드 사이의 후보매칭을 계산한다. 또한 문맥 정보를 반영하는 제안된 경로 유사도 비교를 통해 후보매칭간계 중에서 최종 매칭 결과를 선택한다. 특히 제안된 방법은 기존 연구와 달리 사용자 피드백에 의해 점증적으로 갱신되는 온톨로지에 기반한다. 제안된 온톨로지는 IsA나 PartOf와 같은 다양한 관계를 표현할 수 있기 때문에 일대일 매칭은 물론이고 다대일 및 일대다 관계의 복합매칭을 계산할 수 있다. 제안된 알고리즘의 성능 평가를 위해 다양한 도메인의 XML 스키마를 대상으로 실험한 결과, 평균 97%의 정확률과 83%의 재현율을 나타내어 기존 연구보다 우수하였다. 특히 제안된 온톨로지의 갱신을 통하여 약 9%의 성능 향상을 확인할 수 있었다.

XML문서의 자동변환을 위한 스키마 매칭 알고리즘 (A Schema Matching Algorithm for an Automated Transformation of XML Documents)

  • 이준승;이경호
    • 한국멀티미디어학회논문지
    • /
    • 제7권9호
    • /
    • pp.1195-1207
    • /
    • 2004
  • 스키마 매칭은 XML문서의 자동 변환을 위한 전처리 과정으로서 필수적이다. 스키마 매칭에 관한 기존 연구는 의미적으로 대응 가능한 모든 매칭관계를 고려하기 때문에 다대다의 대응관계를 추출한다. 이에 명확한 매칭관계를 필요로하는 XML문서의 자동변환에는 적합하지 않다. 본 논문에서는 스키마 사이의 일대일 대응관계를 추출할 수 있는 효율적인 스키마 매칭 알고리즘을 제안한다. 제안된 알고리즘은 두 단계로 구성된다. 먼저 단발노드 사이의 언어적 유사도와 데이터타입 유사도를 이용하여 후보매칭을 계산한다. 계산된 후보매칭의 경로유사도 비교를 통해 일대일 매칭을 추출하게 된다. 특히 제안된 방법은 보다 정교한 수준의 스키마 매칭을 위하여 축약어 사전, 동의어 사전, 그리고 도메인 온탈로지에 기반한다. 제안된 알고리즘의 성능을 평가하기 위해서 전자상거래 분야에서 사용 중인 스키마를 대상으로 실험한 결과, 평균적으로 97%의 정확률을 보여 기존 연구보다 우수하였다.

  • PDF

XML 스키마 매칭 기법을 이용한 구조설계 문서구조 표준화 방법론 (A methodology for the standardization of structural design document structure using XML schema matching technique)

  • 김봉근;정연석;김동현;이상호
    • 한국전산구조공학회:학술대회논문집
    • /
    • 한국전산구조공학회 2006년도 정기 학술대회 논문집
    • /
    • pp.200-207
    • /
    • 2006
  • A new formal standardization methodology of the structural design document information is proposed in this paper. The standardization process is divided into three steps: pre-process of the collected sample document (CSD), construction of the document structure, and definition of the occurrence of each element in the document. During the pre-process, the detail document contents in the CSD are indexed with templates defined in this study, and the indexed CSD is translated into XML Schema (XSD) formal Afterwards the degree of confidences of all elements between the temporary standard document (TSD) and the translated CSD are calculated by using the XML schema matching algorithm; the TSD is then updated. This second step is repeated until all of the CSD are compared. In the final step, the common elements and unbounded elements are extracted by determining the occurrence of the temporary document elements, and the standardized document schema is exported in the XSD format. The case study dealing with the structural calculation documents show that the ,proposed methodology can be effectively used to build a XML -based information model of structural design documents.

  • PDF

해양GIS XML 응용스키마 결합방법 연구 (A study on integration of XML application schema for MGIS)

  • 오세웅;박계각;박종민;서상현
    • 한국지능시스템학회논문지
    • /
    • 제19권2호
    • /
    • pp.236-241
    • /
    • 2009
  • 분산되어 있거나 이기종의 데이터베이스 통합을 위해 많은 연구가 수행되었으며, 특히 데이터베이스 통합을 위해 데이터베이스의 스키마 매칭이 이슈가 되고 있다. 본 연구에서는 해양GIS 데이터베이스 통합을 위해 해양GIS 데이터베이스 구조를 XML 응용스키마로 변환하고 유사도 측정법과 relaxation labeling 기법을 이용하여 매칭 방법을 연구하였다. XML 응용스키마의 항목 간 유사도 측정은 각 항목이 가지고 있는 범주와 속성으로 계산하며, 각 항목이 계층간 의미적 연계관계를 적용하기 위하여 relaxation labeling 기법을 이용하여 초기 유사도 측정값에 반복적으로 적용하여 유사도 측정값의 변이를 측정하였다. 본 연구에서는 해양GIS 메타데이터 응용 스키마의 예시를 들어 알고리즘을 통한 매칭을 시도하였고, 실험 결과 알고리즘에 따른 초기 계산 값의 변화를 확인하였다.

XML 스키마 매칭 기법의 교량 구조계산서 적용 방안 (An Efficient Application of XML Schema Matching Technique to Structural Calculation Document of Bridge)

  • 박상일;김봉근;이상호
    • 대한토목학회논문집
    • /
    • 제32권1D호
    • /
    • pp.51-59
    • /
    • 2012
  • 본 논문에서는 실무에서 작성된 교량 상부 구조계산서를 대상으로 문서구조를 분석하고 그 차이점을 찾아낼 수 있는 XML 스키마 매칭 기법을 효율적으로 적용하기 위한 방안을 제시한다. 이를 위해 XML 응용 스키마 매칭 기법의 유사성 측정에 사용되는 요소이름, 부모요소, 형제요소 및 자식요소의 가중치에 대한 매개변수 연구를 30개의 서로 다른 학습용 데이터를 대상으로 수행하여 구조계산서 문서구조 비교에 적합한 가중치를 제시하였다. 또한, 대량의 구성요소를 지니는 구조계산서의 문서구조를 비교할 때 많은 계산시간이 소요되는 단점을 극복하고자 유사성 정량화에 사용할 수 있는 간략 식을 제안하였다. 본 연구에서 제시한 간략 식을 이용한 방법은 그렇지 않은 기존의 연구결과와 비교했을 때 계산시간을 획기적으로 단축시킬 수 있으면서도 거의 유사한 정확도를 나타냄을 알 수 있었으며, 매개변수 연구에서 제시된 최적 가중치를 활용하면 기존 연구성과보다 약 10% 이상 정확도를 향상시킬 수 있음을 확인하였다. 실무에서 사용하는 강교량 상부 구조계산서 20개를 대상으로 실시한 수치실험 결과 본 연구에서 제시된 방법을 이용하는 것은 기존 연구에 비해 문서 구조 파악의 우수한 정확도를 유지하면서 계산시간 측면에서는 구성요소의 수에 따라 4배에서 460배까지 줄일 수 있음을 알 수 있었다.