• 제목/요약/키워드: XML 스키마 매칭

검색결과 21건 처리시간 0.025초

룰과 구조적 속성에 기반한 XML 엘리먼트 매칭 알고리즘 (XML Element Matching Algorithm based on Structural Properties and Rules)

  • 박형;정찬기
    • 정보화연구
    • /
    • 제10권1호
    • /
    • pp.71-77
    • /
    • 2013
  • XML 스키마 매칭은 두 스키마의 엘리먼트들 간의 의미적인 유사성을 찾는 작업이다. XML 스키마 매칭은 스키마 통합, 데이터 통합, 데이터 웨어하우징, 데이터 변환, P2P 데이터 관리, 시멘틱 웹 등과 같은 응용체계에서 중요한 역할을 한다. 본 논문은 룰과 구조적 속성에 기반한 XML 엘리먼트 매칭 알고리즘을 제안한다. 제안한 알고리즘에서는 먼저 XML 문서의 구조적 속성을 이용하여 엘리먼트들이 unique와 non-unique로 분류되며, 이후 룰에 따라 엘리먼트의 매칭여부를 결정한다. 제안 알고리즘의 효과성을 보이기 위해 인터넷에 공개된 XML 스키마를 이용하여 성능을 평가하였다. 또한 제안 알고리즘은 문서의 구조적 속성을 이용함으로써 사용자 주관성을 배제하고 객관성을 보장하며 특정 유형이 아닌 다양한 형태의 XML에 적용이 가능하다.

XML 문서의 변환을 위한 온톨로지 갱신 기반 XML 스키마 매칭 (XML Schema Matching based on Ontology Update for the Transformation of XML Documents)

  • 이경호;이준승
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권7호
    • /
    • pp.727-740
    • /
    • 2006
  • 서로 다른 XML 스키마로 작성된 XML 문서간의 변환을 위해서는 두 스키마 사이의 의미적 연관관계를 계산하는 스키마 매칭 과정이 필수적이다. 본 논문에서는 XML 문서의 변환을 위한 효율적인 스키마 매칭 알고리즘을 제안한다. 제안된 알고리즘은 두 단계로 구성된다. 먼저 제안된 온톨로지와 어휘 유사도에 기반하여 단말노드 사이의 후보매칭을 계산한다. 또한 문맥 정보를 반영하는 제안된 경로 유사도 비교를 통해 후보매칭간계 중에서 최종 매칭 결과를 선택한다. 특히 제안된 방법은 기존 연구와 달리 사용자 피드백에 의해 점증적으로 갱신되는 온톨로지에 기반한다. 제안된 온톨로지는 IsA나 PartOf와 같은 다양한 관계를 표현할 수 있기 때문에 일대일 매칭은 물론이고 다대일 및 일대다 관계의 복합매칭을 계산할 수 있다. 제안된 알고리즘의 성능 평가를 위해 다양한 도메인의 XML 스키마를 대상으로 실험한 결과, 평균 97%의 정확률과 83%의 재현율을 나타내어 기존 연구보다 우수하였다. 특히 제안된 온톨로지의 갱신을 통하여 약 9%의 성능 향상을 확인할 수 있었다.

XML문서의 자동변환을 위한 스키마 매칭 알고리즘 (A Schema Matching Algorithm for an Automated Transformation of XML Documents)

  • 이준승;이경호
    • 한국멀티미디어학회논문지
    • /
    • 제7권9호
    • /
    • pp.1195-1207
    • /
    • 2004
  • 스키마 매칭은 XML문서의 자동 변환을 위한 전처리 과정으로서 필수적이다. 스키마 매칭에 관한 기존 연구는 의미적으로 대응 가능한 모든 매칭관계를 고려하기 때문에 다대다의 대응관계를 추출한다. 이에 명확한 매칭관계를 필요로하는 XML문서의 자동변환에는 적합하지 않다. 본 논문에서는 스키마 사이의 일대일 대응관계를 추출할 수 있는 효율적인 스키마 매칭 알고리즘을 제안한다. 제안된 알고리즘은 두 단계로 구성된다. 먼저 단발노드 사이의 언어적 유사도와 데이터타입 유사도를 이용하여 후보매칭을 계산한다. 계산된 후보매칭의 경로유사도 비교를 통해 일대일 매칭을 추출하게 된다. 특히 제안된 방법은 보다 정교한 수준의 스키마 매칭을 위하여 축약어 사전, 동의어 사전, 그리고 도메인 온탈로지에 기반한다. 제안된 알고리즘의 성능을 평가하기 위해서 전자상거래 분야에서 사용 중인 스키마를 대상으로 실험한 결과, 평균적으로 97%의 정확률을 보여 기존 연구보다 우수하였다.

  • PDF

의사결정나무를 활용한 교량 구조계산서의 XML 스키마 매칭 가중치의 효율적 선택방안 연구 (An Efficient Selection of XML Schema Matching Parameters using Decision Tree for Structural Document of Bridge)

  • 박상일;안현정;김봉근;이상호
    • 한국방재학회:학술대회논문집
    • /
    • 한국방재학회 2010년도 정기 학술발표대회
    • /
    • pp.69.1-69.1
    • /
    • 2010
  • 본 연구는 교량 시설물의 재난방지를 위한 정보시스템의 구축에 있어 선행되어야 하는 교량 구조계산서 항목 저장정보의 질적 향상을 위해 XML 스키마 매칭 기법을 효율적으로 활용할 방법에 대해 제시하였다. 이를 위하여 XML 스키마 매칭에 사용되는 가중치 변화에 따른 매칭 정확도를 나타내는 데이터를 구축하고, 이를 활용하여 데이터 마이닝 기법 중 하나인 의사결정나무 모델을 구현하여 교량의 형식, 문서가 포함하고 있는 항목의 수, 문서를 작성한 회사에 따라 달라질 수 있는 최적의 가중치를 지동으로 선정할 수 있는 프로세스를 제안하였다. 의사결정나무 모델을 통해 결정한 매칭 가중치는 이전에 비하여 약 10% 정확도 상승효과가 있음을 알 수 있었다.

  • PDF

자동분류와 사용자업데이트를 이용한 스키마 매칭 (Automatic Scheme Matching using Classification and User update)

  • 이명주;신현두;박소라;황수찬
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.102-104
    • /
    • 2011
  • 서로 다른 XML 스키마를 바탕으로 작성된 XML 문서간의 비교 및 검색을 위해서는 두 스키마 사이의 연관관계를 계산하는 스키마 매칭 과정이 필수적이다. 스키마 매칭방법으로는 구조적 연관성을 비교하는 방법, 의미적 연관성을 계산하는 방법, 타입의 연관성을 계산하는 방법이 존재한다. 또한, 자동분류기법을 사용하여 연관성을 계산하는 방법도 존재한다. 본 논문에서는 XML 문서의 비교을 위한 효율적인 스키마 매칭 방법을 제안한다. 제안된 방법은 두 단계로 구성된다. 먼저 자동분류기법을 사용하여 단말노드 사이의 매칭정도를 계산한다. 또한 의미적, 구조적, 타입의 연관성도 계산하여 최적의 매칭결과를 선택한다. 특히 의미적 연관성은 사용자 피드백에 의해 점증적으로 갱신되는 온톨로지에 기반한다.

XML 문서의 자동변환을 위한 효율적인 스키마 매칭 알고리즘 (An Efficient Schema Matching Algorithm for An Automated Transformation of XML Documents)

  • 이준승;이경호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.13-15
    • /
    • 2003
  • 본 논문에서는 XML 문서의 자동변환을 위해 2단계의 상향식 매칭 방법을 제안한다. 제안된 방법은 단말 노드 사이의 유사도 비교를 통해 임계값을 넘는 후보 매칭집합을 결정하고, 단말노드가 포함되어 있는 경로의 유사도 비교를 통해 적절한 일대일 매칭을 추출한다. 특히, 노드 사이의 유사도 비교를 위해 축약어 사전, 일반 동의어 사전, 도메인 온톨로지를 적용한다. 실제 전자상거래용 XML 스키마를 대상으로 실험한 결과 제안된 방법은 평균적으로 97%의 정확률을 보였다.

  • PDF

엔지니어링 문서 스키마의 효율적 매칭을 위한 데이터마이닝 기법의 활용방안 (A data mining approach for efficient matching of engineering document schemata)

  • 박상일;안현정;김효진;이상호
    • 한국전산구조공학회:학술대회논문집
    • /
    • 한국전산구조공학회 2010년도 정기 학술대회
    • /
    • pp.226-229
    • /
    • 2010
  • 본 연구에서는 데이터 저장의 질적 향상을 도모하는 XML 스키마 매칭의 효율적 활용방안을 제시하였다. 이를 위하여 매칭의 가중치의 변화에 따라 달라지는 정확도 데이터를 수집하고, 수집한 데이터를 활용하여 데이터 마이닝 기법 중 하나인 의사결정나무 모델을 수립하였다. 수립모델을 응용하여 구현한 가중치 자동선정 모듈은 설명변수인 교량의 형식, 문서가 포함하고 있는 요소의 수, 문서를 작성한 회사 등의 값에 따라 의사결정나무 모델의 목표변수인 정확도뿐만 아니라, 가장 높은 정확도를 보일 수 있는 가중치까지 간접적으로 제안가능하다. 본 연구로 구현한 모듈을 통해 제안된 XML 스키마 매칭 가중치를 활용하면 그렇지 않은 경우에 비하여 약 10% 정확도 상승효과가 있음을 알 수 있었다.

  • PDF

XML 스키마 클러스터링을 위한 효율적인 알고리즘 (An Efficient Algorithm for Clustering XML Schema)

  • 임태우;이경호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.34-36
    • /
    • 2004
  • 최근 웹상에 산재한 정보들의 효율적인 검색과 이용을 위하여 정보의 구조를 정의하는 스키마들의 통합이 중요시되고 있다. 본 논문에서는 XML 스키마들을 클러스터링하기 위한 방법을 제안한다. 제안된 방법은 두 스키마를 통합하는데 드는 비용이 적을수록 스키마간의 유사도가 높다는 가정하에 스키마 사이의 공통된 구조의 크기를 계산한다 이를 위해서 경로사이에 서로 대응하는 요소의 합이 최대가 되는 경로간의 일대일 매칭을 추출한다. 또한 계산된 유사도값에 기반하여 계층적 클러스터링 방법을 적용한다. 제안된 방법의 성능을 평가하기 위해서 다수의 XML 스키마를 대상으로 실험한 결과, 91%의 정확율과 93%의 재현율로서 기존의 알고리즘보다 우수하였다.

  • PDF

XML 스키마간의 복합매칭 추출을 위한 대화형 기법 (Interactive Approach to Discover Complex Matchings between XML Schemas)

  • 이준승;이경호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.55-57
    • /
    • 2004
  • 본 논문은 온톨로지를 활용한 스키마 매칭 알고리즘을 제안한다. 기존의 대부분의 스키마 매칭 방법은 단순매칭을 대상으로 하는 반면, 제안된 방법은 계층적 구조의 온톨로지에 기반하여 복합매칭을 계산할 수 있다. 특히 제안된 온톨로지는 이전의 매칭결과에 대한 사용자의 피드백을 이용하여 자동으로 갱신됨에 따라 적절한 도메인 정보를 유지할 수 있다. 성능평가를 위한 실험결과, 온톨로지의 적용이 매칭 성능을 향상시킴을 확인할 수 있었다.

  • PDF

Inlining 알고리즘을 이용한 XML DTD 매칭 방법에 관한 연구 (A Study for XML DTD Matching Method using Inlining Algorithm)

  • 허보진;김형석;김창석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (하)
    • /
    • pp.1505-1508
    • /
    • 2003
  • XML DTD 매칭은 데이터 통합이나 데이터 웨어하우스, 웹 마이닝, 전자상거래, 의미적 질의 처리등과 같은 데이터베이스 관련 응용분야에서 수행해야 할 근본적인 연구 분야이다. 웹이 발전됨에 따라 웹 상의 데이터 교환의 표준인 XML로 많은 데이터를 표현하게 되었고, 이 XML DTD에 대한 매칭이 주된 연구 분야로 대두되었다. XML 스키마는 플랫 구조인 기존의 관계형 데이터베이스 스키마와는 달리 계층적인 트리 구조로 이루어져 DTD를 직접 비교하기가 어렵다. 본 논문에서는 계층적 구조인 XML DTD의 계층적 구조 정보와 무결성 제약조건을 추출하여 일차원적인 직렬 구조로 변환한 후, 유사한 DTD를 매칭하는 방법을 제안한다.

  • PDF