엔지니어링 문서 스키마의 효율적 매칭을 위한 데이터마이닝 기법의 활용방안

A data mining approach for efficient matching of engineering document schemata

  • 박상일 (연세대학교 토목환경공학과) ;
  • 안현정 (연세대학교 토목환경공학과) ;
  • 김효진 (연세대학교 토목환경공학과) ;
  • 이상호 (연세대학교 토목환경공학과)
  • 발행 : 2010.04.08

초록

본 연구에서는 데이터 저장의 질적 향상을 도모하는 XML 스키마 매칭의 효율적 활용방안을 제시하였다. 이를 위하여 매칭의 가중치의 변화에 따라 달라지는 정확도 데이터를 수집하고, 수집한 데이터를 활용하여 데이터 마이닝 기법 중 하나인 의사결정나무 모델을 수립하였다. 수립모델을 응용하여 구현한 가중치 자동선정 모듈은 설명변수인 교량의 형식, 문서가 포함하고 있는 요소의 수, 문서를 작성한 회사 등의 값에 따라 의사결정나무 모델의 목표변수인 정확도뿐만 아니라, 가장 높은 정확도를 보일 수 있는 가중치까지 간접적으로 제안가능하다. 본 연구로 구현한 모듈을 통해 제안된 XML 스키마 매칭 가중치를 활용하면 그렇지 않은 경우에 비하여 약 10% 정확도 상승효과가 있음을 알 수 있었다.

키워드