Abstract
When any data-centric XML documents are stored and managed in RDBMS, schema extracting from XML Schema is an imminent problem. Furthermore, when they are stored in partitioned way on created table, lots of null values will be produced and/or be increased cost for join, so we need a solution to solve these problems. This paper proposes a Schema Hybrid Inlining technique to generate relational schema of XML documents. The suggested technique creates a relational schema based on the XML Schema graph. Also, the technique expands the legacy Inlining method by manual and heuristic processing table generation method of cardinality and in-degree. Then, an ancestor node, terminal node, and creating a new table on the derived relation in this technique. DTD-dependent storage method uses partitioned storing and relation path element information reformed structured-searching method to reduce joining operation cost that is a weak point of it.
데이터 중심의 XML 문서를 관계형 데이터베이스에 저장하고 관리할 경우에 XML 스키마로부터 관계형 스키마를 추출하는 것이 보다 시급한 일이다. 또한 생성된 테이블에 XML 문서를 분할하여 저장할 경우에 많은 널 값을 초래하거나 조인 비용의 증가를 가져오기 때문에 이에 대한 해결책이 필요하다. 이 논문에서는 XML 스키마로부터 관계형 스키마를 생성하는 Schema Hybrid Inlining 기법을 제안하였다. 제안된 기법은 XML 스키마 그래프를 바탕으로 관계형 스키마를 생성하게 되는데, 기존의 Inlining 방식을 확장하여 출현 지시자와 진입 차수에서의 테이블 생성 방법을 휴리스틱하게 매뉴얼 처리를 하며, 유도 관계에서 최종 노드인 조상 노드는 새로운 테이블을 생성한다. 또한 DTD 종속적인 저장 방식의 단점인 조인 연산 비용을 줄이기 위하여 중복을 활용한 분할 저장과 구조적 검색 기법을 개선한 관계 경로 요소 정보를 이용하였다.