• 제목/요약/키워드: 스키마 추출

검색결과 150건 처리시간 0.028초

공통 문서 구조 추출을 통한 XML DTD의 관계형 데이터 베이스 스키마 변환 기법 (A Transformation Technique of XML DTD to Relational Database Schema Based On Extracting Common Structure in XML Documents)

  • 안성은;최황규
    • 정보처리학회논문지D
    • /
    • 제9D권6호
    • /
    • pp.999-1008
    • /
    • 2002
  • XML은 W3C에 제안된 마크업 언어고 HTML의 단순함과 SGML의 복잡함을 극복하여, 웹 상에서 데이터를 표현하고 교환하기 위한 표준으로 등장하고 있다. XML 문서를 질의 처리하기 위한 방법으로 XML 문서 전용 질의 언어가 개발되고 있지만, 데이터의 양이 증가한다면 결국 막대한 양의 데이터를 처리 할 데이터베이스 시스템을 필요하게 된다. 본 논문에서는 XML DTD를 관계형 데이터베이스 시스템 스키마로 변환하는 기법을 제안한다. 제안된 기법은 XML 데이터의 스키마 역할을 하는 DTD의 트리 구조를 생성하여, XML 데이터들의 공통구조와 비공통구조를 추출한 후 관계형 데이터베이스 스키마를 추출하는 기법이다. 추출된 관계형 데이터베이스 스키마는 기존의 방법들에 비해 생성 테이블 수가 적으며, 널(NULL)값의 출현을 감소시킨다. 또한, 제안기법은 XML 데이터를 보다 적은 테이블로 맵핑(mapping)시킴으로써 데이터 검색 시 참조 테이블 수를 감소시킬 수 있으며 질의 처리 시에도 성능 면에서 우수함을 보인다.

DTD가 없는 XML 데이터의 효율적인 저장 기법 (An Efficient Technique for Storing XML Data Without DTD)

  • 박경현;이경휴;류근호
    • 정보처리학회논문지D
    • /
    • 제8D권5호
    • /
    • pp.495-506
    • /
    • 2001
  • XML이 인터넷상의 데이터 교환의 표준으로 대두되면서 데이터 모델이나 플랫폼에 관계없이 데이터의 전송이 가능하게 되었다. 특히 데이터 중심의 XML문서의 경우 전송시의 부하를 줄이기 위해 DTD 없이 전송되는 경우가 일반적이다. 그러한 이유로 전송받은 XML 데이터를 효율적으로 저장하고 질의를 최적화하며 또한 관계형 데이터베이스에 저장된 기존의 데이터를 XML 형태로 출력하기 위해서는 DTD가 없는 XML 문서로부터 관계형 스키마의 추출이 필수적으로 요구된다. 따라서 이 논문에서는 반구조적 데이터의 스키마 추출기법인 최대/최소 경계 스키마 추출 기법을 이용하여 DTD가 없는 XML문서로부터 관계형 스키마를 생성하고 이를 바탕으로 XML 데이터를 저장하는 방법으로 제시한다. 특히, 반구조적 데이터 최소 경계 스키마를 추출하는데 있어서 기존의 데이터로그보다 효율적인 방법인 시뮬레이션을 제안함으로써 관계형 스키마를 생성하는데 있어서 보다 향상된 방법을 보여준다.

  • PDF

XML 문서의 공통구조를 이용한 효율적인 릴레이션 스키마 추출기법 (An Efficient Relational Schema Extracting Technique Using Common Stricture in XML Documents)

  • 안성은;이정선;최황규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.49-51
    • /
    • 2002
  • XML은 웹 상에서 데이터를 표현하고 교환하기 위안 표준으로 등장하고 있다 최근에 웹 상에서 다루어지는 데이터의 양이 급격하게 증가함에 따라 데이터의 형태는 구조적인 릴레이션 데이터에서 반 구조적인 데이터에 이르기까지 다양하다. 앞으로 웹에서 반 구조적 데이터를 대표할 XML 문서특이 많아지면 .1 데이터들간의 의미적 구조적 관계를 설정하는 스키마즐- 추출하여 그에 따라 데이터를 구조화 시켜 정보로써의 가치를 만들 수 있는 새로운 저장 기법들이 필요하다. 본 논문에서는 XML 문서의 DTD를 이용하여 통일한 DTD를 사용하는 XML 문서들의 공통구조론 추출하여 관계 데이터베이스 시스템에 XML 문서를 저장하기 위한 릴레이션 스키마 추출 기법을 제안한다.

  • PDF

XML 문서의 DTD를 이용한 릴레이션 스키마 추출 기법 (A Relational Schema Extracting Technique Using DTD XML in Documents)

  • 안성은;최황규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (상)
    • /
    • pp.105-108
    • /
    • 2002
  • XML은 웹 상에서 데이터를 표현하고 교환하기 위한 표준으로 등장하고 있다. 최근에 웹 상에서 다루어지는 데이터의 양이 급격하게 증가함에 따라 XML 문서들간의 의미적 구조적 관계를 설정하는 스키마를 추출하여 그에 따라 데이터를 구조화시켜 정보로써의 가치를 만들 수 있는 새로운 저장 기법들이 필요하다. 본 논문에서는 XML 문서의 DTD를 이용하여 동일한 DTD를 사용하는 XML 문서들의 공통구조를 추출하여 관계 데이터베이스 시스템에 XML 문서를 저장하기 위한 릴레이션 스키마 추출 기법을 제안하였다. 제안된 기법은 성능비교에서 기존의 방법에 비하여 생성되는 릴레이션의 수가 적고 릴레이션 생성 시 발생하는 널 값의 출현을 감소시킬 수 있다.

  • PDF

웹 정보원 통합을 위한 내용 기반의 스키마 자동생성시스템 (An Automatic Schema Generation System based on the Contents for Integrating Web Information Sources)

  • 곽준영;배종민
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권6호
    • /
    • pp.77-86
    • /
    • 2008
  • 웹 정보원은 사용자에게 제공되는 가장 큰 분산 데이터베이스로 간주될 수 있다. 분산된 웹 정보원을 가상적으로 통합하여 하나의 정보원으로 보고, 이 가상의 데이터베이스에 대하여 데이터베이스 질의어를 이용하여 검색하는 기능은 여러 가지 웹 기반 응용프로그램 개발에서 중요한 역할을 한다. 이러한 기능을 지원하기 위해서 브라우징 중심의 웹 문서로부터 데이터베이스 스키마를 추출해야 한다. 본 논문은 반 구조적인 웹 문서로부터 XML 스키마를 자동으로 생성하는 경험적 알고리즘을 제시한다. 이를 위하여 미리 정의된 구조태그 기반으로 후보패턴영역을 추출하고 후보패턴영역으로부터 패턴영역을 경험적으로 결정한다. 그리고 패턴영역으로부터 스키마생성규칙을 유도한다. 스키마생성규칙은 XQuery로 표현되기 때문에 공개된다양한 XML 도구를 사용하여 응용시스템을 개발할 수 있다. 개발된 시스템의 유효성을 보이기 위하여 다양한 웹정보원에 대하여 실험한 결과를 제시한다.

  • PDF

XML 스키마 클러스터링을 위한 효율적인 알고리즘 (An Efficient Algorithm for Clustering XML Schemas)

  • 임태우;이경호
    • 한국멀티미디어학회논문지
    • /
    • 제8권7호
    • /
    • pp.857-868
    • /
    • 2005
  • 스키마 클러스터링은 스키마의 통합을 위한 전처리 단계로서 중요하다. 본 논문에서는 XML 스키마를 클러스터링하기 위한 효율적인 방법을 제안한다. 제안된 방법은 먼저 스키마 사이의 유사도를 계산한다. 특히 두 스키마를 통합하는데 드는 비용이 적을수록 유사하다는 가정하에 스키마 사이의 유사도를 공통된 구조의 크기로 정의한다. 이를 위해서 경로 사이에 서로 대응하는 엘리먼트의 합이 최대가 되는 경로간의 일대일 매칭을 추출한다. 또한 계산된 유사도값에 기반하여 계층적 클러스터링 방법을 적용한다. 제안된 방법의 성능을 평가하기 위해서 다수의 XML 스키마를 대상으로 실험한 결과, $99\%$의 정확률과 $93\%$의 클러스터링률을 보여 기존의 알고리즘보다 우수하였다.

  • PDF

XML 데이터의 제약조건 보존을 위한 변환 기법 (A Transformation Technique for Constraints-preserving of XML Data)

  • 조정길;금영욱
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권5호
    • /
    • pp.1-9
    • /
    • 2009
  • XML 데이터를 효율적으로 저장하고 질의하기 위하며 많은 기법들이 제안되었다. 이러한 목표를 위한 한 가지 방법은 XML 데이터를 관계형 형식으로 변환하여 관계형 데이터베이스를 사용하는 것이다. 그러나 대부분의 연구가 XML의 내용과 구조만 변환하고 숨겨진 의미적 제약조건을 간과하거나 일부만 적용하였다. 따라서 이 논문에서는 XML Schema로부터 의미적 제약조건의 체계적인 추출 방법과 추출된 의미적 제약조건을 관계형 스키마로 변환할 때에 보존하는 방법을 제안한다. 변환 알고리즘은 XML Schema로부터 의미적 제약조건을 추출하고 보존하는데 이용되며, 추출된 의미적 정보들을 스키마표기법에 따라 재작성하여 어떻게 의미적 제약조건을 보존하는지를 보여준다. 또한 변환하는 동안에 올바른 관계형 스키마를 보증하기 위하여 제약조건 확인에 필요한 의미적 지식을 제공한다. 이 방법에서는 내용, 구조와 함께 무결성 제약조건들은 동시에 유지되며, 또한 저장 중복성을 줄일 수 있다.

도메인 온톨로지에 기반한 XML 스키마의 통합 (Integration of XML Schemas Based on Domain Ontology)

  • 강혜란;이경호
    • 한국멀티미디어학회논문지
    • /
    • 제11권7호
    • /
    • pp.940-955
    • /
    • 2008
  • 동일한 도메인에 속하고 의미가 유사한 XML 문서들이라도 서로 다른 XML 스키마를 따르는 경우가 많다. 그러므로 XML 문서로부터 정보를 추출하고 통합하기 위해서는 의미가 유사한 XML 스키마들을 통합하는 방법이 필요하다. 본 논문은 동일한 도메인에서 사용되는 XML 스키마들을 의미를 정확하게 보존하면서 통합하는 방법을 제안한다. 제안된 방법은 사전과 함께 도메인 온톨로지를 이용하여 어휘 간 유의어 및 상하위어 관계를 검사하고 이를 스키마 통합 과정에 활용한다. 특히 본 논문은 엘리먼트 및 애트리뷰트가 갖고 있는 구조적 정보를 활용하여 유의어 및 상하위어 관계를 보다 정확하게 검사한다. 그리고 정교한 수준의 연산자 통합과 연산자 최적화 규칙을 제안한다. 제안된 방법의 성능을 평가하기 위해서 다양한 도메인의 XML 스키마를 대상으로 실험한 결과, 도메인 온톨로지와 제안된 방법의 어휘 간 구조적 관계를 이용할 경우 통합 스키마의 정확률과 재현율이 향상됨을 확인하였다.

  • PDF

기하증명과제에서 나타나는 중학교 1학년 학생들의 증명스키마와 그 특징 (Seventh Graders' Proof Schemes and Their Characteristics in Geometric Tasks)

  • 변규미;장경윤
    • 대한수학교육학회지:수학교육학연구
    • /
    • 제27권2호
    • /
    • pp.191-205
    • /
    • 2017
  • 본 연구는 서울의 C중학교 1학년 학생들이 기하 증명 문제를 해결하는 과정에서 보여주는 증명스키마 유형과 그 특징을 조사한 것이다. 자료 분석은 Harel, & Sowder의 증명스키마 유형에 기초하여 이루어졌다. 연구 결과, 학업성취수준에 따라 학생들이 사용하는 증명스키마 유형에 차이가 있었다. 상위권에서 하위권으로 갈수록 변형적 증명스키마를 사용하는 학생의 비율이 감소하였고 귀납적(측정) 증명스키마를 사용하는 학생의 비율은 증가하였다. 또한 증명과정에서 비형식적인 부호 사용하기, 문제에서 주어진 그림 특정 비율로 인식하기 등 각 증명스키마 유형마다 고유한 특징이 나타났다. 이를 바탕으로 4개의 의미 있는 결론을 추출하였고, 이것이 증명 교수 학습에 주는 시사점을 논의하였다.

XML 데이터의 효율적인 DTD 추출 (An Efficient Technique for Extracting DTD from XML Data)

  • 양은주;박경현;류근호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (상)
    • /
    • pp.97-100
    • /
    • 2000
  • 기존의 데이터를 인터넷상에서 XML 데이터 형태로 전송 시 부하를 줄이기 위해 DTD가 없는 형태로 전송하지만, 전송 받은 XML 데이터에 대한 저장 및 질의처리를 최적화하기 위해서는 DTD 추출이 필요하다. 따라서 이 논문에서는 반구조적 데이터의 특징을 갖는 XML 데이터에 대한 DTD를 추출하기 위해 기존의 데이터로그(DataLog)를 이용하여 반구조적 데이터의 최소 경계 스키마를 추출하는 방법보다 향상된 방법인 시뮬레이션을 이용한 최소 경계 스키마 추출 방법을 제시함으로써 보다 효율적인 DTD 추출을 가능하게 하는 방범을 제시한다.

  • PDF