• 제목/요약/키워드: XML 데이터

검색결과 1,469건 처리시간 0.04초

XML 데이터베이스 시스템 성능 평가를 위한 통합 XML 데이터 생성기의 설계 (Design of an Integrated XML Data Generator for the Performance Evaluation of XML DBMSs)

  • 신선미;정회진;이상호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.7-10
    • /
    • 2004
  • XML 데이터베이스 시스템이 개발되면 다른 XML 데이터베이스 시스템과의 성능 비교, 또는 자체 기능에 대한 성능 평가를 수행한다. 성능 평가를 수행하기 위해서는 해당 성능 평가에 적합한 XML 데이터를 생성하는 XML 데이터 생성기가 필요하다. 본 논문에서는 지금까지 개발되었던 다양한 XML 데이터 생성기들의 특징 및 장단점을 살펴보고, 이를 기반으로 하나의 사용자 인터페이스를 이용하여 XML 데이터를 생성하는 통합 XML 데이터 생성기의 설계 내용을 기술한다. 통합 XML 데이터 생성기는 레코드 단위의 텍스트 데이터 파일의 내용을 기반으로 XML 데이터를 생성한다. 통합 XML 데이터 생성기는 관계형 데이터베이스 시스템의 데이터를 이용하여 XML 데이터로 생성하는 등 사용자가 제공하는 데이터 활용이 가능하며, 타 XML 데이터 생성기에 비해 다양한 XML 데이터를 생성함으로써 광범위한 XML 데이터베이스 시스템 성능 평가에 이용될 수 있다.

  • PDF

빈발 패턴 트리 기반 XML 스트림 마이닝 (Frequent Patten Tree based XML Stream Mining)

  • 황정희
    • 정보처리학회논문지D
    • /
    • 제16D권5호
    • /
    • pp.673-682
    • /
    • 2009
  • 웹상에서 데이터 교환과 표현을 위한 표준으로 XML 데이터가 널리 사용되고 있으며 유비쿼터스 환경에서 XML 데이터의 형태는 연속적이다. 이와 관련하여 XML 스트림 데이터에 대한 빈발 구조 추출 및 효율적인 질의처리를 위한 마이닝 방법들이 연구되고 있다. 이 논문에서는 슬라이딩 윈도우 기반으로 하여 XML 스트림 데이터로부터 최근 윈도우 범위에 속하는 데이터에 대한 빈발 패턴 구조를 추출하기 위한 마이닝방법을 제안한다. 제안된 방법은 XML 스트림 데이터를 트리집합 모델, XFP_tree로 표현하고 이를 이용하여 최근의 데이터에 대한 빈발구조 패턴을 빠르게 추출한다.

XML 문서의 효율적인 검색과 재사용성을 지원하는 데이터 모델 (New Data Model for Efficient Search and Reusability of XML Documents)

  • 김은영;천세학
    • 지능정보연구
    • /
    • 제10권3호
    • /
    • pp.27-37
    • /
    • 2004
  • 인터넷상에서 데이터를 표현하고 데이터를 서로 교환하기 위한 문서 표준으로 XML이 제시되고 있다. XML은 또한 웹상에 산재되어 있는 문서에 대한 쉬운 검색 및 재사용을 지원하는 문서 표준으로도 부각되고 있다. XML 콘텐츠 관리 시스템을 구현할 때 Semi-structured 데이터를 얼마나 효율적이고 효과적으로 검색 및 관리할 수 있는 가하는 점과 XML의 특징인 재사용성을 얼마나 지원해 줄 수 있는가를 고려해서 XML 데이터를 모델링 해야한다. 또한 모델링한 데이터를 어떻게 실질적으로 저장해야 할 것인 가도 고려해야 한다. 본 논문에서는 XML 문서의 데이터를 데이터 시스템에 저장하고 검색하기 위한 새로운 데이터 모델을 제안한다. 제안하는 데이터 모델은 XML 문서의 데이터 뷰와 구조 뷰를 모두 표현하며 XML 문서를 위한 새로운 데이터 시스템이나 기존의 관계형 시스템 모두를 고려한다.

  • PDF

WeXGene: 웹 기반 XML 데이터 생성기 (WeXGene: Web-based XML Data Generator)

  • 신선미;정회진;이상호
    • 정보처리학회논문지D
    • /
    • 제12D권2호
    • /
    • pp.199-210
    • /
    • 2005
  • XML 데이터베이스 시스템 성능 평가를 수행하기 위해서는 다양한 형태의 XML 데이터 생성을 필요로 한다. 기존 XML 데이터 생성기들은 특정 성능 평가에 적용 가능한 데이터만을 생성하고, 그 기능 또한 매우 제한적이다. 본 논문에서는 기존 XML 데이터 생성기들의 제한된 기능을 보완하고 동시에 새로운 기능들을 추가한 새로운 XML 데이터 생성기인 "WeXGene"을 제안한다. WeXGene은 열 단위 또는 행 단위의 데이터를 포함하는 사용자 데이터 화일 및 "SDTD(Symbolic DTD)" 또는 입력 파라미터를 명시한 구조 정의 화일을 이용하여 XML 데이터를 생성한다. 또한 사용자 데이터 화일 없이도 임의의 데이터론 포함하는 XML 데이터 생성이 가능하다. 본 논문은 WeXGene의 구체적인 설계 내용, 구조, 데이터 생성과정 등을 기술한다. 또한 타 XML 데이터 생성기와 기능을 비교 분석하였다.

효율적인 물류정보 서비스를 위한 XML 중심의 물류데이터 색인 및 검색

  • 백대원;조이현;백억종;권혁철
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2005년도 공동추계학술대회
    • /
    • pp.264-270
    • /
    • 2005
  • 다양한 XML 데이터를 통합 관리하고, 여러 애플리케이션에 정보를 제공하는 웹 서비스 기반의 정보시 스템에서는 체계적이고 효과적인 XML 데이터의 저장 및 검색을 요구한다. 특히, 물류 분야의 정보시스 템에서는 다양한 물류 객체의 정보를 저장하고 관리 하여야 하며, 여러 애플리케이션의 물류 정보 요청에 지능적인 XML 데이터 검색으로 대처할 수 있어야 한다. XML은 데이터를 구조적으로 표현하고, 체계적인 정보 전달을 위해 많은 분야에서 이용하고 있다. XML 데이터는 데이터 구조적 형식을 정의하는 태그와 해당 값으로 구성되어 있다. 각각의 데이터 구조를 가지는 다양한 물류 데이터의 통합 관리 및 검색서비스를 위해서는 XML 데이터의 섹인이 매우 중요하다. 본 논문에서는 웹 서비스 기반의 물류정보 시스템에서 효율적인 정보 검색서비스 제공을 위한 XML 데이터 색인 기법을 제안한다. 또한, 다양한 물류데이터의 효율적인 통합 관리 및 검색을 위한 온톨로지의 적용을 제안한다.

  • PDF

XML 소스 데이터로부터 스타 스키마를 생성하기 위한 XML2Star 알고리즘 (XML2Star Algorithm Creating Star Schema from Source Data in XML)

  • 최은하;김진호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.190-192
    • /
    • 2002
  • 데이터 웨어하우스는 기업의 의사 결정을 지원하기 위해 기업의 운영 데이터베이스로부터 추출한 데이터의 집합으로써 OLAP 분석에 이용된다. OLAP은 데이터에 대한 다양한 분석을 위해 이들 데이터를 다차원 데이터 모델로 표현하고 이를 활용하여 복잡한 질의 처리 및 다차원 데이터 분석에 이용한다. 이러한 OLAP의 다차원 데이터를 관계형 데이터베이스에서 표현하기 위해 스타 스키마가 널리 사용된다. 지금까지의 데이터 웨어하우스는 일반적으로 ER 도형으로 설계된 소스 데이터로부터 스타 스키마를 설계하고 구축하였다. 하지만, 최근 인터넷의 급성장으로 인해 차세대 웹 문서의 표준인 XML을 통한 인터넷 상의 문서 전송 및 정보 교환이 활발해 지고 있으며, XML 문서에 대한 다차원적인 분석이 요구됨에 따라 데이터 웨어하우스는 XML 문서로부터의 스타 스키마 설계 및 저장이 필요하게 되었다. 따라서 본 논문에서는 XML DTD로부터 애트리뷰트 트리를 생성하여 스타 스키마를 설계하고 이 DTD를 따르는 XML 문서에서 스타 스키마의 인스턴스를 추출하여 관계형 데이터베이스에 저장하기 위한 XML2Star 알고리즘을 개발하였다. 이것을 통해 기업 및 사용자는 OLAP에서 XML 기반의 스타 스키마를 이용한 다차원적인 분석이 가능하게 된다.

  • PDF

스트리밍 XML 데이터의 빈발 구조 마이닝 (Mining of Frequent Structures over Streaming XML Data)

  • 황정희
    • 정보처리학회논문지D
    • /
    • 제15D권1호
    • /
    • pp.23-30
    • /
    • 2008
  • 유비쿼터스 환경에서 상황정보 인식 분야를 연구하면서 가장 밑바탕에서 기초가 될 수 있는 것은 인터넷 기술과 XML(Extensible Markup Language)이다. 인터넷을 통한 통신에서 XML 데이터의 사용이 일반화되고 있으며 데이터의 형태는 연속적이다. 그리고 XML 스트림 데이터에 대한 질의를 처리하기 위한 방안들이 제시되고 있다. 이 논문에서는 스트림 데이터에 대한 질의처리를 효율적으로 수행하기 위한 기반연구로써 XML을 레이블의 순서화된 트리로 모델링하여 온라인 환경에서 빈발한 구조를 추출하는 마이닝 방법을 제안한다. 즉, 지속적으로 입력되는 XML 데이터의 구조를 트리로 모델링하고 각각의 트리를 하나의 트리 집합의 구조로 표현하여 현재 윈도우 시점에서 빈발한 구조를 정확하고 빠르게 추출하는 방법을 제시한다. 제시하는 방법은 XML의 질의 처리 및 색인 구성의 기초 자료로 활용될 수 있다.

XML 데이터 관리 시스템의 자동 생성을 위한 XMLStoDBS (The XMLStoDBS for Automatic Generation of XML Data Management System)

  • 박종현;이한수;강지훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.148-150
    • /
    • 2004
  • XML(1)이 인터넷 상의 메시지 교환 형식으로 활발히 이용되면서, XML을 이용하는 많은 응용에서는 이를 효율적으로 관리하기 위한 방법이 요구되었다. 이러한 요구에 발 맞추어 현재, XML 데이터의 관리를 위한 많은 연구(3, 4, 5, 6, 7, 8, 9)가 진행 중에 있으나 아직까지는 어떤 방법이 XML 데이터의 관리를 위해 최적의 방법이라는 결론은 없는 실정이다 또한, 이러한 방법들을 실제 응용에 적용하기 위해서는 시스템 관리자가 XML 문서의 특성을 파악하고, 이를 기반으로 XML 데이터의 관리를 위해서 필요한 모든 모듈들을 개별적으로 개발하고 관리해야 한다. 이와 같은 방법은 응용의 측면에서 추가적인 비용과 노력을 추가해야 하는 부담이 발생한다. 본 논문에서는 앞서 언급한 요구사항들을 해결하기 위하여 고려하여 XML Schema to Relational Database Schema (XMLStoDBS)라는 XML문서를 제안하고, 이를 이용하여 응용에서 필요한 XML 데이터 관리 시스템을 자동으로 생성하기 위한 방법을 제안한다. XMLStoDBS는 응용에서 사용하고자 하는 XML Schema또는 DTD의 정보와 실제 데이터가 저장될 데이터베이스의 정보, 이 둘간의 사상관계를 표현하는 문서이다. 우리의 XMLStoDBS는 사용자가 응용에서 사용하고자 하는 XML Schema/DTD의 입력만으로 자동으로 생성되며, 응용에서는 이를 이용하여 응용에 필요한 XML 데이터 관리 시스템을 자동으로 생성할 수 있다.

  • PDF

DTD가 없는 XML 데이터의 효율적인 저장 기법 (An Efficient Technique for Storing XML Data Without DTD)

  • 박경현;이경휴;류근호
    • 정보처리학회논문지D
    • /
    • 제8D권5호
    • /
    • pp.495-506
    • /
    • 2001
  • XML이 인터넷상의 데이터 교환의 표준으로 대두되면서 데이터 모델이나 플랫폼에 관계없이 데이터의 전송이 가능하게 되었다. 특히 데이터 중심의 XML문서의 경우 전송시의 부하를 줄이기 위해 DTD 없이 전송되는 경우가 일반적이다. 그러한 이유로 전송받은 XML 데이터를 효율적으로 저장하고 질의를 최적화하며 또한 관계형 데이터베이스에 저장된 기존의 데이터를 XML 형태로 출력하기 위해서는 DTD가 없는 XML 문서로부터 관계형 스키마의 추출이 필수적으로 요구된다. 따라서 이 논문에서는 반구조적 데이터의 스키마 추출기법인 최대/최소 경계 스키마 추출 기법을 이용하여 DTD가 없는 XML문서로부터 관계형 스키마를 생성하고 이를 바탕으로 XML 데이터를 저장하는 방법으로 제시한다. 특히, 반구조적 데이터 최소 경계 스키마를 추출하는데 있어서 기존의 데이터로그보다 효율적인 방법인 시뮬레이션을 제안함으로써 관계형 스키마를 생성하는데 있어서 보다 향상된 방법을 보여준다.

  • PDF

XML 문서에 대한 RDB와 ORDB의 비교 (A comparison of RDB & ORDB about the XML Documents)

  • 연재훈;박현주
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (하)
    • /
    • pp.1485-1488
    • /
    • 2003
  • XML이 인터넷상에서 데이터의 교환 수단으로 널리 사용됨에 따라, 데이터를 처리하고 관리하는 다양한 데이터 모델의 DBMS에서 이를 수용하고 관리하는 도구를 제공하고 있다. XML이 데이터의 교환 수단으로 사용되는 가장 큰 이유는 자기 기술 문서화의 기능과 동적인 확장성을 가지고 있기 때문인데, 이를 통해 서로 다른 언어나 플랫폼에서 다른 형식의 데이터를 자신의 시스템의 맞게 변환할 수 있다. 문제는 XML 문서의 데이터를, 문서의 구조와 상관없이 자신이 사용하고 있는 데이터 모델로 저장하고 관리하려고 한다는 점이다. 이로 인해 데이터 관리상의 비용은 증가하고, DBMS의 성능은 저하된다. 본 논문에서는 XML 문서를 관리할 데이터 모델을 RDB와 ORDB로 한정하고, XML 문서가 지니는 구조적 특성에 따라 그에 맞는 데이터 모델을 제시한다. 고려되는 XML 문서의 구조적 특성은 평면 구조의 XML 문서와 계층 구조의 XML 문서이다.

  • PDF