• 제목/요약/키워드: XML Documents

검색결과 705건 처리시간 0.031초

Modified Element Type ID Representation for XML Structure Retrieval

  • Jin, Seung-Hoon;Kim, Soon-Cheol;Kim, Jong-Wan;Kang, Sin-Jae
    • 한국산업정보학회논문지
    • /
    • 제8권3호
    • /
    • pp.61-68
    • /
    • 2003
  • In this paper, a representation method for structure information retrieval without schema and DTD of XML documents is presented. While existing researches have used DTD or schema to extract structure information, we extract structure information directly from XML documents. Especially the well-formed XML documents are only required to retrieve documents in the proposed method. Thus it can retrieve more general and various documents easily compared to the existing XML retrieval systems requiring DTD or schema. Experimental result indicates that the proposed method retrieves effectively structure information of XML documents independently to DTD information.

  • PDF

XML 문서의 공통 구조를 이용한 클러스터링 기법 (A Clustering Technique using Common Structures of XML Documents)

  • 황정희;류근호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권6호
    • /
    • pp.650-661
    • /
    • 2005
  • 인터넷의 성장으로 인해 반구조적인 문서의 표준인 XML 문서의 사용이 증가하고 있고 이에 따라 XML 문서의 통합과 검색을 위한 연구가 많이 진행되고 있다. 효율적인 문서의 통합과 검색을 위한 기초 작업은 유사 구조의 XML 문서를 클러스터링 하는 것이다. 기존 연구의 XML 문서 클러스터링에서는 문서간의 구조적 유사도를 이용하여 클러스터를 생성한다. 그러나 이러한 방법은 문서간의 구조적 유사성외 정확한 측정 기준을 만들기 어렵고, 반복적인 유사도의 비교로 인해 처리 속도가 느리다는 단점이 있다. 이러한 문제점을 개선하기 위하여 이 논문에서는 많은 데이타에도 유연하게 적용할 수 있는 트랜잭션 데이타를 위한 클러스터링 알고리즘을 적용하는 새로운 클러스터링 방법을 제안한다. 이 논문에서 제안하는 클러스터링 방법은 하나의 DTD나 XML 스키마를 공유하는 문서 집합이 아닌 스키마가 없는 다양한 구조의 XML 문서들을 대상으로 공통 구조를 이용한다. 공통 구조를 이용하기 위하여 XML 문서의 트리 모델에서 구조를 분리하여 빈발 구조를 추출하고 이를 기반으로 클러스터링을 수행한다. 아울러, 기존 연구와의 비교 및 실험을 통해 제안 기법의 효율성을 보인다.

XML 문서저장에 관한 민군겸용 데이터베이스 관리체계의 성능비교 (Performance Comparison of Database Management Methods on XML Document Storage Functions for both Commerce and Military Applications)

  • 강석훈;이재윤;이말순
    • 안보군사학연구
    • /
    • 통권2호
    • /
    • pp.237-260
    • /
    • 2004
  • As the research work about XML based on the development of Internet and according to the information exchange standard is being carried out, the need of discovering new methods to store XML documents and manage them efficiently according to the frequency of large-capacity XML documents increases. Consequently, as a kind of back-end database system, XML storage systems such as RDBMS, OODBMS and Native XML DBMS etc. are coming forth in order to save XML documents. It is an urgent task to make comparisons among usage expense, function comparison storage, inquiry, and manage dimension for each DBMS. This paper makes an analysis and comparison of DTD-independent XML document access methods in RDBMS, OODBMS and Native XML DBMS for XML storage and management. After analyzing the advantages and disadvantages of each access method and comparing the function of typical commerce DBMS such as Oracle 8i, eXcelon and Tamino for finding the possibility of military applications, an another appropriate method to save XML documents is proposed as to find an implementation approach to save structural XML documents.

  • PDF

클러스터의 히스토그램을 이용한 XML 문서의 점진적 클러스터링 기법 (An Incremental Clustering Technique of XML Documents using Cluster Histograms)

  • 황정희
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권3호
    • /
    • pp.261-269
    • /
    • 2007
  • 이 논문에서는 XML 문서에 대한 효율적인 검색과 통합을 위한 기초연구로써 XML 문서들에 대한 구조 중심의 클러스터링 기법을 제안한다. 기존 연구에서 문서간의 구조적 유사도를 기반으로 클러스터를 형성해 가는 것과는 다르게 많은 데이타를 빠르게 처리할 수 있는 트랜잭션 데이타를 취급하는 알고리즘을 변형하여 적용한다. 각 클러스터에 포함되어 있는 항목들에 대한 누적 분포를 나타내는 히스토그램을 이용하여 전체적인 클러스터링의 응집도를 고려하는 클러스터링을 수행한다. 기존 연구와의 실험을 통해 클러스터링 처리 시간의 향상과 양질의 클러스터를 생성하는 것을 알 수 있었다.

대용량 XML 문서의 효율적인 검색과 관리를 위한 SCOF 모델 (Service-centric Object Fragmentation Model for Efficient Retrieval and Management of Huge XML Documents)

  • 정창후;최윤수;진두석;김진숙;윤화묵
    • 인터넷정보학회논문지
    • /
    • 제9권1호
    • /
    • pp.103-113
    • /
    • 2008
  • XML 문서가 증가하면서 XML 문서를 처리하는 방법론에 대한 많은 논의가 있어왔다. 본 논문에서는 두 가지 중요한 목적을 가지고 XML 정보 검색 및 관리 시스템을 개발하는데, 첫 번째는 질의에 적합한 내용을 쉽고 빠르게 검색해서 제공하는 것이고, 두 번째는 시스템의 부담을 최소화하면서 효율적이고 안정적인 관리 기능을 제공하는 것이다. 이렇게 실용적인 시스템을 개발하는 핵심 기술은 XML 문서를 어떻게 효과적으로 분할하여 구조적으로 서비스하는가에 달려 있다. 이러한 목적을 달성하기 위하여 본 논문에서는 SCOF(Service-centric Object Fragmentation) 모델을 제안한다. SCOF 모델은 XML 데이터 베이스 관리자에 의해서 정의되는 변환 규칙(conversion rule)을 이용하여 문서를 분할하는 준분할(semi-decomposition) 저장 방식이다. SCOF 모델을 사용한 키워드 기반 검색은 전형적인 XML 질의 언어처럼 문서의 특정 엘리먼트나 속성 값을 이용하여 검색을 수행할 수 있다. 비록 이러한 접근법이 XML 문서 컬렉션에 대한 관리자의 지식을 필요로 한다고 하더라도, 개별 문서의 크기나 전체 문서의 양에 상관없이 검색과 관리를 효율적으로 수행할 수 있기 때문에 실용적인 시스템을 구축할 수 있다는 장점이 있다.

  • PDF

XML 문서 저장관리 시스템을 위한 효율적인 버전닝 기법 (An Efficient Versioning Method for XML Document Repository System)

  • 손충범;배양석;유재수
    • 인터넷정보학회논문지
    • /
    • 제3권4호
    • /
    • pp.37-50
    • /
    • 2002
  • XML 문서 저장관리 시스템은 손실없이 XML 문서를 저장. 수정하고 관리하는 수직과 수평 버전들을 관리할 수 있어야 한다. 그러나 대부분의 기존 XML 문서 저장관리 시스템들은 버전닝 기법을 지원하지 않고 있다. 일부 버전닝을 지원하는 시스템들은 XML 문서들의 수직적인 버전들만을 관리한다. 수직 버저닝은 문서의 변경 이력만을 유지하는 반면에. 수평 버전닝은 한 문서를 여러 개의 버전들로 분기하게 함으로써 사용자들은 보다 넓게 원본 문서로부터 새로운 문서들을 생성할 수 있고 다른 의미를 갖는 문서로 편집할 수 있다. 이 논문에서는 수직 및 수평 버전닝을 효과적으로 지원하기 위한 새로운 버전 번호부여 방법을 제안한다. 또한, 버전닝을 지원하며 XML 문서의 특징인 정보 구조화의 패러다임을 유지하는 스키마를 설계한다.

  • PDF

스키마가 없는 XML 문서에서의 재사용 가능한 XML Schema 추출 기법 (Technique for extracting reusable XML Schema from schema-less XML Documents)

  • 조정길;구연설
    • 정보처리학회논문지D
    • /
    • 제10D권4호
    • /
    • pp.603-612
    • /
    • 2003
  • 웹의 발전으로 인터넷상에 XML 문서의 양이 증가하면서 클라이언트에서 수신된 XML 데이터를 검증하고 데이터베이스에 효율적으로 저장하고 질의하는데 필요한 많은 연구들이 진행되고 있다. 이러한 작업들을 처리하기 위해서는 XML 문서의 DTD나 XML Schema가 필요하다. 그러나 스키마가 없는 XML 문서는 DTD나 XML Schema가 없기 때문에 이러한 작업들을 처리할 수가 없다. 이에 이 논문에서는 well-formed XML 문서이거나 XML Schema가 없는 XML 문서에서 XML 데이터를 검증하고 데이터베이스에 효율적으로 저장하고 질의할 수 있도록 XML Schema론 추출한다. 이 논문에서 제안하는 XML Schema 추출 방법은 반구조적 데이터의 스키마 추출 기법인 데이터가이드와 시뮬레이션을 적용하여 스키마가 없는 XML 문서에서 스키마 그래프를 추출한다. 그리고 스키마 그래프와 재사용성을 고려한 패턴 테이블을 이용하여 XML Schema를 추출하는 기법을 제안한다.

XML 문서의 효율적인 검색과 관리를 위한 SCOF 모델 (Service-centric Object Fragmentation Model for Efficient Retrieval and Management of XML Documents)

  • 정창후
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2007년도 추계 종합학술대회 논문집
    • /
    • pp.595-598
    • /
    • 2007
  • XML 문서가 기하급수적으로 증가하면서 XML 문서를 처리하는 방법론에 대한 많은 논의가 있어왔다. 본 논문에서는 두 가지 중요한 목적을 가지고 XML 정보 검색 및 관리 시스템을 개발하는데, 첫 번째는 질의에 적합한 내용을 쉽고 빠르게 검색해서 제공하는 것이고, 두 번째는 시스템의 부담을 최소화하면서 효율적이고 안정적인 관리 기능을 제공하는 것이다. 이렇게 실용적인 시스템을 개발하는 핵심 기술은 XML 문서를 어떻게 효과적으로 분할하여 구조적으로 서비스하는가에 달려 있다. 이러한 목적을 달성하기 위하여 본 논문에서는 SCOF(Service-centric Object Fragmentation) 모델을 제안한다. SCOF 모델은 XML 데이터베이스 관리자에 의해서 정의되는 변환 규칙(conversion rule)을 이용하여 문서를 분할하는 준분할(semi-decomposition) 저장 방식이다. SCOF 모델을 사용한 키워드 기반 검색은 전형적인 XML 질의 언어처럼 문서의 특정 엘리먼트나 속성 값을 이용하여 검색을 수행할 수 있다. 비록 이러한 접근법이 XML 문서 컬렉션에 대한 관리자의 지식을 필요로 한다고 하더라도, 개별 문서의 크기나 전체 문서의 양에 상관없이 검색과 관리를 효율적으로 수행할 수 있기 때문에 실용적인 시스템을 구축할 수 있다는 장점이 있다.

  • PDF

ORDBMS를 사용한 XML 질의 캐쉬의 효율적인 지연 갱신 (Efficient Deferred Incremental Refresh of XML Query Cache Using ORDBMS)

  • 황대현;강현철
    • 정보처리학회논문지D
    • /
    • 제13D권1호
    • /
    • pp.11-22
    • /
    • 2006
  • XML 문서의 생성 및 활용도가 증가함으로 인해 XML 문서를 데이터베이스에 저장하여 관리하는 기법이 활발히 연구되고 있다. 관계형 또는 객체 관계형 데이터베이스 관리 시스템(RDBMS/ORDBMS)을 XML 문서의 저장소로 사용하는 것은 현재 가장 실용적인 방법으로 받아들여지고 있다. 데이터베이스에 저장된 XML 문서에 대한 빠른 질의 처리를 위하여 XML 질의 캐쉬를 사용할 수 있다. 그러나 XML 질의 캐쉬의 사용은 하부 자료의 변경에 대한 일관성 유지비용이 든다. 본 논문에서는, ORDBMS를 XML 질의 캐쉬와 하부 XML 자료의 저장소로 사용하고 변경로그를 사용하여 XML 질의 캐쉬를 지연 갱신할 때, XML 질의 캐쉬에 대한 비효율적인 갱신의 원인인 변경로그에 저장된 동일한 XML 문서에 대한 중복 변경을 제거 또는 여과하는 알고리즘을 제시한다. 또한 이를 바탕으로 XML 질의 캐쉬의 갱신에 사용할 최적화된 SQL 문을 생성한다. 실험을 통해 본 논문에서 제안한 XML 질의 캐쉬의 지연 갱신 방법의 효율성을 보인다.

경로를 표시하지 않는 XML 질의 (XML Queries without Path Expressions)

  • 이월영;용환승
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권2호
    • /
    • pp.204-218
    • /
    • 2005
  • XML은 수 많은 응용들에서 데이타를 교환하기 위한 표준으로 급속도로 출현되었다. XML 데이타에 대해 효율적인 질의를 지원하기 위하여 많은 질의어들도 설계되었다. 이러한 질의어들은 사용자들이 XML 문서 구조를 알아야 사용할 수 있고 구조에 대한 검색 조건을 명시해야만 한다. 이러한 XML 문서에 대해 경로 기반으로 하는 질의는 XML이 계층적 구조이기 때문에 당연한 것 이다. 그러나 이러한 현재의 경로 기반의 질의를 보충하기 위하여, 사용자들이 XML 문서에 대하여 경로를 사용하지 않는 질의도 필요하다. 이 논문에서 우리는 XML 문서 구조를 모르고도 질의할 수 있는 질의 표현을 설계하고, 이 경로를 명시하지 않는 질의를 평가하기 위한 질의 처리기를 개발하였다.