• 제목/요약/키워드: Large XML Documents

검색결과 60건 처리시간 0.025초

MPEG-7 데이터의 효율적인 관리를 위한 클러스터링 방법 (Clustering of MPEG-7 Data for Efficient Management)

  • 안병태;강병수;조건화;강현석
    • 한국멀티미디어학회논문지
    • /
    • 제10권1호
    • /
    • pp.1-12
    • /
    • 2007
  • 모바일 환경의 제한된 자원 하에서 멀티미디어 데이터를 이용하기 위해서는 XML로 표현되는 MPEG-7 문서의 효율적인 관리 방법이 필요하다. 이 때 XML 문서 클러스터링 방법들을 이용할 수 있겠으나 보다 효율성을 높이기 위해 MPEG-7 문서의 특성을 반영한 새로운 클러스터링 방법이 요구된다. 새로운 클러스터링은 모바일 환경에서 멀티미디어 검색시 질의 처리 속도가 향상되며 다양한 응용에 적합한 문서 저장이 가능하다. 본 논문에서는 대용량의 멀티미디어 데이터를 MPEG-7 문서로 효율적으로 관리하기 위해 MPEG-7 문서의 엘리먼트들 사이에 나타나는 의미 관련성을 이용해 저장할 수 있는 새로운 클러스터링 방법을 제안하고, 이를 기존 방법들과 비교하였다.

  • PDF

통보형 XML 공문서 관리를 위한 프레임웍 설계 (Framework Design for Managing the Distributable Official XML Documents)

  • 이소영;정옥란;조동섭
    • 컴퓨터교육학회논문지
    • /
    • 제7권2호
    • /
    • pp.11-23
    • /
    • 2004
  • 학교 내의 문서 전달은 교육청과 같은 규모가 큰 교육기관과는 달리 소규모라는 점 때문에 소홀히 여겨져 왔다. 외부의 행정 환경 변화에 따라 학교 내의 행정 서비스 전달 체계도 그 구조와 틀을 쇄신할 필요가 있다. 이러한 취지에서 본 논문은 실제 학교 현장에서 활용할 수 있도록 통보형 XML 공문서 관리를 위한 프레임웍을 설계하고, 컴포넌트 관계로 모델링하여 JSP 컴포넌트 기반의 공문서 관리 시스템을 구현하였다. 결과적으로 본 시스템은 기한이 임박한 공문서와 같은 교육활동에 부정적 영향을 미치는 요소를 줄이고 문서 관리 체계의 전산화로 학교 내 행정 서비스 환경을 개선한다는데 의의가 있다.

  • PDF

대응효율성을 통한 변화 탐지 알고리즘의 성능 개선 (Improving Performance of Change Detection Algorithms through the Efficiency of Matching)

  • 이석균;김동아
    • 정보처리학회논문지D
    • /
    • 제14D권2호
    • /
    • pp.145-156
    • /
    • 2007
  • 최근 웹 문서의 변조의 탐지, 버전 관리 등을 위한 XML/HTML 문서들에 대한 효과적인 실시간 변화탐지 알고리즘의 필요성이 증대하고 있다. 특히 대용량의 XML/HTML 문서들에 대한 실시간 변화탐지 응용들은 최소비용의 편집스크립트를 계산하는 알고리즘 보다는 실시간 처리가 가능한 빠른 휴리스틱 알고리즘들을 필요로 한다. 기존의 휴리스틱 알고리즘들은 실행속도는 빠르나 생성되는 편집스크립트의 질이 만족스럽지 못하다. 본 논문에서는 기존의 알고리즘 XyDiff와 X-tree Diff를 소개하고 이들 알고리즘들의 문제점들을 분석하고 문제점들을 개선한 알고리즘 X-tree Diff+를 제안한다. X-tree Diff+는 실행시간 측면에서 기존 알고리즘들과 유사하나 대응효율성에 기반한 대응과정의 개선을 통해 두 문서 간의 노트들의 대응률을 향상시킨 알고리즘이다.

XML 문서의 저장과 추출을 위한 색인 기법 (An Index Method for Storing and Extracting XML Documents)

  • 김우생;송정석
    • 한국멀티미디어학회논문지
    • /
    • 제8권2호
    • /
    • pp.154-163
    • /
    • 2005
  • XML 문서를 위한 현재까지 연구된 대부분의 색인기법에서는 절대좌표를 표현하는 방법을 이용하기 때문에 갱신연산이 커다란 부담으로 받아들여지고 있다. 또한 이 기법에서 XML문서내의 엘리먼트, 애트리뷰트, 텍스트 사이의 상호 구조적 관계를 표현하려면 좌표를 재구성해야 한다. 이와 같은 재구성 작업은 갱신이 이루어지는 노드에 국한하지 않고 XML 문서 전반에 걸쳐 연쇄적으로 일어나기 때문에, XML 문서의 갱신이 빈번할 경우 심각한 성능 문제를 야기하게 된다. 본 연구에서는 갱신이 빈번한 상황에서도 성능 저하가 많지 않은 확장 색인에 기반한 색인 기법을 제안하고자 한다. 이 방법은 갱신으로 인한 트리의 재구성 연산에 참여하는 노드의 수를 제한하여 전체적으로 성능을 많이 향상시킬 수 있다. 또한 확장색인 기법은 SQL 문장을 이용한 간결한 표현을 통하여 포함관계질의를 처리할 수 있다.

  • PDF

XML 문서에 대한 RDBMS에 기반을 둔 효율적인 역색인 기법 (An Efficient Inverted Index Technique based on RDBMS for XML Documents)

  • 서치영;이상원;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권1호
    • /
    • pp.27-40
    • /
    • 2003
  • XML 정보검색 시스템이 XML 문서에 대한 포함질의를 지원하기 위해서는 기존의 정의검색 분야에서 널리 쓰이는 역색인 기법을 XML 문서에 대해서도 적용이 가능하도록 확장해야 한다. 본 논문에서는 확장된 역색인 정보를 저장하고 XML 문서에 대한 포함질의를 처리하는 방법을 이전 연구에서와 같이 두 가지 관점에서 제시한다. 하나는 관계형 데이타베이스 관리 시스템(RDBMS)을 이용해서 역색인 정보를 저장하고 질의를 처리하는 방법이고 다른 하나는 RDBMS 대신 역 리스트 엔진(Inverted List Engine)을 이용하는 방법이다. 이전 연구에서 역색인을 확장한 방식은 두 가지 문제점이 존재한다. 하나는 RDBMS를 이용하는 방법이 역 리스트 엔진을 이용하는 방법에 비해 성능 상으로 많이 안 좋다는 점이고, 다른 하나는 RDBMS 상에서 포함질의를 처리 시, 질의의 경로길이에 비례해서 조인연산이 증가하고 조인연산도 크기가 큰 테이블간의 조인이 된다는 점이다. 본 논문에서는 이러한 문제점들을 해결하고자 이전연구와는 다르게 역색인을 확장하여 RDBMS를 이용하는 방법의 효율성을 밝힌다.

관계형 모델에서 XML 변경과 전문 검색을 지원하기 위한 역 인덱스 구축 기법 (Inverted Indexes for XML Updates and Full-Text Retrievals in Relational Model)

  • 천윤우;홍동권
    • 정보처리학회논문지D
    • /
    • 제11D권3호
    • /
    • pp.509-518
    • /
    • 2004
  • 최근 산업체를 중심으로 XML 전문 검색과 XML 문서의 변성 기능에 대한 표준의 시도가 활발히 이루어지고 있다. XML 질의어에서의 전문 검색 기능은 매우 중요한 부분을 차지한다. XML 문서는 관계형 테이블과는 달리 문서의 구조가 복잡하며 때로는 매우 불규칙하다. 이런 상황에서의 검색은 부분적인 정보를 최대한 활용해야 하는 전문 검색이 일반적인 구조적 검색보다 매우 중요한 역할을 한다. 본 논문은 XML 데이터를 관리하기 위하여 관계형 모델을 사용하는 환경에서 XML 문서의 변경과 다양한 형태의 전문 검색을 동시에 지원하기 위한 방안으로 효율적인 역 인덱스 구축 기법을 제안한다. 본 논문에서 제안한 방법은 인덱스 크기의 큰 변화 없이 역 인덱스를 구축하며, 대용량의 XML 문서의 다양한 전문 검색 기능을 성능의 저하 없이 지원한다. 또 XML 문서의 부분적인 변화에 역 인덱스의 변경이 기존의 방법들에 비해서 급격히 줄어든 좋은 성능을 보인다.

역 색인을 이용한 경로 질의 기반 대용량 XML문서 검색 (Retrieval of Large scaled XML Documents based on Path Query using Inverted indexes)

  • 문경원;황병연
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.35-38
    • /
    • 2005
  • 1998년 XML 문서 표준이 제안된 이래, 다양한 응용 분야에서 XML은 데이터를 표현하는 표준으로 자리잡아 가고 있다. 특히, 인터넷상의 많은 데이터들이 XML 형태로 작성되고 변환됨에 따라 다량의 XML 데이터가 생성되고 있다. 따라서 현재 XML 문서의 저장 및 질의 처리 기법의 연구가 활발하게 진행되고 있다. 하지만 기존의 연구는 대용량 XML 문서를 다루기에는 미흡한 점이 있다. 본 논문에서는 인터넷상의 널리 퍼져있는 방대하고, 다양한 구조의 XML문서들을 대상으로 패스 기반 질의를 빠르게 처리할 수 있는 검색 기법을 제안한다. 제안된 기법은 인터넷상에 산재해 있는 여러 XML 문서를 관계형 데이터베이스에 효율적으로 저장하고 질의를 통해 인터넷상 XML 문서의 엘리먼트를 빠르게 검색하는데 주안점을 둔다. 먼저, XML 문서를 관계형 데이터베이스에 효율적으로 저장하는 계층형 XML 저장 기법을 제안하고, 정보 검색 시스템에서 많이 사용하는 역 인덱스를 사용하여 저장된 XML 문서에 대한 검색 성능을 향상시킨다.

  • PDF

구조적 중복을 사용한 XML 문서의 릴레이션으로의 분할저장 (Shredding XML Documents into Relations using Structural Redundancy)

  • 김재훈;박석
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권2호
    • /
    • pp.177-192
    • /
    • 2005
  • 본 논문에서는 XML 데이타를 릴레이션으로 분할 저장할 경우, 분할된 XML 데이타로부터 질의 결과 XML 문서를 재구성하는데 소모되는 질의 처리비용을 줄이기 위한 구조적 중복 방법을 소개한다. 기본 아이디어는 주어진 질의 패턴을 분석하여, 적절한 데이타들을 중복시킴으로서 질의 처리 성능을 향상시키는 것이다. 이러한 구조적 중복 방법으로 실질적으로 유효할 수 있는 ID, VALUE, SUBTREE의 세 가지 유형의 특성을 분석하였다. 본 논문에서는 추가적으로 주어진 XML 데이타와 질의들이 매우 크고 복잡할 경우 최적의 중복 집합을 팎는 것이 매우 어려운 작업이 될 수 있으므로, 이를 위한 경험적 탐색 방법을 소개한다. 마지막으로 몇 가지 실험을 통하여, 중복 데이타를 사용함으로 발생하는 XML 질의 처리비용과 제안된 탐색 방법의 효율성을 분석한다. 중복 데이타를 사용함으로 XML 판독 질의는 빨라지지만, XML 갱신 질의는 중복 데이타의 갱신 일관성 비용 때문에 느려지는 것은 당연하다. 하지만 실험 결과는 매우 과도한 갱신 비용의 경우에도 in-place ID 중복은 효율적이며, 갱신 비용이 매우 과도하지만 않다면 multiple-place SUBTREE 중복은 판독 질의 처리 성능을 크게 향상시킬 수 있음을 보여주었다.

RDB의 묵시적 참조 무결성 추출 알고리즘에 대한 성능 평가 (Performance Evaluation about Implicit Referential Integrities Extraction Algorithm of RDB)

  • 김진형;정동원
    • 한국시뮬레이션학회:학술대회논문집
    • /
    • 한국시뮬레이션학회 2005년도 추계학술대회 및 정기총회
    • /
    • pp.71-76
    • /
    • 2005
  • XML is rapidly becoming one of the most widely adopted technologies for information exchange and representation on the World Wide Web. However, the large part of data is still stored in a relational database. Hence, we need to convert relational data into XML documents. The most important point of the conversion is to reflect referential integrities In relational schema model to XML schema model exactly. Until now, FT, NeT and CoT are suggested as existing approaches for conversion from the relational schema model to the XML schema model but these approaches only reflect referential integrities which are defined explicitly for conversion. In this paper, we suggest an algorithm for automatic extraction of implicit referential integrities such as foreign key constraints which is not defined explicitly in the initial relational schema model. We present translated XML documents by existing algorithms and suggested algorithms as comparison evaluation. We also compare suggested algorithm and conventional algorithms by simluation in accuracy part.

  • PDF

내장형 XML 데이터베이스 시스템을 위한 P-DOM의 설계 및 구현 (Design and Implementation of P-DOM for Embedded XML Database System)

  • 강동완;제권엽;홍영표;한동원;강현석;배종민
    • 한국멀티미디어학회논문지
    • /
    • 제6권2호
    • /
    • pp.183-193
    • /
    • 2003
  • 이동형 단말 시스템에서 XML 데이터의 역할과 데이터베이스의 지원이 중요해지고 있다. 이에 따라, 내장형 XML 데이터베이스 시스템에 대한 연구가 활발하다. XML문서를 처리하기 위해서는 DOM API를 지원할 필요가 있는데, 기존의 DOM API는 DOM 트리를 메모리에 유지한다. 이것은 제한된 리소스를 가지는 내장형 시스템 을 안정적으로 운용하는데 위협적인 요소이다. 본 논문에서는 내장형 시스템의 부족한 리소스를 고려하여 DOM 트리를 메모리가 아닌 내장형 데이터베이스 시스템인 버클리 DB위에서 구성되는 P-DOM 트리를 제안하고, 이를 관리하는 DOMdbm 시스템을 개발한다.

  • PDF