• 제목/요약/키워드: large XML document

검색결과 49건 처리시간 0.021초

XML 문서의 저장과 추출을 위한 색인 기법 (An Index Method for Storing and Extracting XML Documents)

  • 김우생;송정석
    • 한국멀티미디어학회논문지
    • /
    • 제8권2호
    • /
    • pp.154-163
    • /
    • 2005
  • XML 문서를 위한 현재까지 연구된 대부분의 색인기법에서는 절대좌표를 표현하는 방법을 이용하기 때문에 갱신연산이 커다란 부담으로 받아들여지고 있다. 또한 이 기법에서 XML문서내의 엘리먼트, 애트리뷰트, 텍스트 사이의 상호 구조적 관계를 표현하려면 좌표를 재구성해야 한다. 이와 같은 재구성 작업은 갱신이 이루어지는 노드에 국한하지 않고 XML 문서 전반에 걸쳐 연쇄적으로 일어나기 때문에, XML 문서의 갱신이 빈번할 경우 심각한 성능 문제를 야기하게 된다. 본 연구에서는 갱신이 빈번한 상황에서도 성능 저하가 많지 않은 확장 색인에 기반한 색인 기법을 제안하고자 한다. 이 방법은 갱신으로 인한 트리의 재구성 연산에 참여하는 노드의 수를 제한하여 전체적으로 성능을 많이 향상시킬 수 있다. 또한 확장색인 기법은 SQL 문장을 이용한 간결한 표현을 통하여 포함관계질의를 처리할 수 있다.

  • PDF

SMIL(Synchronized Multimedia Integration Language) 전용 저작도구의 설계 및 구현 (Design and Implementation of the SMIL Authoring Tool)

  • 신동규;신동일;김세영
    • 정보처리학회논문지B
    • /
    • 제10B권1호
    • /
    • pp.103-110
    • /
    • 2003
  • SMIL은 XML을 기반으로 한 선언적 마크업 언어로서, 멀티미디어 개체들의 상호 유기적인 동기화로 워 상에서 효과적인 멀티미디어 표현을 가능하게 한다. 본 논문에서는 멀티미디어 통한 언어인 SMIL을 이용하여, 웹 멀티미디어 문서를 직관적으로 작성하고, 생성된 정보를 다양하게 활용 가능하게 하는 SMIL전용 저작도구를 설계 및 구현하였다. 문서의 생성, 관리, 저작 모듈뿐만 아니라, 일반 사용자에게 손쉬운 멀티미디어 표현(Presentation)의 저작을 제공하기 위하여 인터넷 망이 대역폭에 따른 템플릿 인터페이스를 제공하였고, SMIL 컨텐츠 데이터베이스 서버와의 연동으로 다수사용자를 위한 SMIL문서 관리 기능을 구현하였다.

관계형 모델에서 XML 변경과 전문 검색을 지원하기 위한 역 인덱스 구축 기법 (Inverted Indexes for XML Updates and Full-Text Retrievals in Relational Model)

  • 천윤우;홍동권
    • 정보처리학회논문지D
    • /
    • 제11D권3호
    • /
    • pp.509-518
    • /
    • 2004
  • 최근 산업체를 중심으로 XML 전문 검색과 XML 문서의 변성 기능에 대한 표준의 시도가 활발히 이루어지고 있다. XML 질의어에서의 전문 검색 기능은 매우 중요한 부분을 차지한다. XML 문서는 관계형 테이블과는 달리 문서의 구조가 복잡하며 때로는 매우 불규칙하다. 이런 상황에서의 검색은 부분적인 정보를 최대한 활용해야 하는 전문 검색이 일반적인 구조적 검색보다 매우 중요한 역할을 한다. 본 논문은 XML 데이터를 관리하기 위하여 관계형 모델을 사용하는 환경에서 XML 문서의 변경과 다양한 형태의 전문 검색을 동시에 지원하기 위한 방안으로 효율적인 역 인덱스 구축 기법을 제안한다. 본 논문에서 제안한 방법은 인덱스 크기의 큰 변화 없이 역 인덱스를 구축하며, 대용량의 XML 문서의 다양한 전문 검색 기능을 성능의 저하 없이 지원한다. 또 XML 문서의 부분적인 변화에 역 인덱스의 변경이 기존의 방법들에 비해서 급격히 줄어든 좋은 성능을 보인다.

대용량 비정형 데이터 자료 입력 및 출력 (Data Input and Output of Unstructured Data of Large Capacity)

  • 심규철;강병준;김경환;정회경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2013년도 춘계학술대회
    • /
    • pp.613-615
    • /
    • 2013
  • 최근 들어 워드 파일을 XML로 변환하여 서비스하기 위한 요구가 많아지고 있다. 이에 본 논문에서는 워드 파일(아래한글, MS-Office)로 입력된 데이터를 XML 파일로 변환하여 사용자가 XML 매핑 파일을 만들어 워드 프로세서에 입력된 데이터를 바로 추출하여 데이터베이스에 저장하는 시스템을 제안한다. 이는, 워드프로세스에 양식을 미리 작성하여 필요한 데이터를 데이터베이스에서 조회하여 워드프로세서 문서를 어플리케이션 프로그램에서 워드 파일을 생성 할 수 있다.

  • PDF

XML 데이타 관리시스템과 유전체 데이타베이스에의 응용 (An XML Data Management System and Its Application to Genome Databases)

  • 이경희;김태경;김선신;이충세;조완섭
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권4호
    • /
    • pp.432-443
    • /
    • 2004
  • 최근 들어 XML의 급속한 확산으로 인해 DBMS를 이용한 XML 데이타 관리의 필요성이 높아지고 있다. 기존의 DBMS를 이용한 XML 저장 및 검색에 관한 연구들은 편의성 측면이나 성능 측면에서 아직 해결할 문제점을 가지고 있다. 특히, 관계 DBMS를 이용하는 경우 복잡한 XML 문서를 간단한 테이블 형태로 변환하는 데이타 모델 변환과 그에 따른 질의 변환의 복잡성이 문제점으로 지적되고 있다. 본 논문에서는 UniSQL ORDBMS를 이용한 DTD 의존적 데이타 관리 시스템인 Xing을 제안한다. Xing 시스템에서는 ORDBMS의 객체 참조와 다중값 속성을 이용하므로 XML 데이타를 객체 모델로 매핑하는 것이 간단하다. 또한, DTD 의존적인 객체 스키마를 생성하므로 XML 저장 알고리즘이 간단하고, 검색을 위한 질의 변환도 용이하다. 특히, Xing에서는 SAX 파서를 이용하여 메모리 부하가 적은 고유의 Xing 트리를 생성하므로 대량의 XML 데이타를 빠르게 저장할 수 있다. 그리고, 질의결과를 XML 형태로 반환함으로써 완전한 XML 데이타 관리시스템으로 사용할 수 있다. GenBank의 유전체 XML 데이타에 대하여 Xing을 이용한 저장과 관계 데이터베이스로 저장한 경우에 검색성능을 비교한 결과 제안한 시스템이 최고 10배까지 좋은 성능을 보였다.

구조적 중복을 사용한 XML 문서의 릴레이션으로의 분할저장 (Shredding XML Documents into Relations using Structural Redundancy)

  • 김재훈;박석
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권2호
    • /
    • pp.177-192
    • /
    • 2005
  • 본 논문에서는 XML 데이타를 릴레이션으로 분할 저장할 경우, 분할된 XML 데이타로부터 질의 결과 XML 문서를 재구성하는데 소모되는 질의 처리비용을 줄이기 위한 구조적 중복 방법을 소개한다. 기본 아이디어는 주어진 질의 패턴을 분석하여, 적절한 데이타들을 중복시킴으로서 질의 처리 성능을 향상시키는 것이다. 이러한 구조적 중복 방법으로 실질적으로 유효할 수 있는 ID, VALUE, SUBTREE의 세 가지 유형의 특성을 분석하였다. 본 논문에서는 추가적으로 주어진 XML 데이타와 질의들이 매우 크고 복잡할 경우 최적의 중복 집합을 팎는 것이 매우 어려운 작업이 될 수 있으므로, 이를 위한 경험적 탐색 방법을 소개한다. 마지막으로 몇 가지 실험을 통하여, 중복 데이타를 사용함으로 발생하는 XML 질의 처리비용과 제안된 탐색 방법의 효율성을 분석한다. 중복 데이타를 사용함으로 XML 판독 질의는 빨라지지만, XML 갱신 질의는 중복 데이타의 갱신 일관성 비용 때문에 느려지는 것은 당연하다. 하지만 실험 결과는 매우 과도한 갱신 비용의 경우에도 in-place ID 중복은 효율적이며, 갱신 비용이 매우 과도하지만 않다면 multiple-place SUBTREE 중복은 판독 질의 처리 성능을 크게 향상시킬 수 있음을 보여주었다.

효율적인 XML검색을 위한 상대 위치 좌표 기반의 BitmapInvert Index 기법 (An Efficient BitmapInvert Index based on Relative Position Coordinate for Retrieval of XML documents)

  • 김택곤;김우생
    • 전자공학회논문지CI
    • /
    • 제43권1호
    • /
    • pp.35-44
    • /
    • 2006
  • 최근 XML 문서의 저장 및 관리에 대한 연구가 활발히 이루어지고 있다. XML 문서를 위한 현재까지 연구된 대부분의 색인기법의 경우 절대좌표를 이용하여 표현하는 방법을 사용하므로 갱신연산이 커다란 부담으로 받아들여지고 있다. 본 논문에서는 이를 개선하기 위하여 상대위치좌표에 기반한 BitmapInvert 색인 기법을 제안하였다. 상대위치좌표는 부모 노드와 좌, 우 형제 노드들 간의 관계만을 표현하므로 갱신연산지 자주 발생하더라도 좋은 성능을 보인다. BitmapInvert 색인 기법은 bitwise 연산을 지원하는 텍스트 검색을 지원하고, PostUpdate 알고리즘을 적용하여 갱신에 따른 성능 저하를 줄이도록 하였다. 따라서, 제안하는 기법은 검색이나 갱신에 대해서 접근하는 노드를 줄임으로써 전체적인 성능을 향상시킬 수 있다.

정보 검색 기술을 이용한 대규모 이질적인 XML 문서에 대한 효율적인 선형 경로 질의 처리 (Efficient Linear Path Query Processing using Information Retrieval Techniques for Large-Scale Heterogeneous XML Documents)

  • 박영호;한욱신;황규영
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권5호
    • /
    • pp.540-552
    • /
    • 2004
  • 본 논문에서는 대규모 이질 XML 문서들에 대한 부분 매치 질의를 효과적으로 처리하는 새로운 방법 XIR-Linear를 제안한다. XPath 질의는 XML 문서를 표현하는 트리 구조에 대한 경로 표현식 (path expression)으로 쓰여진다. 주요한 형태의 XPath 질의는 부분 매치 질의(partial match query)이다. XIR-Linear의 목적은 이질적인 스키마들을 가진 대규모 문서들에 대한 부분 매치 질의를 효과적으로 지원하는 것이다. XIR-Linear는 관계형 테이블을 이용한 스키마-레벨 방법에 기반을 두고, 역 인덱스 (inverted index) 기술을 사용하여 XPath 질의 처리의 효율성을 획기적으로 향상시킨다. 본 방법은 레이블 경로(label path)를 덱스트로 간주하고 레이블 경로 내의 레이블(label)들을 텍스트 내에 있는 키워드(keyword)로 간주한 후, 레이블들을 정보 검색 기술을 이용하여 인덱스 함으로써 전통적인 방법들에서 사용된 스트링 매치(string match) 보다 효율적인 방법으로 질의와 매치되는 레이블 경로들을 찾을 수 있도록 하였다. 성능 평가에서는 인터넷에서 수집한 XML 문서들을 사용하여 기존의 관계형 테이블을 이용하는 XRel, XParent와 비교 실험함으로써, 제안한 방법의 효율성을 입증한다. 실험을 통해 XIR-Linear가 실험 범위 내에서 XRel 이나 XParent에 비해 수십 배 이상 좋은 성능을 보이며, XML 문서 수의 증가함에 따라 더욱 우수하다는 것을 보인다.

XML 문서에 자동 전파하는 XML 스키마 변경 접근법 (XML Schema Evolution Approach Assuring the Automatic Propagation to XML Documents)

  • 나영국
    • 정보처리학회논문지D
    • /
    • 제13D권5호
    • /
    • pp.641-650
    • /
    • 2006
  • XML은 자기 기술적인 특징이 있기 때문에 구조를 한정하기 위해서 DTD 또는 XML 스키마를 사용한다. XML 스키마가 아직 권고안에 불과하지만 DTD는 XML 언어가 아니고 표현에도 한계가 있기 때문에 XML 스키마의 사용이 보편화 될 것이다. XML 문서의 구조와 데이터는 XML 스키마의 잘못된 디자인, 어플리케이션의 새로운 요구 등의 여러 복합적인 이유로 변할 수가 있다. 이에 우리는 XML 스키마 진화(schema evolution)을 분석하여 w;ls화의 기능을 실현할 수 있는 최소한의 연산자들을 제안한다. 이러한 스키마 진화 연산자들은 XML스키마에 순응하는 XML 문서의 수가 많을 경우, XSE가 없다면 불가능한 XML 스키마와 XML 문서의 수정을 가능하게 한다. 더욱이 연산자들은 자동적으로 XML 스키마에 등록되어 있는 모든 XML 문서의 수정위치를 찾아주고 수정 후에도 XML 문서를 well-form 상태가 아닌 valid 상태를 유지시키는 기능을 포함하고 있다 이 논문은 XML 스키마를 체계적으로 수정하는 첫 번째 시도이며 XML의 수정에 필요한 대부분의 연산을 제공한다. 이 논문의 연구는 XML 문서의 구조뿐만 아니라 데이터까지 쉽고 정확하게 수정하는 것을 도와주기 때문에 XML 어플리케이션의 개발과 유지를 위해 꼭 필요한 작업이다.

XML 데이터베이스를 활용한 성과물 관리 프로세스의 효과 (Effective Management of Construction Information Using a XML Based Project Deliverable Management System)

  • 문성우;양병수
    • 대한토목학회논문집
    • /
    • 제26권3D호
    • /
    • pp.481-489
    • /
    • 2006
  • 건설사업의 관리는 정보화 환경에서 이뤄지고 있으며, 건설업무 추진 중 많은 양의 건설정보가 생성된다. 사업종료 후 건설정보는 성과물 형태로 정리되어서 발주자에게 이관된다. 정보화의 발전에도 불구하고 성과물은 문서, 자료 등 파일을 CD로 작성하여 제출하는 방법을 현재 따르고 있다. 기업의 관점에서 다수의 프로젝트가 존재할 경우 파일형태의 성과물 관리는 데이터 관리에 있어서 비효과적이다. 본 논문은 XML 데이터베이스를 기반으로 하는 성과물 관리 프로세스를 제시하여 프로젝트 성과물의 활용성을 높이는 것을 목적으로 한다. 새롭게 제시된 프로세스에서는 건설 프로젝트의 성과물을 단순한 파일 형태로 제공하는 것이 아니라 데이터베이스 형태로 제공한다. 본 연구의 효과를 검증하기 위해서 개발된 XML 데이터 베이스 기반의 성과물관리시스템 파일럿은 성과물 자료의 이관을 편리하게 할 뿐만 아니라, 데이터의 저장과 검색, 수정을 용이하게 하여 성과물의 활용성을 높인다는 것을 보여준다.