• 제목/요약/키워드: XML 데이타베이스

검색결과 147건 처리시간 0.024초

구조적 중복을 사용한 XML 문서의 릴레이션으로의 분할저장 (Shredding XML Documents into Relations using Structural Redundancy)

  • 김재훈;박석
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권2호
    • /
    • pp.177-192
    • /
    • 2005
  • 본 논문에서는 XML 데이타를 릴레이션으로 분할 저장할 경우, 분할된 XML 데이타로부터 질의 결과 XML 문서를 재구성하는데 소모되는 질의 처리비용을 줄이기 위한 구조적 중복 방법을 소개한다. 기본 아이디어는 주어진 질의 패턴을 분석하여, 적절한 데이타들을 중복시킴으로서 질의 처리 성능을 향상시키는 것이다. 이러한 구조적 중복 방법으로 실질적으로 유효할 수 있는 ID, VALUE, SUBTREE의 세 가지 유형의 특성을 분석하였다. 본 논문에서는 추가적으로 주어진 XML 데이타와 질의들이 매우 크고 복잡할 경우 최적의 중복 집합을 팎는 것이 매우 어려운 작업이 될 수 있으므로, 이를 위한 경험적 탐색 방법을 소개한다. 마지막으로 몇 가지 실험을 통하여, 중복 데이타를 사용함으로 발생하는 XML 질의 처리비용과 제안된 탐색 방법의 효율성을 분석한다. 중복 데이타를 사용함으로 XML 판독 질의는 빨라지지만, XML 갱신 질의는 중복 데이타의 갱신 일관성 비용 때문에 느려지는 것은 당연하다. 하지만 실험 결과는 매우 과도한 갱신 비용의 경우에도 in-place ID 중복은 효율적이며, 갱신 비용이 매우 과도하지만 않다면 multiple-place SUBTREE 중복은 판독 질의 처리 성능을 크게 향상시킬 수 있음을 보여주었다.

경로를 표시하지 않는 XML 질의 (XML Queries without Path Expressions)

  • 이월영;용환승
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권2호
    • /
    • pp.204-218
    • /
    • 2005
  • XML은 수 많은 응용들에서 데이타를 교환하기 위한 표준으로 급속도로 출현되었다. XML 데이타에 대해 효율적인 질의를 지원하기 위하여 많은 질의어들도 설계되었다. 이러한 질의어들은 사용자들이 XML 문서 구조를 알아야 사용할 수 있고 구조에 대한 검색 조건을 명시해야만 한다. 이러한 XML 문서에 대해 경로 기반으로 하는 질의는 XML이 계층적 구조이기 때문에 당연한 것 이다. 그러나 이러한 현재의 경로 기반의 질의를 보충하기 위하여, 사용자들이 XML 문서에 대하여 경로를 사용하지 않는 질의도 필요하다. 이 논문에서 우리는 XML 문서 구조를 모르고도 질의할 수 있는 질의 표현을 설계하고, 이 경로를 명시하지 않는 질의를 평가하기 위한 질의 처리기를 개발하였다.

질의-인식 복호화를 사용한 암호화된 XML데이타에 대한 안전한 질의 처리 (Secure Query Processing against Encrypted XML Data Using Query-Aware Decryption)

  • 이재길;황규영
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권3호
    • /
    • pp.243-253
    • /
    • 2005
  • 인터넷에서 XML 데이타를 그대로 배포할 경우 모든 사용자가 배포된 XML 데이타를 아무 제약 없이 액세스할 수 있어, XML 데이타 제공자의 프라이버시가 보장되지 않는다. 따라서, 배포된 XML 데이타에 대해서 액세스를 통제할 수 있도록 암호화 기법을 사용하는 방법들이 최근에 제안되었다. 그러나, 이들 방법에서는 배포된 XML 데이타에 대한 질의 처리 성능이 충분히 논의되지 않았다 질의 처리기는 암호화된 XML 데이타를 복호화하기 전까지 XML 데이타의 실제 내용을 알 수 없으며, 이로 인해 질의 결과를 포함하지 않은 부분까지도 복호화해야 하는 오버헤드가 발생한다. 본 논문에서는 암호화된 XML 데이타에 대한 효율적인 질의 처리를 위해 질의-인식 복호화(Query-aware decryption)라는 개념을 제안한다. 질의-인식 복호화란 암호화된 XML 데이타 중에서 질의 결과를 포함하는 부분만 복호화하는 방법이다. 이를 위해 XML 인덱스를 암호화하여 데이타와 함께 배포한다. 암호화된 XML 인덱스만을 복호화함으로써 암호화된 XML 데이타에서 질의 결과가 포함되어 있는 위치를 알아내어, 다른 암호화된 XML 데이타의 불필요한 복호화를 방지할 수 있다. 암호화된 XML 인덱스는 암호화된 XML 데이타에 비해 그 크기가 매우 작으므로 이를 복호화하는 비용은 암호화된 XML 데이타를 불필요하게 복호화하는데 낭비된 비용에 비해 매우 작다. 실험 결과는 질의-인식 복호화를 사용하는 질의 처리 방법이 기존의 방법에 비해 질의 처리 성능을 최대 6배까지 향상시킴을 보인다. 마지막으로, 암호화된 XML 인덱스로 인해 추가적인 보안 누출이 발생하지 않음을 정형적으로 증명한다.

XML 스트림 데이타에 대한 적응력 있는 질의 처리 시스템 (An Adaptive Query Processing System for XML Stream Data)

  • 김영현;강현철
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권3호
    • /
    • pp.327-341
    • /
    • 2006
  • 센서 네트워크, 모니터링, SDI (selective dissemination of information) 등과 같이 스트림 데이타를 생성하는 응용의 증가로 스트림 데이타에 대한 질의 처리를 효율적으로 지원하기 위한 연구가 활발히 수행되고 있다. 특히 SDI와 같은 웹 환경의 응용은 XML 스트림에 대한 질의 처리를 필요로 하는데, XML은 웹 환경에서 데이타 교환의 표준이므로 이에 대한 연구는 아주 중요하다. 그러나 현재까지 제시된 XML 스트림 질의 처리 시스템들은 정적인 질의 계획을 사용하기 때문에 동적으로 변하는 스트림 데이타에 대해 적응력 있게 대처하지 못하는 문제가 있다. 반면 관계 데이타 스트림에 대한 질의 처리 시스템들은 질의 연산자 라우팅 기법을 통해 동적인 질의 계획을 사용함으로써 적응력 있는 질의 처리를 지원한다. 본 논문에서는 관계 데이타 모델을 사용하는 시스템의 적응력 있는 질의 처리 모델을 적용하여XML 스트림에 대한 적응력 있는 질의 처리를 수행할 수 있는 시스템을 제안한다. 그리고 기존의 XML을 기반으로 하는 대표적인 시스템인 YFilter와 본 논문이 제안하는 시스템의 성능을 비교, 평가하여 본 논문이 제안하는 시스템의 효율성을 보인다.

XML 문서에 대한 RDBMS에 기반을 둔 효율적인 역색인 기법 (An Efficient Inverted Index Technique based on RDBMS for XML Documents)

  • 서치영;이상원;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권1호
    • /
    • pp.27-40
    • /
    • 2003
  • XML 정보검색 시스템이 XML 문서에 대한 포함질의를 지원하기 위해서는 기존의 정의검색 분야에서 널리 쓰이는 역색인 기법을 XML 문서에 대해서도 적용이 가능하도록 확장해야 한다. 본 논문에서는 확장된 역색인 정보를 저장하고 XML 문서에 대한 포함질의를 처리하는 방법을 이전 연구에서와 같이 두 가지 관점에서 제시한다. 하나는 관계형 데이타베이스 관리 시스템(RDBMS)을 이용해서 역색인 정보를 저장하고 질의를 처리하는 방법이고 다른 하나는 RDBMS 대신 역 리스트 엔진(Inverted List Engine)을 이용하는 방법이다. 이전 연구에서 역색인을 확장한 방식은 두 가지 문제점이 존재한다. 하나는 RDBMS를 이용하는 방법이 역 리스트 엔진을 이용하는 방법에 비해 성능 상으로 많이 안 좋다는 점이고, 다른 하나는 RDBMS 상에서 포함질의를 처리 시, 질의의 경로길이에 비례해서 조인연산이 증가하고 조인연산도 크기가 큰 테이블간의 조인이 된다는 점이다. 본 논문에서는 이러한 문제점들을 해결하고자 이전연구와는 다르게 역색인을 확장하여 RDBMS를 이용하는 방법의 효율성을 밝힌다.

UML 개발 산출물을 위한 관계 및 내용 기방 검색 시스템 (A Retrieval System for UML Development Artifacts based on Relationship and Content)

  • 전세길;나연묵
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권1호
    • /
    • pp.57-68
    • /
    • 2001
  • 본 논문에서는 UML을 기반으로 한 객체지향 시스템 개발에서 발생하는 멀티미디어 산출물들을 저장, 관리하기 위한 객체 저장소의 산출물 관리 기법을 제시하였다. 객체 관리 기능 모듈은 상용 객체 관계 DBMS인 IUS를 이용하여 구현하였다. 산출물 객체의 표현 및 데이터의 공유를 위해 UML 다이아그램 산출물을 XML 문서 형태로 표현하고, eXcelon XML 데이터 서버를 이용하여 XML 문서처리 시스템을 구현하였다. 산출물 객체의 관계 관리 기법과 UML 다이아그램에 대한 XML 문서화 기법은 UML을 기반으로 하는 CASE 도구의 개발에 활용될 수 있다.

  • PDF

클러스터의 히스토그램을 이용한 XML 문서의 점진적 클러스터링 기법 (An Incremental Clustering Technique of XML Documents using Cluster Histograms)

  • 황정희
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권3호
    • /
    • pp.261-269
    • /
    • 2007
  • 이 논문에서는 XML 문서에 대한 효율적인 검색과 통합을 위한 기초연구로써 XML 문서들에 대한 구조 중심의 클러스터링 기법을 제안한다. 기존 연구에서 문서간의 구조적 유사도를 기반으로 클러스터를 형성해 가는 것과는 다르게 많은 데이타를 빠르게 처리할 수 있는 트랜잭션 데이타를 취급하는 알고리즘을 변형하여 적용한다. 각 클러스터에 포함되어 있는 항목들에 대한 누적 분포를 나타내는 히스토그램을 이용하여 전체적인 클러스터링의 응집도를 고려하는 클러스터링을 수행한다. 기존 연구와의 실험을 통해 클러스터링 처리 시간의 향상과 양질의 클러스터를 생성하는 것을 알 수 있었다.

메타데이타를 삽입한 디지털 콘텐츠 생성 도구 개발 (Development of Digital Contents Authoring Tool using Metadata)

  • 천수덕;주상욱;이상준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (C)
    • /
    • pp.50-54
    • /
    • 2007
  • 정보기술은 통신 및 멀티미디어 기술의 발전에 힘입어 빠르게 발전되고 있으며, 이에 따른 데이타베이스의 기술이 공간데이타, XML, 비디오, 음성과 같은 다양한 멀티미디어 데이터 분야에 적용되고 있다. 비디오 데이타는 순차적인 특성을 가지며, 시간과 공간정보가 결합된 3차원 데이타로서 처리시간이 높은 작업이기 때문에 검색이나 브라우징이 대단히 비효율적이다. 본 논문에서는 비주얼리듬을 이용하여 비디오 데이타에서 대표 프레임(Key Frame)을 추출한 다음 XML을 이용한 태그 및 키워드 정보를 대표 프레임에 삽입하여 검색이나 브라우징을 할 수 있는 동영상 내용편집 도구(Authoring Tool for Video Contents)를 제안한다. 비주얼리듬은 3차원의 시공간적인 정보를 2차원으로 매핑한 정보로 IDCT(inverse Discrete Cosine Transform)과정 없이 픽셀 정보를 얻을 수 있어 처리속도가 빠르며 컷, 와이프, 디졸브 등의 편집효과를 효과적으로 구분할 수 있다. 그리고 XML 데이타에는 태그 및 정보와 함께 대표 프레임의 정보까지 저장되므로 유사 화면 검색이나 내용 기반 검색을 제공할 수 있다.

  • PDF

동적으로 갱신가능한 XML 데이터에서 레이블 재작성하지 않는 원형 레이블링 방법 (A Circle Labeling Scheme without Re-labeling for Dynamically Updatable XML Data)

  • 김진영;박석
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권2호
    • /
    • pp.150-167
    • /
    • 2009
  • XML은 인터넷과 유비쿼터스 환경의 데이타에 대한 저장과 교환, 출판의 목적으로 널리 사용되고 있다. XML의 광범위한 사용에 따라 XML 데이타를 효율적으로 저장하고 활용하기 위한 방법으로 레이블링 방법이 연구되고 있다. 레이블링 방법에 대한 최근 연구들은 동적으로 업데이트 가능한 XML 문서에 대한 효과적인 레이블링 방법에 중점을 두고 있다. 그러나 레이블 재작성 비용, 레이블 저장을 위한 큰 저장공간 할당 등의 문제점이 있다. 이러한 문제점은 새로운 데이타가 지속적으로 삽입될 경우 더욱 심화된다. 본 논문에서는 XML 문서를 원으로 나타냄으로써 회전수, 부모/자식원의 개념을 적용하여 전체 레이블 저장공간의 효율을 얻는 방법을 제시한다. 그리고 반지름 개념을 적용하여 동일 위치에 지속적인 새로운 데이타 삽입 시에도 레이블의 길이가 증가하지 않으면서 기존 레이블의 변경을 초래하지 않는 방법을 제시한다. 또한 실험을 통해 제안하는 원형 레이블링 방법의 우수성을 보인다. 본 논문은 XML 문서를 원으로 이해하는 새로운 시도를 한 점과 XML 문서의 크기 증가 시 레이블 저장공간의 효율을 얻을 수 있는 점과 동적 XML 환경에서 새로운 데이타의 업데이트 시에 기존 노드들에 대해 레이블 재작성을 피할 수 있는 점에 의미가 있다.

공간 유사도와 주석을 이용한 이미지 검색 기법 (Image Retrieval Scheme using Spatial Similarity and Annotation)

  • 이수철;황인준
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권2호
    • /
    • pp.134-144
    • /
    • 2003
  • 이미지를 비롯한 멀티미디어 데이타의 검색시스템에서 객체들 간의 공간 관계는 이미지를 표현하는 중요한 요소 중의 하나이다. 본 논문에서는 기존의 검색 방식과는 달리 이미지에 나타나 있는 객체들간의 다양한 공간 관계와 각 객체들이 가지고 있는 특징을 이용한 새로운 방식의 이미지 검색 기법을 제안한다. 이것은 질의 이미지와 데이타베이스 내에 있는 이미지들 간의 유사성을 효율적으로 계산하는데 유용하다. 특히 각 객체들 간의 공간 정보와 그들의 특징들에 대한 정보들이 XML 형태로 주석 처리되어 있기 때문에 이전 검색 기법보다 정확하고 신속하게 질의를 처리한다. 마지막으로 제안된 검색기법을 이용한 이미지 검색 시스템을 구현하여, 실제 실험을 통하여 성능을 평가하였다.