• 제목/요약/키워드: XML 압축

검색결과 21건 처리시간 0.036초

타입 정보 추출을 통한 질의 가능 XML 압축 (A Queriable XML Compression Through An Extraction of Type Information)

  • 박명제;민준기;정진완
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.554-556
    • /
    • 2003
  • 인터넷에서 널리 사용되는 HTML은 현재 데이터베이스 시스템과 같은 저장소 대신, 전형적인 파일 시스템에 저장되는 경우가 대부분이다. 마찬가지로 최근에 인터넷 상에서의 데이터 교환 및 표현의 표준으로 부각되는 XML 역시 파일 시스템에 저장되는 경우가 많다. 하지만, XML 문서의 비정규적인 구조와 장황성 때문에. 디스크 공간이나 네트워크 대역폭이 정규적인 구조의 데이터에 비해 비효율적이다. 따라서. 이를 해결하고자. XML 문서의 압축에 관한 연구가 진행되었다. 하지만. 최근에 연구된 XML 압축 기법들은 압축한 XML 문서에 대한 질의를 지원하지 않거나, 질의를 지원하더라도 XML 문서의 데이터 값들의 특성을 고려하지 않고 단순히 기존의 압축 방법을 통해 XML 문서를 압축한다. 그러므로 본 연구에서는 압축한 XML 문서에 대한 질의를 효율적으로 지원하는 XML 압축 기법을 제안한다. 본 연구에서는 태그를 Dictionary 압축으로 압축하며 태그 별로 데이터 값들의 타입을 추출하여 추출한 타입에 적절한 압축 방법으로 데이터 값을 압축한다. 또한, 제안하는 압축 기법의 구현 및 성능 평가를 통하여. 구현한 시스템이 실생활에 사용되는 XML 문서들을 효율적으로 압축하며 향상된 질의 성능을 제공하는 것을 보인다.

  • PDF

추론한 데이타 타입을 이용한 질의 가능 XML 압축 (A Queriable XML Compression using Inferred Data Types)

  • 박명제;민준기;정진완
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권4호
    • /
    • pp.441-451
    • /
    • 2005
  • HTML은 데이타베이스와 같은 특수한 형태의 저장소 대신, 전형적인 파일 시스템에 저장되는 경우가 대부분이다. 이와 마찬가지로, 최근 인터넷 상에서의 데이타 교환 및 표현의 표준으로 부각되는 XML 역시 파일 시스템을 통하여 저장되는 경우가 현저하다. 하지만, XML 문서가 지니는 비정규적인 구조와 장황성 때문에, 디스크 공간이나 네트워크 상의 대역폭의 사용이 정규적인 구조를 지니는 데이터에 비해 크다. 이러한 XML 문서의 비효율성을 해결하고자, XML 문서의 압축에 관한 연구가 진행되었다. 최근에 연구된 XML 압축 기법들을 살펴보면, 압축된 XML 문서에 대한 질의를 전혀 지원하지 않거나, 질의를 지원하더라도 XML 문서 내의 데이타 값들의 특성을 고려하지 않고 단순히 기존의 압축 방법들을 적용하기 때문에 영역 질의를 지원하기 위해서는 압축의 일부를 복원해야 한다. 그 결과, 압축된 XML 문서에 대한 질의 성능이 저하되었다. 따라서, 본 연구에서는 압축된 XML 문서에 직접적이고 효율적인 질의를 지원하는 XML 압축 기법을 제안하고자 한다. XML 문서의 각 태그를 사전 압축 방법을 사용하여 압축하고자 하며, 태그 별로 데이타들의 타입을 추론하여 추론된 타입에 적절한 압축 방법을 사용하여 데이타 값들을 압축하고자 한다. 또한, 제안하는 압축 기법의 구현 및 성능 평가를 통하여, 구현한 XML 압축기가 실생활에 사용되는 XML 문서들을 효율적으로 압축하며 압축된 XML 문서에 대해 향상된 질의 성능을 제공하는 것을 보인다.

압축된 문서에 대한 질의 처리를 지원하는 XML 압축 알고리즘의 설계 및 구현 (Design and Implementation of a XML Compression Algorithm Supporting Query Processing for Compressed Documents)

  • 이석재;강영준;유재수;조기형
    • 한국콘텐츠학회논문지
    • /
    • 제4권1호
    • /
    • pp.90-99
    • /
    • 2004
  • 인터넷의 급속한 확산에 따라 사회 전반의 디지털화와 지식정보화가 급속도로 진행되고 있다. 많은 사용자들은 웹 상에서 다양한 작업을 하고 서비스를 이용하고 있다. 이러한 작업들의 대부분은 XML을 이용한다. XML은 개발자가 필요시 문서의 논리 구조를 정의할 수 있으며, 내용과 스타일이 분리되어있어 문서의 재사용성이 뛰어나다. 하지만 XML은 문서의 내용을 단순히 텍스트 형태로 다루고 문서의 구조를 표현하기 위해 많은 태그들이 추가되기 때문에 문서의 크기가 커질 수 밖에 없다. 팜탑, PDA등 용량이 제한된 기기에서 XML 문서를 보다 잘 활용하기 위해서는 XML문서를 효율적으로 압축해서 사용할 필요가 있다. 이러한 이유로 최근 XML 문서를 효과적으로 압축하고 다루기 위한 XML 압축 기법에 대한 연구가 일부 이루어지고 있지만, 기존 연구들의 대부분은 압축된 XML문서에 대한 질의 처리를 고려하지 않았다. 본 연구에서는 기존의 방법들보다 XML 문서를 효과적으로 압축을 하여 저장 공간의 활용도를 놓이고, 압축된 XML 문서에 대해 질의처리를 가능하게 하여 보다 빠른 질의 처리를 할 수 있는 XML 압축 알고리즘을 설계 및 구현한다.

  • PDF

압축된 문서에 대해 질의 처리를 지원하는 XML 압축 알고리즘 (The XML Compression Algorithm Supporting Query Processing For Compressed Documents)

  • 강영준;이석재;유재수
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2003년도 추계종합학술대회 논문집
    • /
    • pp.195-203
    • /
    • 2003
  • 인터넷의 급속한 확산에 따라 사회 전반의 디지털화와 지식정보화가 급속도로 진행되고 있다. 특히 많은 사용자들은 웹상에서 다양한 작업을 하고 서비스를 이용하고 있다. 이러한 작업들의 대부분은 XML을 이용한다. XML은 개발자가 필요시 문서의 논리구조를 정의할 수 있으며, 내용과 스타일이 분리가 되어 있어서 문서의 재사용성이 뛰어나다. 하지만 XML은 기본적으로 문서의 내용을 단순히 텍스트형태로 다루고 문서의 구조를 표현하기 위해 많은 태그들이 추가되기 때문에 문서의 크기가 커질 수 밖에 없다. 팜탑. PDA등의 제한된 용량을 보다 잘 활용하기 위해서는 문서를 효율적으로 압축해서 사용할 필요가 있다. 이를 해결하기 위해 최근 XML문서를 효과적으로 압축하고 다루기 위한 XML 압축 기법에 대한 연구가 일부 이루어지고 있지만, 기존 연구들의 대부분은 압축된 XML문서에 대한 질의 처리를 고려하지 않았다. 이에 본 연구에서는 기존의 방법들보다 효과적으로 압축을 하여 저장 공간의 효율성을 높이고, 압축된 XML 문서에 대해 질의처리를 가능하게 하여 보다 보다 빠른 질의 처리를 할 수 있는 XML 압축 알고리즘을 설계 및 구현하고자한다.

  • PDF

XML 기반의 통합 임상정보를 효율적으로 저장하기 위한 XML 압축 기법에 대한 연구 (A Study on XML Compress method for efficient integration and storing of XML-based Clinical Information)

  • 유의혁;정종일;이태헌;신동규;신동일
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.71-74
    • /
    • 2005
  • 임상정보 문서는 환자 진료기록뿐만 아니라 처방전, 개인적 유전자정보를 가지고 있다. 이러한 임상 정보 문서는 병원 시스템들간에 교환 및 공유함으로써 양질의 의료서비스를 제공할 수 있다. 이와 관련하여 임상정보의 통합을 위한 기존의 연구들은 각각 HL7 메시지를 XML 문서로 변환하고 XML 기반의 CDA 를 관계형 데이터베이스에 저장하는 연구가 진행되었다. 그러나 관계형 데이터베이스는 문서의 데이터 별 테이블 단위로 생성, 저장된다. 그러나 HL7 과 CDA 는 문서 중심의 XML 문서이기 때문에 관계형 데이터베이스에 저장 시 문서 별 많은 변이가 존재하여 테이블 증가를 갖는다. 따라서 비정규적인 구조에 적합한 데이터베이스를 선택하기 위해 XML 전용 데이터베이스와 관계형 데이터베이스 비교하고 효율적 저장을 위해 압축기법을 제시한다. 압축기법을 적용한 임상 정보 데이터베이스는 대용량 임상정보 문서의 크기를 압축함으로써 문서의 크기를 줄임으로써 데이터베이스의 효율적 저장을 향상시킨다.

  • PDF

스키마를 이용한 XML 문서의 압축과 복원 (Compression/Decompression of XML Instance Documents Conforming to a Schema)

  • 염지현;김혁만
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (D)
    • /
    • pp.157-160
    • /
    • 2006
  • 본 논문은 MPEG-7 BiM 규격에 따라 XML 스키마 정의를 기반으로 바이너리 형태로 압축하고 복원하는 시스템의 구현에 관한 것이다. MPEG-7 BiM 압축기 및 복원기의 세부 모듈과 기능을 서술하고, 설계 및 구현방법을 제안한다. 구현된 MPEG-7 BiM 압축기 및 복원기는 대역폭의 제약이 심한 방송 분야에서 메타데이터 전송을 위한 핵심 모듈로 사용 될 수 있다.

  • PDF

관계형 XML 가지 패턴 질의를 위한 비트맵 인덱스와 질의 처리 기법 (Bitmap Indexes and Query Processing Strategies for Relational XML Twig Queries)

  • 이경하;문봉기;이규철
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제37권3호
    • /
    • pp.146-164
    • /
    • 2010
  • XML 데이터 량의 증가에 따라 DBMS를 이용한 XML 데이터의 저장 관리 기법들이 고안되었다. 하지만, 현재의 가지 패턴 질의 처리 알고리즘들은 XML 데이터를 태그 또는 임의 단위로 분할되고, 각 항목들이 특정 순서로 정렬된 역 리스트들을 입력으로 한다. 이러한 저장 기법의 불일치는 관계형 테이블에 나뉘어 저장되는 XML 데이터의 질의 처리에 이 알고리즘들의 적용을 어렵게 한다. 이 논문에서는 관계형 테이블에 저장된 XML 데이터에 대한 홀리스틱 가지 조인을 지원하기 위한 비트맵 인덱스와 이를 이용한 질의 처리 기법을 제안한다. 비트맵 인덱스는 많은 데이터베이스 시스템에서 지원하므로, 제안하는 인덱스와 가지 질의 처리 기법은 관계형 질의 처리 프레임워크에서 보다 이식이 용이하다. 제안하는 인덱스 기법은 압축을 통해 인덱스 크기를 줄이면서도 질의 처리시 압축해제가 불필요해 시간과 공간 효율적이다. 또한, 이 논문에서는 비트맵 인덱스만을 이용해 XML 노드들 간의 관계성을 식별함으로써, 가지 패턴 질의 처리를 레코드에 저장된 XML 데이터의 접근 없이 수행할 수 있는 혼합 인덱스를 제시한다.

XML 웹서비스 기반 멀티미디어 CMS 구현 (Implementation of Multimedia CMS Based on XML Web Service)

  • 이준희;조용환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (3)
    • /
    • pp.55-57
    • /
    • 2003
  • 멀티미디어 콘텐츠 서비스에서는 멀티미디어 콘텐츠 생성, 압축, 전송 등 멀티미디어 콘텐츠를 보다 효과적이고 효율적으로 처리해 언제 어디서든 쉽게 서비스를 받고 콘텐츠의 효율적인 구축 및 관리가 매우 필요하다. 본 논문에서는 XML 웹서비스를 통한 멀티미디어 CMS를 구현하였다. 제안 시스템의 실험 결과 멀티미디어 콘텐츠의 생성, 업데이트, 디자인 변경 속도가 향상되었고 콘텐츠 및 사이트의 품질 향상과 유지 보수 비용이 감소되는 결과를 얻었다.

  • PDF

모바일 환경에서의 이진 부호화된 XML 문서를 위한 복호기 설계 및 구현 (Design and Implementation of Decoder for Binary Encoded XML Document on Mobile Environment)

  • 유정수;낭종호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (B)
    • /
    • pp.411-415
    • /
    • 2008
  • 최근 멀티미디어 응용에서 XML은 메타데이터를 표현하기 위하여 그 사용량이 증가하고 있는 추세이며, 그 예로는 MPEG-7 MDS, MPEG-21등이 있다. 이러한 XML형식의 메타데이터의 크기를 줄이기 위하여 MPEG-7에서 정의한 포맷이 Binary Format for Metadata(BiM)이다. BiM은 스트리밍을 고려하여 단편화를 통한 점진적인 전송이 가능하며, 압축률이 높고 복호화에 따르는 오버헤드가 작다는 장점을 제공한다. 본 논문에서는 BiM에 대한 간단한 소개와 모바일 환경에 적합하도록 구현한 BiM 복호기의 설계 및 구현에 대하여 소개한다.구현한 복호기는 모바일 환경의 다양한 플랫폼에서의XML 파싱 모듈과 DOM 트리모듈에 대한 종속성을 제거하기 위하여, 스키마 파일의 파싱을 데스크탑에서 수행하고 이에 대한 파싱 결과를 자체 정의한 Syntax File 형식으로 복호기에 전송할 수 있도록 하였다. 또, BiM형태로 전송되는 ESG 메타데이터와 MPEG-4 LASeR 스트림에 대하여 Windows, Windows CE, embeded Linux 환경에서 정상적으로 복호화 하는 것을 확인하였다.

  • PDF

XML 기반 의료 문서의 압축전송 (Compress transmission of XML-based Clinical Document)

  • 유의혁;정종일;신동규;신동일
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.250-252
    • /
    • 2005
  • XML 기반의 CDA는 의료정보 데이터로써 환자의 개인정보, 과거 의료정보, 가족기록 및 검사기록 등 의료정보를 저장한다. 의료정보 데이터는 병원 시스템간에 교환 및 공유함으로써 양질의 의료서비스를 제공되고 데이터베이스에 저장되어 관리된다. 그러나 다양한 의료정보는 의료정보 문서 자체의 크기를 증가시키기 때문에 데이터베이스에 저장 시 공간증가와 저장시간 그리고 데이터의 전송 시 송,수신 시간을 증가한다. 따라서 의료정보 문서의 크기를 감소시켜 문서 처리시간을 단축시킴으로써 처리 효율성을 증가시킨다.

  • PDF