• 제목/요약/키워드: XML Document Structure

검색결과 225건 처리시간 0.029초

XML 문서 검색을 위한 구조 기반 클러스터링 (Structure-based Clustering for XML Document Retrieval)

  • 황정희;류근호
    • 정보처리학회논문지D
    • /
    • 제11D권7호
    • /
    • pp.1357-1366
    • /
    • 2004
  • 웹에서 효율적인 정보 관리와 데이터 교환을 위해 XML의 중요성이 증가함에 따라 XML의 구조 통합과 구조 검색에 대한 연구가 진행되고 있다. 구조가 정의되어 있는 XML 문서의 구조 검색은 스키마 또는 DTD를 통해 가능하다 그러나 DTD나 스키마가 정의되어 있지 않은 XML 문서에 대한 검색은 기존의 검색 방법을 적용할 수 없다. 그러므로 이 논문에서는 구조 정보가 주어지지 않은 많은 양의 XML 문서를 대상으로 구조를 빠르게 검색하기 위한 기반 연구로써 새로운 클러스터링 기법을 제안한다. 먼저 각 문서로부터 빈발한 구조의 특성을 추출한다. 그리고 추출된 빈발 구조를 문서의 대표 구조로 하여 유사 구조기반의 클러스터링을 수행한다. 이것은 서로 다른 구조의 전체 문서를 대상으로 검색하는 것보다 신속하게 구조 검색을 할 수 있도록 한다. 또한 유사한 구조들로 그룹화되어 있는 클러스터들을 기반으로 XML 문서에 대한 구조 검색을 수행한다. 아울러 구조 검색의 적용 방법을 기술하고, 그에 대한 결과의 예를 보여 제안 기법의 효율성을 증명한다.

효율적인 검색을 위한 Tree 형태의 XML 문서 구조 모델 (XML Structured Model of Tree-type for Efficient Retrieval)

  • 김영란
    • 한국컴퓨터정보학회논문지
    • /
    • 제9권4호
    • /
    • pp.27-32
    • /
    • 2004
  • XML 문서가 DTD를 포함하지 않거나 여러 곳에서 XML문서를 모았을 때, 그 구조는 비정규적일 수 있다. 비정규적인 구조를 가지는 문서들에 대해 정확한 구조적 질의를 작성하는 것은 어려운 일이다. 이 논문에서는 XML 문서의 효율적인 관리와 검색을 위한 XML 문서 모델과 구조적 검색 방법을 제안한다. 이를 위해 XML 문서의 구조 정보를 표현하기 위해 엘리먼트에 대한 정보를 갖는 고정된 크기의 LETID를 사용하고, 구조 정보 검색을 위한 부모 및 자식 엘리먼트 검색 알고리즘을 제시하였다. 제안된 방법을 이용하여 XML 문서의 구조 정보를 효율적으로 표현할 수 있을 뿐만 아니라. 간단한 연산으로 특정 엘리먼트에 직접적인 접근과 다양한 질의 처리가 가능하다. 또한, 특정 엘리먼트의 부모. 자식, 형제에 대한 다양한 구조 검색을 효율적으로 지원할 수 있는 효과가 기대된다.

  • PDF

XML 기반 데이터 공유 Interface 설계 및 구현 (A Design and Implementation for Data Sharing Interface in based XML)

  • 김철원;김상영;박종훈
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2004년도 춘계종합학술대회
    • /
    • pp.424-428
    • /
    • 2004
  • XML 문서를 저장하고 검색하는 시스템에 관련된 연구가 활발하게 이루어지고 있으며, 이러한 시스템들은 효율적으로 XML 문서를 저장하고 검색할 수 있는 기능에 중점을 둔 경우가 많다. 또한 XML 문서를 저장하기 위해서 특별히 설계된 테이블이나 저장 구조를 가지고 있어서 XML 문서의 내용뿐만 아니라 문서의 구조 정보 둥도 같이 저장할 수 있으며 이를 바탕으로 XML 문서의 내용 검색이나 구조 검색 등을 효율적으로 할 수 있도록 하고 있다. 본 논문은 기존에 사용해 왔던 여러 종류의 데이터베이스들이 갖고 있는 데이터들을 그대로 재활용하여 XML 형식으로 변환하고, 이 XML 파일을 웹에서 공유하여 여러 가지 다양한 Interface를 통해 출력 될 수 있도록 설계, 구현하였다.

  • PDF

XML 문서 편집을 위한 추상문법 (An Abstract Grammar for XML Document Editing)

  • 신경희;최종명;유재우
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권3_4호
    • /
    • pp.268-277
    • /
    • 2003
  • 문서내의 태그를 정의하는 문서타입정의(DTD)는 구문구조를 정의하는 XML 문서문법으로 이문법에 따라 작성되는 XML 문서는 파싱처리로 적합성을 확인해야 한다. XML 문서의 적합성을 확인하기 위한 파싱 방법으로서 프로그래밍 언어의 결정적 파싱은 표준에서 언급한 모든 엘리먼트선언에 대한 결정적 내용 모델에 대한 정의를 만족할 수 없다. 이에 본 논문에서는 적합한 XML 문서 처리를 위하여 구문 편집환경에 초점을 맞추고 구문편집에 기본이 되는 DTD의 내부표현과 그에 따른 알고리즘에 대하여 기술한다. 문자열로 표현되는 DTD의 엘리먼트선언과 어트리뷰트선언의 문서 논리구조는 본 논문에서 제시하는 알고리즘에 의해 그래프구조와 데이블구조로 변환되고, 특히 테이블구조의 구문정보는 속성값을 갖는 문맥자유문법형태로 구문지향적 편집기에 이용되는 문법이 된다. 이 문법을 XML 추상문법이라고 하고 문법생성결과 및 구문편집 예를 보인다.

구조적 정보 검색을 위한 XQL 질의 처리 시스템 설계 (Design of XQL Query Processing System for Structural information retrieval)

  • 김상영;김철원;김광현;박종훈;정현철
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2003년도 추계종합학술대회
    • /
    • pp.892-896
    • /
    • 2003
  • XML은 단순히 웹 브라우저에 표시하기 위한 것을 넘어서 여러 다양한 시스템간, 어플리케이션간의 데이터 교환을 위한 인터페이스 포맷 등 다양한 분야에서 활용되고 있다. 이에 따라 정보의 생성, 재사용, 처리 및 지속성, 이식성 등 XML 문서를 효과적으로 관리하고 검색할 수 있는 시스템에 관한 많은 연구들이 진행되어 지고 있다. 본 논문에서는 XQL과 문서 구조 처리기와 질의 언어 처리기에 대해 설명하고 XML 문서의 내용을 트리구조로 만들어 구조정보를 파싱하는 동안 XQL을 이용해 질의에 맞는 XML 문서 트리 구조정보를 찾는 방법을 제시한다. 이를 통해 웹 상에 분산된 XML 문서를 병합하여 파싱한 후 문서의 구조 정보를 트리 구조로 구성하고 질의 언어로 제안되어진 XQL을 이용한 효율적인 XML 문서 검색 시스템의 설계 및 구현에 대하여 기술하였다.

  • PDF

웹 문서로부터 논리적 구조 추출 (Extracting Logical Structure from Web Documents)

  • 이민형;이경호
    • 한국멀티미디어학회논문지
    • /
    • 제7권10호
    • /
    • pp.1354-1369
    • /
    • 2004
  • 본 논문에서는 웹 문서를 XML 문서로 변환하기 위한 논리적 구조분석 방법을 제안한다. 제안된 방법은 비주얼 그룹화, 요소 식별, 그리고 논리적 그룹화의 세 단계로 구성된다. 특히 정교한 수준의 논리적 구조분석을 지원하기 위하여 특정 주제에 속하는 문서 유형의 논리적 계층 구조를 효과적으로 기술할 수 있는 문서 모델을 정의한다. 제안된 방법은 비주얼 그룹화를 통해서 추출된 시각적 계층구조와 문서 유형에 대한 논리적 구조 정보를 기술한 문서 모델에 기반하기 때문에 보다 정교한 수준의 구조 분석을 지원한다. 제안된 방법의 성능을 평가하기 위하여 웹으로부터 추출한 다수의 HTML 문서를 대상으로 실험한 결과, 기존 연구와 비교하여 논리적 구조분석을 성공적으로 수행하였다. 제안된 방법은 논리적 구조분석의 최종 결과로서 XML문서를 생성하기 때문에 문서의 재 사용성을 높인다.

  • PDF

기계 조립품 정보의 표현을 위한 XML기반 공용문서 구조 (Development of Common Document Structure based on XML for Representing Mechanical Part and Assembly Information)

  • 정태형;박승현;윤성원
    • 한국정밀공학회지
    • /
    • 제20권9호
    • /
    • pp.180-187
    • /
    • 2003
  • In engineering design environment it is hard to link design data and systems because the types of them are disparate. Therefore, the importance of metadata has increased. Some researches have been executed to develop metadata. But they cannot interact with other metadata and are difficult to extend. The purpose of this paper is to develop a common document structure which represents the general information of mechanical part assembly using XML, and to use it as base documents in order to integrate design data and systems. It is composed of part, assembly and user documents. Part document represents the information of a part independently to part type. Assembly document represents the location of constituent part documents. User document represents user's information. Common documents can be used as a broker between design data and systems, and it can improve the interpretability and reusability of document. We applied the developed common document structure to 2-stage spur gear drive.

DTD 전자서명을 이용한 XML문서의 보안성 향상 (Security Elevation of XML Document Using DTD Digital Signature)

  • 김형균;오무송
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2002년도 추계종합학술대회
    • /
    • pp.592-596
    • /
    • 2002
  • DTD는 XML 문서에 표현될 자료의 의미를 정의한 메타 데이터라고 할 수 있다. 따라서 DTD 정보가 손상될 경우 이 정보를 기반으로 한 XML 문서의 보안은 심각한 문제점을 가지게 된다. 본 연구에서는 XML 문서의 송수신 과정에서 XML 문서에만 전자서명을 첨부하는 것이 아니라, DTD 에도 전자 서명을 첨부하는 방법을 제안하였다. 먼저 DTD파일을 끝까지 읽으면서 파싱을 하고 여기서 추출되는 엘리먼트나 속성, 엔티티들을 해시테이블에 저장한다. 파싱이 종료되면 해시 테이블을 읽어 들여서 메시지 다이제스트를 수행한다. 수행 후 이를 개인 키와 합성하여 전자 서명을 생성한다. 전자 서명 시 메시지 다이제스트 과정에서 바꿔 순서에 대해서는 검사하지 못하기 때문에 전혀 다른 다이제스트 값을 생성하는 문제가 발생되는데, 이것은 표준화된 구조와 문서에 대한 트리구조를 구현할 수 있는 DOM을 이용하여 DTD의 전자 서명을 생성하는 방법으로 해결하였다.

  • PDF

구조화된 전자문서 생성을 위한 사용자 중심의 XML 문서편집 시스템 (XML document editing system that is creation for structural digital document)

  • 최일선;이용준;정회경
    • 한국정보통신학회논문지
    • /
    • 제7권3호
    • /
    • pp.513-518
    • /
    • 2003
  • 초기의 웹(Web)이 비구조적인 문서를 사용함으로써 발생하는 단점인 문서 처리와 교환 및 재사용성에 대한 해결책으로서 W3C(World Wide Web Consortium)에서 1998년 2월에 XML(eXtensible Markup Language)을 제정하였다. XML을 사용함으로써 기존 전자거래는 XML 기반 메시지 교환을 통한 기업간 전자거래 형태로 변화하고 있으며, 이러한 기업간 전자거래에 사용되는 XML 기반의 구조화된 전자문서를 저작할 수 있는 솔루션에 대한 필요성이 대두되었다. 이에 본 논문에서는 XML 문서를 효율적으로 편집 및 저작 할 수 있는 사용자 중심의 XML 인스턴스 편집기와 XML 문서의 구조를 정의하는 XML 스키마 문서를 저작하기 위한 XML 스키마 편집기를 통합한 XML 문서편집 시스템에 관한 연구를 하였다.

구조화된 전자문서 생성을 위한 사용자 중심의 XML 문서편집 시스템에 관한 연구 (Study of XML document editing system that is creation for structural digital document)

  • 차원준;황재각;이용준;정회경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2003년도 춘계종합학술대회
    • /
    • pp.277-280
    • /
    • 2003
  • 초기의 웹(Web)이 비구조적인 문서를 사용함으로써 발생하는 단점인 문서 처리와 교환 및 재사용성에 대한 해결책으로서 W3C(World Wide Web Consortium)에서 1998년 2월에 XML(extensible Markup Language)을 제정하였다. XML을 사용함으로써 기존 전자거래는 XML 기반 메시지 교환을 통한 기업간 전자거래 형태로 변화하고 있으며, 이러한 기업간 전자거래에 사용되는 XML 기반의 구조화된 전자문서를 저작 할 수 있는 솔루션에 대한 필요성이 대두되었다. 이에 본 논문에서는 XML 문서를 효율적으로 편집 및 저작 할 수 있는 사용자 중심의 XML 인스턴스 편집기와 XML 문서의 구조를 정의하는 XML 스키마 문서를 저작하기 위한 XML 스키마 편집기를 통합한 XML 문서편집 시스템에 관한 연구를 하였다.

  • PDF