• 제목/요약/키워드: XML 트리

검색결과 206건 처리시간 0.029초

BRS/Search 시스템을 이용한 XML 문서 검색시스템 설계 및 구현 (Design and Implementation of a XML Document Retrieval System Using the BRS/Search System)

  • 손충범;이병엽;유재수
    • 인터넷정보학회논문지
    • /
    • 제2권2호
    • /
    • pp.51-63
    • /
    • 2001
  • 본 논문에서는 상용 검색 엔진인 BRS/Search 시스템을 이용하여 XML문서에 대한 구조 기반 검색이 가능하도록 XML문서 검색시스템을 설계하고 구현한다. 본 논문에서 구현한 시스템은 XML문서의 논리적인 구조를 Unix 파일시스템의 디렉토리 구조로 표현한다. 이렇게 표현된 XML 문서를 BRS/Search 시스템의 데이터베이스에 정보의 손실 없이 저장하기 위해 데이터베이스 스키마를 정의하고 내용 검색뿐만 아니라, 구조 검색, 혼합 검색, 애트리뷰트 검색이 가능하도록 BRS/search 시스템에 부가적으로 필요한 ETID 추출기, 구조정보 추출기, 저장 관리기, 질의 처리기를 설계하고 구현한다.

  • PDF

불완전 XML 문서의 파싱 (Parsing of Incomplete XML Document)

  • 조용윤;유재우
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.589-592
    • /
    • 2004
  • 대표적인 웹 문서의 표준인 XML(eXtensible Markup Language)은 문서의 구조와 내용을 기술하기 위해 태그(tag)로 이루어진 문법 구조를 이용한다. 일반적인 텍스트 에디터 환경에서 XML 문서에 입력되는 내용(contents)과 그것을 포함하는 태그의 쌍은 완전하지 못한 형태로 입력될 수 있다. XML 문서를 작성하는 과정에서 문법적으로 불완전한 문장 입력은 정상적인 파싱을 보장하지 않는다. 본 논문은 XML 문서 편집기에 사용될 수 있는 XML 파서가 문법적으로 불충분한 문장의 입력에 대해 문법에 따라 빠진 부분을 인식하고, 누락된 문법 심벌을 찾아 부족한 부분 파스 트리를 완성함으로써 사용자에게 성공적인 XML 문서 편집을 보장할 수 있는 파싱 방법을 제안한다. 제안된 파싱 방법을 통해 사용자는 프로그래밍 편집 중 문법 오류에 대한 부담을 줄일 수 있다. 또한, 사용자는 불완전 입력에 대해 일반적인 에러 처리에 따른 편집 중단 없이 계속적인 문서 파싱을 보장받아 편집 효율을 높일 수 있다.

  • PDF

XML을 위한 효율적인 저장구조 및 인덱싱 기법설계 (Design of Efficient Storage Structure and Indexing Mechanism for XML Documents)

  • 신판섭
    • 한국컴퓨터산업학회논문지
    • /
    • 제5권1호
    • /
    • pp.87-100
    • /
    • 2004
  • 최근에 인터넷의 급속한 발전과 더불어 대량의 정보를 효과적으로 표현 및 교환할 수 있는 새로운 데이터 표준으로 XML (extensible Markup Language)이 제안되었으며, XML 문서에 대한 저장과 인덱싱에 대한 연구가 활발하게 진행되고 있다. 본 논문에서는 실시간 XML 문서 처리에 효율적인 주기억장치 기반의 XML 전용 저장 시스템을 설계하고, 사용자 질의에 포함된 엘리먼트 타입 정보를 이용하여 XML 문서트리에 대한 순회를 최소화시킬 수 있는 구조적 검색 기법을 설계한다 또한, 엘리먼트의 삭제 및 삽입 등 동적인 변경에 빠르고 유연하게 대처할 수 있는 인덱스 구조와, 링크 정보를 가지고 있는 XML 문서의 질의 처리를 위해 XLink 표준을 준수하여 테이블 형식의 링크 정보 인덱스 구조를 설계한다.

  • PDF

인터넷 쇼핑몰에서 암호화된 XML/EDI를 위한 DTD 전자서명에 관한 연구 (A Study on the DTD Digital Signature for Cryptographic XML/EDI in an Internet Shopping Mall)

  • 홍성표;김형균;이준
    • 한국정보통신학회논문지
    • /
    • 제7권3호
    • /
    • pp.519-525
    • /
    • 2003
  • XML의 등장으로 기존의 EDI를 전자상거래 환경에 맞게 발전시킨 기술이 XML/EDI이다. DTD는 XML 문서에 표현될 자료의 의미를 정의한 메타 데이터라고 할 수 있다. 따라서 DTD 정보가 손상될 경우 이 정보를 기반으로 한 XML 문서의 보안은 심각한 문제점을 가지게 된다. 본 연구에서는 인터넷 쇼핑몰에서 암호화된 XML/EDI를 위하여 XML 문서에만 전자서명을 첨부하는 것이 아니라, DTD에 전자서명을 첨부하는 방법을 제안하였다. 전자서명 시 메시지 다이제스트 과정에서 바꿔 순서에 대해서는 검사하지 못하기 때문에 전혀 다른 다이제스트 값을 생성하는 문제가 발생되는데, 이것은 표준화된 구조와 문서에 대한 트리구조를 구현할 수 있는 DOM을 이용하여 DTD의 전자서명을 생성하는 방법으로 해결하였다.

구조 및 의미적 유사성에 기반한 XML 문서들의 효율적인 저장을 위한 통합 기법 (The study of integration techniques for storing XML documents efficiently based on structures and semantics)

  • 김연희;김병곤;이재호;임해철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.590-592
    • /
    • 2003
  • 최근 XML이 웹 상의 데이터의 표현, 교환, 중재의 표준으로 각광받으면서 이러한 XML 문서를 효과적으로 저장, 접근 및 검색하기 위한 기법에 대한 연구가 많았으나, 기존의 연구들은 하나의 XML 문서를 저장 및 검색의 대상으로 하는 경우가 대부분이였다. 그러나 XML 문서를 데이터의 표현과 교환의 표준으로 이용하는 애플리케이션의 개발이 점차 활성화됨에 따라 저장해야하는 XML 문서의 수가 크게 증가하면서 의미나 구조적으로 많은 유사성을 지니는 XML 문서들을 함께 효율적으로 저장하고 검색하기 위한 기법의 연구가 요구된다. 따라서 본 논문에서는 의미 및 구조적으로 유사성을 가지는 여러 XML 문서들을 통합하는 기법을 제안한다. 제안된 통합 기법은 같은 DTD나 XML Schema를 가지는 경우와 다른 DTD나 XML Schema를 가지는 경우를 모두 고려한다. 또한 특별한 구조적 정보를 가지지 않는 XML 문서의 경우도 다른 DTD나 XML Schema를 가지는 경우와 마찬가지로 처리함으로써 다양한 XML 문서들에 대한 통합이 가능하도록 한다. 이러한 통합 기법은 중복되는 엘리먼트나 애트리뷰트에 대한 저장 공간의 낭비를 최소화한다. 또한 의미적으로 또는 구조적으로 관련성있는 여러 XML 문서의 부분들을 디스크 상의 페이지내에 서로 가까이 저장할 수 있기 때문에 사용자의 일반적인 질의에 대해 효율적이고 빠른 검색 결과를 유도할 수 있고, I/O 횟수를 줄임으로써 그에 따른 오버헤드를 줄일 수 있는 장점이 있다.

  • PDF

도메인 온톨로지에 기반한 XML 스키마의 통합 (Integration of XML Schemas Based on Domain Ontology)

  • 강혜란;이경호
    • 한국멀티미디어학회논문지
    • /
    • 제11권7호
    • /
    • pp.940-955
    • /
    • 2008
  • 동일한 도메인에 속하고 의미가 유사한 XML 문서들이라도 서로 다른 XML 스키마를 따르는 경우가 많다. 그러므로 XML 문서로부터 정보를 추출하고 통합하기 위해서는 의미가 유사한 XML 스키마들을 통합하는 방법이 필요하다. 본 논문은 동일한 도메인에서 사용되는 XML 스키마들을 의미를 정확하게 보존하면서 통합하는 방법을 제안한다. 제안된 방법은 사전과 함께 도메인 온톨로지를 이용하여 어휘 간 유의어 및 상하위어 관계를 검사하고 이를 스키마 통합 과정에 활용한다. 특히 본 논문은 엘리먼트 및 애트리뷰트가 갖고 있는 구조적 정보를 활용하여 유의어 및 상하위어 관계를 보다 정확하게 검사한다. 그리고 정교한 수준의 연산자 통합과 연산자 최적화 규칙을 제안한다. 제안된 방법의 성능을 평가하기 위해서 다양한 도메인의 XML 스키마를 대상으로 실험한 결과, 도메인 온톨로지와 제안된 방법의 어휘 간 구조적 관계를 이용할 경우 통합 스키마의 정확률과 재현율이 향상됨을 확인하였다.

  • PDF

KIMF를 이용한 XML 인덱싱 알고리즘 설계 및 구현 (Design and Implementation of XML-Based Indexing Algorithm Using KIMF)

  • 김광남;윤희병;김화수
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2004년도 춘계학술대회 학술발표 논문집 제14권 제1호
    • /
    • pp.13-16
    • /
    • 2004
  • XML은 사용자 정의 태그를 이용한 정보 제공의 장점으로 인하여 웹 뿐만 아니라 EDI, CALS, RDF, HDML, WML둥 많은 분야에서 사용하고 있다. 그러나 XML 문서는 다양한 사용자 정의를 포함하기 때문에 사용자 질의에 대하여 효율적으로 응답하기 위해서는 내용기반 질의로부터 구조, 내용과 구조가 포함된 질의까지 해결해 줄 수 있는 인덱싱 기법이 필요하다. 이를 해결하기 위해 DTD를 이용한 방법, K-ary 완전트리, 추상화기법, SCL 등이 제시되었으나 XML 노드의 거리관계를 이용한 방법은 제시되지 않았다. 본 논문에서는 국방대 인덱싱 모델 프레임워크인 KIMF를 이용하여 효율적으로 XML 문서를 인덱싱하고 설계 및 구현한다. 이를 위해서 KIMF 모듈에 대한 구성도를 제시하고, 깊이탐색과 최단거리, 깊이 차이를 이용하여 XML 문서를 인덱싱하는 알고리즘을 제안한다. 마지막으로 C#을 이용하여 제안한 알고리즘을 설계 및 구현하고, 이를 기반으로 한 내용검색, 구조검색 및 혼합(내용+구조) 검색 결과를 또한 제시한다.

  • PDF

Inlining 알고리즘을 이용한 XML DTD 매칭 방법에 관한 연구 (A Study for XML DTD Matching Method using Inlining Algorithm)

  • 허보진;김형석;김창석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (하)
    • /
    • pp.1505-1508
    • /
    • 2003
  • XML DTD 매칭은 데이터 통합이나 데이터 웨어하우스, 웹 마이닝, 전자상거래, 의미적 질의 처리등과 같은 데이터베이스 관련 응용분야에서 수행해야 할 근본적인 연구 분야이다. 웹이 발전됨에 따라 웹 상의 데이터 교환의 표준인 XML로 많은 데이터를 표현하게 되었고, 이 XML DTD에 대한 매칭이 주된 연구 분야로 대두되었다. XML 스키마는 플랫 구조인 기존의 관계형 데이터베이스 스키마와는 달리 계층적인 트리 구조로 이루어져 DTD를 직접 비교하기가 어렵다. 본 논문에서는 계층적 구조인 XML DTD의 계층적 구조 정보와 무결성 제약조건을 추출하여 일차원적인 직렬 구조로 변환한 후, 유사한 DTD를 매칭하는 방법을 제안한다.

  • PDF

XSL-fo를 적용한 XML 문서 표현 시스템의 설계 및 구현 (Design and Implementation of XML Document presentation that apply to XSL-fo)

  • 이형문;강치원;정회경
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.191-193
    • /
    • 2000
  • 인터넷 표준 문서인 XML(Extensible Markup Language)이 구조적인 내용만을 갖고 있기 때문에 문서를 보여주기 위한 표현 정보를 포함하는 스타일 시트(style sheets)가 필요하다. 이를 위해 W3C(World Wide Web Consortium)에서는 XML 문서의 구조적인 접근을 위한 XPath(XML Path Language)와 문서의 내용구조를 변환하기 위한 XSLT (Transformations), 그리고 포맷팅 정보를 위한 XSL-fo(XSL Formatting objects)로 구성되는 XSL(Extensible Stylesheet Language)를 제안하였다. 본 논문에서는 XML 문서와 XSL 스타일 시트를 이용하여 XML 문서의 데이터를 변환하고 XSL-fo 정보를 이용하여 결과 FO(Formatting Objects)를 생성한다. 또한 트리로 구성된 결과 FO에서 페이지 정보와 FOT (Formatting Objects Tree)를 추출하는 FOT 생성부를 두었고, 디스플레이 관리기와 포맷팅 모듈 객체 관리기를 두어 FOT를 포맷팅을 위한 모듈로 저장하고 디스플레이 해주는 포맷팅 처리 시스템을 설계 및 구현하였다.

  • PDF

객체지향형 데이터베이스를 이용한 XML 문서 저장 시스템 설계 (Design of an XMl Document Storage System using Object Oriented Database)

  • 김영일;신동욱;권택근;김형선
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.63-65
    • /
    • 1999
  • 최근 인터넷을 통한 정보 교환을 위해 XML(eXtensible Markup Language)에 대한 저장 및 검색에 대한 연구가 활발히 진행되고 있다. 본 연구에서는 객체지향형 데이터베이스를 이용하여 대량의 XML문서에 대한 저장 및 검색을 지원하는 XML 문서 저장 시스템을 설계하였다. 제안하는 데이터 모델은 XML 문서의 삽입 및 갱신이 용이하도록 분할 방식을 사용하였으며, 객체지향형 데이터베이스에서 구조정보를 추출하기 위한 새로운 모델을 제시하고 있다. XML 문서의 주된 구조정보를 갖는 엘리먼트와 에트리뷰트를 DTD별로 저장하고, 하나의 DTD를 따르는 문서 인스턴스들에 대한 관계를 리스트롤 이용하여 저장해 둠으로서 객체지향형 데이터베이스 내에서 임의의 위치에 존재하는 객체에 대한 접근을 빠르게 지원할 수 있도록 설계하였다.

  • PDF