• 제목/요약/키워드: XML DTD 통합

검색결과 66건 처리시간 0.025초

유사 구조를 가지는 XML 문서들의 DTD 통합 알고리즘 (A Unification Algorithm for DTDs of XML Documents having a Similar Structure)

  • 유춘식;우선미;김용성
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권10호
    • /
    • pp.1400-1411
    • /
    • 2004
  • 논리적으로 동일한 종류에 속하여 서로 유사한 구조를 가지는 많은 XML 문서들이 서로 다른 종류로 분류되어 서로 다른 문서형 정의(DTD)를 가지게 되는 경우가 많다. 이로 인하여 XML 문서를 저장하기 위한 데이타베이스의 스키마가 서로 다르게 되고, 동일한 데이타베이스에 저장되어야 하는 XML 문서들이 서로 다른 데이타베이스에 저장되는 문제점이 발생하게 된다. 이러한 문제점을 해결하기 위하여 본 논문에서는 유한 오토마타와 트리구조를 이용하여 유사한 구조를 가지는 XML 문서들의 DTD를 통합하는 알고리즘을 제안한다. 유한 오토마타는 DTD의 반복연산자나 연결자를 표현하기에 적합하고 표현 방법이 단순하므로 DTD 통합 알고리즘의 복잡도를 감소시킬 수 있다. 또한 제안한 알고리즘의 효과성을 검증하기 위하여 국내 학회 논문지의 논문 DTD를 통합하는데 본 논문에서 제안한 알고리즘을 적용한다.

통합 DTD를 이용한 폼(Form) 기반 XML 편집 및 변환 시스템 개발 (Development of a Form-based XML Editing and Converting System Using Integrated DTD)

  • 손원성;이현찬;김재경;최윤철;유범종
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2000년도 추계학술발표논문집
    • /
    • pp.3-7
    • /
    • 2000
  • 전자문서를 정의하기 위해서는 구조문서 정의가 가능한 SGML(Standard Generalized Markup Language) 및 XML(eXtensible Markup Language), 그리고 웹문서를 위한 HTML을 이용할 수 있다. 그러나 SGML은 매우 복잡한 구문을 포함하기 때문에 일반 사용자들이 쉽게 사용하기가 어렵고 HTML은 비 구조적인 문서정보 및 스타일 정보를 포함하기 때문에, 근래에 개발된 대부분의 전자문서 시스템에서는 XML을 응용하고 있다. 전자문서 시스템은 복잡한 구조의 다양한 문서들을 포함하고 있으며 이러한 문서들은 DTD를 정의하고 있기 때문에 DTD의 구조 정의 및 관리가 매우 비효율적이다. 따라서 본 연구에서는 다양한 구조를 모두 표현할 수 있는 통합 DTD를 정의하고 이를 효율적으로 관리 및 처리하기 위한 폼 기반 구조문서 처리 방법을 제안한다. 통합 DTD와 폼을 통하여 사용자는 폼 단위의 문서 인스턴스만을 입력 및 편집함으로써 복잡한 DTD 구조에 독립적으로 문서를 처리할 수 있으며, 처리된 문서는 DTD에 위배되지 않는 정확한 XML 인스턴스가 된다. 또한 기존의 HTML문서를 XML로 변환하기 위하여 본 논문에서는 누구나 손쉽게 사용할 수 있는 중간단계(semi-auto)의 XML 변환시스템을 제공한다. 그 결과 본 연구에서 개발한 시스템에서는 다양하고 복잡한 문서에 대하여 효율적인 문서구조가 가능하고, XML문서를 폼을 이용하여 누구나 쉽고, 정확하게 작성할 수 있다. 그리고 웹에서 사용된 HTML 문서를, 본 연구에서 정의한 통합 DTD구조에 일치하는 XML 문서로 간단히 변환할 수 있다.

  • PDF

메타정보 인터페이스를 이용한 이질 구조 분석 XML문서 통합 검색 (Integrated Information Retrieval with Metadata Interface for Heterogeneous Distributed XML Documents)

  • 류성준;황재문;김태훈;남영광
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권11호
    • /
    • pp.1505-1518
    • /
    • 2004
  • 본 논문은 구조적, 의미론적 이질성을 가진 분산 XML 문서의 통합 검색을 위해 반자동으로 생성된 인터페이스를 통해 각 지역 문서에 대한 질의를 생성하여 검색하는 방법을 제안한다. 본 시스템에서는 데이타 통합을 위한 메타데이타 인터페이스인 DDXMI(Distributed Documents XML Metadata Interface)를 정의하고, 분산 데이타에 대한 DTD를 입력으로 받아 사용자로 하여금 전역 DTD와 각 지역 DTD 간의 의미 차이를 극복하기 위한 사용자 인터페이스 생성 방법을 제안하였다. 전역 DTD와 지역 DTD의 특성을 고려하여 인덱스 매핑과 그에 필요한 함수 이름의 매핑 정보를 기반으로 DDXMI가 자동으로 생성된다. XML 질의 언어인 Quilt를 사용하여 생성된 DDXMI를 통해 각 지역 문서에 적합한 질의를 생성, 수행한다 사용자는 검색 대상 문서의 스키마와 통합스키마의 구조를 잘 알고 있다고 가정하였다. XML로 만들어진 석박사 논문, 논문지, 연구보고서에 대한 소규모, 중규모 전역 DTD를 만들어 실제로 질의를 생성하여 검색 결과를 검증할 수 있도록 하였다. 본 시스템은 JavaCC와 Java 서블릿을 이용하여 개발하였다.

XML의 View DTD를 이용한 웹 상의 정보통합 및 검색 (Information Integration and Search on the Web using XML View DTD)

  • 홍석일;양정욱;홍동완;윤지희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.231-233
    • /
    • 2000
  • 인터넷에 산재해 있는 분산 이질의 대규모 정보들을 통합, 관리하기 위한 기본 모델로서 최근 정보교환 표준으로 인정받고 있는 XML을 사용할 수 있다. HMS(Hallym Mediator System)는 XML을 기본 데이터 모델로 하는 미디에이터 시스템으로서 뷰(View) DTD의 정의, 추론 기능을 이용하여 웹 상의 분산, 이질 정보의 통합 기능을 제공한다. 뷰 DTD는 관리자에 의하여 정의되어, 추론 및 보완 과정을 거쳐 생성되며, 웹 상의 통합된 가상 정보 구조를 표현한다. 웹 상의 사용자는 이와 같이 생성된 뷰 DTD를 근거로 분산이질 정보에 대한 구조정보 및 내용정보에 대한 질의를 수행할 수 있다. HMS에서는 DTD 구동형 비주얼 사용자 인터페이스를 제공하여, 관리자와 일반 사용자에게 직관적이고 간편한 웹 정보 브라우징 및 질의검색 환경을 제공한다.

  • PDF

Oracle 8i를 이용한 통합 상품 표현 모델의 구현 (Implementation of an Integrated Product Expression Model using Oracle 8i)

  • 하상호
    • 한국멀티미디어학회논문지
    • /
    • 제6권6호
    • /
    • pp.945-952
    • /
    • 2003
  • B2B의 전자상거래의 발달로 상품 정보를 효과적으로 표현하고, 이러한 정보를 회사들간에 교환하기 위한 디지털 카탈로그는 점차 그 중요성이 인식되고 있다. 본 논문은 상품들을 통합하여 효과적으로 표현할 수 있는 통합 상품 표현 모델을 참조하고, 이 모델을 Oracle 8i에서 제공하는 XDK(XML Development Kit)를 사용하여 구현한다. 먼저, 상품 표현 모델을 XML DTD로 표현하고, 이 DTD로 표현된 KML상품 정보를 효과적으로 Oracle 8i에 데이터베이스에 저장하고 검색하는 시스템을 구축한다. 마지막으로, 구축된 시스템에 대한 실행 예제를 보여준다.

  • PDF

다양한 구조 문서를 효율적으로 처리하기 위한 폼(Form) 기반 XML 편집 시스템 개발 (Development of a Form-based XML Editing System for Efficient Processing of Variously Structured Documents)

  • 손원성;김재경;고승규;최윤철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.257-259
    • /
    • 2000
  • 다양한 전자문서를 효율적으로 처리하기 위해서는 구조문서 정의가 가능한 SGML(Standard Generalized Markup Language)이나 XML(eXtensible Markup Language)을 이용할 수 있다[1,2]. SGML 및 XML과 같은 구조문서를 생성하기 위해서는 별도의 편집기가 필요하며 현재 다양한 제품이나 연구결과를 살펴볼 수 있다[3,4]. 그러나 기존의 입력, 편집 시스템에서는 사용자가 작성하려는 문서에 대한 구조를 숙지하여야 하는 동시에, DTD(Document Type Definition)에 대한 지식을 필요로 한다. 이를 인해 복잡한 구조의 SGML 및 XML 문서를 일반인들이 사용하기 어렵고, 작성한 결과에 대한 검증 과정이 필수적으로 요구된다. 또한 다양한 분야에서 적용 가능한 전자문서 시스템을 위해서는 효과적인 통합 DTD의 정의와 처리 방법이 필요하다. 따라서 본 논문에서는 구조화 문서에 대한 지식이 없는 일반인들도 쉽게 구조문서 작성이 가능하며, 통합적 DTD의 효율적인 처리가 가능한 Form 기반 편집 시스템의 모델을 제시하며, 특히 웹에서도 적용이 가능한 XML을 지원한다. 그 결과 본 연구에서 개발한 XML 편집 시스템은 Form 기반의 통합 DTD 처리와 XML 문서 작성 및 출력 기능, 그리고 이미지, 테이블 기능 등을 제공함으로써 누구나 쉽고 정확한 XML 문서를 작성할 수 있다.

  • PDF

통합의료정보 시스템을 위한 XML DTD 설계 및 구현 (A Design and Implementation of XML DTDs for Integrated Medical Information System)

  • 안철범;나연묵
    • 전자공학회논문지CI
    • /
    • 제40권6호
    • /
    • pp.106-117
    • /
    • 2003
  • 선진 의료정보시스템은 텍스트 기반 정보를 위한 HL7 표준과 의료 영상 정보를 위한 DICOM 표준을 기반으로 한 HIS(병원정보시스템)/RIS(방사선진단시스템), PACS(의료영상시스템)와 같은 독립적인 시스템이 상호 유기적으로 결합된 형태로 구축된다. 최근 들어 시스템(HIS/RIS, PACS) 상호간의 원활한 정보 교환의 필요성과 환자의 타 병원으로의 이송, 원격진료(Teleradiology) 서비스, 기타 의료 데이터 공유에 대한 필요성이 증가함에 따라 통합의료정보시스템의 개발과 인터넷을 통한 통합검색 및 교환을 위한 적절한 대안이 요구되고 있다. 본 논문에서는 이에 대한 방안으로 XML을 활용한 통합의료정보시스템을 제안하였다. 기존 문서의 XML화를 위하여 HL7과 DICOM 두 표준에서 제안하는 표준 문서의 특성을 분석하고 이를 기초로 통합 XML DTD를 설계하였다. 시스템 구현은 1)HL7 메시지와 DICOM 파일로부터 관련 데이터에 대한 정보의 추출. 2)통합 DTD를 기반으로 한 XML 문서 인스턴스와 XSL 스타일시트의 생성 및 저장. 3)최종적으로 ASP를 사용한 웹 검색 인터페이스를 구현함으로써 웹상에서 데이터의 공유와 상이한 두 표준간 의료 정보의 교환 및 검색을 위한 통합의료정보 시스템을 구현하였다. 본 논문에서 제안한 XML 기반 통합 의료정보 시스템은 의료정보의 통합과 인터넷을 통한 데이터의 교환 및 공유를 가능하게 함으로써 기존 의료정보시스템의 문제점을 해결할 수 있을 것으로 보인다. 또한 XML의 유용성과 확장성으로 기존의 HTML 기반 웹 의료정보 서비스와의 차별화도 기대할 수 있을 것이다.

웹 정보 통합 및 검색을 위한 XML기반 미디에이터 시스템의 개발 (Development of an XML-based Mediator System for Web Information Integration and Retrieval)

  • 양정욱;홍동완;이덕형;윤지희
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 2001년도 춘계 Conference: CRM과 DB응용 기술을 통한 e-Business혁신
    • /
    • pp.281-294
    • /
    • 2001
  • HMS(Hallym Mediator System)는 XML을 기본 데이터 모델로 하여 인터넷에 산재하여 있는 분산이질 정보에 대한 통합, 검색기능을 제공하는 미디에이터 시스템이다. 분산이질 정보의 공통 스키마 구조로서 XML DTD를 사용하며, 각종 정보에 대한 가상의 통합 뷰(view) 생성기능을 제공하여 웹 상의 통합된 가상정보 구조를 표현한다. 웹 상의 일반 사용자는 이와 같이 생성된 뷰 DTD를 근거로 분산이질 정보에 대한 구조적, 내용적 질의를 수행할 수 있다. HMS는 가상접근 기법(virtual approach) 기반의 정보검색 시스템으로서, 사용자 질의는 XML 형태의 소스 매핑정보를 이용하여 각 소스에 대한 부질의로 변환되며, 각 소스로부터의 검색결과는 시스템에 의하여 통합되어 XML 문서 형태로 돌아오게 된다. HMS에서 는 DTD 구동형의 비쥬얼 사용자 인터페이스를 제공하여, 관리자와 일반 사용자에게 직관적이고 간편한 가상정보 구축 및 질의검색 환경을 제공한다.

  • PDF

구조 및 의미적 유사성에 기반한 XML 문서들의 효율적인 저장을 위한 통합 기법 (The study of integration techniques for storing XML documents efficiently based on structures and semantics)

  • 김연희;김병곤;이재호;임해철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.590-592
    • /
    • 2003
  • 최근 XML이 웹 상의 데이터의 표현, 교환, 중재의 표준으로 각광받으면서 이러한 XML 문서를 효과적으로 저장, 접근 및 검색하기 위한 기법에 대한 연구가 많았으나, 기존의 연구들은 하나의 XML 문서를 저장 및 검색의 대상으로 하는 경우가 대부분이였다. 그러나 XML 문서를 데이터의 표현과 교환의 표준으로 이용하는 애플리케이션의 개발이 점차 활성화됨에 따라 저장해야하는 XML 문서의 수가 크게 증가하면서 의미나 구조적으로 많은 유사성을 지니는 XML 문서들을 함께 효율적으로 저장하고 검색하기 위한 기법의 연구가 요구된다. 따라서 본 논문에서는 의미 및 구조적으로 유사성을 가지는 여러 XML 문서들을 통합하는 기법을 제안한다. 제안된 통합 기법은 같은 DTD나 XML Schema를 가지는 경우와 다른 DTD나 XML Schema를 가지는 경우를 모두 고려한다. 또한 특별한 구조적 정보를 가지지 않는 XML 문서의 경우도 다른 DTD나 XML Schema를 가지는 경우와 마찬가지로 처리함으로써 다양한 XML 문서들에 대한 통합이 가능하도록 한다. 이러한 통합 기법은 중복되는 엘리먼트나 애트리뷰트에 대한 저장 공간의 낭비를 최소화한다. 또한 의미적으로 또는 구조적으로 관련성있는 여러 XML 문서의 부분들을 디스크 상의 페이지내에 서로 가까이 저장할 수 있기 때문에 사용자의 일반적인 질의에 대해 효율적이고 빠른 검색 결과를 유도할 수 있고, I/O 횟수를 줄임으로써 그에 따른 오버헤드를 줄일 수 있는 장점이 있다.

  • PDF

XML Schema 기반 이질 정보 통합의 충돌 분류와 해결 방안 (Classification and Resolution of Conflicts for Integration of Heterogeneous Information Based on XML Schema)

  • 권석훈;이경하;이규철
    • Journal of Information Technology Applications and Management
    • /
    • 제10권3호
    • /
    • pp.55-74
    • /
    • 2003
  • Due to the evolution of computer systems and the proliferation of Internet, numerous information resources have been constructed. The deluge of information makes the need to integrate information, which are distributed on the internet and are handled in heterogeneous systems. Recently, most of the XML -based information integration systems use XML DTD(Document Type Definition) for describing integrated global schema. However, DTD has some limitations in modeling local information resources such as datatypes. Although W3C's XML Schema is more flexible and powerful than XML DTD in specifying integrated global schema, it has more complex problems in resolving conflicts than using DTD. In this paper, we provide a taxonomy of conflict problems in integration information resources using XML Schema, and propose conflict resolution mechanism using XQuery.

  • PDF