• Title/Summary/Keyword: 문서구조

Search Result 1,614, Processing Time 0.026 seconds

A Transformation of XML Documents with Semantic Constraints using XML Schema (XML 스키마의 의미 구조 분석을 이용한 XML문서의 변환)

  • Kawk Dong-Guy;Park Ho-Byung;Yoo Chae-Woo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.11a
    • /
    • pp.592-594
    • /
    • 2005
  • XML은 현재 어플리케이션에서 데이터를 저장하는 W3C 표준으로 많은 응용 분야에서 사용되고 있다. 어떤 응용 프로그램에서 사용하던 기존의 XML문서를 다른 응용 프로그램에서 재사용하기 위해서는 변환 XML 문서가 가지고 있는 정보와 구조의 손실 없이 피 변환 XML의 구조에 합당하게 변환해야 한다. XML 문서 정보의 의미는 엘리먼트를 통해 표현되는데 자동으로 분석하여 변환에 적용하기 어렵다. 그러나 XML 문서는 DTD나 XML 스키마와 같은 구조적 정보를 가지고 있고 XML의 구조 정보는 엘리먼트에 속성을 표현한다. 이에 착안하여 DTD의 의미정보를 분석하여 XML 문서의 변환에 적용하는 방법이 제안되었다. 하지만 DTD는 지원하는 데이터 형식이 한정되어 있고 엘리먼트의 반복 속성도 제안되어 있다. 본 논문은 XML의 엘리먼트 정보를 분석하기 위해서 XML 스키마를 사용한다. XML 스키마는 기존에 DTD보다 다수의 데이터 타일과 엘리먼트의 반복적 속성을 다양하게 제공하고 있다. 그러므로 기존 방법보다 더 많은 정보를 변환에 적용할 수 있는 장점을 가지고 있다. 제안하는 시스템은 한번 작성한 XML 문서를 다른 XML 어플리케이션에서 재사용함으로써 XML 문서 제작성에 따른 비용을 절감할 것으로 기대된다.

  • PDF

Patent Document Categorization based on Semantic Structural Information (문서의 의미적 구조정보를 이용한 특허 문서 분류)

  • Kim, Jae-Ho;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2005.10a
    • /
    • pp.28-34
    • /
    • 2005
  • 특허 검색은 수많은 특허 문서 중에서 특정 해당분야의 문서 집합 내에서 검색을 수행하기 때문에 정확한 특허 분류에 크게 의존하게 된다. 이러한 특허 분류의 중요성에 덧붙여, 특허 문서의 수가 빠르게 증가하게 되면서 특허를 자동으로 분류하려는 요구가 더욱 필요하게 되었다. 특허문서는 일반문서와는 달리 구조화되어 있기 때문에 특허분류를 하기 위해서는 이러한 점이 고려되어야 한다. 본 논문에서는 k-NN 방법을 이용하여 일본어 특허 문서를 자동으로 분류하는 방법을 제안한다. 훈련집합으로부터 유사문서를 검색할 때, 구조화되어 있는 특허 문서의 특징을 이용한다. 문서 전체가 아닌 (기존 기술), (응용 분야), (해결하고자 하는 문제), (문제를 해결하려는 방법) 등의 세분화된 요소끼리 비교하여 유사성을 계산한다. 특허 문서에는 사용자가 정의한 많은 의미 요소가 있기 때문에 먼저 이들을 군집화한 후에 이용한다. 실험 결과 제안한 방법이 특허문서를 그대로 이용하는 것보다는 74%, 특허문서에 나타난 <요약>, <청구항>, <상세한 설명>의 큰 구조 정보를 이용하는 것보다는 4%의 성능 향상을 가져왔다.

  • PDF

Searching XML Documents based on Xtree and Documents Similarity (Xtree와 문서 유사도에 기반한 XML 문서 검색)

  • 이은정;박우창
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04a
    • /
    • pp.578-580
    • /
    • 2003
  • 인터넷의 성장으로 인해 준구조적인 문서 표준의 하나인 XML 문서의 사용이 증가하고 있다. 본 연구는 인터넷이나 XML 데이터베이스에서 저장된 스키마 정보가 주어지지 않는 많은 양의 XML 문서를 대상으로 주어진 XML 문서에 가장 가까운 문서들을 찾는 방범을 제시한다. 먼저 XML 문서들의 스키마 정보를 얻기위하여 XML 문서에 해당하는 카디널리티 정보를 포함하는 xtree로 변환하고, 변환된 문서들에 대하여 XML 각 요소에 대한 유사도와 문서 구조에 대한 유사도를 계산하여 가장 유사도가 가까운 XML 문서를 결과로 제시한다. 본 논문의 방법은 스키마가 알려지지 않는 XML의 문서들에 대한 검색을 할 수 있고 유사도를 이용하여 문서의 근사 검색을 할 수 있는 장정이 인다.

  • PDF

A Study on the Depth-Oriented Decomposition Indexing Method for Creating and Searching Structured Documents Based-on XML (XML을 이용한 구조적 문서 생성 및 탐색을 위한 깊이중심분할 색인기법에 관한 연구)

  • Yang, Ok-Yul;Lee, Yong-Ju
    • The KIPS Transactions:PartD
    • /
    • v.9D no.6
    • /
    • pp.1025-1042
    • /
    • 2002
  • The goal of this study is to generate a structured document which improves the performance of an information retrieval system by using thesaurus, information on relations between words (terms), and to study on the technique for searching this structured document. In order to accomplish this goal, we propose a DODI (Depth -Oriented Decomposition Index) technique for the structured document and an algorithm to search for related information efficient]y through this index technique that uses a thesaurus. We establish a storage system by which the structured document generated by this index technique is saved in a database through OpenXML and XML documents are generated through ForXML methods.

A Development Method for Standardized Document Model of Structural Calculation Document (구조계산서의 표준화된 문서모델 구축 방법)

  • Kim, Bong-Geun;Park, Sang-Il;Kim, Hyo-Jin;Lee, Sang-Ho
    • Journal of Korean Society of societal Security
    • /
    • v.1 no.3
    • /
    • pp.83-91
    • /
    • 2008
  • Most construction information is being recorded in the form of electronic document. However, design documents generated in current practice are not suitable in share and exchange of information for disaster management. This study proposes how to develop th e XML Schema based semantic model of structural calculation document (SCD) for systematic storage and management of SCD information. in addition, 5 basic data types are developed for various expression forms appeared in the structural calculation documents. A prototype semantic model for steel bridge superstructure is developed based on the proposed method, and it is observed that the proposed method can be effectively used to build a standardized semantic model of SCD.

  • PDF

Design and Implementation of an XML Manager for BADA-11 (바다-II에서 XML관리자의 설계와 구현)

  • 차명훈;박영철
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04b
    • /
    • pp.7-9
    • /
    • 2002
  • XML 문서를 관계형 데이타베이스에 저장하는 것은 관계형 데이타베이스 관리 시스템이 제공하는 안정성과 질의 능력을 활용하고자 하는 것이 주된 요인이다. 관계형 데이타베이스는 2차원의 테이블 구조를 저장하고 응용하는 것에 특화되어 있으므로 XML 문서에 표현되어 있는 계층적 구조, 중첩 구조 등 이질적인 요소들을 관계형 데이타베이스에 반영하는 모델링 방법으로 현재가지 완벽하게 실용화된 것은 없다. 본 논문은 XML 문서를 관계형 데이타베이스에 저장하기 위한 스키마 구조를 제안하고 XML 문서를 바다 -II에 저장, 검색, 재구성만 구현 결과를 제시한다.

  • PDF

An SGML Document Authoring Tool (SGML 문서 저작 도구)

  • An, Bo-Hui;Yu, Jae-U;Song, Hu-Bong
    • The Transactions of the Korea Information Processing Society
    • /
    • v.6 no.2
    • /
    • pp.512-521
    • /
    • 1999
  • SGML, defined as the ISO 8879, is a meta-language to define a document type, used as basic format for electronic documents. Since an SGML document is composed of a document type definition and a document instance conforms to the definition, it is necessary for SGML document authoring tools to compose and validate document type and document instance. In present, formal models and procedures for SGML documents are not defined, it's not easy to construct such tools. We propose a model of SGML authoring tool consists of SGML parser, document type definition editor, SGML document editor and style editor. We also introduce and implement formal procedure for each component. For user convenience, we adopted icon based visual programming method, and solved the HANGUL problems. The SGML authoring tool is implemented I Windows NT system using java and C++ programming language.

  • PDF

XML Document Clustering Based on Sequential Pattern (순차패턴에 기반한 XML 문서 클러스터링)

  • Hwang, Jeong-Hee;Ryu, Keun-Ho
    • The KIPS Transactions:PartD
    • /
    • v.10D no.7
    • /
    • pp.1093-1102
    • /
    • 2003
  • As the use of internet is growing, the amount of information is increasing rapidly and XML that is a standard of the web data has the property of flexibility of data representation. Therefore electronic document systems based on web, such as EDMS (Electronic Document Management System), ebXML (e-business extensible Markup Language), have been adopting XML as the method for exchange and standard of documents. So research on the method which can manage and search structural XML documents in an effective wav is required. In this paper we propose the clustering method based on structural similarity among the many XML documents, using typical structures extracted from each document by sequential pattern mining in pre-clustering process. The proposed algorithm improves the accuracy of clustering by computing cost considering cluster cohesion and inter-cluster similarity.

Design and Implementation of Proposal Registration and Estimation System based on XML (XML 기반의 제안서 접수 및 평가 시스템의 설계 및 구현)

  • 권석훈;나재열;유정연;이강찬;이규철
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.139-141
    • /
    • 2001
  • 기존의 제안서 접수 및 평가 방식은 수작업이 대부분을 차지하여 많은 인력과 시간이 소요되며 정확성도 완전히 보장할 수 없는 단점을 가지고 있다. 이러한 비효율적인 방식을 개선하기 위해서 접수 및 평가과정을 웹상에서 자동화하여, 문서 작성자, 접수자, 평가자 및 관리자들이 좀 더 편리하게 관련 작업을 처리할 수 있게 하였다. 자동화를 도입하기 위한 방법으로 HWP 문서의 구조 정보를 표현할 수 있는 마크업(markup) 언어인 HWPML(HWP Markup Language : 이하 HML)을 사용하였으며, HML 문서를 파싱(parsing)하여 필요한 정보만을 추출하여 XML(eXtensible Markup Language) 문서를 생성하였다. 이렇게 생성된 XML 문서는 논리적인 구조 정보를 가지고 있고 플랫폼 및 소프트웨어 중립적이기 때문에 효과적인 검색, 관리 및 공유가 가능한 시스템 환경을 제공한다. 이 기법으로 표준 언어로 부각되고 있는 XML 형태의 문서 관리를 기존의 워드 프로세서 형태의 문서 관리에 확장 적용할 수 있다. 본 논문에서는 이러한 자동화 시스템의 구조와 문서 변환 기법을 제안하였다.

  • PDF

The Design and Implementation of SGML Document Editing System Using Document Structure Information (문서 구조정보를 이용한 SGML 문서 편집 시스템의 설계 및 구현)

  • Kim, Chang-Su;Jo, In-June;Jung, Hoe-Kyung
    • The Journal of Engineering Research
    • /
    • v.3 no.1
    • /
    • pp.21-27
    • /
    • 1998
  • This paper describes the design and implementation of system for editing SGML document instance using document structure information of SGML DTD. For make use of structure window for logical structure expression of document to SGML document editing without editing mistake of user and easy update the using support to editing process of elements, attributes, entities tools and product document, and valid using SGML parser. Also, in order to support Korean and English text using KS 5601. In this paper, the proposed SGML document editing system is used common controls support of window 95 for window user interface

  • PDF