• Title/Summary/Keyword: 문서구조

Search Result 1,613, Processing Time 0.026 seconds

A Storage Model for XML-based government document to RDB (XML기반 행정기관 전자문서의 관계 데이터베이스로의 저장 모델)

  • 안만선;이언배
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.166-168
    • /
    • 2004
  • 행정기관의 전자문서는 정부의 공문서 표준 DTD 및 XML 문법에 따라 작성되고 있으나. 일반 문서와 동일하게 정부의 디렉토리시스템에 문서 단위로 저장 관리되고 있다 그러나 구조 정보를 포함하고 있는 XML 문서를 보다 효과적으로 활용하기 위해서는 논리구조 단위로 정보를 저장 관리할 필요가 있다. 본 논문은 행정기관 전자문서의 특성을 파악하여 데이터베이스로 저장할 때 적합한 모델을 제안한다. 대부분의 행정기관이 사용하고 있는 관계 데이터베이스시스템(RDBMS)을 사용하였고. 데이터 중심과 문서내용 중심의 성격을 동시에 가지는 행정기관 전자문서의 특성을 고려하였다. 제안하는 저장 모델은 메타데이터를 표현하는 부분은 정적인 테이블을 사용하여 구조정보와 내용을 항께 저장하고, 문서 내용 중심의 본문 부분은 분할하지 않고 저장하는 변형된 분할 저장 방식이다. 제안하는 저장 모델을 활용하면 기존 RDBMS로 개발된 여러 응용 시스템과의 연동이 가능하고, XML 데이터 저장/검색을 위한 새로운 데이터베이스시스템의 구입 없이 행정기관에서 XML 전자문서를 효율적으로 관리할 수 있는 장정이 있다.

  • PDF

A Study on Layered Electronic Document (계층구조로 운영하는 전자문서에 관한 연구)

  • Lee, Jongkuk;Jeong, Yeonseo;Nam, Kidong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.11a
    • /
    • pp.780-782
    • /
    • 2012
  • 본 논문은 전자문서를 다중 계층적으로 운영하는 구조와 방법을 제시한다. 기존의 전자문서는 단일 계층에서의 작업으로만 이루어졌다. 이런 방식으로는 원본에 변경을 필요하기 때문에 원본을 변경할 수 없는 파일인 경우 (예: Adobe PDF), 전자문서를 보면서 줄을 긋고, 설명을 적는 것과 같은 작업은 전자문서를 출력해서 종이에 작업을 해야 하거나, 원본 문서를 내가 변경 시킬 수 있는 형태의 문서로 제작한 다음, 설명을 적거나, 줄을 긋는 방법을 택하여 왔다. 이런 방법은 원본을 다시 복사해야 하는 불편함과, 저장해야 하는 데이터 용량의 증가 등의 문제를 야기시켜왔다. 이에 본 논문은 위의 문제점들을 해결하기 위해, 전자문서를 다중 계층적으로 운영하는 구조를 제시한다. 즉 다중 계층을 적용시킨 전자문서로 원본에는 전혀 손상을 입히지 않으면서, 설명 자료 등을 첨부시키고, 강조하는 등의 작업을 가능하게 하여 전자문서의 효용성을 높이고자 한다.

A Storage and Retrieval System for Structured SGML Documents using Grove (Grove를 이용한 구조적 SGML문서의 저장 및 검색)

  • Kim, Hak-Gyoon;Cho, Sung-Bae
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.8 no.5
    • /
    • pp.501-509
    • /
    • 2002
  • SGML(ISO 8879) has been proliferated to support various document styles and to transfer documents into different platforms. SGML documents have logical structure information in addition to contents. As SGML documents are widely used, there is an increasing need for database storage and retrieval system using the logical structure of documents. However. traditional search engines using document indexes cannot exploit the logical structure. In this Paper, we have developed an SGML document storage system, which is DTD-independent and store the document type and the document instance separately by using Grove which is the document model for DSSSL and HyTime. We have used the Object Store, an object-oriented DBMS, to store the structure information appropriately without any loss of structural information. Also, we have supported a index structure for search efficiency like the relational DBMS, and constructed an effective user interface which combines content-based search with structure-based search.

ETRI신기술-DSSSL 준거 SGML 브라우저 기술

  • Electronics and Telecommunications Research Institute
    • Electronics and Telecommunications Trends
    • /
    • v.14 no.3 s.57
    • /
    • pp.120-122
    • /
    • 1999
  • 문서의 내용을 효율적으로 표현하기 위해서는 문서를 문서구조와 형식으로 분리하는 것이 필요하다. 인터넷에서의 문서구조는 SGML(Standard Generalized Markup Language)에서 파생된 HTML로 표현하는 것이 일반화되었으며, 1996년에 이르러 문서형식 부분도 DSSSL(Document Style Semantics and Specification Language: ISO/IEC 10179)로 제정되었으나 아직 개발 사례는 없다. 동 기술은 DSSSL 형식에 따라 복합문서를 볼 수 있게 개발한 Library를 기반으로 SGML 기반 브라우저를 1998년 4월 세계 최초로 개발하였다.

  • PDF

Design and Implementation of an XML Document Storage System supporting XQL (XQL를 지원하는 XML 문서 저장 시스템)

  • 허명식;손기락
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10a
    • /
    • pp.39-41
    • /
    • 1999
  • XML 문서와 같은 구조적 데이터는 관계형 데이터베이스에 저장하고 인터넷 응용 프로그램을 개발하는데 많은 이점을 가지고 있다. 또한 이러한 구조적 문서에 대한 질의 언어를 지원하는 것은 유용하다. 이에 본 논문에서는 XML 문서에 대한 질의 언어로 제안되어진 XQL을 효율적으로 지원할 수 있도록 XML 문서의 각 엘리먼트를 관계형 데이터베이스의 테이블로 매핑시키는 방법과 XQL을 SQL로 변환하는 방법을 제시하고 또한 XML 문서의 DTD를 통해 해당하는 문서의 테이블을 자동으로 생성하는 방법을 제시한다. 이를 통해 XQL을 효율적으로 지원하는 XML 문서 저장 시스템을 설계하고 구현한다.

  • PDF

Extracting Maximal Similar Paths between Two XML Documents using Sequential Pattern Mining (순차 패턴 마이닝을 사용한 두 XML 문서간 최대 유사 경로 추출)

  • 이정원;박승수
    • Journal of KIISE:Databases
    • /
    • v.31 no.5
    • /
    • pp.553-566
    • /
    • 2004
  • Some of the current main research areas involving techniques related to XML consist of storing XML documents, optimizing the query, and indexing. As such we may focus on the set of documents that are composed of various structures, but that are not shared with common structure such as the same DTD or XML Schema. In the case, it is essential to analyze structural similarities and differences among many documents. For example, when the documents from the Web or EDMS (Electronic Document Management System) are required to be merged or classified, it is very important to find the common structure for the process of handling documents. In this paper, we transformed sequential pattern mining algorithms(1) to extract maximal similar paths between two XML documents. Experiments with XML documents show that our transformed sequential pattern mining algorithms can exactly find common structures and maximal similar paths between them. For analyzing experimental results, similarity metrics based on maximal similar paths can exactly classify the types of XML documents.

XTGen: A Component Based System for Generating XML Transformer (XTGen: XML 변환기 생성을 위한 컴포넌트 기반 시스템)

  • 심민석;유대승;엄전섭;강만모;이명재
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04a
    • /
    • pp.310-312
    • /
    • 2001
  • 최근 인터넷상에서 DTD 기반의 XML 문서가 문서 교환의 표준 수단으로 등장하면서 B2B 상에서 XML 문서의 사용이 빠른 속도로 증가하고 있다. 그러나 B2B 환경에서 문서교환시스템은 각기 다른 형태의 문서구조의 사용으로 인하여 시스템의 통합 및 상호운용에 있어 많은 어려움이 있다. 이에 논리적으로는 유사한 문서 교환 시스템의 통합 및 상호운용에 있어서 XML 문서의 교환을 위해서는 상호 변환 모듈이 필요하다. 그러나 상호 변환 모듈 개발을 위한 표준화된 방법과 툴의 미비로 인하여 변환 모듈 개발과 유지 보수에 많은 비용이 소요된다. 본 연구에서는 논리적으로 비슷하지만 서로 다른 DTD 기반의 XML 문서를 상호 변환하는 변환기를 자동 생성하는 시스템(XTGen)을 설계하고 구현한다. 시스템은 XML 문서를 검증하고 DTD를 추출하는 컴포넌트(XDA), 검증된 DTD를 문서 구조 정보 형식으로 변경하는 컴포넌트(DDA), 문서 구조 정보를 보여주고 상호 변환을 위해 매핑 할 수 있도록 하는 컴포넌트(DIV), 두 문서간의 매핑 정보를 추출하는 컴포넌트(MDO), 추출된 매핑 정보를 바탕으로 2개의 XML 문서를 상호 변환하는 변환기를 생성하는 컴포넌트(TCG)로 구성된다. 본 연구에서는 제안한 XML 변환기 생성 시스템(XTGen)은 XML 문서들의 상호 변환을 위한 변환 모듈을 자동 생성함으로써 변환기 생성의 비용을 감소시킬 수 있고 변환 모듈의 표준화를 통해 유지 보수성을 높일 수 있다.

Rhetorical Structure Tree Generation for Text Summarization System (문서 요약 시스템을 위한 수사 구조 트리 생성)

  • 정준호;김미진;이현주;박미성;이상조
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10b
    • /
    • pp.175-177
    • /
    • 1999
  • 본 논문에서는 수사 정보와 문장간 유사도를 이용하여 문서의 수사 구조 트리를 생성하는 방법을 제안하였다. 말뭉치에서 찾아낸 수사 정보를 종류별로 분류하고, 이를 사용해서 문서 내의 수사 정보를 추출해서 가능한 모든 구조를 생성한다. 다음으로 문장간의 유사도를 사용해서 가중치가 가장 높은 하나의 구조를 선택한다. 생성된 수사 구조를 사용하여 문서를 요약할 수 있는데, 수사 정보는 언어적 특성을 이용하는 것이므로 모데인에 독립적인 요약 시스템을 만들 수 있다.

  • PDF

The Efficient Schema Conversion to map the XML Document into the RDB (XML의 RDB로의 맵핑을 위한 효율적인 스키마 변환)

  • 김태희;김선경
    • Proceedings of the Korea Society for Industrial Systems Conference
    • /
    • 2003.11a
    • /
    • pp.429-433
    • /
    • 2003
  • 웹상의 문서는 데이터 중심의 표준 언어인 XML 문서로 표현된다. XML 데이터를 범용적이고 우수한 성능의 관계형 데이터베이스와 연동하여 이용하기 위해서는 두 구조 사이의 맵핑 과정이 필요하다. 계층적 구조의 XML 문서와 데이터베이스의 평면적인 구조의 차이를 고려한 구조 맵핑을 위해서 검색 시스템에 적합한 가상분할 방식으로 엘리먼트를 분석하여 관계 스키마를 정의한 후 XML 문서를 저장한다. 이를 위해 스키마는 DTD 에 독립적인 형태로 변환하고, 엘리먼트의 추가와 삭제, 검색의 효율성을 위해 노드간의 위치 정보와 함께 독립적인 ID를 부여하여 구조적 검색을 수행할 수 있게 하였다.

  • PDF

Design and Implementation of a SGML/XML Document Retrieval System (SGML/XML 검색 시스템의 설케 및 구현)

  • Ko, Seung-Kyu;Cho, Seung-Ki;Choy, Yoon-Chul;Koh, Kyun
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2000.11a
    • /
    • pp.99-102
    • /
    • 2000
  • 이기종 간의 문서 교환 표준으로 제안되 SGML은 문서의 구조정보를 표현할 수 있는 장점으로 인해 CALS(Commerce At Light Speed), EC(Electronic Commerce), EDI(Electronic Data Interchange), 전자 도서관(Digital Library) 등 여러 분야에서 사용되고 있다. 이렇게 SGML이 여러 분야에서 사용됨에 따라 많은 SGML 문서 중에서 원하는 문서를 효율적으로 찾아줄 수 있는 검색 시스템의 필요성이 증가하고 있다. 이에 본 연구실에서는 기본적인 구조 검색을 지원하는 SGML 문서 관리시스템을 기개발하였다. 그러나 이 시스템은 구조 검색을 효과적으로 지원하기 못하기 때문에 본 연구에서는 구조 검색의 기능을 정의하고, 이를 지원하는 새로운 구조 질의어를 정의하였다. 또한 이러한 구조 검색을 효과적으로 지원하기 위한 구조 색인을 정의하였다. 그리고 구조 검색 방식으로 세가지 방식을 각각 구현 및 실험하여 그 중에서 성능이 뛰어난 절충식을 이용하여 검색 시스템을 구현하였다.

  • PDF