• 제목/요약/키워드: 문서구조

검색결과 1,614건 처리시간 0.03초

XML 기반 학술지 데이터베이스 저장관리시스템의 개발 (A Development of XML-Based ]Repository Management System for a thesis database)

  • 조남선;김우성;서인홍
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2001년도 춘계학술대회 발표논문집
    • /
    • pp.330-333
    • /
    • 2001
  • 학술지 데이터 베이스 구축에 있어서 가장 주요한 문제점온 기존 문헌의 디지털화이다. 기존 문헌을 디지털화함에 있어서 택할 수 있는 방법은 문서 인식기(OCR)를 통한 자동인식과 수작업을 통해서 컴퓨터로 입력하는 방법이 있다. 전자의 방법은 현재의 한글 문서 인식기술로 볼 때 인식률이 저조하고, 인식기를 통한 자동인식에서 발생된 오류를 수정하는 비용이 수작업으로 입력하는 비용에 비해 더 크다고 판단된다. 따라서 자료의 입력은 수작업으로 하는 것이 효율적이다 학술지 데이터 베이스들 구축하고 이를 서비스하기 위해 서는 입력된 텍스트 데이터를 표준화하여 구조적으로 변환/편집해야 한다. 이는 구조문서 표준이라 할 수 있는 XML의 이용이 필요하다는 말이기도 할 것이다. 또한 디지털화 된 문서를 효율적으로 활용하고 관리하기 위해서는 비쥬얼한 구조문서 저장 관리기가 필요하다. 본 논문에서는 디지털화 된 텍스트를 구조적인 XML문서로 변환하여 효과적으로 저장 관리 할 수 있는 저장관리기를 설계하고 개발하였다.

XDR 스키마를 위한 UML 클래스 다이어그램 (UML Class Diagram for XDR Schema)

  • 유문성
    • 인터넷정보학회논문지
    • /
    • 제4권4호
    • /
    • pp.35-44
    • /
    • 2003
  • XML이 웹에서 사용하는 문서와 데이터의 표준이 되고 있다. XML의 문서를 정의하는데 사용되는 것이 스키마다. 이 중 마이크로소프트사가 중심이 되어 개발하고 있는 스키마인 XDR은 스키마 중에서 실제적인 활용을 주도하고 있다. UML은 객체지향 개발 방법론에서 나온 표기법으로 시스템의 구조를 나타내는데 유용한 도구이다. 본 논문은 XDR의 스키마의 구조를 UML 클래스 다이어그램으로 변환하는 방법과 알고리즘을 제안한다. 이 변환으로 XML의 문서구조를 시각화하여 XML문서의 구조를 쉽게 파악할 수 있게 되었고 재사용성과 유연성을 높여 XML문서 개발을 효율적으로 하게 하였다.

  • PDF

통합 편집 환경을 지원하는 시각적 XML 편집기 (Visual XML Editor Supporting Integrated Editing Environment)

  • 최상길;정영우;곽지현;김건우;김상욱
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.249-251
    • /
    • 1998
  • XML은 W3C에서 권고안으로 채택됨으로써, 이를 바탕으로한 CDF, RDF, WIDL, WebBroker 등과 같은 많은 웹 어플리케이션들이 개발되고 있다. XML은 HTML과 같은 단일하고 고정적인 문서 구조에서 벗어나서 자신만의 구조를 가지는 문서를 작성할 수 있도록 해준다. 또한 문서의 내용과 그 내용의 표현이 분리되어 있어, 원 문서의 내용을 변화시키지 않고도 여러 가지 형식으로 표현될 수 있다. 본 논문에서는 이러한 확장된 기능을 가지는 XML 문서를 보다 직관적이고 시각적으로 편집할 수 있는 XML 편집기를 제안한다. 본 시각적 XML을 기반으로 하는 다양한 문서를 편집하는데 범용적으로 사용될 수 있다.

  • PDF

XML문서저장 시스템을 위한 DOM 인터페이스의 설계 및 구현 (Design and Implementation of DOM Interface for an XML Document Storage System)

  • 김성욱;정호영;김천식;손기락
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.75-77
    • /
    • 2000
  • 구조적 정보의 표현방법으로 제시된 XML 문서를 가공하고 저장하는 방법에 대한 연구가 활발하게 진행되고 있다. XML을 가공하는 형태로는 몇 가지가 제시되어 일반화 되어있으나 계층적 특성을 가진 XML 문서를 관계형 데이터베이스에 효율적으로 저장하기는 어렵다. 본 연구에서는 XML 문서의 계층 구조를 DFS Numbering 으로 저장하고 데이터베이스에 저장된 문서에 대한 DOM 인터페이스를 효과적으로 제공하는 시스템의 설계 및 구현이다. 문서의 변경 내용을 저장할 때 SQL Query 횟수를 최소화하는 효율적인 기법을 제시한다.

  • PDF

인터넷 정보 추출을 이용한 웹문서 구조화 (Web Site Construction Using Internet Information Extraction)

XML 문서에 대한 효율적인 구조 기반 검색을 위한 색인 모델 (An Indexing Model for Efficient Structure-based Retrieval on XML Documents)

  • 박종관;강형일;손충범;유재수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.18-20
    • /
    • 2000
  • XML 문서의 구조검색을 위한 기존 방법들은 특정 엘리먼트의 조상, 자손, 형제에 대한 다양한 구조검색을 효율적으로 지원하지 못한다. 본 논문에서는 XML 문서의 효율적인 관리와 구조검색을 위해 DTD(Document Type Definition)의 논리적 구조를 따르는 XML 문서에 대해 구조정보를 표현하기 위한 방법을 제시한다. 구조정보는 엘리먼트 이름을 식별할 수 있는 EID, 부모와 자식 엘리먼트간의 계층정보를 위한 ETID, 동일한 부모 엘리먼트를 갖는 자식 엘리먼트들의 순서정보를 위한 SORD, 그리고 동일한 부모 엘리먼트를 갖는 자식들 중 동일한 타입의 엘리먼트들에 대한 순서정보를 위한 SSORD로 구성된다. 이런 구조정보를 이용해 빠른 검색을 위한 내용 색인, 구조 색인, 애트리뷰트 색인을 설계한다. 설계된 색인을 통하여 질의를 처리하는 과정을 설명함으로써 다양한 구조적 질의를 효과적으로 처리할 수 있음을 보인다.

  • PDF

네비게이션 정보추출에 의한 XML 본문검색시스템 (XML Fulltext Retrieval System by Extracting Navigation Information)

  • 강남규;이응봉;이석형
    • 정보관리학회지
    • /
    • 제19권3호
    • /
    • pp.91-110
    • /
    • 2002
  • 최근, 키워드 기반 정보검색의 한계를 극복하기 위한 구조문서 기반의 연구가 활발하게 진행되고 있지만, 실제 적용에는 많은 어려움이 존재한다. 본 고에서는 구조문서에 대한 본문검색시스템을 제안한다. 본문검색시스템에 적용된 문서는 XML로 구축된 국가 연구개발보고서를 대상으로 하였으며, XML 연구보고서의 DTD. 본문 간의 이동을 위한 네비게이션 정보추출, 본문검색을 위한 검색엔진의 적용 방안에 관하여 살펴본다. 본 시스템은 XML 문서에 대해 문서의 구조정보를 저장하고 이를 검색하여 다양한 형태로 열람할 수 있는 검색엔진의 부재 상황을 본문검색이라는 방법으로 극복하기 위한 것이다.

SGML 문서 관리 시스템의 설계 및 구현 (Design and Implementation of SGML Document Management System)

  • 김용훈;이원석;류은숙;이규철;이상기;김현기;이혜란;주종철
    • 한국문헌정보학회지
    • /
    • 제32권3호
    • /
    • pp.157-177
    • /
    • 1998
  • 다가오는 21세기는 고도화된 정보화 사회가 될 것이며, 이러한 정보화 사회에서 필수적인 요소로는 기하급수적으로 발생되는 전자 문서를 관리하는 것이라 할 수 있다. 특히, 디지털 도서관(Digital Library), 인트라넷 상에서의 CSCW(Computer-Supported Cooperative Work) , CALS(Commerce At the Light Speed) 등의 최근의 응용에서는 대량의 전자 문서를 효율적으로 저장하고 관리하는 시스템이 요구되고 있다. 다양한 전자 문서의 형태 중 ISO에서 문서 교환 표준으로 제정한 SGML은 구조 정보로 사용할 수 있는 마크업(Markup)을 포함하고 있어, 문서를 구조 단위로 표현할 수 있다. 이는 대량의 전자 문서를 저장하거나 관리하는데 적합하다. 본 논문에서는 SGML 문서를 효율적으로 관리하기 위한 SGML 문서의 데이터 모델을 제시하고, 다양한 구조의 SGML 문서에 대한 스키마 동적 생성 기능과 SGML 인스턴스 저장 기능 그리고 저장된 SGML 인스턴스를 문서 혹은 문서의 구조 단위로 꺼내오는 기능을 제공하는 SGML 문서 관리 시스템을 설계하고 구현하였다.

  • PDF

구조화 문서 작성/편집 시스템의 설계 및 구현 (The Design and Implementation of a Structured Document Author/Editor)

  • 장명길;이혜란;이재성;주종철;박동인
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1995년도 제7회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.80-85
    • /
    • 1995
  • 본 논문은 문서 작성시 해당 문서의 구조적 제한 조건을 명시한 DTD(Document Type Definition) 문법 및 SGML 태깅 방법에 익숙치 않은 사용자가 문서 템플리트를 통해 오류없는 SGML문서를 작성할 수 있도록 하는 구조화 문서 작성/편집 시스템을 소개한다. 본 시스템은 크게 DTD 해석기와 문서편집기로 구성되며 현재 오브젝트 지향 방법론에 따라 구현 중이다.

  • PDF

XSL-fo를 적용한 XML 문서 표현 시스템의 설계 및 구현 (Design and Implementation of XML Document presentation that apply to XSL-fo)

  • 이형문;강치원;정회경
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.191-193
    • /
    • 2000
  • 인터넷 표준 문서인 XML(Extensible Markup Language)이 구조적인 내용만을 갖고 있기 때문에 문서를 보여주기 위한 표현 정보를 포함하는 스타일 시트(style sheets)가 필요하다. 이를 위해 W3C(World Wide Web Consortium)에서는 XML 문서의 구조적인 접근을 위한 XPath(XML Path Language)와 문서의 내용구조를 변환하기 위한 XSLT (Transformations), 그리고 포맷팅 정보를 위한 XSL-fo(XSL Formatting objects)로 구성되는 XSL(Extensible Stylesheet Language)를 제안하였다. 본 논문에서는 XML 문서와 XSL 스타일 시트를 이용하여 XML 문서의 데이터를 변환하고 XSL-fo 정보를 이용하여 결과 FO(Formatting Objects)를 생성한다. 또한 트리로 구성된 결과 FO에서 페이지 정보와 FOT (Formatting Objects Tree)를 추출하는 FOT 생성부를 두었고, 디스플레이 관리기와 포맷팅 모듈 객체 관리기를 두어 FOT를 포맷팅을 위한 모듈로 저장하고 디스플레이 해주는 포맷팅 처리 시스템을 설계 및 구현하였다.

  • PDF