• Title/Summary/Keyword: 문서 구조 분석

Search Result 496, Processing Time 0.027 seconds

Storing XML documents through analyzing DTD (DTD의 분석을 통한 XML 문서 저장)

  • 신병주;진민
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2002.05c
    • /
    • pp.89-93
    • /
    • 2002
  • XML은 인터넷 기반의 비즈니스 환경에서 데이터 교환의 표준으로 확고한 위치를 확보하였다. 따라서, XML로 표현된 비즈니스 데이터를 가장 보편적인 DBMS인 관계 데이터베이스에 저장하기 위한 요구가 증가하고 있다. 그러나, XML과 관계 데이터베이스 간의 구조적 불일치에 의해 발생하는 문제점들을 해결하기 위해 XML 문서를 관계 데이터베이스에 저장하기 위한 별도의 저장 방법에 대한 연구가 활발히 진행되었다. 그 중의 한 방법이 DTD의 분석을 통해서 저장 방법을 결정하는 것이었다. 그러나 DTD는 XML과 다른 문법 구조를 갖기 때문에 파싱의 어려움이 존재하고, 관계 데이터베이스와의 원활한 연계가 어려우며, 사용자가 원하는 형태를 정의해서 사용할 수가 없기 때문에 유연성이 떨어지는 단점을 가지고 있다. 따라서, 본 논문에서는 DTD를 통한 XML 문서의 저장 방법에서 DTD로부터 추출한 저장 구조를 XML 형태의 문서로 변환하여 저장할 수 있는 방법을 제안한다.

  • PDF

Korea Information Science Society (순차 패턴을 이용한 XML문서의 유사성 계산 방법 분석)

  • 이원철;이상민
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.232-234
    • /
    • 2004
  • XML 문서의 요소는 의미적인 정보와 트리기반의 구조적인 정보를 포함하고 있기 때문에 요소의 구조적인 유사성이 곧 XML 문서의 유사성으로 연구되어 왔다. 그러나 구조적이고 순차적인 유사성만을 고려한 순차패턴 유사성 검색 방법은 의미적인(sementic) 유사성을 제대로 반영을 할 수가 없다. 이것은 정보 검색에 있어 재현율(recall)을 낮을 수밖에 없는 원인을 제공한다. 따라서 본 논문에서는 기존에 사용되었던 순차패턴을 기반으로 한 유사성의 계산 방법과 각각의 연구 방법이 의미적인 유사성에 대하여 한계가 있음을 찾아보았다.

  • PDF

The Geometric Layout Analysis of the Document Image Using Connected Components Method and Median Filter (연결요소 방법과 메디안 필터를 이용한 문서영상 기하학적 구조분석)

  • Jang, Dae-Geun;Hwang, Chan-Sik
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.27 no.8A
    • /
    • pp.805-813
    • /
    • 2002
  • Document image should be classified into detailed regions as text, picture, table and etc through the geometric layout analysis if paper documents can be converted automatically into electronic documents. However, complexity of the document layout and variety of the size and density of a picture are the reason to make it difficult to analyze the geometric layout of the document images. In this paper, we propose the method which have a better performance of the region segmentation and classifications, and the line extraction in the table region than the commercial softwares and previous methods. The proposed method can segment the document into detailed regions by using connected components method even if its layout is complex. This method also classifies texts and pictures by using separable median filter even. Though their size and density are diverse, In addition, this method extracts the lines from the table adapting one dimensional median filter to the each horizontal and vertical direction, even though lines are deformed or texts attached to them.

Analysis of Parallel and Sequential processing for integrated XQuery query (통합 XQuery 질의의 병렬처리와 순차처리 성능분석)

  • Kang, Soon-Jong;Park, Jong-Hyun;Kang, Ji-Hoon
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10c
    • /
    • pp.214-217
    • /
    • 2006
  • XML 문서의 검색을 위한 질의 언어인 XQuery는 다양한 데이터 소스로부터 가져온 고유한 구조를 가진 질의 결과로 구성할 수 있도록 설계되어 XML질의 언어의 표준이 되었다. XQuery를 이용해 특별히, 분산 환경에서 다중 XML문서 를 대상으로 하는 통합 질의의 경우, 질의 처리 계획을 결정하는 것은 처리 효율과 직결된다. 따라서 질의 처리 계획을 결정하는 요소 중 하나인 조인 처리 방법의 연구는 중요하다. 그러나 통합 질의에서 조인구조를 기준으로 단일 XML문서에 대한 질의 처리방법을 결정하는 것은 쉽지 않다. 본 논문에서는 분산환경에서 다중 XML문서를 대상으로 하는 조인을 포함한 다양한 통합 질의를 대상으로 실험을 통해 병렬처리 방법과 순차처리 방법 그리고 두 가지 처리방법을 조합한 하이브리드 방법을 적용하여 처리 시간을 비교 분석하고, 다중 문서에 대한 효율적인 조인방법과 순서를 모색한다.

  • PDF

XML Global Schema Generation Model of XML Documents Considering Conflicts on Local Schema Integration (지역 스키마간 충돌 문제를 고려한 XML 문서의 전역 스키마 생성 모델)

  • 김정희;곽호영
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10c
    • /
    • pp.70-72
    • /
    • 2002
  • 본 논문에서는 분산된 XML 문서를 수집 처리하여 상호 제공하는 과정에서 활용될 통합된 XML 문서의 전역 스키마를 생성하는 시스템을 제안한다. 제안된 시스템에서는 분산 환경에 존재하는 개별적인 XML 문서들에 대한 지역 스키마 정보를 관계형 데이터베이스로 구축하고, 통합된 XML 문서의 데이터를 기반으로 각각의 지역 스키마 데이터베이스를 검색한 후 데이터에 적합한 스키마 정의를 추출하게 된다. 또한 추출과정에서 중복 정의에 의한 충돌 범주를 분석하고, 이를 해결하는 방법도 제시하였다. 시스템 모델링 결과 XML 문서의 구조와 검증을 명확하게 보장하는 통합된 XHL 문서의 전역 스키마 생성과 지역 스키마간 발생되는 충돌문제 해결이 가능함을 알 수 있었다.

  • PDF

Design of a 3-Tiered XML Document Storage System (3계층 XML 문서 저장 시스템의 설계)

  • Oh, Jun-Hwan;Lee, Byung-Wook
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2000.04a
    • /
    • pp.16-21
    • /
    • 2000
  • XML 문서와 같은 구조적 문서는 관계형 데이터베이스에 저장하는 것이 적합하다. 본 논문에서는 XML 문서의 각 엘리먼트를 관계형 데이터베이스에 검색을 위해 적정 노드까지만 깊이 우선 탐색 순서쌍에 의해 저장하고, 검색된 문서의 재생성 속도를 향상하기 위해 문서전체를 저장하는 방법을 제시하였다. 또 위에서 제시한 방법을 저장 시스템과 분석 검색하는 시스템을 서로 다른 사이트로 분리하는 것을 제안한다. 이를 통해 XML 문서를 서로 다른 사이트로 분리함으로써 서버의 부담을 줄여 저장 및 검색 성능을 향상한다.

  • PDF

Design and Implementation for the Effective Web (효율적인 웹 마이닝 시스템의 설계 및 구현)

  • 김형욱;최익규;김민구
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2002.11a
    • /
    • pp.303-307
    • /
    • 2002
  • 효율적인 웹 마이닝을 위해서는 방대한 인터넷 공간에서 사용자가 원하는 정보를 찾아내고, 이들 중 보다 유용하다고 판단되어진 자료를 선별적으로 제시할 수 있어야 한다. 본 논문에서는 웹 컨텐츠 분석과 HTML 문서들 사이의 링크 연결의 패턴 분석을 기반으로 하는 웹 구조 분석 방법들을 검토하고, 웹 검색 시스템을 구현하여 결과를 분석하였다. 이를 위해 웹 문서의 내용을 인덱싱한 뒤 질의와의 관련성의 확률을 구하는 랭귀지 검색 모델에 링크 구조 분석을 이용한 순위 알고리즘을 사용하여 좋은 결과를 얻고자 하였다. 또한 기존의 링크 관련 알고리즘에서 알려진 문제점을 해결하기 위한 몇가지 테크닉을 사용하였다.

  • PDF

Design and Implementation of Interactive Editing System for SGML DTD Composition (SGML 문서형 정의부 작성을 위한 대화형 편집 시스템 설계 및 구현)

  • 김창수;정회경
    • The Journal of Information Technology
    • /
    • v.2 no.2
    • /
    • pp.35-49
    • /
    • 1999
  • This papar describes an design and implementation of a rule builder, named SGML DTD(Document Type Definition) Editor conforming to ISO 8879(SGML : Standard Generalized Markup Language). SGML DTD define types of logical structure in documents and it is very hard to managing, operating with general common text editors because of it's complex structures. Therefore, We studied DTD automatic editor and production system, prototype system, direct operations on graphic trees in the environment of windows. It's easy to handle with general users. So, We analyzed the structures of document, and studied about SGML documents operation models. And also described logical structures by tree on Windows.

  • PDF

An SGML Document Authoring Tool (SGML 문서 저작 도구)

  • An, Bo-Hui;Yu, Jae-U;Song, Hu-Bong
    • The Transactions of the Korea Information Processing Society
    • /
    • v.6 no.2
    • /
    • pp.512-521
    • /
    • 1999
  • SGML, defined as the ISO 8879, is a meta-language to define a document type, used as basic format for electronic documents. Since an SGML document is composed of a document type definition and a document instance conforms to the definition, it is necessary for SGML document authoring tools to compose and validate document type and document instance. In present, formal models and procedures for SGML documents are not defined, it's not easy to construct such tools. We propose a model of SGML authoring tool consists of SGML parser, document type definition editor, SGML document editor and style editor. We also introduce and implement formal procedure for each component. For user convenience, we adopted icon based visual programming method, and solved the HANGUL problems. The SGML authoring tool is implemented I Windows NT system using java and C++ programming language.

  • PDF

Development of A Tool for Transforming XML Document for E-commerce (E-commerce를 위한 XML 문서 변환 도구 개발)

  • 최정익;정재우;하상호
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2001.11a
    • /
    • pp.472-476
    • /
    • 2001
  • 현재 전자상거래에서 정보전달에 쓰이고 있는 HTML이나 EDI는 정보의 전달과 효율방면에는 별로 유용하지가 않다. 그 대처 방안으로 정보전달에 매우 유용하고 효율적인 XML이 대두되고 있다. 그러나 XML 문서는 정보제공자 마다 그 구성과 태그이름이 다르다. 이러한 타 XML 문서를 사용하기 위해서는 정보제공자와 같은 구조의 XML을 사용하거나 XML문서의 변환이 불가피하다. XML은 XSL을 사용하여 변환이 가능하지만 구조와 요소이름이 파악되지 않은 XML문서의 변환은 그 문서를 분석뿐만 아니라 변환시킬 수 있는 XSL을 직접 제작 해줘야 한다. 이와 같은 작업은 전자 상거래에서 저해요인이 될 뿐 아니라 시간적으로도 크나큰 손실이다. 본 논문에서는 Java를 기반으로 사용자의 편의적인 GUI(Graphical Use Interface)에 입각한 XSL문서 제작 도구의 구현 및 향후 개발 방향을 제시하였다.

  • PDF