• Title/Summary/Keyword: 문서 구조 분석

Search Result 496, Processing Time 0.026 seconds

Dynamic Generation of Graphical User Interfaces from WSDL Documents (WSDL 문서로부터 그래픽 유저 인터페이스의 동적인 생성)

  • Song Ki-Sub;Lee Kyong-Ho
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.11b
    • /
    • pp.553-555
    • /
    • 2005
  • 본 논문에서는 웹 서비스의 WSDL 문서로부터 XForms에 기반한 그래픽 유저 인터페이스를 동적으로 생성하는 방법을 제안한다. 제안된 방법은 구조분석과 XForms 변환의 두 단계로 구성된다. 구조분석 단계는 입력된 WSDL의 구조를 파악하여 인터페이스 생성에 필요한 요소를 추출하고, 이후 XForms 변환단계에서 변환규칙을 적용함으로써 적절한 인터페이스를 생성한다.

  • PDF

The Design & Analysis of Time-Stamp Protocol with H-Binary Tree (H-이진트리 구조를 갖는 타임스탬프 설계 및 분석)

  • Jung, Kyung-Won;Do, Kyoung-Hwa;Jun, Moon-Seog
    • The KIPS Transactions:PartC
    • /
    • v.9C no.6
    • /
    • pp.817-822
    • /
    • 2002
  • We want to find a timestamping method which improves efficient performance and have high-level security to send secured messages in the digital signature and the law of e-commerces. Our paper shows a H-binary tree of time stamp to use a time stamp protocol with high suity and performance in the packets of sending messages. We implement and analyze the protocols, show to compare with previous RSA methods. Our proposed protocol has O(log n) time complexity and high-performance.

Design and Implementation of XML Publishing Subsystem in the XML Storage and Retrieval System (XML 저장 및 검색 시스템에서의 XML 문서 추출 서브시스템의 설계 및 구현)

  • 곽민성;홍석진;이석호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.109-111
    • /
    • 2003
  • 관계형 데이타베이스에 저장되어 있는 데이타를 XML 문서로 추출하기 위해서는 데이블에 저장된 데이타를 XML 문서 형식에 맞는 계층적인 관계를 가지도록 구조화하는 과정이 필요하다. 본 논문에서는 관계형 데이타베이스를 사용하는 XML 저장 및 검색 시스템인 eXDM(embedded XML Database Management System)의 내부에서 구현한 XML 문서 추출 서브시스템에 대하여 기술한다. 이 시스템은 XML 문서에 대한 질의(XQuery)의 RETURN 절과 SORTBY 절을 분석하여, 관계형 데이타베이스에 저장되어 있는 데이타를 구조화하여 계층적인 구조를 가지는 XML 문서 형태로 추출한다.

  • PDF

Design and Implementation of Testbed for Information Cost Test (이동 객체 데이터베이스 상에서 정보 비용 테스트를 위한 테스트 베드의 설계 및 구현)

  • 김태원;김경식;김창화;강태원
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10c
    • /
    • pp.73-75
    • /
    • 2002
  • 본 논문에서는 분산된 XML 문서를 수집 처리하여 상호 제공하는 과정에서 활용될 통합된 XML 문서의 전역 스키마를 생성하는 시스템을 제안한다. 제안된 시스템에서는 분산 환경에 존재하는 개별적인 XML 문서들에 대한 지역 스키마 정보를 관계형 데이터베이스로 구축하고, 통합된 XML 문서의 데이터를 기반으로 각각의 지역 스키마 데이터베이스를 검색한 후 데이터에 적합한 스키마 정의를 추출하게 된다. 또한 추출과정에서 중복 정의에 의한 충돌 범주를 분석하고, 이를 해결하는 방법도 제시하였다. 시스템 모델링 결과 XML 문서의 구조와 검증을 명확하게 보장하는 통합된 XHL 문서의 전역 스키마 생성과 지역 스키마간 발생되는 충돌문제 해결이 가능함을 알 수 있었다.

  • PDF

R3 : Open Domain Question Answering System Using Structure Information of Tables (R3 : 테이블의 구조 정보를 활용한 오픈 도메인 질의응답 시스템)

  • Deokhyung Kang;Gary Geunbae Lee
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.455-460
    • /
    • 2022
  • 오픈 도메인 질의 응답에서 질의에 대한 답변은 질의에 대한 관련 문서를 검색한 다음 질의에 대한 답변을 포함할 수 있는 검색된 문서를 분석함으로써 얻어진다. 문서내의 테이블이 질의와 관련이 있을 수 있음에도 불구하고, 기존의 연구는 주로 문서의 텍스트 부분만을 검색하는 데 초점을 맞추고 있었다. 이에 테이블과 텍스트를 모두 고려하는 질의응답과 관련된 연구가 진행되었으나 테이블의 구조적 정보가 손실되는 등의 한계가 있었다. 본 연구에서는 테이블의 구조적 정보를 모델의 추가적인 임베딩을 통해 활용한 오픈 도메인 질의응답 시스템인 R3를 제안한다. R3는 오픈 도메인 질의 응답 데이터셋인 NQ에 기반한 새로운 데이터셋인 NQ-Open-Multi를 이용해 학습 및 평가하였으며, 테이블의 구조적 정보를 활용하지 않은 시스템에 비해 더 좋은 성능을 보임을 확인할 수 있었다.

  • PDF

Adjusting Edit Scripts on Tree-structured Documents (트리구조의 문서에 대한 편집스크립트 조정)

  • Lee, SukKyoon;Um, HyunMin
    • Journal of Korea Society of Industrial Information Systems
    • /
    • v.24 no.2
    • /
    • pp.1-14
    • /
    • 2019
  • Since most documents used in web, XML, office applications are tree-structured, diff, merge, and version control for tree-structured documents in multi-user environments are crucial tasks. However research on edit scripts which is a basis for them is in primitive stage. In this paper, we present a document model for understanding the change of tree-structured documents as edit scripts are executed, and propose a method of switching adjacent edit operations on tree-structured documents based on the analysis of the effects of edit operations. Mostly, edit scripts which are produced as the results of diff on tree-structured documents only consist of basic operations such as update, insert, delete. However, when move and copy are included in edit scripts, because of the characteristics of their complex operation, it is often that edit scripts are generated to execute in two passes. In this paper, using the proposed method of switching edit operations, we present an algorithm of transforming the edit scripts of X-treeESgen, which are designed to execute in two passes, into the ones that can be executed in one pass.

Digitalizing Technical Documents of Construction Projects Based on Database and XML (데이터베이스와 XML에 기반한 건설프로젝트 기술문서 전자화)

  • Jung Jong-Hyun
    • Korean Journal of Construction Engineering and Management
    • /
    • v.6 no.4 s.26
    • /
    • pp.190-198
    • /
    • 2005
  • This study describes the digitalization of technical documents of construction projects using database for storage and XML for exchange format on the web. First, for this purpose, the requirements for effective digitalization are identified. Second, the strategies for using database and XML are presented. These strategies include the way to store and search for the technical documents, to draw up the XML document for some parts of the technical documents, to arrange the components in their proper hierarchy, to manage the graphics and mathematical expressions in database and XML documents. Finally we discussed the validities of the results of this study by partial implementation for structural design sheets which has all the characteristics of technical documents.

The Design & Implementation of Korean Hypertext Automatic Translator (한글 하이퍼텍스트 자동변환시스팀의 설계 및 구현)

  • Ahn, B.I.;Kim, Jay;Kim, Y.W.
    • Annual Conference on Human and Language Technology
    • /
    • 1993.10a
    • /
    • pp.91-98
    • /
    • 1993
  • 하이퍼텍스트는 문서검색 전산화의 새로운 대안을 제시하고 있으나 저작에 많은 시간과 노력이 요구되는 단점이 있다. 본 연구에서는 기존의 한글문서를 하이퍼텍스트 문서로 자동 변환하는 변환시스팀을 설계, 구현하였다. 문서는 사용자가 제공한 부제목형식의 정규표현식(regular expression)으로부터 논리적 구조가 분석되며 문서분할, 형태소분석, 대표카드결정 및 링크생성의 과정을 거쳐 하이퍼텍스트 문서로 변환된다. 시험운용 결과 본 시스팀은 대량의 한글문서를 적은 노력으로 실용성있는 하이퍼텍스트 문서로 자동 변환할 수 있음을 입증하였다.

  • PDF

Development common DTD on construction-form documents (건설 서식문서에 관한 공통 DTD 개발)

  • Jeong, Seong-Yun;Kim, Seong-Jin;Ok, Hyun;Na, Hei-Suk
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10a
    • /
    • pp.19-21
    • /
    • 2001
  • 건설사업을 시행하면서 발생하는 법정 서식문서를 사업주체간에 보다 원활하게 교환하기 위해서는 서식 문서의 전자화가 선행되어야 한다. 서식문서를 XML로 전자화 할 때 사업주체가 공통으로 활용할 수 있는 문서의 논리구조 정립이 필요하다. 이를 위해서 1,500여 개의 건설관련 법정 서식문서와 건설CALS/EC 사업에서 개발한 XML 전자문서를 조사.분석하였다. 분석된 결과를 바탕으로 서식문서의 공통 구성체계와 구성요소를 구조화하고 이론 XML 규칙에 따라 24개 대표 엘리먼트로 구성된 공통 DTD를 개발하였다.

  • PDF

A new segmentation method for non-manhattan layout document images using connected component (연결요소 특징을 이용한 복잡한 문서영상의 구조 분석)

  • 이상협;이경무
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 1997.11a
    • /
    • pp.71-74
    • /
    • 1997
  • 본 논문은 일반적으로 제약 없는 형식 문서 즉, 논-맨하탄(non-manhattan) 형식의 이진문서영상을 분석하는 기법으로서, 연결요소기법에 기반한 특징추출과 이를 이용한 영역분리 및 분류에 관한 새로운 방법을 제안한다. 제안한 방식은 바텀-업(bottom-up)방식으로서 먼저 처리속도의 고속화와 축소시 특징 영역보존을 위해 임계치 축소기법을 사용하고, 축소된 이진 문서영상내의 각 연결된 검은 화소의 집합을 개체화하고 개체의 특성에 따라 텍스트, 신성분, 해프톤, 도형 그리고 표 등으로 분류한다. 영역분류는 두단계로 이루어지는데, 1차분류에서는 우선, B/W 비, 면적, 외각 테두리의 높이와 너비 비, 테두리선유무 등의 특징을 이용하여 해프톤, 수평 수직선, 테두리(표 및 도형)영역을 분리한다. 이후 2차 분류에서는 문자성분의 수평결합을 통한 텍스트행 성분을 추출한다. 마지막 후처리 과정으로 표분석 알고리듬을 통하여 테두리 영역중 표와 도형을 정확히 구분하고, 또한 도형에 관련한 문서성분을 해당 도형 개체에 연결하는 작업을 수행함으로써 완벽한 영역분류를 한다. 다양한 문서영상을 이용한 시뮬레이션을 통해 제안한 알고리듬의 성능을 입증한다.

  • PDF