• 제목/요약/키워드: structured document

검색결과 170건 처리시간 0.034초

분산환경에서의 JAVA,CORBA를 이용한 전자문서관리시스템 구현 (Electronic Document Management System based on JAVA,CORBA)

  • 김형선;한성배
    • 산업경영시스템학회지
    • /
    • 제21권48호
    • /
    • pp.193-199
    • /
    • 1998
  • Electronic document management system is tool, based on the document life cycle concept, for structured management of various documents within an organization. In this paper, we address a development process of electronic document management system based on pure JAVA and CORBA. We have developed a electronic document management system which can support a variety of platform in heterogeneous distributed environment. EDMS can serve as an integration platform for industries that require handling of massive document and data such as construction and engineering, automobile, shipbuilding industries. Using the developed system, users can access documents in the system through an internet brower, and also add or modify existing document.

  • PDF

웹상에서의 의사결정모형의 객체지향적 표현과 관리를 위한 구조적 마크업 언어 (A Structured Markup Language for the Object-Oriented Representation and Management of Decision Models on the Web)

  • 김형도
    • Asia pacific journal of information systems
    • /
    • 제8권2호
    • /
    • pp.53-67
    • /
    • 1998
  • The explosive growth of the Web is providing end-users access to ever-increasing volumes of information. The resources of legacy systems and relational databases have also been made available to the Web browser, which has become an essential business tool. Recently, model management on the Internet/Web is also proposed with its conceptual design or prototypical system like DecisionNet and DSS Web. However, they are also suffering from the same symptoms as the Web, Although we can identify the elements of a page with HTML tags and (declare) the relationships among the various document elements, they are semantically opaque to computer systems and have no domain-specific meaning. However, HTML is not extensible, so developers are forced to invent convoluted, non-standard solutions for embedding and parsing data. Extensible Markup Language (XML) is a simplified subset of SGML that has many benefits for folks who want to improve structure, maintainability, searchability, presentation, and other aspects of their document management. This paper proposes a structured markup language for model representation and management on the Web as an XML application. The language is based on a conceptual modeling framework, Object-Oriented Structured Modeling (OOSM), which is an extension of the structured modeling.

  • PDF

초고속정보통신망상에서 웹 기반의 전자문서교환(EDI) 시스템 구현 (The Development of Web Browsed Electronic Document Interchanges System)

  • 김낙현;노명호
    • 산업공학
    • /
    • 제13권2호
    • /
    • pp.258-265
    • /
    • 2000
  • EDI(Electronic Data Interchange) allows the exchange of business information and computer-processable data in a standard, structured format electronically between organizational entities. EDI handles the restructuring of a business document into the standard format so that it can be transmitted from one computer to another. This paper identifies features and technologies of web browsed electronic document exchange system as follows 1) the fundamental technologies that consists of the EDI technologies, the Internet/Web technologies, the security/authentication techniques, and the XML implementation technologies. 2) the functions that consists of the document standards, transfer technology of the document, encryption and authentication 3) the implemented Web-EDI systems that consists of document generation module, encryption and authentication module, transfer module, acknowledgement module, administration module. In this paper, the Web-based EDI system implemented from the researched technologies will be installed on the EDI servers owned by corporate customers and enable the exchange of documents between each installed companies.

  • PDF

Structured light를 이용한 깊이 차이에 문자 왜곡 교정 (Restoration of Distorted Document Image Due to Depth Variation by Using Structured Light)

  • 허훈;채옥삼
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.487-489
    • /
    • 2001
  • 제본된 책이나 고문서를 디자타이즈할 때 책을 바르게 펴지 못하거나 지정된 위치나 방위로 위치시키지 못해서 문제가 발생한다. 특히 힘을 가할 수 없는 고문서의 경우에는 바르게 펼수가 없기 때문에 깊이 차이에 의한 문서의 왜곡이 발생한다. 본 연구에서는 Structured Light을 이용하여 깊이 차에 의한 문자의 왜곡을 복원하는 방안을 제안한다. 또한 입력시 책의 위치와 방위에 대한 제한을 완화시킬 수 있도록 책의 위치와 방위 변화에 적을 알 수 있는 방안을 제안한다,

  • PDF

MIRAGE-III 디지털도서관에서 가상문서 검색 서버의 설계 및 구현 (Design and Implementation of a Retrieval Server for Virtual Documents in the MIRAGE-III Digital Library)

  • 이용배;맹성현
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제8권2호
    • /
    • pp.219-230
    • /
    • 2002
  • 인터넷이용의 급증에 따라 지식정보화사회 전반의 작업들이 분산환경의 디지털도서관에 저장되어 있는 멀티미디어 컨텐츠를 쉽고 신속하게 찾아 새로운 정보를 생성 또는 공유하는 작업을 통해 이루어진다. 이를 위해 핵심적으로 연구해야 할 부분은 원격지에 흩어져 있는 정보를 효과적으로 연결시켜서 의미있고 일관된 형태로 보여지도록 하는 것이다. 이 목적을 달성하기 위해 디지털도서관에서는 물리적으로 홑어져 있는 정보들이 논리적으로 일관되게 표현될 수 있는 가상공간을 제공해야 하며 가상공간에서 정보가 표현되었을 때 사용자가 원하는 정보를 신속하게 수집하여 제시할 수 있어야 한다. 가상문서(Virtual Document)란 특정 저장장소에 저장되어 존재하던 물리적 문서(Physical Document)들을 대상으로 사용자에게 필요한 일부분 또는 전체를 동적으로 연결하여 통합한 문서를 의미한다. MIRAGE-III 디지털도서관에서는 일반 텍스트문서와 XML로 기술된 구조화된 가상문서를 대상으로 내용기반 검색을 수행한다. 이 시스템에서는 XML 문서구조를 기반으로 부분문서의 검색이 가능하며 문서의 속성 및 계층구조에 대한 검색과 문서간의 링크관계를 이용한 검색도 가능하다. 본 논문에서는 MIRAGE-III 디지털도서관에서의 질의어처리기 및 검색기를 설계하고 구현한 방법론에 대하여 기술한다.

사용자 의도 트리를 사용한 동적 카테고리 재구성 (Dynamic recomposition of document category using user intention tree)

  • 김효래;장영철;이창훈
    • 정보처리학회논문지B
    • /
    • 제8B권6호
    • /
    • pp.657-668
    • /
    • 2001
  • 기존에 단어의 빈도수를 근간으로 하는 문서 분류 시스템에서는 단일 키워드를 사용하기 때문에 사용자의 의도를 충분히 반영한 문서 분류가 어려웠다. 이러한 단점을 개선하기 위하여 우선 기존의 설명에 근거한 학습방법(explanation based learning)에서 한 예제만 있어도 지식베이스 정보와 함께 개념을 학습할 수 있다는 점에 착안하여 먼저 사용자 질의를 분석, 확장한 후 사용자 의도 트리를 생성한다. 이 의도 트리의 정보를 기존의 키워드 빈도 수에 근거한 문서분류 과정에 제약 및 보충 정보로 사용하여 사용자의 의도에 더욱더 근접한 웹 문서를 분류할 수 있다. 문서를 분류하는 측면에서 볼 때 구조화된 사용자 의도 정보는 단순한 키워드의 한계를 극복하여 문서 분류 과정에서 특정 키워드 빈도수의 임계값을 결정함으로서 잃게되는 문서 및 정보를 좀더 보유하고 재적용할 수 있게 된다. 질의에서 분석, 추출된 사용자 의도 트리는 기존의 통계 및 확률을 사용한 문서 분류기법들과 조합하여 사용자 의도정보를 제공함으로서 카테고리의 형성 방향과 범위를 결정하는데 높은 효율성을 보인다.

  • PDF

XML 문서의 효율적인 검색과 재사용성을 지원하는 데이터 모델 (New Data Model for Efficient Search and Reusability of XML Documents)

  • 김은영;천세학
    • 지능정보연구
    • /
    • 제10권3호
    • /
    • pp.27-37
    • /
    • 2004
  • 인터넷상에서 데이터를 표현하고 데이터를 서로 교환하기 위한 문서 표준으로 XML이 제시되고 있다. XML은 또한 웹상에 산재되어 있는 문서에 대한 쉬운 검색 및 재사용을 지원하는 문서 표준으로도 부각되고 있다. XML 콘텐츠 관리 시스템을 구현할 때 Semi-structured 데이터를 얼마나 효율적이고 효과적으로 검색 및 관리할 수 있는 가하는 점과 XML의 특징인 재사용성을 얼마나 지원해 줄 수 있는가를 고려해서 XML 데이터를 모델링 해야한다. 또한 모델링한 데이터를 어떻게 실질적으로 저장해야 할 것인 가도 고려해야 한다. 본 논문에서는 XML 문서의 데이터를 데이터 시스템에 저장하고 검색하기 위한 새로운 데이터 모델을 제안한다. 제안하는 데이터 모델은 XML 문서의 데이터 뷰와 구조 뷰를 모두 표현하며 XML 문서를 위한 새로운 데이터 시스템이나 기존의 관계형 시스템 모두를 고려한다.

  • PDF

DISSECTION TECHNIQUE FOR EFFICIENT JOIN OPERATION ON SEMI-STRUCTURED DOCUMENT STREAM

  • Seo, Dong-Hyeok;Lee, Dong-Gyu;Ryu, Keun-Ho
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2007년도 Proceedings of ISRS 2007
    • /
    • pp.11-13
    • /
    • 2007
  • There has been much interest in stream query processing. Various index techniques and advanced join techniques have been proposed to efficiently process data stream queries. Previous proposals support rapid and advanced response to the data stream queries. However, the amount of data stream is increasing and the data stream query processing needs more speedup than before. In this paper, we proposed novel query processing techniques for large number of incoming documents stream. We proposed Dissection Technique for efficient query processing in the data stream environment. We focused on the dissection technique in join query processing. Our technique shows efficient operation performance comparing with the other proposal in the data stream. Proposed technique is applied to the sensor network system and XML database.

  • PDF

상이한 구조의 XML문서들에서 경로 질의 처리를 위한 RDBMS기반 역 인덱스 기법 (An RDBMS-based Inverted Index Technique for Path Queries Processing on XML Documents with Different Structures)

  • 민경섭;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권4호
    • /
    • pp.420-428
    • /
    • 2003
  • XML은 웹을 비롯한 모든 문서들을 표현할 수 있는 데이타 중심 표준 언어이다. XML 기반의 여러 문서 개발 도구들의 등장과 이를 이용한 사유 XML 문서의 증가, XML 문서로의 기존 데이타 변환가속화로 인해, 우리는 대량의 서로 상이한 구조로 표현된 XML 문서들을 가지게 되었으며, 이러한 문서 집합으로부터 원하는 정보를 담은 문서를 추출해 내는 것이 중요해 졌다. 하지만, 기존의 XML 문서에 대한 연구들은 한 개의 대규모 XML 문서나 동일한 구조를 가진 문서들에 대한 저장, 검색에 초점이 맞춰져 있거나. 상이한 구조를 지원하더라도, 구조적인 정보를 이용한 빠른 검색을 지원하지 못하는 단점을 가지고 있었다. 이에, 본 논문에서는 상이한 구조를 가진 문서들에 대해서도 빠른 경로 질의를 제공할 수 있도록 지원하기 위한 새로운 기법으로, 관계형 데이타베이스 시스템을 이용한 새로운 역 인덱스를 제안하였다. 우리는 제안된 기법이 기존의 방법에 비해 높은 성능을 보임을 실험을 통해 확인하였다. 특히, 간접 포함 관계를 포함한 모든 진의에서 논은 성능을 제공함으로서, 상이한 구조를 가진 문서들에 대해 적합한 인덱스 구조임을 보여 주었다.

Machine Learning Based Automatic Categorization Model for Text Lines in Invoice Documents

  • Shin, Hyun-Kyung
    • 한국멀티미디어학회논문지
    • /
    • 제13권12호
    • /
    • pp.1786-1797
    • /
    • 2010
  • Automatic understanding of contents in document image is a very hard problem due to involvement with mathematically challenging problems originated mainly from the over-determined system induced by document segmentation process. In both academic and industrial areas, there have been incessant and various efforts to improve core parts of content retrieval technologies by the means of separating out segmentation related issues using semi-structured document, e.g., invoice,. In this paper we proposed classification models for text lines on invoice document in which text lines were clustered into the five categories in accordance with their contents: purchase order header, invoice header, summary header, surcharge header, purchase items. Our investigation was concentrated on the performance of machine learning based models in aspect of linear-discriminant-analysis (LDA) and non-LDA (logic based). In the group of LDA, na$\"{\i}$ve baysian, k-nearest neighbor, and SVM were used, in the group of non LDA, decision tree, random forest, and boost were used. We described the details of feature vector construction and the selection processes of the model and the parameter including training and validation. We also presented the experimental results of comparison on training/classification error levels for the models employed.