• 제목/요약/키워드: Document Processing System

검색결과 394건 처리시간 0.03초

XML 링크정보를 이용한 정보 검색 색인 기법의 설계 (Design of an Information Retrieval Indexing Method using XML Links)

  • 김은정;배종민
    • 한국정보처리학회논문지
    • /
    • 제7권7호
    • /
    • pp.2020-2027
    • /
    • 2000
  • The hypertext document is used for information exchange in the Web environments. Its structure is considered as having graph structures with links, which makes nonlinear processing of documents possible. This paper proposes an indexing method for information retrieval system using XML links. We define new attributes that control links of a remote document and assign an unique identifier for the attribute of each link. Each identifier has a different weight according to its occurrence position that is local or remote documents. We index a word not only from a local document but a remote document based on the given weight. Experimental results show that the proposed method outperforms conventional retrieval systems that ignore links.

  • PDF

ODA에 근거한 문서 클래스 에디터 설계 및 구현 (Implementation and Design of Document Class Editor based on ODA)

  • 정회경;이수연
    • 한국통신학회논문지
    • /
    • 제17권12호
    • /
    • pp.1412-1422
    • /
    • 1992
  • 본 논문은 이 기종 문서처리 시스템간에 문서교환을 위해 국제 표준으로 재정된 ODA에 따른 문서 클래스(class) 에디터 설계 및 구현에 대하여 기술하였다. ODA에서처럼 문서구조를 공통 논리구조와 배치구조로 분리하여 처리하였으며, 문서 프로화일을 작성 할 수 있도록 설계하였다. 문서가 정확하게 작성되었는지를 객체(object) 단위로 확인할 수 있는 유틸리티(utility)를 구현하였다. 또한 그 문서의 ODIF 스트림(stream) 데이타가 정확한지를 확인하였다. 본 에디터는 국제 문서 응용 프로화일 (DAP : Document Application Profile)인 DAP 단계 2의 제안에 따라 설계하였으며, UNIX 운영체제의 SUN 워크스테이션상에서 이식성이 좋고 일관된 사용자 인터페이스(interface)를 제공하는 X 윈도우 및 Motif 환경하에서 구현하였다. 본 연구를 통하여 구현된 에디터는 특정 문서구조를 갖는 실제 ODA 문서를 작성시 이용될 수 있다.

  • PDF

능동문서: 서식설계자의 프로그램 (Active Documents: Programs by Form Designers)

  • 남철기;배재학;유해영
    • 정보처리학회논문지B
    • /
    • 제10B권6호
    • /
    • pp.599-610
    • /
    • 2003
  • 웹은 정보 제공원으로서 중요한 역할을 하며 대부분의 웹 응용프로그램은 문서 중심이다. 문서는 문서설계자의 의도를 함축하고 있으며 이는 업무처리 과정의 자동화에 적극적으로 활용될 수 있다. 이러한 문서기능의 본질 파악을 통해 본 논문에서는 특별한 경우, 문서를 실행 가능한 컴퓨터 프로그램으로 보는 시각으로 접근하였다. 이를 위해 서식, 지식베이스, 규칙 그리고, 질의로 구성되는 능동문서 모델을 제안하였다. 이 모델의 각 요소는 문서의 재사용과 상호 운용성을 위해 XML로 일관되게 표현된다. 소개한 능동문서는 사용자 인터페이스를 제공하는 수동적인 역할뿐만 아니라 문서설계자가 의도하는 문서처리 절차와 업무규칙을 기계가 읽고 추론하여 처리할 수 있게 하는 문서이다. 이를 통해 문서와 기계가 상호작용을 할 수 있으며 다른 응용 프로그램과 협력할 수도 있다. 이러한 능동문서의 적용 가능함을 보이기 위해 기업 간 거래(B2B) 시스템에서 구매주문 처리의 예를 보였다. 서식문서를 컴퓨터 프로그램의 시각으로 바라보는 본 논문의 접근법을 통해 본 연구는 문서중심의 지능적인 응용프로그램 개발을 가속화하는 발판을 마련할 수 있을 것이다. 요컨대 본 논문에서 제시한 능동문서는 지식표현 및 처리기능이 내장되어 있는 바, 시맨틱 웹(Semantic Web)이 추구하는 문서의 역할을 담당할 수 있을 것으로 기대한다.

XML뷰를 이용한 XQL질의처리 시스템 (XQL Query Processing System using XML Views)

  • 김천식;손기락
    • 한국멀티미디어학회논문지
    • /
    • 제5권2호
    • /
    • pp.129-140
    • /
    • 2002
  • XML은 웹 상에서 문서 데이터 교환을 위한 표준이 되었다. 현재 대부분의 상업적인 데이터가 관계형 데이터베이스 시스템에 저장되어 있다. 관계형 데이터베이스에 저장되어 있는 문서를B2B간에 교환하기 위해서는 XML형태의 문서로 변환하는 작업이 필요하다. 본 논문에서는 관계형 데이터베이스에 저장되어 있는 문서데이터로부터 필요한 정보를 쉽고 편리하게 질의하고 결과를 얻을 수 있도록 XML질의처리시스템에 대한 연구를 하였다. 그리고 XML 문서를 사용하는 사용자들이 관계형 데이터 베이스에 저장되어 있는 문서를 XML문서로 간주하여 질의할 수 있도록 하기 위해서 R2X라 부르는 XML뷰를 설계하였다. 본 논문에서는 이 R2X뷰를 이용하여 XQL질의언어로 편리하게 질의할 수 있는 질의처리 시스템을 설계 및 구현하였다.

  • PDF

Development of Knowledge Code Converter for Design Knowledge Management

  • Nomaguchi, Yutaka;Shimomura, Yoshiki
    • International Journal of CAD/CAM
    • /
    • 제5권1호
    • /
    • pp.83-90
    • /
    • 2005
  • This is a report on a new methodology to manage design knowledge by utilizing a knowledge-based CAD and a prototype system named $C^3$ (Cubic; CAD knowledge Code Capacitor), which is being developed using our methodology. $C^3$ facilitates (i) the automatic generation of a knowledge code for a knowledge-based CAD by processing design documents written in the format near the natural language, such as English or Japanese, and (ii) automatically generation of a design document written in the format near the natural language from the knowledge code. The features of the system facilitate document-based design knowledge management which reduces the designer's load to encode and maintain design knowledge, because it is easier for a designer to treat a natural language description than a coded description.

네트워크 상에서의 공동저작 프로토타입 시스템 (a Prototype System for collaborative Authoring Over a Network)

  • 김차종
    • 한국정보처리학회논문지
    • /
    • 제6권4호
    • /
    • pp.1009-1021
    • /
    • 1999
  • 본 논문에서는 네트워크 상에서의 공동저작을 위한 프로토타입 시스템의 설계원칙과 구조를 기술한다. 본 시스템은 주석 달기와 주석 확인을 위해서 광범위한 문서공간에서의 네비게이션 기능, 문서 locking 과 작업기록을 포함한 작업그룹 모니터 링 및 관리를 위한 도구를 포함하고 있다. 설계된 프로토타입은 인간과 컴퓨터 상호작용, 그룹 사호작용, 그룹지원, 문서구조화의 구현 시험을 위한 testbed로 제공 될 수 있으며, 프로토타입의 개발배경과 문제점도 지적한다.

  • PDF

XML 문서 관리 시스템 (XML Document Management System)

  • 나중찬;이미영;김완석;김명준;이규철
    • 한국정보처리학회논문지
    • /
    • 제7권2S호
    • /
    • pp.711-720
    • /
    • 2000
  • BADA-IV/XML is a system designed specifically for managing XML. Documents and is essential to various electronic document applications as a fundamental system. BADA-IV/XML supports all of aspects of data model, querying and manipulation operations for managing XML documents. This paper provides an overview of these aspects of the BADA-IV/XML, as well as defines schema classes for stroing, querying and maintaining hierarchical semantics of multimedia documents and structural semantics of complex documents linked with each other, Also a multimedia document query language is designed and implemented to support essential operations for efficient searching and managing multimedia documents. Finally, some simulation results show the performance of the paged VF(Virtual Fragmentation) model and the search model using element's identifier as compared with a general model.

DSSSL에 기반한 SGML 문서 표현 시스템의 설계 및 구현 (Design and Implementation of an SGML Document Presentation System based on DSSSL)

  • 김창수;정회경;윤보현;강현규
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제6권5호
    • /
    • pp.477-486
    • /
    • 2000
  • 본 논문은 SGML(Standard Generalized Markup Language) 문서를 포맷팅 처리하여 표현하기 위한 SGML 문서정보 표현 시스템의 설계 및 구현에 관한 것이다. 이를 위해 본 논문에서는 ISO/IEC에서 SGML 문서 포맷팅을 위해 정의한 모델인 DSSSL(Document Style Semantics and Specification Language)표준에 따라 시스템을 설게하였고, SGML 문서를 온라인으로 포맷팅 처리하는 시스템을 구현하였다. 본 시스템은 한글 처리를 지원하면서 임의의 DTD(Document Type Definition), SGML 문서, DSSSL 스타일 시트에 대한 파싱 기능을 가지며, 텍스트뿐만 아니라 표, 목록, 그림 등 다양한 명세 표현이 처리 가능한 포맷터를 포함한다. 이는 이 기종간에 포맷 정보를 포함한 SGML 문서 교환에 대한 사용자 욕구를 충족시킬 수 있으리라 보며, SGML 문서처리 환경 구축에 크게 기여하리라 본다.

  • PDF

Modified ECCD 및 문서별 범주 가중치를 이용한 문서 분류 시스템 (A Document Classification System Using Modified ECCD and Category Weight for each Document)

  • 한정석;박상용;이수원
    • 정보처리학회논문지B
    • /
    • 제19B권4호
    • /
    • pp.237-242
    • /
    • 2012
  • 웹 문서 정보 서비스는 관리자의 효율적 문서관리와 사용자의 문서검색 편의성을 위해 문서 분류 시스템을 필요로 한다. 기존의 문서 분류 시스템은 분류하고자 하는 문서 내 선택된 자질어의 개수가 적거나, 특정 범주의 문서 비율이 높아 그 범주에서 대부분의 자질어가 선택되어 모델이 생성된 경우 분류 정확도가 저하되는 문제점을 가진다. 이러한 문제점을 해결하기 위해 본 논문에서는 'Modified ECCD' 기법 및 '문서별 범주 가중치' 특징 변수를 사용한 문서 분류 시스템을 제안한다. 실험 결과, 제안 방법인 'Modified ECCD' 기법이 ${\chi}^2$ 및 ECCD 기법에 비해 높은 분류 성능을 보였으며, '문서별 범주 가중치' 특징 변수를 'Modified ECCD' 기법으로 선택된 자질어 변수에 추가하여 학습하였을 경우에 더 높은 분류 성능을 보였다.