• 제목/요약/키워드: Document Processing System

검색결과 397건 처리시간 0.024초

XML 기반의 EDI 문서 처리 시스템 설계 및 구현 (The Design and Implementation of EDI document processing system based on XML)

  • 임대명;정상호;류지웅;정회경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2010년도 춘계학술대회
    • /
    • pp.734-736
    • /
    • 2010
  • 현재 초고속 인터넷망을 이용한 정보 처리(Information processing) 및 정보 교환(Information exchange)에 대한 연구 및 개발이 활발하게 이루어지고 있다. 이를 위해서는 전자 문서에 대한 좀더 효율적이고 정확한 표준화 작업이 진행되어야 한다. 이에 따라 세계 각국의 표준화 기구들은 각종 표준을 제시하고 있으며, 이중 대표적으로 기업 간에 데이터를 교환하는 표준화 시스템으로 EDI(Electronic Data Interchange)를 들 수 있다. EDI는 전자상거래의 한 형태이며, 기업 간 거래에 관한 데이터와 문서를 표준화를 거쳐 컴퓨터 통신망을 이용하여 거래 당사자 간에 직접 송수신이 이루어진다. 하지만, 기업과 기업이 서로 정의된 방식으로 문서를 전달하는 것이므로 데이터 자체가 고정되어 있고 정형화되어 있어 확장 시에 문제가 발생하고, 구조적인 데이터 검색 및 처리가 불가능하다. 이에 본 논문에서는 구조적이고 확장성이 뛰어난 인터넷 표준 언어인 XML(eXtensible Markup Language)을 이용하여 EDI 문서를 처리하는 시스템을 설계 및 구현하였다.

  • PDF

문서 영상의 기울기 검출을 위한 기준선 탐색 기법 (Baseline Searching Method for Document Skew Detection)

  • 신명진;김도연;차의영
    • 한국멀티미디어학회논문지
    • /
    • 제10권2호
    • /
    • pp.218-225
    • /
    • 2007
  • 본 논문은 문자 인식 등을 통한 문서 자동 처리 시스템을 위해서 스캔 과정에서 발생할 수 있는 문서의 기울기를 정확하게 검출하는 기법을 제안한다. 제안한 알고리즘은 처리 속도 향상을 위해 영상을 축소한 다음 형태학적 연산과 연결 성분 분석 방법으로 기울기 검출 대상 영역(ROI)을 먼저 설정한 후 설정된 영역 내에서 문서의 기울기 정보를 가지고 있는 기준선을 탐색하는 방법으로 정확하게 기울어진 각도를 검출할 수 있게 하였다. 기존의 형태학적 연산을 기반으로 한 기울기 검출 기법과 비교하고 다양한 종류의 대용량 문서 영상을 대상으로 한 실험 및 분석을 통해 제안한 기울기 검출 방법의 정확도 및 효율성을 증명하였다.

  • PDF

통합적 EDI 문서생성 시스템의 개발 (Development of an Integrated EDI Document Generation System)

  • 이승익;조성배
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제6권3호
    • /
    • pp.339-347
    • /
    • 2000
  • 국내외적으로 정보통신망의 구축이 활발히 진행됨에 따라 이를 이용하여 개인이나 기업이 업무의 효율성을 높이기 위하여 전자적으로 문서를 교환하여야 할 필요성이 증대되고 있다. 이를 위한 표준으로 UN에서는 전자문서표준을 제정, 보급함으로써 신속하고 정확한 업무의 처리를 돕고 있다. 이 논문에서는 UN에서 제정한 전자문서표준에 따르는 EDI 문서를 통합적으로 처리하는 시스템을 설계하고 구현한다. 이 시스템은 세 개의 부 시스템으로 구성되어 있는데, 각각은 EDI 문서가 문법적으로 올바른지를 검사하기 위한 EDI 파서, EDI 문서를 작성하기 위한 EDI 문서 편집기, 그리고 EDI 문법 규정을 참조하기 위한 EDI 디렉토리 뷰어이다. 이러한 도구들을 통합적으로 사용하면 오류 없는 EDI 문서를 원활히 작성할 수 있을 것이다.

  • PDF

웹을 기반으로 한 PDF 출판 솔류션에 관한 연구 (PDF Publication Solution based on Web)

  • 이재득
    • 산업경영시스템학회지
    • /
    • 제28권2호
    • /
    • pp.109-116
    • /
    • 2005
  • In the previous C/S publishing system, the editor or contributor can arbitrarily modify the document created by the author, in which case it is difficult to identify the changes made in the document. Another shortcoming is in that when the document is in need of tracking or editing, the client must have the respective editing system. To solve this problem, the gist of the document must be preserved along with the document itself, and the process of handling the document must be standardized. Publishing on the web ensures a more stable and accurate result in processing documents. The significance of web publishing is made clear, when we consider the importance of information per se and the growing demand for immediate publication in the present day. The need for a simple and straightforward apache-based PDF publishing system, in which HTML and CSS are supported, and a converting engine provides PDF standard security application support, is prominent. This provides a library in which one can directly create a PDF via Windows, Linux, or Unix without having to rely on a client, allowing high-speed PDF creation. The development of a web-accessed PDF converting engine forms the basis for e-transactions, online brochures, electronic B/L, and many other industrial sectors.

XML 어플리케이션을 위한 트리 기반 문서 편집 시스템의 설계 및 구현 (A Design and Implementation of the Tree-based Document Editing System for XML Application)

  • 김영철;강춘길
    • 정보처리학회논문지D
    • /
    • 제11D권4호
    • /
    • pp.959-966
    • /
    • 2004
  • 본 논문에서는 구조 중심형 환경에서 사용 가능한 트리기반 XML 어플리케이션 문서 편집 시스템의 설계 및 구현에 관하여 논의한다. 본 시스템은 DTD를 ASTD( Syntax Tree Definition)로 변환하여 내장하는 구조로서 잘 설계된(well-formed) 문서는 물론 편집 중에 유효한(valid) 문서를 작성하도록 하기 위하여 구문 지향 편집(syntax-directed editing)을 지원한다. 또한 구조 중심형 환경에서 사용자와의 인터페이스를 담당하는 편집기를 설계함에 있어 새로운 도구의 추가로 인한 기능 확장이 용이하도록 고려하였으며, 편집기의 구현 시 기존의 문법 검증에 대한 비효율성을 감안하여 다중 엔트리(multiple entry)를 적용한 파서를 사용하여 실시간으로 유효성 검증이 가능하도록 하였다. 본 논문은 XML 문서 편집 시스템의 개발 모델을 제시함으로써 관련 어플리케이션 개발에 크게 기여할 것으로 기대된다.

문서 라우팅 기법을 이용한 간호진단 과정에서의 정보접근 (Applying document routing mode of information access in nursing diagnosis process)

  • 백우진
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2006년도 제13회 학술대회 논문집
    • /
    • pp.163-168
    • /
    • 2006
  • Nursing diagnosis process is described as nurses assessing the patients' conditions by applying reasoning and looking for patterns, which fit the defining characteristics of one or more diagnoses. This process is similar to using a typical document retrieval system if we consider the patients' conditions as queries, nursing diagnoses as documents, and the defining characteristics as index terms of the documents. However, there is a small fixed number of nursing diagnoses and infinite number of patients' conditions in a typical hospital setting. This state is more suitable to applying document routing mode of information access, which is defined as a number of archived profiles, compared to individual documents. In this paper, we describe a ROUting-based Nursing Diagnosis (ROUND) system and its Natural Language Processing-based query processing component, which converts the defining characteristics of nursing diagnoses into query representations.

  • PDF

Conceptual Extraction of Compound Korean Keywords

  • Lee, Samuel Sangkon
    • Journal of Information Processing Systems
    • /
    • 제16권2호
    • /
    • pp.447-459
    • /
    • 2020
  • After reading a document, people construct a concept about the information they consumed and merge multiple words to set up keywords that represent the material. With that in mind, this study suggests a smarter and more efficient keyword extraction method wherein scholarly journals are used as the basis for the establishment of production rules based on a concept information of words appearing in a document in a way in which author-provided keywords are functional although they do not appear in the body of the document. This study presents a new way to determine the importance of each keyword, excluding non-relevant keywords. To identify the validity of extracted keywords, titles and abstracts of journals about natural language and auditory language were collected for analysis. The comparison of author-provided keywords with the keyword results of the developed system showed that the developed system was highly useful, with an accuracy rate as good as up to 96%.

공간 정보와 투영 프로파일을 이용한 문서 영상에서의 타이틀 영역 추출 (Automatic Title Detection by Spatial Feature and Projection Profile for Document Images)

  • 박효진;김보람;김욱현
    • 융합신호처리학회논문지
    • /
    • 제11권3호
    • /
    • pp.209-214
    • /
    • 2010
  • 본 논문은 형태 처리기법과 연결요소 분석을 이용한 문서 영상의 분할과 구조적인 특징과 투영 프로파일 분석을 이용하여 문서영상에서 제목영역 추출방안을 제안한다. 문서 영상의 처리는 영상 분할과 제목 추출, 두 단계로 이루어진다. 영상 분할의 단계에서는 문서 영상을 구성요소 영역들로 나눈다. 영상 분할이 끝나면 분할된 영역들을 대상으로 구조적인 정보를 이용하여 제목이 될 후보 영역을 추출한다. 제목이 아닌 영역을 제거하여 제목 후보영역을 추출하고 난 후 투영 프로파일을 분석하여 제목 영역을 최종적으로 추출한다. 본 논문에서 제시된 투영 프로파일 분석을 이용한 제목 추출 방법은 다양한 문서 영상의 분할 및 제목 추출 결과를 보였으며, 문서 제목 인식, 멀티미디어 데이터 검색, 실시간 영상처리와 같은 다양한 응용분야에 활용될 것으로 기대된다.

제한적 문맥 인식과 다중 스트림을 기반으로 한 숫자 정정 OCR 모델의 설계 및 구현 (Design and Implementation of OCR Correction Model for Numeric Digits based on a Context Sensitive and Multiple Streams)

  • 신현경
    • 정보처리학회논문지D
    • /
    • 제18D권1호
    • /
    • pp.67-80
    • /
    • 2011
  • 재무 데이터 관리를 위한 자동화된 비지니스 서류 영상 처리 시스템에서 숫자 정보 검색 중 발생한 오류는 심각하여 그 시스템의 가용성 및 성능을 결정한다. 그 동안 자동 맞춤법 교정에 관한 방법론들이 개발되어 정보 검색 시스템 개발에 중요한 역할을 해왔으나 이러한 맞춤법 교정은 알파벳 등 기계학습이 가능하고 사전 형태로 보관이 가능한 기호에 한정되어왔다. 반면에 순수한 마코프 수열에 불과한 숫자들의 순열들은 맞춤법 교정을 위하여 사전적 형태로 보관하여 활용하는 것이 불가능 하다. 본 논문에서는 확률론적 정보 검색 알고리즘의 토대위에 제한적 문맥 인식과 복수의 스트림을 적용한 새로운 형태의 숫자 정정 OCR 모델을 제안하였다. 본 논문에서 제안된 숫자 정정 모델은 기존의 송장 문서 처리 시스템에 구현하였으며 제안된 숫자 정정 모델의 효과를 확인하기 위해 비교 테스트를 실행하였고 테스트 결과 상당한 성능이 개선되었음을 보여 주었다.

XML에 기반한 EDI 문서교환 시스템 설계 및 구현 (Design and Implementation of EDI Document Exchange system based on XML)

  • 임영태;한우용;정회경
    • 한국정보처리학회논문지
    • /
    • 제7권11S호
    • /
    • pp.3603-3612
    • /
    • 2000
  • 본 논문에서는 XML(eXxtensible Markup Language)을 이용하여 고정적이고 정형화된 EDI(Electronic Data Interchange) 문서를 유동적이고 효율적으로 처리하기 위한 시스템을 설계 및 구현하였다. 본 시스템에서는 사용자가 원하는 문서를 직접 생성할 수 있도록 트랜잭션(Transaction) 처리기와 템플리트(Template) 관리기를 설계 및 구현하였으며, 기존 EDI와의 호환을 위해 변환기를 설계하였다. 또한, 본 시스템의 경우 변환에 반드시 필요한 EDI 메시지 구조를 XML 형식으로 저장하고, 이것을 DOM API로 관리하도록 하여 XML의 구조정보를 이용하여 기존 시스템과의 호환성을 고려하였으며, 사용자가 변환기를 이용하여 템플리트 파일을 생성할 수 있고 필요한 구성요소(elements)를 선택 전송할 수 있도록 해당 인터페이스를 제공하도록 하여, 사용자가 전송할 엘리먼트를 선택할 수 있는 인터페이스를 제공하였다. 그리고 아직까지 다른 시스템에서는 문서의 변환에 관한 적절한 해법을 제시하지 못하고 있지만 본 시스템에서는 기존의 시스템이 제공하지 못하는 XML기반의 EDI문서 변환 기법 및 구조정보를 제공하여 그 해법을 제안하고 있다.

  • PDF