• 제목/요약/키워드: Document processing automation

검색결과 20건 처리시간 0.03초

능동문서: 서식설계자의 프로그램 (Active Documents: Programs by Form Designers)

  • 남철기;배재학;유해영
    • 정보처리학회논문지B
    • /
    • 제10B권6호
    • /
    • pp.599-610
    • /
    • 2003
  • 웹은 정보 제공원으로서 중요한 역할을 하며 대부분의 웹 응용프로그램은 문서 중심이다. 문서는 문서설계자의 의도를 함축하고 있으며 이는 업무처리 과정의 자동화에 적극적으로 활용될 수 있다. 이러한 문서기능의 본질 파악을 통해 본 논문에서는 특별한 경우, 문서를 실행 가능한 컴퓨터 프로그램으로 보는 시각으로 접근하였다. 이를 위해 서식, 지식베이스, 규칙 그리고, 질의로 구성되는 능동문서 모델을 제안하였다. 이 모델의 각 요소는 문서의 재사용과 상호 운용성을 위해 XML로 일관되게 표현된다. 소개한 능동문서는 사용자 인터페이스를 제공하는 수동적인 역할뿐만 아니라 문서설계자가 의도하는 문서처리 절차와 업무규칙을 기계가 읽고 추론하여 처리할 수 있게 하는 문서이다. 이를 통해 문서와 기계가 상호작용을 할 수 있으며 다른 응용 프로그램과 협력할 수도 있다. 이러한 능동문서의 적용 가능함을 보이기 위해 기업 간 거래(B2B) 시스템에서 구매주문 처리의 예를 보였다. 서식문서를 컴퓨터 프로그램의 시각으로 바라보는 본 논문의 접근법을 통해 본 연구는 문서중심의 지능적인 응용프로그램 개발을 가속화하는 발판을 마련할 수 있을 것이다. 요컨대 본 논문에서 제시한 능동문서는 지식표현 및 처리기능이 내장되어 있는 바, 시맨틱 웹(Semantic Web)이 추구하는 문서의 역할을 담당할 수 있을 것으로 기대한다.

능동문서에 대한 새로운 접근법과 그 응용 (A New Approach to Active Documents and its Application)

  • 남철기;배재학;장길상
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권3_4호
    • /
    • pp.347-357
    • /
    • 2003
  • 웹은 중요한 정보인천이며, 대부분의 웹 응용프로그램은 HTML 작성된 서식문서를 기반으로 한다. 이러한 HTML 기반의 서식문서는 사용자 인터페이스를 제공하는 역할을 할 뿐, 문서서식 설계자가 지향하는 업무처리 절차나 로직을 내포하지는 않는다 그러나 서식문서에는 그것에 대한 처리방법이 함축되어 있고. 이렇게 내재된 전차적 지신을 업무치리 과정의 자동화에 적극적으로 활용할 수 있다. 이에, 본 논문에서는 서신문서에 기반한 업무치리 전차를 자동화시키기 위해 인지과학적인 측면에서 문서의 능동성을 파악하였나. 이를 통해 능동문서(Active Documents)에 대한 새로운 개념과 그 적용 가능성을 제시하고자 한다. 이 능동문서는 문서에 함축되어 있는 업무규칙과 문서처리의 자동화를 지원하기 위한 선언적 지식을 문서 사제에 내포하고 있다. 또한, 본 논문에서는 제시된 능동문서를 처리하기 위한 프레임워크를 제안한다. 제안된 프레임워크는 크게 생성단계와 실행단계로 구성된다. 본 논문에서 제안한 프레임워크의 유용성을 보이기 위해, 인터넷 구매 시스템의 구매 요청서 처리에 능동문서를 적용한 ActiveForm이라는 원형시스템을 설계하고 구현하였다. 그 결과, 본 논문은 서식설계자의 지식이 Prolog로 명시적으로 표현되어 있는 능동문서를 추론엔진에서 처리함으로써 인터넷 응용프로그램의 지능화에 기여할 수 있음을 확인하였다.

Multimedia Document Databases : Representation, Query Processing and Navigation

  • Kalakota, Ravi S.;Whinston, Andrew B.
    • 정보기술과데이타베이스저널
    • /
    • 제1권1호
    • /
    • pp.31-62
    • /
    • 1994
  • Information systems for application areas like office automation, customer service or computer aided manufacturing are usually highly interactive and deal with complex document structures composed of multiple media formats. For the realization of these systems, nonstandard database systems, which we call document databases, need to handle different types of coarse-and fine-grained document objects(like full-text documents, graphics and images), hierarchical and non-hierarchical relationships between objects(like composition-links and cross-references using hypertext structures) and document attributes of different types such as formatting/presentation information and access control. In this paper, we present the underlying data model for document databases based on descriptive markup languages that provide mechanisms for specifying the logical structure(or schema) of individual documents stored in the database. We then describe extensions to the data model for supporting notion of composite structures("join" operators for documents) --composition and hyperlinking mechanisms for representing compound documents and inter-linked documents as unique entites separate from their components. Furthermore, due to the interactive nature of the application domains, the database system in conjunction with clients(or browsers) has to support visual navigation and graphical query mechanisms. We describe the functionality of a new user interface paradigm called HyBrow for meeting the above mentioned requirements. The underlying implementation strategy is also discussed.discussed.

  • PDF

Intelligent Character Recognition System for Account Payable by using SVM and RBF Kernel

  • Farooq, Muhammad Umer;Kazi, Abdul Karim;Latif, Mustafa;Alauddin, Shoaib;Kisa-e-Zehra, Kisa-e-Zehra;Baig, Mirza Adnan
    • International Journal of Computer Science & Network Security
    • /
    • 제22권11호
    • /
    • pp.213-221
    • /
    • 2022
  • Intelligent Character Recognition System for Account Payable (ICRS AP) Automation represents the process of capturing text from scanned invoices and extracting the key fields from invoices and storing the captured fields into properly structured document format. ICRS plays a very critical role in invoice data streamlining, we are interested in data like Vendor Name, Purchase Order Number, Due Date, Total Amount, Payee Name, etc. As companies attempt to cut costs and upgrade their processes, accounts payable (A/P) is an example of a paper-intensive procedure. Invoice processing is a possible candidate for digitization. Most of the companies dealing with an enormous number of invoices, these manual invoice matching procedures start to show their limitations. Receiving a paper invoice and matching it to a purchase order (PO) and general ledger (GL) code can be difficult for businesses. Lack of automation leads to more serious company issues such as accruals for financial close, excessive labor costs, and a lack of insight into corporate expenditures. The proposed system offers tighter control on their invoice processing to make a better and more appropriate decision. AP automation solutions provide tighter controls, quicker clearances, smart payments, and real-time access to transactional data, allowing financial managers to make better and wiser decisions for the bottom line of their organizations. An Intelligent Character Recognition System for AP Automation is a process of extricating fields like Vendor Name, Purchase Order Number, Due Date, Total Amount, Payee Name, etc. based on their x-axis and y-axis position coordinates.

비즈니스 문서의 생산성 향상을 위한 RPA(Robotics Process Automation)적용방안에 대한 연구 (A Study On The Application of RPA(Robotics Process Automation) For Productivity Of Business Documents)

  • 현영근;이주연
    • 디지털융복합연구
    • /
    • 제17권9호
    • /
    • pp.199-212
    • /
    • 2019
  • 디지털화(Digitalization)가 우리의 비즈니스 환경에 다양한 변화와 혁신을 일으키고 있다. 제조업에서는 오래전부터 자동화를 위해 로봇을 활용하여 처리속도 및 품질에 혁신을 이루었다. RPA는 이러한 제조현장의 혁신을 사무공간으로 가져온 것이라고 할 수 있다. 본 연구의 목적은 사무공간에서 단순 반복적으로 이루어지는 업무에 대해 생산성을 향상시키는 것을 그 목적으로 한다. 이러한 생산성 향상과 관련하여, 비즈니스 자동화(Business Automation)에 대한 개념을 살펴본 후, 비즈니스 문서 작업과 관련하여 자동화의 가능성을 확인하기 위해 5가지 업무영역을 대상으로 애자일 방법론을 활용하여 시뮬레이션을 수행하였다. 결론적으로, 품질점검 관련 97.3%, 편집 디자인 관련 31.7%의 생산성 향상이 가능함을 확인하였으며, 실제 업무에 적용하기 위한 방향성에 대해서도 살펴보았다. 향후 연구에서는 이러한 결과를 바탕으로 IPA(Intelligent Process Automation)의 적용방안에 대해 진행하고자 한다.

Managing and Modeling Strategy of Geo-features in Web-based 3D GIS

  • Kim, Kyong-Ho;Choe, Seung-Keol;Lee, Jong-Hun;Yang, Young-Kyu
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 1999년도 Proceedings of International Symposium on Remote Sensing
    • /
    • pp.75-79
    • /
    • 1999
  • Geo-features play a key role in object-oriented or feature-based geo-processing system. So the strategy for how-to-model and how-to-manage the geo-features builds the main architecture of the entire system and also supports the efficiency and functionality of the system. Unlike the conventional 2D geo-processing system, geo-features in 3B GIS have lots to be considered to model regarding the efficient manipulation and analysis and visualization. When the system is running on the Web, it should also be considered that how to leverage the level of detail and the level of automation of modeling in addition to the support for client side data interoperability. We built a set of 3D geo-features, and each geo-feature contains a set of aspatial data and 3D geo-primitives. The 3D geo-primitives contain the fundamental modeling data such as the height of building and the burial depth of gas pipeline. We separated the additional modeling data on the geometry and appearance of the model from the fundamental modeling data to make the table in database more concise and to allow the users more freedom to represent the geo-object. To get the users to build and exchange their own data, we devised a file format called VGFF 2.0 which stands for Virtual GIS File Format. It is to describe the three dimensional geo-information in XML(eXtensible Markup Language). The DTD(Document Type Definition) of VGFF 2.0 is parsed using the DOM(Document Object Model). We also developed the authoring tools for. users can make their own 3D geo-features and model and save the data to VGFF 2.0 format. We are now expecting the VGFF 2.0 evolve to the 3D version of SVG(Scalable Vector Graphics) especially for 3D GIS on the Web.

  • PDF

한국 고문헌 정보시스템의 구축 및 전망 (The Project and Prospects of Old Documents Information Systems in Korea)

  • 강순애
    • 한국문헌정보학회지
    • /
    • 제31권4호
    • /
    • pp.83-112
    • /
    • 1997
  • 본 논문은 고문헌에 적합한 최선의 정보시스템을 구축하기 위해, 고문헌의 개념, 특성과 정리현황, 전산화의 범위와 제도적인 장치, 정보시스템의 구축, 시스템의 사례, 평가와 전망 등을 중심으로 고찰하였다. 고문헌시스템의 구축에 있어서는 국립중앙도서관을 중심으로 하여 정보전산망을 형성하고, 그에 따라 목록정보, 해제, 원은, 검색정보시스템의 통합시스템을 구축하는 방향으로 전개하였다. 사례분석에서는 현재 디지털시스템으로 구축하고 있는 국립중앙도서관고문헌시스템과 자체적으로 DB를 개발하여 공용정보로 활용하고 있는 성균관대학교 고문헌정보시스템을 비교 평가하였으며. 고문헌시스템을 구축하려는 도서관에는 전체적인 지침을 제시하였다.

  • PDF

Managing Scheme for 3-dimensional Geo-features using XML

  • Kim, Kyong-Ho;Choe, Seung-Keol;Lee, Jong-Hun;Yang, Young-Kyu
    • 한국GIS학회:학술대회논문집
    • /
    • 한국GIS학회 1999년도 추계학술대회 발표요약문
    • /
    • pp.47-51
    • /
    • 1999
  • Geo-features play a key role in object-oriented or feature-based geo-processing system. So the strategy for how-to-model and how-to-manage the geo-features builds the main architecture of the entire system and also supports the efficiency and functionality of the system. Unlike the conventional 2D geo-processing system, geo-features in 3D GIS have lots to be considered to model regarding the efficient manipulation and analysis and visualization. When the system is running on the Web, it should also be considered that how to leverage the level of detail and the level of automation of modeling in addition to the support for client side data interoperability. We built a set of 3D geo-features, and each geo-feature contains a set of aspatial data and 3D geo-primitives. The 3D geo-primitives contain the fundamental modeling data such as the height of building and the burial depth of gas pipeline. We separated the additional modeling data on the geometry and appearance of the model from the fundamental modeling data to make the table in database more concise and to allow the users more freedom to represent the geo-object. To get the users to build and exchange their own data, we devised a fie format called VGFF 2.0 which stands for Virtual GIS File Format. It is to describe the three dimensional geo-information in XML(extensible Markup Language). The DTD(Document Type Definition) of VGFF 2.0 is parsed using the DOM(Document Object Model). We also developed the authoring tools for users can make their own 3D geo-features and model and save the data to VGFF 2.0 format. We are now expecting the VGFF 2.0 evolve to the 3D version of SVG(Scalable Vector Graphics) especially for 3D GIS on the Web.

  • PDF

Resume Classification System using Natural Language Processing & Machine Learning Techniques

  • Irfan Ali;Nimra;Ghulam Mujtaba;Zahid Hussain Khand;Zafar Ali;Sajid Khan
    • International Journal of Computer Science & Network Security
    • /
    • 제24권7호
    • /
    • pp.108-117
    • /
    • 2024
  • The selection and recommendation of a suitable job applicant from the pool of thousands of applications are often daunting jobs for an employer. The recommendation and selection process significantly increases the workload of the concerned department of an employer. Thus, Resume Classification System using the Natural Language Processing (NLP) and Machine Learning (ML) techniques could automate this tedious process and ease the job of an employer. Moreover, the automation of this process can significantly expedite and transparent the applicants' selection process with mere human involvement. Nevertheless, various Machine Learning approaches have been proposed to develop Resume Classification Systems. However, this study presents an automated NLP and ML-based system that classifies the Resumes according to job categories with performance guarantees. This study employs various ML algorithms and NLP techniques to measure the accuracy of Resume Classification Systems and proposes a solution with better accuracy and reliability in different settings. To demonstrate the significance of NLP & ML techniques for processing & classification of Resumes, the extracted features were tested on nine machine learning models Support Vector Machine - SVM (Linear, SGD, SVC & NuSVC), Naïve Bayes (Bernoulli, Multinomial & Gaussian), K-Nearest Neighbor (KNN) and Logistic Regression (LR). The Term-Frequency Inverse Document (TF-IDF) feature representation scheme proven suitable for Resume Classification Task. The developed models were evaluated using F-ScoreM, RecallM, PrecissionM, and overall Accuracy. The experimental results indicate that using the One-Vs-Rest-Classification strategy for this multi-class Resume Classification task, the SVM class of Machine Learning algorithms performed better on the study dataset with over 96% overall accuracy. The promising results suggest that NLP & ML techniques employed in this study could be used for the Resume Classification task.

웹 서비스 기반의 유비쿼터스 워크플로우 언어 (A Ubiquitous Workflow Language based on Web Services)

  • 한주현;조용윤;최재영
    • 정보처리학회논문지A
    • /
    • 제12A권6호
    • /
    • pp.485-492
    • /
    • 2005
  • 현재 비즈니스 및 분산 컴퓨팅 환경에서 사용되는 워크플로우는 서비스 통합 및 자동화, 동적 흐름 관리, 동시 수행, 실시간 서비스 등의 기능을 제공한다. 유비쿼터스 컴퓨팅 환경에서 서비스들은 사용자와 현재 사용자가 속해 있는 환경으로부터 다양한 정보를 제공받아 상황에 맞는 서비스를 동적으로 제공해야 한다. 이와 같은 서비스를 효과적으로 제공하기 위해서는 서비스의 자동화에 사용되고 있는 워크플로우를 유비쿼터스 컴퓨팅에 적용하고, 상황인지 서비스를 제공하기 위해 상황 정보를 워크플로우의 전이조건으로 명시해야 한다. 본 논문에서는 유비궈터스 환경에서 발생하는 상황 정보를 워크플로우의 서비스 전이조건으로 사용하기 위한 웹 서비스 기반의 워크플로우 언어인 uWDL (Ubiquitous Workflow Description Language)을 제안한다. uWDL은 상황 정보인 컨텍스트, 프로파일 및 이벤트 정보에 따라 사용자 상황에 맞는 서비스를 선택할 수 있다. 또한 uWDL 전용 파서와 컨텍스트 처리기를 통해 uWDL로 기술된 시나리오 문서가 제대로 실행되는지를 검증하였다. 유비쿼터스 환경을 위한 시나리오 설계를 위해 개발자는 uWDL 시나리오 편집기를 이용하여 유쿼비터스 환경의 상황 정보를 고려해 그에 맞는 서비스들의 관계를 워크플로우 형태로 기술함으로써 작업을 통합하고 자동화할 수 있다