• 제목/요약/키워드: 문서 처리 자동화

검색결과 114건 처리시간 0.023초

문서 길이 정규화를 이용한 문서 요약 자동화에 관한 연구 (A Study on Text Summarize Automation Using Document Length Normalization)

  • 이재훈;김영천;이성주
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2001년도 춘계학술대회 학술발표 논문집
    • /
    • pp.228-230
    • /
    • 2001
  • WWW(World Wide Web)와 온라인 정보 서비스의 급속한 성장으로 인해, 보다 많은 정보가 온라인으로 이용 혹은 접근 가능해 졌다. 이런 정보홍수로 접근 가능한 정보들이 과잉되는 문제가 발생했다. 이러한 과잉 정보 현상으로 인하여 시간적 제약이 뒤따르며 이용 가능한 모든 정보를 근거로 중요한 의사 결정을 내려야 한다. 문서 요약 자동화(Text Summarize Automation)는 이 문제를 처리하는데 필수적이다. 본 논문에서는 정보 검색을 통해 획득한 문서들을 일차적으로 문서 길이 정규화를 이용하여 질의에 적합하고 신뢰도가 더욱 높은 문서 정보를 얻을 수 있음을 보인다.

  • PDF

문서 처리 자동화를 위한 인보이스 이미지의 구조 인식 방법 (Structure Recognition Method of Invoice Document Image for Document Processing Automation)

  • 이동석;권순각
    • 한국산업정보학회논문지
    • /
    • 제28권2호
    • /
    • pp.11-19
    • /
    • 2023
  • 본 논문은 인보이스 문서 이미지에 문서 처리 자동화를 적용하기 위한 문서 구조 인식 방법과 문서 구조 인식 결과를 토대로 스프레드문서 형태로 출력하는 방법을 제안한다. 딥러닝 OCR 엔진을 통해 문서 내 단어 블록들과 해당 블록들의 문자 인식 결과를 얻는다. 단어 블록의 위치 정보들을 통해 같은 행과 같은 열에 존재하는 단어 블록들을 검출한다. 단어 블록들의 배치 정보를 통해 문서 영역을 분할한다. 문서의 구역 정보를 통해 얻어진 문서 구조를 토대로 스프레드시트의 알맞은 위치에 문자 인식 결과를 입력한다. 실험 결과 제안된 방법을 통한 항목 배치는 평균 92.30%의 정확도를 보인다.

능동문서에 대한 새로운 접근법과 그 응용 (A New Approach to Active Documents and its Application)

  • 남철기;배재학;장길상
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권3_4호
    • /
    • pp.347-357
    • /
    • 2003
  • 웹은 중요한 정보인천이며, 대부분의 웹 응용프로그램은 HTML 작성된 서식문서를 기반으로 한다. 이러한 HTML 기반의 서식문서는 사용자 인터페이스를 제공하는 역할을 할 뿐, 문서서식 설계자가 지향하는 업무처리 절차나 로직을 내포하지는 않는다 그러나 서식문서에는 그것에 대한 처리방법이 함축되어 있고. 이렇게 내재된 전차적 지신을 업무치리 과정의 자동화에 적극적으로 활용할 수 있다. 이에, 본 논문에서는 서신문서에 기반한 업무치리 전차를 자동화시키기 위해 인지과학적인 측면에서 문서의 능동성을 파악하였나. 이를 통해 능동문서(Active Documents)에 대한 새로운 개념과 그 적용 가능성을 제시하고자 한다. 이 능동문서는 문서에 함축되어 있는 업무규칙과 문서처리의 자동화를 지원하기 위한 선언적 지식을 문서 사제에 내포하고 있다. 또한, 본 논문에서는 제시된 능동문서를 처리하기 위한 프레임워크를 제안한다. 제안된 프레임워크는 크게 생성단계와 실행단계로 구성된다. 본 논문에서 제안한 프레임워크의 유용성을 보이기 위해, 인터넷 구매 시스템의 구매 요청서 처리에 능동문서를 적용한 ActiveForm이라는 원형시스템을 설계하고 구현하였다. 그 결과, 본 논문은 서식설계자의 지식이 Prolog로 명시적으로 표현되어 있는 능동문서를 추론엔진에서 처리함으로써 인터넷 응용프로그램의 지능화에 기여할 수 있음을 확인하였다.

테이블 내의 호목단 구조 판별 자동화에 대한 연구 (A Study on Automated HoMokDan Structure Determination in Table)

  • 조성수;김명호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 춘계학술발표대회
    • /
    • pp.295-297
    • /
    • 2012
  • 현재 법률과 관련된 문서들은 변경 사항 에 대한 공표와 기록의 중요성을 가지고 있다. 따라서 변경사항을 자동으로 인지하고 공표할 수 있는 자동화 시스템에 대한 관심과 연구가 진행되고 있다. 그러나 대부분의 문서들은 복잡한 구조이기 때문에 자동화에 어려움이 많다. 이로 인해 복잡한 구조의 문서를 자동으로 판별할 수 있는 방법에 관한 관심이 증대되고 있다. 현재 국내외에서는 전자 문서 파일의 텍스트 및 테이블을 판별해서 분류 하는 자동화에 대한 연구가 진행되고 있다. 하지만 이전 연구에서는 호목단 구조를 갖는 계층적인 테이블을 판별하지 않는다. 그래서 본 논문에서는 호목단을 정의하고, 테이블의 호목단 구조를 패턴 별로 분류 하며, 테이블의 호목단 구조 판별 방법을 제시한다.

XML 기반의 제안서 접수 및 평가 시스템의 설계 및 구현 (Design and Implementation of Proposal Registration and Estimation System based on XML)

  • 권석훈;나재열;유정연;이강찬;이규철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.139-141
    • /
    • 2001
  • 기존의 제안서 접수 및 평가 방식은 수작업이 대부분을 차지하여 많은 인력과 시간이 소요되며 정확성도 완전히 보장할 수 없는 단점을 가지고 있다. 이러한 비효율적인 방식을 개선하기 위해서 접수 및 평가과정을 웹상에서 자동화하여, 문서 작성자, 접수자, 평가자 및 관리자들이 좀 더 편리하게 관련 작업을 처리할 수 있게 하였다. 자동화를 도입하기 위한 방법으로 HWP 문서의 구조 정보를 표현할 수 있는 마크업(markup) 언어인 HWPML(HWP Markup Language : 이하 HML)을 사용하였으며, HML 문서를 파싱(parsing)하여 필요한 정보만을 추출하여 XML(eXtensible Markup Language) 문서를 생성하였다. 이렇게 생성된 XML 문서는 논리적인 구조 정보를 가지고 있고 플랫폼 및 소프트웨어 중립적이기 때문에 효과적인 검색, 관리 및 공유가 가능한 시스템 환경을 제공한다. 이 기법으로 표준 언어로 부각되고 있는 XML 형태의 문서 관리를 기존의 워드 프로세서 형태의 문서 관리에 확장 적용할 수 있다. 본 논문에서는 이러한 자동화 시스템의 구조와 문서 변환 기법을 제안하였다.

  • PDF

XML 전자서명 메커니즘 구현과 응용 (Implementation and It's Application of XML Signature Mechanism)

  • 전형득;송유진
    • 한국정보보호학회:학술대회논문집
    • /
    • 한국정보보호학회 2002년도 종합학술발표회논문집
    • /
    • pp.487-490
    • /
    • 2002
  • 최근 기업에서 인터넷을 활용한 전자문서 교환이 급증함에 따라 교환되는 문서의 안전한 전달을 위한 보안 서비스 문제가 대두되고 있다. B2B 전자문서 교환은 기업간 문서의 신속한 교환과 처리과정의 자동화를 통해 기업 업무 자동화에 큰 기여를 하고 있는 전자문서 교환방식(EDI)을 통해 이루어진다. 그러나 현재의 전자문서 교환방식은 해당 소프트웨어 개발과 통신망에 대한 부대 비용으로 인해 광범위하게 채택되지 못하고 있다. 이러한 문제를 해결하기 위한 방안으로 현재 광범위하게 사용되고 있는 웹기반 표준문서인 XML을 이용한 전자문서 교환이 새롭게 떠오르고 있다.[1] 본 논문은 XML 전자서명 메커니즘을 구현하고 XML 기반 전자조달 시스템에의 응용이 목표이다. XML 전자서명 기술을 이용해 전송되는 XML문서의 무결성, 인증 그리고 송수신 부인봉쇄의 보안 서비스를 제공하고, 전자조달 시스템에의 적용에 관한 것이다.

  • PDF

능동문서: 서식설계자의 의도가 내장된 프로그램 (Active Documents: Another Kind of Program Implying Intention of Form Designers)

  • 남철기;배재학;유해영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (상)
    • /
    • pp.353-356
    • /
    • 2003
  • 인터넷 기반의 많은 응용이 문서중심의 컴퓨팅 모델로 전환되고 있다. 문서는 문서설계자의 의도를 함축하고 있으며 이는 업무처리 과정의 자동화에 적극적으로 활용될 수 있다. 이러한 무서의 본질 파악을 통해 본 논문에서는 문서를 실행 가능한 컴퓨터 프로그램의 시각으로 접근한다. 이를 위해 서식, 데이터, 규칙 그리고, 질의로 구성되는 능동문서 모델을 제시한다. 모델의 각 요소는 문서의 재사용성과 상호 운영성을 위해 XML로 일관되게 표현된다. 능동문서는 사용자 인터페이스를 제공하는 수동적인 역할뿐만 아니라 문서설계자가 의도하는 문서처리 절차와 업무규칙을 기계가 읽고 추론하여 처리할 수 있는 문서이다. 이를 통해 문서와 기계가 상호작용을 할 수 있으며 다른 응용 프로그램과 협력할 수도 있다. 이러한 능동문서의 적용 가능함을 보이기 위해 기업가거래(B2B) 시스템에서 구매주문 처리의 예를 보였다. 요컨대 본 논문에서 제시한 능동문서는 지식표현 및 처리기능이 내장되어 있는 바, 문서중심의 지능적인 응용프로그램 개발을 가속화하는 토대를 마련할 수 있을 것으로 기대한다.

  • PDF

TENT PRISM / 어도비 PDF 솔루션 구축 사례

  • 신종훈
    • 디지털콘텐츠
    • /
    • 11호통권126호
    • /
    • pp.54-57
    • /
    • 2003
  • 정부의 정부문서관리법령 개정으로 최근 각 지방자치 단체와 정부 공공기관은 전자문서 시스템 도입 준비에 안창이다. 내년 1월 이후에는 그간 중앙행정기관에서 개발적으로 유통되던 전자문서를 정부전자문서유통센터를 통해 관리함으로써 정부문서처리 전 과정을 전산화, 자동화 하기로 했기 때문이다. 기존의 종이 문서를 전자문서로 변환해 관리하기 위한 노력은 그 동안 각 기업별 또는 기관별로 꾸준히 진행돼 왔다. 특히 인터넷을 통한 각종 정보 서비스의 제공을 위해서는 전자문서 구축은 필수다. 그렇다면 남은 문제는 얼마나 우수한 시스템을 얼마나 비용 효율적으로 구축하는 가의 문제이다. 어도비시스템즈의 PDF솔루션을 통해 전자문서 시스템을 구축하고, 이를 통해 비용절감과 함께 서비스 만족도 향상등 두 가지 토끼를 한번에 해결한 사례를 살펴봤다

  • PDF

능동문서를 기반으로 하는 SLA 관리 시스템 UI 구현 (UI Implementation of an Active Document Based ASLM System)

  • 이광일;김상락;배재학;장길상
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(B)
    • /
    • pp.242-244
    • /
    • 2011
  • 최근 SOA와 클라우드 컴퓨팅 기반의 IT 서비스가 증가함에 따라 정보처리 분야에서 SLA(Service Level Agreement)가 주목을 받고 있다. 통상의 SLA는 종이에 자연언어로 표현되는 것이어서 SLA 체결, SLA 관리나 SLA 기반 정보처리의 자동화가 제한된다. 오늘날과 같은 SOA, 온 디맨드 서비스, 유틸리티 컴퓨팅, 클라우드 컴퓨팅 환경에서는 서비스를 통합 자동관리할 수 있는 기술이 필요하다. 본 논문에서는 능동문서 기반의 ASLM(Active Service Level Managenment)의 계약체결 사용자 인터페이스(UI: User Interface)를 구현하여 일반 문서의 경우와 비교하여 보았다. 그 결과 ASLM의 UI가 SLA 체결, SLA 유지보수 자동화, 그리고 사용자의 편의성에서 SLA 기반의 계약업무 처리에 보다 효과적임을 알 수 있었다.

문서중심 및 웹기반 핵설계 자동화 시스템의 설계 및 구현 (Design and Implementation of a Document-Oriented and Web-Based Nuclear Design Automation System)

  • 박용수;김종경
    • 정보처리학회논문지D
    • /
    • 제11D권6호
    • /
    • pp.1319-1326
    • /
    • 2004
  • 본 논문에서는 모델링과 전산코드 실행 등에 시간과 노력이 많이 드는 핵설계 업무를 자동화하기 위하여 $IDP^{TM}$(Innovative Design Processor)를 개발하였다. IDP의 기본 원리는 문서중심 설계와 웹기반 설계이다. 문서중심 설계란 프로그래머가 아닌 일반 설계자가 동적문서(active document)라는 문서를 작성하여 이를 특수한 프로그램이 파싱후 실행하도록 하면 해석결과와 표 및 그림 둥이 담긴 완전한 설계문서를 자동적으로 얻게 됨을 말한다. 동적문서는 일반 HTML 또는 XML 편집기를 이용하여 작성될 수 있고 웹에서 또한 작성이 가능하다. LAMP(Linux/Apache/MySQL/PHP)의 웹기반 설계 환경하에서 설계마법사 형태의 서버 및 클라이언트 프로그램을 통해 설계 초보자도 쉽게 설계를 할 수 있게 되어 있다.