• 제목/요약/키워드: 문서 처리 자동화

검색결과 113건 처리시간 0.026초

컬러코드를 이용한 스캔 문서 분류 자동화 (Automating Scanned Document Classification Using ColorCode)

  • 안상길;최병욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.766-769
    • /
    • 2008
  • 디지털 형태의 문서가 널리 퍼지고 끊임없이 증가함에 따라 이를 자동으로 가공하고 처리하는 문서자동분류의 중요성이 널리 인식되고 있다. 본 논문에서는 복합기에서 컬러코드를 인식하는 모듈을 탑재하여 스캔된 문서를 자동으로 분류하는 시스템을 제안하고자 한다. 복합기에서 컬러코드가 부착된 종이문서를 스캔한 다음 그 컬로코드를 추출하여 인식하고 해당 컬러코드와 관련된 문서관리정보에 따라 스캔문서를 복합기 내부의 지정 폴더에 저장하거나 다른 곳으로 전달하는 시스템이다. 이렇게 함으로써 종이문서를 전자화하는 과정에서 수작업으로 분류하는 시간을 줄일 수 있고 또한 사람에 의한 오류를 줄일 수 있다는 장점이 있다.

효율적인 문서검색을 위한 레벨별 불용어 제거에 기반한 문서 클러스터링 (Document Clustering based on Level-wise Stop-word Removing for an Efficient Document Searching)

  • 주길홍;이원석
    • 컴퓨터교육학회논문지
    • /
    • 제11권3호
    • /
    • pp.67-80
    • /
    • 2008
  • 오늘날 여러 문서 범주화 방법들은 문서 클러스터링 알고리즘을 통하여 의미적으로 비슷한 내용의 문서들을 클러스터로 표현한 후 클러스터링 과정에서의 결합관계를 통해 범주화하는 자동화된 방법과 미리 정의된 분류 기준에 의해 수작업으로 문서를 분류하는 방법으로 구분되어 진다. 자동화된 방법은 속도는 빠르나 의미적으로 낮은 정확성을 가지며, 수작업에 의한 분류 방법은 처리 시간과 비용이 크게 증가하는 단점이 있다. 이러한 단점들을 극복하기 위하여 본 논문에서는 각 문서가 속하는 도메인의 불용어 제거를 기반으로 하여 문서 클러스터링을 수행하여 의미적으로 명확한 클러스터를 빠르게 생성한다. 클러스터의 정확성을 높이기 위하여 생성된 클러스터에 대해 레벨 순서에 따른 불용어 제거와 문서 클러스터링 과정을 반복적으로 적용하여 카테고리 트리를 생성하고, 이를 통해 문서집합간의 상하위 관계를 표현하는 자동화된 문서 범주화 방법을 제안한다.

  • PDF

기울기 보정과 블록 분할 합병을 통한 문자 추출 (Text Extraction by Skew Normalization and Block Split & Merge)

  • 김도현;차의영;강민경
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.424-426
    • /
    • 2001
  • 신문, 잡지, 공문서, 영수증 등의 문서로부터 필요한 정보를 자동화하여 처리할 수 있는 문서영상 이해 시스템의 구현에 있어서 문서영상에 존재하는 문자를 추출하는 연구는 문자 인식의 전처리 단계로서 매우 중요한 의미를 지니고 있다. 하지만 현 시점에서 문서 자체가 가지는 다양한 형태 및 배경 등에 의하여 범용화되고 일반화된 방법을 찾기란 매우 어려운 실정이다. 본 논문에서는 특히 배경이 선이나 도표 등으로 이루어진 문서 영상에서 Hough Transform을 사용하여 기울어짐을 보정하고 문자들이 선에 겹친 부분을 효과적으로 보정하며 추출된 영역에 대한 분할 및 합병 과정을 거쳐 최종적으로 완전한 문자 영역을 추출하는 방법에 대하여 다룬다.

  • PDF

링크 검색을 지원하는 XML 문서 질의 언어의 설계 (Design of XML Document Query Language(XQL) Supported Link Retrieval)

  • 김용훈;이강찬;이규철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (1)
    • /
    • pp.350-352
    • /
    • 1998
  • 최근 들어서 사무자동화 시스템(Office Information System), 디지털 도서관(Digital Library), WWW(WorldWideWeb)등의 응용에서는 대량의 문서들의 정보를 효율적으로 저장하고 처리, 검색할 수 있는 기능을 요구하고 있다. 이에 대해 최근에 인터넷 기반의 무서 표준인 XML(eXtensible Markup Language)이 제시되었고, 이러한 XML 문서를 저장하고 처리, 검색하기 위한 다양한 연구들이 진행되고 있다. 그러나, 이러한 대부분의 연구들은 XML 문서의 구조적 정보만을 저장하고 검색하도록 설계되어 지고 있으며, XML 문서가 지닌 또 다른 정보인 링크 정보를 저장하고 검색하는 기능을 제공되지 않고 있다. 본 논문에서는 현재 파서나 브라우저 수준에서 제공해 주는 링크의 브라우징을 확장하여 데이터베이스로 수많은 XML문서의 링크 정부들을 저장하고 저장된 링크 정보들에 대해 사용자들이 검색할 수 있는 시스템을 개발하고자 한다. 이를 위해 링크 정보를 지워할 수 있는 XML 문서에 대한 데이터 모델을 제시하고 이러한 데이터 모델로 지원할 수 있는 질의어들을 설계하였다.

효과적인 프로젝트 관리 계획서위한 프로젝트 문서 생성 자동화 (Automatic document generation for effective project management plan specification)

  • 강건희;손현승;이근상;김영철;이상은
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.959-961
    • /
    • 2015
  • 현재 많은 소프트웨어 개발 기업들은 제품 개발에만 치중되어 품질 유지/관리 측면의 문서 산출물을 만들 여유가 없다. 그리고 프로젝트 문서 관리 자체가 주먹구구식이며, 차후 평가나 검수시 문서 산출물을 만드는 경향이 있다. 이 문제 해결위해, 실시간으로 프로젝트가 진행되는 상황에 맞게 문서를 자동 생성하는 방법을 제안한다. 이 방법은 기존의 통합관리(CI) 시스템에 XML과 XSLT 기법을 접목하여 프로젝트 계획 문서를 자동 추출가능하다. 이로 인해 소규모의 영업장에서도 적은 인원으로도 프로젝트 관리를 효율적으로 할 수 있고, 실제 문서와 프로젝트의 진행의 불일치가 많이 줄어들 것으로 판단된다.

안전한 메시지교환을 위한 XML 기반의 변환시스템 (A XML Based Conversion System for Secure Message Exchange)

  • 오대균;홍창범;송정길
    • 인터넷정보학회논문지
    • /
    • 제3권4호
    • /
    • pp.1-9
    • /
    • 2002
  • XML 스키마가 2001년 5월 W3C의 공식 표준안으로 확정되고, XSL과 Xpath, Namespace등의 XML 관련 기술이 발전됨에 따라 XML은 새로운 문서교환의 표준이 되어가고 있다. XML은 다양한 문서의 구조를 표현할 수 있기 때문에 ebXML, RosettaNet, BizTalk들이 e-Business 부분에서 XML을 핵심기술로 사용하고 있다. B2B 전자상거래 시스템에서 업무를 자동화하기 위해서는 표준의 XML 문서가 필요하다. 각 기업들의 내부 문서를 외부기업의 자동화 시스템에서 처리하기 위해서는 문서의 정보손실 없이 외부기업의 문서 형태로 변환하여야 한다. 본 논문에서는 자바 서블릿을 기반으로 XML 문서의 변환하여, 안전한 문서교환을 제공하는 XML 시스템을 설계 구현하였다

  • PDF

온토로지 학습 방법을 활용한 (반)자동화된 웹 서비스 발견 및 조합 시스템 (Semi-Automated Web Services Discovery and Composition System using Learning Ontology Methods)

  • 이용주
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 춘계학술발표대회
    • /
    • pp.1058-1061
    • /
    • 2010
  • 시맨틱 웹 서비스 기술의 성공을 보장하기 위해서는 품질 좋은 온톨로지의 사용이 필수적이다. 하지만 온톨로지 사용의 중요성에도 불구하고 현재 웹 서비스를 위한 온톨로지는 거의 존재하지 않으며 이들의 구축도 쉬운 일이 아니다. 이러한 문제는 오늘날 웹 서비스의 확산과 발전을 가로막는 큰 저해요인이 되고 있다. 본 논문에서는 웹 서비스를 개발할 때 자동 생성되는 WSDL 문서만 가지고 항목 간 숨어있는 시맨틱 정보를 찾아내어 온톨로지를 자동 구축하고, 이를 활용한 (반)자동화된 웹 서비스 발견 및 조합 시스템을 구현하는 것이다.

개인화 된 특허 분류 시스템 사례 연구 (A Case Study on Personalized Patent Classification System)

  • 서형국;최광선;안한준;최성준
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2006년도 제18회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.241-245
    • /
    • 2006
  • 개인화 된 특허 분류 시스템은 기존의 자동 분류 및 특허 문서의 특성, 그리고 분류 체계의 개인화를 고려하여 접근해야 한다. 본 논문에서는 개인화 된 특허 분류 시스템을 구축하는데 있어 개인화된 분류 체계 및 모델의 구축, 특히 분류체계 구축에 있어서의 자동화에 초점을 두었다. 우리는 특히 분류체계 구축 자동화에 있어 특허 문서의 기존 분류체계인 IPC 및 문서 클러스터링을 활용하였다. 다음으로 이를 기반으로 한 구축 시스템 사례를 들었다. 구축 후 나타난 정성적 문제점을 분석해보고, 분석 결과를 향후 연구 방향으로 삼고자 한다.

  • PDF

XML 문서의 검색을 위한 효율적인 색인 기법과 질의 언어(TQL)의 설계 (Efficient Indexing Technique for Retrieval of an XML Document and Design of Query Language (TQL))

  • 이계준;신동욱;권택근
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.57-59
    • /
    • 1999
  • 현재 WWW(World Wide Web), 사무 자동화 시스템(Office Information System), 전자 도서관(Digital Library) 등의 빠른 발전으로 인하여 정보가 기하급수적으로 증가하였다. 이러한 방대한 양의 정보를 처리하기 위하여 많은 인터넷 기반의 문서 표준들이 출현하였고, 대표적으로 XML(eXtensible Markup Language)이 차세대 인터넷 전자 문서의 표준으로 많은 곳에 응용되고 있다. 이에 따라 XML 문서의 정보들을 효율적이고 정확하게 저장하고 이용, 검색 할 수 있는 기능을 요구되어졌다. 현재 대부분의 연구들은 XML 문서에 대한 구조적인 정보만을 저장하고 검색하는 기능만을 지원 할 뿐 검색된 결과에 대한 재사용이나 재구성에 대한 기능의 제공은 미흡한 실정이다. 본 논문에서는 현재 검색기들이 제공하는 XML 문서에 대한 구조적인 검색 기능을 확장하여 XML 문서를 보다 효율적으로 검색하기 위하여 새로운 색인 기법을 제안하고, 데이터베이스 내에 저장된 XML문서에 대해 구조적인 검색과 이것을 바탕으로 문서를 재구성하고 재사용하는 기능을 수행할 수 있도록 새로운 질의어(TQL)을 설계하였다.

  • PDF

무역부문의 전자상거래 구현사례 : KTNET - EDI와 인터넷의 전략적 활용을 중심으로

  • 심상렬
    • 한국전자거래학회:학술대회논문집
    • /
    • 한국전자거래학회 1998년도 학술대회지 vol.2
    • /
    • pp.523-537
    • /
    • 1998
  • ㆍ 종전에는 사람이 서류를 직접 들고 은행, 세관, 조합, 보험사, 관세사 등의 무역유관기관을 일일이 다니며 무역업무를 처리 ㆍ 무역자동화(Trade Automation)는 전자문서교환(EDI)을 이용하여 무역업무를 사무실에서 컴퓨터로 신속정확하게 처리하고, 궁극적으로는 서류없는 무역절차(Paperless Trading)를 실현하는 것(중략)

  • PDF