• 제목/요약/키워드: 전자문서처리

검색결과 458건 처리시간 0.034초

PrefixLM에 기반한 한국어 텍스트 요약 (PrefixLM for Korean text summarization)

  • 이건희;나승훈;임준호;김태형;최윤수;장두성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.22-27
    • /
    • 2021
  • 언어 모델은 많은 데이터와 많은 파라미터로 오래 사전학습을 수행할수록 그 성능이 높아지지만, 그 크기가 큰 만큼 거대 언어 모델은 너무 큰 크기로 인해서 실사용에 많은 하드웨어 리소스를 필요로 한다. 본 논문에서는 거대 언어 모델 중 하나인 T5의 인코더-디코더 구조 대비 절반의 크기를 가지는 PrefixLM 구조에 기반한 한국어 모델을 학습하여 자연어 처리에서 중요한 태스크 중 하나인 텍스트 생성 요약 태스크에서의 성능평가를 하여 BART, T5와 비교하여 각각 0.02, 0.0859의 성능 향상을 보였다.

  • PDF

오픈소스 기반 OCR의 한국어 인식성능 비교분석에 관한 연구 (Comparative Analysis of Korean Language Recognition Performance in Open Source-Based OCR)

  • 김정섭;김현정;유상현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.471-472
    • /
    • 2023
  • 문서 전자화 시스템의 도입에 따라 OCR에 관련된 많은 연구가 진행되고 있으며, 현재 넓은 분야에서 OCR을 활용 중이다. 그러나 OCR 라이브러리들의 한국어 인식성능에 어느 정도 차이가 있는지에 대한 의문이 생기고 있다. 본 논문에서는 현재 사용 중인 OCR 라이브러리의 한국어 인식성능을 비교, 분석하였고 Tesseract OCR이 더 인식성능이 좋다는 결과를 얻었다.

XML/EDI기반 전자입찰 시스템을 위한 비즈니스 흐름 관리기의 설계 및 구현 (Design and Implementation of Business Flow Management System for XML/EDI based Electronic Bidding System)

  • 윤선희
    • 한국컴퓨터산업학회논문지
    • /
    • 제4권10호
    • /
    • pp.751-760
    • /
    • 2003
  • 미래의 기업은 B to B기반의 전자거래 형태로 실현된다. B to B모델의 기본 개념은 작업 프로세스, 구성원과 지원 환경으로 구성된다. 작업 프로세스는 정보 프로세스, 기술과 표준과 관련되며 작업 프로세스의 요소는 디지털 데이터 교환, 데이터 공유 및 협업 작업으로 이루어 진다. 본 논문에서는 인터넷 상에서 B to 13 모델의 전자거래를 위한 구성요소인 작업 처리를 위한XML 기반 비즈니스 흐름관리기를 설계 및 구현한다. 본 논문에서 제안하는 비즈니스 흐름관리기는 인터넷상에서 전자거래 시스템을 구축하기 위한 추매관리, 입찰관리 및 조달관리를 포함하는 전자입찰 시스템의 자동화를 실현시킨다. XML은 데이터의 공유 및 교환을 위한 표준화된 문서로써 사용 가능하며 독립적인 플랫폼을 제공한다.

  • PDF

WIPI 모바일 단말을 위한 Pull 모드 XML 처리기 (A Pull-Mode XML Processor for WIPI-Based Mobile Devices)

  • 정순지;유호연;김지현;강미연;정원호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (D)
    • /
    • pp.358-360
    • /
    • 2006
  • 기존의 다양한 무선 인터넷 플랫폼이 WIPI라는 무선 인터넷 플랫폼으로 통합되면서 플랫폼 간의 호환성과 이식성을 제공하여 다양하고 풍부한 컨텐츠들이 개발되고 있다. 인터넷 상의 콘텐츠 표현의 주요 표기 언어인 XML을 파싱하고 뷰잉 하기 위한 XML 처리기 역시 이제, 각종 모바일 단말에 내장되어야 할 필수적인 소프트웨어 중의 하나가 되었다. 본 논문에서는 WIPI 기반의 모바일 단맡로의 내장을 위한 효율적 XML 처리기가 설계 구현된다. XML 처리기는 HTTP를 기반으로 하여 서버와 XML 데이터를 교환할 수 있으며, 모바일 단말에 적합하도록 CPU 부하를 덜어주고, 메모리 사용량을 줄이면서, 크기가 작은 Pull 모드 XML 파서를 핵심 컴포넌트로 가지고 있다. 또한, XML 처리기를 사용하여 인터넷을 통해 XML 문서를 전승 받아, 모바일 단말에서 볼 수 있는 간단한 전자책을 개발하였다.

  • PDF

관계형 데이타베이스 기반의 RDF와 OWL의 저장 및 질의처리 (RDF and OWL Storage and Query Processing based on Relational Database)

  • 정호영;김정민;정준원;김종남;임동혁;김형주
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제11권5호
    • /
    • pp.451-457
    • /
    • 2005
  • 컴퓨터의 발전에도 불구하고 수많은 전자 문서가 범람하는 현재와 같은 상황에서 원하는 정보를 얻기는 더욱 어려워지고 있다. 이와 같은 상황에서 데이타를 얼마나 빠르게 처리하는지 보다 얼마나 의미 있는 정보를 얻을 수 있는지가 중요한 문제가 되고 있다. 이에 웹 자원에 대해 지식기반의 메타 데이타를 기술하고 이를 이용한 지능적인 정보 처리를 목적으로 하는 것이 시멘틱 웹이다 또한 시멘틱 웹이 발전함에 따라 웹 자원 못지않게 지식자원에 대한 중요성도 커질 수 밖에 없다. 본 논문에서는 시멘틱 웹을 기술하는 W3C표준 언어인 OWL에 대해 효율적이고 의미 있는 질의처리를 제공할 수 있는 데이터 베이스의 저장 시스템 및 OWL-QL 질의 처리기를 제공한다.

XML기반의 안전한 E-Procurement 시스템 설계 및 구현 (Design and Implementation of Secure E-Procurement System based on XML)

  • 문태수;송유진
    • 정보처리학회논문지D
    • /
    • 제9D권6호
    • /
    • pp.1043-1054
    • /
    • 2002
  • 본 논문은 국내 자동차산업을 대상으로 개발된 응용시스템으로, UML(Unified Modeling Language)을 이용한 XML(eXtensible Markup Language)기반의 안전한 전자조달(E-Procurement) 시스템을 제안하고 있다. 컴포넌트 개발기법인 UML 방법론의 활용으로 자동차산업의 구매업무 Workflow가 분석되었으며, XML 기반의 EDI(Electronic Data Interchange)와 전자서명 기능을 구현함으로써 기업간 구매업무를 자동화하는 효율적인 E-Procurement 시스템 프로토타입이 구현되었다. 또한 본 논문은 기존 정보공학방법론에서 한계로 지적되던 S/W의 재사용성과 Life Cycle의 위험을 줄인 컴포넌트 개발기법을 활용하고, 기업내 Legacy 시스템인 ERP와의 연동을 가능하게 하였다. 본 시스템은 기존 시스템이 제공하지 못하는 워크플로우(workflow)분석 및 설계, 컴포넌트 개발, 기업내부 시스템과의 연동, 그리고 전자문서의 무결성과 인증을 위한 XML 전자서명을 적용하는 해법을 제안하고 있다.

검색 엔진을 위한 '백과 명사' 전자 사전의 구축 (I) <인명 관련 백과 명사의 연구> (Korean Electronic Dictionary of Encyclopedic Nouns I. - Nouns related to Human Names -)

  • 남지순;이주호;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.304-315
    • /
    • 1998
  • 정보 검색 시스템에서 가장 문제가 되는 어휘 클라스는 소위 '고유 명사'와 '합성 명사'로 분류되는 명사 유형이다. 이들 클라스는, 기존 대사전 및 전자 사전 (MRD)류에서, 그 어휘 목록을 체계적으로 제공하지 못하는 가장 대표적인 부류들인데, 실제 검색 시스템에서는 많은 경우 정보의 핵심어 (Key Word)가 된다. 본 연구에서는 신문, 잡지등 시사 문서류에서 가장 빈번히 발견되는 명사 유형의 하나인, '인명 관련 고유 명사' 유형에 대한 문제에 그 논의의 촛점을 두고, 이들 명사들의 체계적인 처리를 위해서 어떠한 형태로 사전을 구성해야 하는지를 검토할 것이다. '고유 명사'라는 개념 자체가 지니고 있는 외연적 정의상의 문제점을 극복하기 위해서 우리는 '백과 명사 (Encyclopedic Noun)'라는 용어를 사용하기로 하며, 이는 좁은 의미의 고유 명사 및, 전문어, 고유 명사 관련 파생-복합어류 등을 포함하는, 보다 확장된 개념으로 이해되어야 한다. <인명> 관련 백과 명사류의 하위 유형 분류 및 그 특징적 결합어 형태(Appropriate Particle)에 대한 연구 결과들이 소개된다.

  • PDF

검사실 정보 교류를 위한 임상문서표준규격의 적용 (Adoption of CDA(Clinical Document Architecture) for reporting laboratory results)

  • 송준현;김일곤;이성현;도형호;예정훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (B)
    • /
    • pp.21-26
    • /
    • 2007
  • HITSP(Healthcare Information Technology Standards Panel)은 헬스 케어 관련 산업의 상호 운용성을 위해 일반적으로 수용되고 유용한 표준들을 선별하여 표준 세트를 제공하는 것을 목적으로 한다. HITSP에서는 평생전자건강진료정보(EHR, Electronic Health Record)의 활성화를 위해 첫 번째 해결해야 할 영역으로 검사실 결과 정보 교류를 정하였다. 이에 본 논문에서는 검사실 결과 정보 교류를 위한 방법으로 HITSP에서 제시하는 HL7 버전 2.x 메시지와 CDA 방법 중 인증(authentication) 처리가 가능하고 영속성(persistence)이 있는 CDA 방법을 선택하였다. 또한 CDA를 작성하고 처리하는 방법을 제시하고, 더 나아가 평생전자건강진료정보(EHR)를 위해 CDA를 적용하여 검사실 결과 정보를 교류하여 보았다. 이에 병원과 EHR 시스템의 상호 운용성이 높아져 진료 과정의 효율성을 높일 수 있었고 환자와 의료진에게 양질의 검사 결과 정보를 제공할 수 있었다.

  • PDF

XML기반 상품 카탈로그의 설계 및 적용 (Design and Application of a XML Based Product Catalog)

  • 하상호;김경래
    • 정보처리학회논문지D
    • /
    • 제9D권3호
    • /
    • pp.523-530
    • /
    • 2002
  • 최근에 인터넷의 폭 넓은 사용과 구조적 웹 문서를 기술할 수 있는 XML의 기술에 힘입어, 인터넷과 XML을 기반으로 하는 전자상거래에 관한 연구가 많은 조직과 기업에서 활발하게 진행되고 있다. 기존에 연구되었던 상품 카탈로그는 상품 정보가 분류되어 표현되지 않을 뿐만 아니라 구체적이지 않고, 다양한 상품들의 상세한 정보들을 체계적으로 기술하기에는 미흡하다. 본 논문에서는 다양한 상품들을 기술하는데 사용될 수 있는 정보들을 분석하고 분류하고, 기존의 연구들을 보완하여 다양한 종류의 상품 정보를 통합하여 기술 할 수 있는 모델을 제안한다. 그리고 다양한 상품에 대해서 제안된 모델을 적용하여 그 효용성을 검증한다. 제안된 모델의 사용은 하나의 상품 카탈로그 모델로 다양한 상품의 정보를 자세히 표현할 수 있어 여러 종류의 상품을 취급하는 인터넷 쇼핑몰 등의 유사 기종에 편리함과 효율성을 준다.

확장형ERP 건설분야 적용모델(E2CM) 및 시스템(eCOMIS)개발 (A Development Of Extended ERP Based Model AND System In Construction Industry)

  • 이민남;오동환;신태홍
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.565-568
    • /
    • 2004
  • 최근 ERP에 고객관계관리(CRM), 공급망관리(SCM), 지식관리(KMS) 등의 기능을 확장한 확장형 ERP에 대한 연구개발이 활발해지고 있다. 그러나 타산업과 달리 건설산업의 특수성으로 인한 정보화의 부진으로 인해 이러한 새로운 개념을 적용할 수 있는 ERP 확장모델이 없는 상태이며, 대기업의 경우 일부 이러한 모듈을 부분적으로 적용하려는 움직임은 보이고 있으나, ERP와 별도의 이종시스템으로 관리되고 있어 통합적인 ERP운용을 통해 얻을수 있는 효과를 기대하기 어려운 실정이다. 이에 본 연구에서는 산자부에서 건설표준ERP템플릿으로 지정받은 ERP엔진을 모체로 협력업체와의 인터페이스 제공을 위한 협업적IT시스템과 전자계약시스템, 그리고 변화되는 ISO에 대한 기업의 대처능력 향상을 위한 ISO인증관리시스템, 고객과의 관계관리를 위한 고객관계관리시스템, 절차서와 같은 기업 내의 표준화 된 문서를 관리하기 위한 전자매뉴얼관리시스템, 결재관리를 위한 그룹웨어, 기업 내의 지식저장소 관리를 위한 지식관리시스템을 연구범위로 하여 건설분야 확장형ERP 모델(E2CM)을 개발하였으며, 이를 검증을 위한 시스템(eCOMIS)을 개발하였다.

  • PDF