• Title/Summary/Keyword: 전자문서처리

Search Result 457, Processing Time 0.035 seconds

PrefixLM for Korean text summarization (PrefixLM에 기반한 한국어 텍스트 요약)

  • Lee, Kun-Hui;Na, Seung-Hoon;Lim, Joon-Ho;Kim, Tae-Hyeong;Choi, Yun-Su;Chang, Du-Seong
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.22-27
    • /
    • 2021
  • 언어 모델은 많은 데이터와 많은 파라미터로 오래 사전학습을 수행할수록 그 성능이 높아지지만, 그 크기가 큰 만큼 거대 언어 모델은 너무 큰 크기로 인해서 실사용에 많은 하드웨어 리소스를 필요로 한다. 본 논문에서는 거대 언어 모델 중 하나인 T5의 인코더-디코더 구조 대비 절반의 크기를 가지는 PrefixLM 구조에 기반한 한국어 모델을 학습하여 자연어 처리에서 중요한 태스크 중 하나인 텍스트 생성 요약 태스크에서의 성능평가를 하여 BART, T5와 비교하여 각각 0.02, 0.0859의 성능 향상을 보였다.

  • PDF

Comparative Analysis of Korean Language Recognition Performance in Open Source-Based OCR (오픈소스 기반 OCR의 한국어 인식성능 비교분석에 관한 연구)

  • Jeong-Seob Kim;Hyun-Jung Kim;Sang-Hyun Yoo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.11a
    • /
    • pp.471-472
    • /
    • 2023
  • 문서 전자화 시스템의 도입에 따라 OCR에 관련된 많은 연구가 진행되고 있으며, 현재 넓은 분야에서 OCR을 활용 중이다. 그러나 OCR 라이브러리들의 한국어 인식성능에 어느 정도 차이가 있는지에 대한 의문이 생기고 있다. 본 논문에서는 현재 사용 중인 OCR 라이브러리의 한국어 인식성능을 비교, 분석하였고 Tesseract OCR이 더 인식성능이 좋다는 결과를 얻었다.

Design and Implementation of Business Flow Management System for XML/EDI based Electronic Bidding System (XML/EDI기반 전자입찰 시스템을 위한 비즈니스 흐름 관리기의 설계 및 구현)

  • 윤선희
    • Journal of the Korea Computer Industry Society
    • /
    • v.4 no.10
    • /
    • pp.751-760
    • /
    • 2003
  • One of the business in the future will be executed by Business to Business(B to B) model of E-Commerce. The concept of the B to B model composes the work process, people, and supporting environment. The work processes are related to the information process, technologies, and standards. Information process elements contains digital data exchange, data sharing, and collaboration. This paper designed and implemented the XML-based Business Flow Management System(BFMS) for B to B model of E-commerce in the Internet. BFMS in this paper automatically performs the information process for B to B model such as electronic bidding system including purchase order management, bidding management, delivery management to build E-Commerce in the Internet. XML can be used as document standard between business for skating and exchange of data and also provide platform independent environment.

  • PDF

A Pull-Mode XML Processor for WIPI-Based Mobile Devices (WIPI 모바일 단말을 위한 Pull 모드 XML 처리기)

  • Jung Soon-Ji;Eu Ho-Yeon;Kim Ji-Hyun;Kang Mi-Yeon;Chung Won-Ho
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06d
    • /
    • pp.358-360
    • /
    • 2006
  • 기존의 다양한 무선 인터넷 플랫폼이 WIPI라는 무선 인터넷 플랫폼으로 통합되면서 플랫폼 간의 호환성과 이식성을 제공하여 다양하고 풍부한 컨텐츠들이 개발되고 있다. 인터넷 상의 콘텐츠 표현의 주요 표기 언어인 XML을 파싱하고 뷰잉 하기 위한 XML 처리기 역시 이제, 각종 모바일 단말에 내장되어야 할 필수적인 소프트웨어 중의 하나가 되었다. 본 논문에서는 WIPI 기반의 모바일 단맡로의 내장을 위한 효율적 XML 처리기가 설계 구현된다. XML 처리기는 HTTP를 기반으로 하여 서버와 XML 데이터를 교환할 수 있으며, 모바일 단말에 적합하도록 CPU 부하를 덜어주고, 메모리 사용량을 줄이면서, 크기가 작은 Pull 모드 XML 파서를 핵심 컴포넌트로 가지고 있다. 또한, XML 처리기를 사용하여 인터넷을 통해 XML 문서를 전승 받아, 모바일 단말에서 볼 수 있는 간단한 전자책을 개발하였다.

  • PDF

RDF and OWL Storage and Query Processing based on Relational Database (관계형 데이타베이스 기반의 RDF와 OWL의 저장 및 질의처리)

  • Jeong Hoyoung;Kim Jungmin;Jung Junwon;Kim Jongnam;Im Donghyuk;Kim Hyoung-Joo
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.11 no.5
    • /
    • pp.451-457
    • /
    • 2005
  • In spite of the development of computers, the present state that a lot of electronic documents are overflowing makes it more difficult for us to get appropriate information. Therefore, it's more important to focus on getting meaningful information than processing the data quickly In this context, Semantic Web enables an intelligent processing by adding semantic metadata on yow web documents. Also, as the Semantic Web grows, the knowledge resources as well as web resources are getting more and more importance. In this paper, we propose an OWL storage system aiming at an intelligent Processing by adding semantic metadata on your web documents, plus a system aiming at an OWL-QL Query Processing.

Design and Implementation of Secure E-Procurement System based on XML (XML기반의 안전한 E-Procurement 시스템 설계 및 구현)

  • Moon, Tae-Soo;Song, You-Jin
    • The KIPS Transactions:PartD
    • /
    • v.9D no.6
    • /
    • pp.1043-1054
    • /
    • 2002
  • This paper intends to suggest a XML-based secure E-Procurement system using Unified Modeling Language(UML), as an application system for domestic automobile industry. Applying UML methodology, which is Component-based Development (CBD), we analyzed the workflow on procurement operation of automobile industry and implemented a prototype of efficient E-Procurement system for automobile industry, by developing XML/EDI and XML signature. Also, on this paper, object-oriented CBD is employed to minimize the risk of life cycle and reuse software as mentioned to limitation of information engineering methodology. It enables the interoperability with ERP (Enterprise Resource Planning) as corporate legacy system. This system proposes a solution to apply analysis and design of workflow, component development, interoperability with corporate information system, and XML signature for integrity and authentication of electronic documents in other system so far.

Korean Electronic Dictionary of Encyclopedic Nouns I. - Nouns related to Human Names - (검색 엔진을 위한 '백과 명사' 전자 사전의 구축 (I) <인명 관련 백과 명사의 연구>)

  • Nam, Jee-Sun;Lee, Ju-Ho;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 1998.10c
    • /
    • pp.304-315
    • /
    • 1998
  • 정보 검색 시스템에서 가장 문제가 되는 어휘 클라스는 소위 '고유 명사'와 '합성 명사'로 분류되는 명사 유형이다. 이들 클라스는, 기존 대사전 및 전자 사전 (MRD)류에서, 그 어휘 목록을 체계적으로 제공하지 못하는 가장 대표적인 부류들인데, 실제 검색 시스템에서는 많은 경우 정보의 핵심어 (Key Word)가 된다. 본 연구에서는 신문, 잡지등 시사 문서류에서 가장 빈번히 발견되는 명사 유형의 하나인, '인명 관련 고유 명사' 유형에 대한 문제에 그 논의의 촛점을 두고, 이들 명사들의 체계적인 처리를 위해서 어떠한 형태로 사전을 구성해야 하는지를 검토할 것이다. '고유 명사'라는 개념 자체가 지니고 있는 외연적 정의상의 문제점을 극복하기 위해서 우리는 '백과 명사 (Encyclopedic Noun)'라는 용어를 사용하기로 하며, 이는 좁은 의미의 고유 명사 및, 전문어, 고유 명사 관련 파생-복합어류 등을 포함하는, 보다 확장된 개념으로 이해되어야 한다. <인명> 관련 백과 명사류의 하위 유형 분류 및 그 특징적 결합어 형태(Appropriate Particle)에 대한 연구 결과들이 소개된다.

  • PDF

Adoption of CDA(Clinical Document Architecture) for reporting laboratory results (검사실 정보 교류를 위한 임상문서표준규격의 적용)

  • Song, Joon-Hyun;Kim, Il-Kon;Lee, Sung-Hyun;Do, Hyoung-O;Yeah, Jung-Hoon
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.06b
    • /
    • pp.21-26
    • /
    • 2007
  • HITSP(Healthcare Information Technology Standards Panel)은 헬스 케어 관련 산업의 상호 운용성을 위해 일반적으로 수용되고 유용한 표준들을 선별하여 표준 세트를 제공하는 것을 목적으로 한다. HITSP에서는 평생전자건강진료정보(EHR, Electronic Health Record)의 활성화를 위해 첫 번째 해결해야 할 영역으로 검사실 결과 정보 교류를 정하였다. 이에 본 논문에서는 검사실 결과 정보 교류를 위한 방법으로 HITSP에서 제시하는 HL7 버전 2.x 메시지와 CDA 방법 중 인증(authentication) 처리가 가능하고 영속성(persistence)이 있는 CDA 방법을 선택하였다. 또한 CDA를 작성하고 처리하는 방법을 제시하고, 더 나아가 평생전자건강진료정보(EHR)를 위해 CDA를 적용하여 검사실 결과 정보를 교류하여 보았다. 이에 병원과 EHR 시스템의 상호 운용성이 높아져 진료 과정의 효율성을 높일 수 있었고 환자와 의료진에게 양질의 검사 결과 정보를 제공할 수 있었다.

  • PDF

Design and Application of a XML Based Product Catalog (XML기반 상품 카탈로그의 설계 및 적용)

  • Ha, Sang-Ho;Kim, Gyeong-Rae
    • The KIPS Transactions:PartD
    • /
    • v.9D no.3
    • /
    • pp.523-530
    • /
    • 2002
  • With an advent of XML(extensible markup language), researches on electronic commerce based on XML have been conducted by many organizations and companies. Although these researches described electronic catalogs, they are not sufficient because in the catalogs, the product information are not classified properly, and are not organized hierarchically. In this paper, we analyse and classify information that can use to describe various products. And then, we suggest the modes that can describe the various products information through the complement of existing researches, and we apply it over several products on the Web. The uses of this model supports flexibility and facility to the product offers such as internet shopping malls.

A Development Of Extended ERP Based Model AND System In Construction Industry (확장형ERP 건설분야 적용모델(E2CM) 및 시스템(eCOMIS)개발)

  • Lee, Min-nam;Oh, Dong-hwan;Shin, Tae-hong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.05a
    • /
    • pp.565-568
    • /
    • 2004
  • 최근 ERP에 고객관계관리(CRM), 공급망관리(SCM), 지식관리(KMS) 등의 기능을 확장한 확장형 ERP에 대한 연구개발이 활발해지고 있다. 그러나 타산업과 달리 건설산업의 특수성으로 인한 정보화의 부진으로 인해 이러한 새로운 개념을 적용할 수 있는 ERP 확장모델이 없는 상태이며, 대기업의 경우 일부 이러한 모듈을 부분적으로 적용하려는 움직임은 보이고 있으나, ERP와 별도의 이종시스템으로 관리되고 있어 통합적인 ERP운용을 통해 얻을수 있는 효과를 기대하기 어려운 실정이다. 이에 본 연구에서는 산자부에서 건설표준ERP템플릿으로 지정받은 ERP엔진을 모체로 협력업체와의 인터페이스 제공을 위한 협업적IT시스템과 전자계약시스템, 그리고 변화되는 ISO에 대한 기업의 대처능력 향상을 위한 ISO인증관리시스템, 고객과의 관계관리를 위한 고객관계관리시스템, 절차서와 같은 기업 내의 표준화 된 문서를 관리하기 위한 전자매뉴얼관리시스템, 결재관리를 위한 그룹웨어, 기업 내의 지식저장소 관리를 위한 지식관리시스템을 연구범위로 하여 건설분야 확장형ERP 모델(E2CM)을 개발하였으며, 이를 검증을 위한 시스템(eCOMIS)을 개발하였다.

  • PDF