• 제목/요약/키워드: 전자문서처리

검색결과 461건 처리시간 0.033초

XML 기반 통합 상품 표현 모델 (A XML based Unified Product Description Model)

  • 김경래;하상호;서건수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 춘계학술발표논문집 (하)
    • /
    • pp.793-796
    • /
    • 2001
  • XML은 강력한 데이터 표현능력을 인정받아 전자상거래와 같은 데이터 처리 분야에 적극적으로 도입되고 있다. 하지만 XML을 이용하여 다른 조직이나 사용자간에 원활한 데이터 교환과 사용을 위해서는 공통적으로 사용할 수 있는 태그나 용어가 표준화되어야 한다. 현재 이와 같은 표준화 작업은 CommerceNet에서 주관하는 xCbl이 주를 이루고 있으며, RosettaNet과 BizTalk에서도 자신의 고유한 문서 표준을 채택하고 있다. 하지만 위의 표준은 B2B간의 상품이나 서비스에 대한 포괄적인 관점으로 기술되었기 때문에 상품 자체의 세부적인 정보 표현에는 부족한 점이 있다. 또한 현재 국내에서 이와 같은 표준에 대한 구축이 초기 단계에 있기 때문에 산업별, 산업간 정보 연계를 위한 표준화가 시급하다. 본 논문에서는 이와 같은 표준화 작업의 일환으로 XML에 기반 하여 가능한 모든 상품을 기술할 수 있는 표준 모델을 제시하고 이를 XML의 DTD로 구현하였다.

  • PDF

개인화된 메일 필터링 에이전트 (Personalized Mail Filtering Agent)

  • 정옥란;조동섭
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (상)
    • /
    • pp.729-732
    • /
    • 2003
  • 인터넷의 발달로 인하여 웹을 통한 문서 송수신이 많아지면서 이메일의 사용자도 기하급수적으로 늘어나고 있다. 또한 일반 사용자나 전자상거래에서 오가는 메일의 양도 갈수록 늘어나고 있다. 편리하다는 점을 이용해서 엄청난 양의 스팸메일도 매일 같이 쏟아져 나와 사회적 문제점으로 부각되고 있는 현실이다. 본 논문에서는 사용자 개개인에 맞게 메일을 자동 관리해주는 개인화 된 필터링 에이전트(Personalized Mail Filtering Agent)를 제안한다. 즉 새로운 메시지가 오면, 먼저 사용자의 메일 처리과정을 관찰하여 각각 개인에 맞는 룰을 형성하고, 만들어진 개인적 룰(personal rule)을 바탕으로 메시지를 자동 관리 즉 카테고리별 분류, 저장 및 불필요하나 메일이나 스팸메일을 삭제 해주는 것이다.

  • PDF

딥러닝 기반의 표 경계선 히트맵 회귀를 이용한 표의 구조 인식 (Table Structure Recognition using Borderline Heatmap Regression)

  • 이은지;박재우;구형일;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 추계학술대회
    • /
    • pp.84-87
    • /
    • 2021
  • 본 논문에서는 딥러닝을 기반으로 문서영상에서 표 안의 셀 경계선을 히트맵 회귀(heatmap regression)로 추정함으로써 표의 구조를 인식하는 방법을 제안한다. 표는 기본적으로 행과 열로 이루어져 있기 때문에, 제안하는 방법에서는 먼저 1 차원 벡터 형태로 세로/가로 방향의 행/열 경계선 위치를 찾고, 이에 병합된 셀을 처리하기 위해 경계선이 그어져야 할 위치를 2 차원으로 추정한 결과를 적용하여 온전한 표의 경계선을 구한다. 이러한 구조를 통해 제안하는 방법은 표의 행과 열에 대한 정보를 효과적으로 이용함과 동시에, 복잡한 후처리 없이 병합된 셀을 처리할 수 있는 이점을 보인다. 실험은 1 차원의 행/열 경계선 위치를 반영하는 두 가지 방식에 대해 PubTabNet[11]에 대해 진행하여 결과를 보였다.

  • PDF

BERT 기반 End-to-end 신경망을 이용한 한국어 상호참조해결 (Korean End-to-end Neural Coreference Resolution with BERT)

  • 김기훈;박천음;이창기;김현기
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.181-184
    • /
    • 2019
  • 상호참조해결은 주어진 문서에서 상호참조해결 대상이 되는 멘션(mention)을 식별하고, 같은 개체(entity)를 의미하는 멘션을 찾아 그룹화하는 자연어처리 태스크이다. 한국어 상호참조해결에서는 멘션 탐지와 상호참조해결을 동시에 진행하는 end-to-end 모델과 포인터 네트워크 모델을 이용한 방법이 연구되었다. 구글에서 공개한 BERT 모델은 자연어처리 태스크에 적용되어 많은 성능 향상을 보였다. 본 논문에서는 한국어 상호참조해결을 위한 BERT 기반 end-to-end 신경망 모델을 제안하고, 한국어 데이터로 사전 학습된 KorBERT를 이용하고, 한국어의 구조적, 의미적 특징을 반영하기 위하여 의존구문분석 자질과 개체명 자질을 적용한다. 실험 결과, ETRI 질의응답 도메인 상호참조해결 데이터 셋에서 CoNLL F1 (DEV) 71.00%, (TEST) 69.01%의 성능을 보여 기존 연구들에 비하여 높은 성능을 보였다.

  • PDF

하이퍼레저 패브릭과 DID를 사용한 EMR관리 시스템 기법 제안 (EMR Management System Using Hyperledger Fabric and DID)

  • 엄효상;강혁;이근호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.220-221
    • /
    • 2023
  • EMR 시스템은 환자들의 진료, 처방 및 개인정보들을 중앙집중형으로 관리하는 시스템이다. 기존 EMR 시스템은 수기로 작성하던 진료기록을 컴퓨터를 통해 전자문서 형태로 관리하고 있다. 그러나 EMR 시스템은 외부로부터 해킹이나 데이터 유출에 대한 피해가 우려된다. 본 논문에서는 블록체인 기반의 하이퍼레저 패브릭과 DID를 사용하여 EMR 데이터를 분산 저장하여 환자의 진료기록을 안전하게 관리하는 시스템 기법을 제안한다.

IP 네트워크에서 실시간 영상 서비스 품질에 관한 연구 (A Study on Real-time Video Service Quality in IP Networks)

  • 문서현;박승섭
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 춘계학술발표대회
    • /
    • pp.777-780
    • /
    • 2008
  • 최근 IP 네트워크를 통한 유무선 통신 기술, 멀티미디어, 그리고 영상 처리 기술의 발전은 IPTV, VoIP와 같은 여러 형태의 서비스를 가능하게 하였다. 이러한 서비스들의 대부분은 실시간 동영상 및 음성 서비스를 바탕으로 하고 있으며 대용량의 대역폭뿐만 아니라 높은 수준의 서비스 품질을 요구한다. 이에 대한 대안으로 QoS 보장 기술에 대한 연구가 활발히 이루어지는 가운데 아직까지 QoS 보장에 따른 실시간 영상 서비스 품질 변화에 대한 테스트 결과가 미흡하다. 본 논문에서는 QoS 보장에 따른 실시간 영상 서비스의 품질을 사용자 입장에서 객관적 화질 측정방법인 PSNR을 이용하여 측정하고 평가한다. 또한, 현재의 기반망인 IPv4망과 차세대 인터넷 프로토콜인 IPv6망을 고려하여 현실적으로 가장 높은 품질의 서비스를 제공할 수 있는 IP망의 QoS 보장을 제안하고자 한다.

관점지향 프로그래밍 기법을 이용한 BPEL 기능 추가를 위한 XAS4B 엔진 설계 (A Design of XAS4B for Adding Function in BPEL using Aspect-Oriented Programming)

  • 곽동규;최재영
    • 전기전자학회논문지
    • /
    • 제17권4호
    • /
    • pp.525-530
    • /
    • 2013
  • 워크플로우의 표준인 BPEL은 프로그래밍 언어에 대한 이해도가 낮은 도메인 전문가도 손쉽게 비즈니스 흐름을 작성할 수 있다. 하지만 특정 도메인에서는 BPEL 문법에 없는 새로운 기능이 요구된다. BPEL 엔진이 새로운 기능을 처리하기 위해서는 새로운 BPEL 엔진을 개발하거나 기존의 BPEL 엔진에 기능을 추가해야 하는데 이는 비용이 많이 필요하다. 본 논문에서는 XML 스키마를 확장하여 XAS4B 문서를 제안하고 관점지향 프로그래밍 기법을 이용하여 BPEL 엔진에 새로운 기능을 추가하는 방법을 보인다. 관점지향 프로그래밍 기법은 직조를 이용하여 핵심관심사의 수정없이 횡단관심사를 추가할 수 있다. 본 연구에서는 기존의 BPEL 엔진으로 B2J (BPEL to JAVA)를 사용하는데 이 엔진은 BPEL 문서를 JAVA 프로그램으로 변환하고 이를 실행한다. 본 시스템은 B2J 엔진이 생성한 JAVA 프로그램을 핵심관심사로 새로운 기능을 처리하는 프로그램을 횡단관심사로 두 프로그램을 직조하여 BPEL 흐름에 새로운 기능의 흐름을 추가한다. 제안하는 방법은 BPEL의 새로운 기능을 추상적으로 제공하여 한 번 개발된 새로운 기능을 도메인 전문가가 재사용하기 손쉽다.

MIPv6와 PMIPv6의 상호연동에 관한 연구 (A Study on Interaction between MIPv6 and PMIPv6)

  • 한병진;이종혁;정태명
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 춘계학술발표대회
    • /
    • pp.773-776
    • /
    • 2008
  • 최근 WiBro, HSDPA 등의 무선 네트워크 기술의 급격한 발달과 휴대용 기기의 놀라운 성능향상으로 인해 이동 중에도 네트워크 연결성을 잃지 않기 위한 기술이 요구 되고 있다. 이러한 요구사항을 위한 IP 계층에서의 해결책을 보인 기술이 Mobile IP이다. Mobile IP 기술에는 호스트 기반의 이동성을 제공하는 MIPv6, FMIPv6, HMIPv6 등의 기술과 네트워크 기반의 이동성을 제공하는 PMIPv6 등이 IETF에서 RFC와 드래프트 문서를 통해 제시되었다. 각각의 네트워크 도메인은 이러한 이동성 관리 기술을 채택하여 이동성을 제공하는데 각 기술 간의 상호연동에 있어 몇 가지 문제점이 있다. 본 논문은 호스트 기반 이동성 관리 기술의 대표인 MIPv6와 네트워크 기반 이동성 관리 기술인 PMIPv6 간의 상호연동을 위하여 PMIPv6 네트워크를 식별하기 위한 새로운 방안을 제시하고 MIPv6와 PMIPv6가 상호연동하는 시나리오를 제시한다. 본 논문이 제안한 새로운 PMIPv6 Indication 방법과 시나리오는 이동 기기가 다양한 특성을 지닌 도메인 간을 로밍할 때 효율적으로 상호연동할 수 있다.

재난정보 표준화를 통한 환경 재난정보 수집 및 활용 (Collection and Utilization of Unstructured Environmental Disaster by Using Disaster Information Standardization)

  • 이동섭;김병식
    • Ecology and Resilient Infrastructure
    • /
    • 제6권4호
    • /
    • pp.236-242
    • /
    • 2019
  • 본 연구는 재난정보 표준화를 목표로 다양한 재난 및 사고에서 생성되는 정형, 비정형 문서를 전자화된 문서로 변환하여 환경재난 정보를 생성함으로써 데이터베이스에 저장하고 환경재난 관리에 활용할 수 있는 체계를 개발하였다. 최근 4차 산업 시대를 통해 다양한 지능화 기술들이 발전하고 있다. 이러한 기술들은 환경재난, 재난관리 등의 분야에 다양한 형태로 적용되며, 환경재난 관리 업무와 융합되어 활용되고 있다. 재난정보관리는 단순히 재난업무를 지원하는 것이 아니라 과거의 환경재난 이력정보를 활용하여 인공지능 기술을 적용한 스마트 재난관리를 지원할 수 있도록 한다. 환경재난을 관리하는 중요한 요소는 재난정보이다. 재난정보는 재난의 발생에서 진행, 대응 및 계획까지의 재난 전주기에 대한 정보를 전자화된 정보로 관리하고 처리하는 행위를 의미한다. 그러나, 자연, 사회, 환경재난에 대한 상황, 대응, 대비, 복구의 정보는 주로 보고서의 형태인 핸드아웃이나 비정형 정보로 존재하고 있다. 이러한 비정형 재난안전정보는 관리 부실에 의해 사라지거나 폐기되는 경우가 많다. 이에 따라 비정형 재난안전정보는 재난정보로서의 관리를 위해 인식기술이 필요하다. 본 연구에서는 지능화된 기술을 활용하여 인쇄되거나 스캐너에 의해 이미지 또는 문서로 생성된 재난 보고서를 전자화된 문서로 변환하는 것에 중점을 두었으며, 그 후 변환된 재난정보는 재난정보관리 코드체계에 맞추어 정리하여 재난정보관리 데이터베이스에 저장한다. 정형, 비정형 재난정보를 생성하는 것은 스마트 재난관리의 시작으로 가장 중요한 요소이며, 이렇게 생성된 환경재난 정보는 재난정보 코드체계와 연계하여 표준화된 형식으로 관리한다. 재난코드체계는 재난 별 발생 진행 상황, 피해 규모, 대처사항 등의 정보를 저장할 수 있는 표준을 구축하였으며, 향후 이러한 많은 재난 데이터와 이력정보를 기반으로 한 인공지능 기술을 접목하여 스마트 재난관리 및 의사결정에 활용될 수 있을 것으로 판단된다.

다중 어댑터를 이용한 교차 언어 및 스타일 기반의 제목 생성 (Cross-Lingual Style-Based Title Generation Using Multiple Adapters)

  • 박요한;최용석;이공주
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권8호
    • /
    • pp.341-354
    • /
    • 2023
  • 문서의 제목은 문서의 내용을 가장 효율적으로 요약하여 제공해 준다. 이때 독자들이 선호하는 스타일과 언어에 따라 문서의 제목을 다르게 제공해 준다면, 독자들은 문서의 내용을 좀 더 쉽게 예측할 수 있다. 본 연구에서는 문서가 주어졌을 때 언어와 스타일에 따라 제목을 자동 생성하는'교차 언어 및 스타일 기반의 제목 생성 모델을 제안한다. 모델을 학습하기 위해서는 같은 내용을 다른 언어와 다른 스타일로 작성한 병렬데이터가 필요하다. 그러나 이러한 종류의 병렬데이터는 구축하기 매우 어렵다. 반면, 단일 언어와 단일 스타일로 구축된 제목 생성 데이터는 많으므로 본 연구에서는 제로샷(zero-shot) 학습으로 제목 생성을 수행하고자 한다. 교차 언어 및 스타일 기반의 제목 생성을 학습하기 위해 다중 언어로 사전 학습된 트랜스포머 모델에 각 언어, 스타일, 기계번역을 위한 어댑터를 추가하였다. 기계 번역용 병렬데이터를 이용하여 기계번역을 먼저 학습한 후, 동일 스타일의 제목 생성을 학습하였다. 이때, 필요한 어댑터만을 학습하고 다른 부분의 파라미터는 모두 고정시킨다. 교차 언어 및 스타일 기반의 제목을 생성할 때에는 목적 언어와 목적 스타일에 해당하는 어댑터만을 활성화시킨다. 실험 결과로는 각 모델을 따로 학습시켜 파이프라인으로 연결시킨 베이스라인에 비해 본 연구에서 제안한 제로샷 제목 생성의 성능이 크게 떨어지지 않았다. 최근 대규모 언어 모델의 등장으로 인한 자연어 생성에서의 많은 변화가 있다. 그러나 제한된 자원과 제한된 데이터만을 이용하여 자연어 생성의 성능을 개선하는 연구는 계속되어야 하며, 그런 점에서 본 연구의 의의를 모색한다.