• 제목/요약/키워드: 문서 전자화

검색결과 261건 처리시간 0.028초

비트벡터에 기반한 XML 문서 군집화 기법 (XML Documents Clustering Technique Based on Bit Vector)

  • 김우생
    • 전자공학회논문지CI
    • /
    • 제47권5호
    • /
    • pp.10-16
    • /
    • 2010
  • XML은 점점 데이터 교환과 정보 관리에서 중요하게 여겨진다. 따라서 XML 문서들을 접근, 질의, 저장하는 효율적인 방법들을 개발하기 위한 많은 노력이 진행되고 있다. 본 논문은 XML 문서들을 효율적으로 군집화 하는 새로운 기법을 제안한다. XML 문서를 군집화하기 위해 문서를 대표하는 비트 벡터를 제안한다. 두 XML 문서의 유사도는 대응하는 두 비트 벡터간의 bit-wise AND 연산에 의해서 측정된다. 실험 결과 XML 문서의 특징으로 비트 벡터가 사용되었을 때 군집화가 제대로 그리고 효율적으로 형성됨을 알 수 있다.

XML 라이브러리의 효율적 재사용을 위한 비즈니스 정보 개발 방안 (Research on a Development of Business Information for the Efficient Reuse of XML Libraries)

  • 박찬권;김형도
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2008년도 추계 공동 국제학술대회
    • /
    • pp.656-663
    • /
    • 2008
  • XML 기술의 발전에 따라 확장성 있는 ebXML(Electronic Business eXtensible Markup Language) 기반의 스키마 사용이 확장되면서 점차 기존 EDI 전자문서나 DTD(Document Type Definition) 구조로 되어 있는 전자문서를 XML 스키마 형태로 변환하거나 새롭게 개발해고 있는 추세이다. 한국전자거래진흥원에서는 XML 전자운세 개발 지침과 함께 XML 라이브러리를 개발하여 제시함으로써 표준 XML 전자문서의 개발을 지원하고 있다. XML 전자문서 개발 지침은 ebXML CCTS 기술규격에서 제시하고 있는 방법론을 준용하고, UN/CEFACT ATG 그룹에서 개발한 XML Naming & Design Rule 규격을 국내에 맞게 수정하여 적용하고 있다. 또한 XML 라이브러리는 전자문서 개발지침에 따라 사전에 정의하고 개발해 놓은 핵심 컴포넌트와 비즈니스 정보 개체들로 구성되어 있다. 하지만 전자문서개발 지침상의 일부 규칙들이 의미상 명확하지 않은 상태에서 개발자의 임의적 선택의 폭을 허용하거나 개체의 명명에 대한 뚜렷한 기준을 제시하지 못함으로써 핵심 컴포넌트와 비즈니스 정보 개체의 검색 및 재사용을 제한하고 라이브러리 유지보수를 어렵게 하고 있는 실정이다. 본 연구에서는 XML 전자문서 개발지침 상의 일부 규칙에 대한 문제점을 분석, 규칙을 구제화함으로써 개발자 중립적인 핵심 컴포넌트와 비즈니스 정보 개체의 개발을 지원하고 라이브러리 관리를 효율적으로 수행할 수 있는 방안을 제시하고자 한다.

  • PDF

GROVE를 이용한 SGML 문서 저장 관리 시스템 설계 (Design of SGML Document Storage Management System using GROVE)

  • 정회경;안성옥;오일덕
    • 정보학연구
    • /
    • 제2권2호
    • /
    • pp.269-279
    • /
    • 1999
  • 정보화 사회에서 많은 문서가 전자화 됨에 따라 효율적인 처리를 위해 구조화된 전자 문서 처리가 요구되고 있다. 이에 SGML은 구조화된 정보를 생성하고 교환하기 위한 문서 표준으로써, 이러한 전자 문서를 보여주고 수정하며 새로운 문서를 생성하기에 알맞다. 이에 따라 대량의 구조화된 SGML 문서 정보의 저장, 관리에 관한 연구가 필요하다. 본 논문은 HyTime(Hypermedia Time-based Structuring Language)에서 정의된 GROVE(Graph Representation Of property ValuEs)를 이용하여 데이터 모델링 설계 및 SGML 문서 저장 관리 시스템 설계에 대해 기술한다.

  • PDF

컬러코드를 이용한 스캔 문서 분류 자동화 (Automating Scanned Document Classification Using ColorCode)

  • 안상길;최병욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.766-769
    • /
    • 2008
  • 디지털 형태의 문서가 널리 퍼지고 끊임없이 증가함에 따라 이를 자동으로 가공하고 처리하는 문서자동분류의 중요성이 널리 인식되고 있다. 본 논문에서는 복합기에서 컬러코드를 인식하는 모듈을 탑재하여 스캔된 문서를 자동으로 분류하는 시스템을 제안하고자 한다. 복합기에서 컬러코드가 부착된 종이문서를 스캔한 다음 그 컬로코드를 추출하여 인식하고 해당 컬러코드와 관련된 문서관리정보에 따라 스캔문서를 복합기 내부의 지정 폴더에 저장하거나 다른 곳으로 전달하는 시스템이다. 이렇게 함으로써 종이문서를 전자화하는 과정에서 수작업으로 분류하는 시간을 줄일 수 있고 또한 사람에 의한 오류를 줄일 수 있다는 장점이 있다.

SVD에 기반한 모델 경량화를 통한 문서 그라운딩된 응답 생성 (Lightweight Language Models based on SVD for Document-Grounded Response Generation)

  • 이검;서대룡;전동현;강인호;나승훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.638-643
    • /
    • 2023
  • 문서 기반 대화 시스템은 크게 질문으로부터 문서를 검색하는 과정과 응답 텍스트를 생성하는 과정으로 나뉜다. 이러한 대화 시스템의 응답 생성 과정에 디코더 기반 LLM을 사용하기 위해서 사전 학습된 LLM을 미세 조정한다면 많은 메모리, 연산 자원이 소모된다. 본 연구에서는 SVD에 기반한 LLM의 경량화를 시도한다. 사전 학습된 polyglot-ko 모델의 행렬을 SVD로 분해한 뒤, full-fine-tuning 해보고, LoRA를 붙여서 미세 조정 해본 뒤, 원본 모델을 미세 조정한 것과 점수를 비교하고, 정성평가를 수행하여 경량화된 모델의 응답 생성 성능을 평가한다. 문서 기반 대화를 위한 한국어 대화 데이터셋인 KoDoc2Dial에 대하여 평가한다.

  • PDF

SHA-256 기반의 캡슐화된 전자의무기록 문서 저장 시스템 (SHA-256 based Encapsulated Electronic Medical Record Document Storage System)

  • 이효승;오재철
    • 한국전자통신학회논문지
    • /
    • 제15권1호
    • /
    • pp.199-204
    • /
    • 2020
  • IT기술의 발달로 현재 여러 분야에서 융·복합 시스템을 적용하고 운영 중에 있다. 그중 대표적인 분야가 의료분야로 나노기술 및 바이오 기술을 접목하여 다양한 형태로 발전해 나가고 있다. 하지만 실제 의료데이터를 운영하고 관리하는 측면에서는 기술적인 혁신이 부족한 것이 현실이다. 대표적인 예로 전자의무기록 또는 SAM 파일과 같이 데이터를 전송 또는 보관하는 업무의 운영에 있어 현재는 데이터와 문서의 양식을 별도로 저장하고 조합하는 형태를 취하고 있으며 그렇지 않은 경우에도 종이에 기록 후 보관하는 방식을 고수하고 있다. 본 연구에서는 데이터와 문서의 양식을 캡슐화 하고 업무 처리상 발생할 수 있는 문서 형태 그대로를 데이터화 하여 운영 및 보관할 수 있는 EMR 시스템을 설계 및 구현함으로써 업무적인 측면과 관리적인 측면에서 보다 효율적인 전자문서의 운영이 가능할 수 있기를 기대한다.

OOXML 기반의 안전한 문서관리 시스템 설계 (Design of a Secure Document Management System Based on OOXML)

  • 이영구;김현철;김정재;전문석
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2009년도 춘계학술발표논문집
    • /
    • pp.469-472
    • /
    • 2009
  • 본 논문에서는 권한이 없는 불법적인 이용자로부터의 전자문서 유출을 사전에 차단하기 위한 문서관리 시스템을 제안한다. 이를 위해 각 문서를 OOXML을 이용하여 페이지별로 분리하고 분리한 페이지에 대하여 각각의 대칭키로 암호화하여 저장한다. 암호화된 문서의 복호화를 위해 각각의 대칭키를 랜덤하게 생성한 OTP로 암호화하여 서버의 개인키로 전자서명 한 후 사용자의 공개키로 암호화하여 전송한다. 사용자는 자신의 개인키를 이용하여 대칭키를 획득하여 문서를 복호화하여 열람할 수 있다.

  • PDF

규칙기반 텍스트 영역 선택 기법을 이용한 펜기반 교정 시스템의 구현 (Implementation of Pen-based Editing System using Rule-based Text Selection Technique)

  • 정한상;김재경;손원성;임순범;최윤철
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 추계학술발표논문집
    • /
    • pp.203-206
    • /
    • 2002
  • 최근 웹을 기반으로 한 문서의 전자화가 이루어지면서 기존의 전통적인 펜기반 교정 시스템 또한 온라인 상의 전자 문서 환경에 맞게 변화하고 있다. 이러한 펜기반 입력 기법을 사용하는 교정 시스템에서는 일반 문서와 달리 웹 문서의 구조정보를 고려한 편집이 지원되어야 하며 또한 교정 부호와 텍스트 간의 정확한 영역 인식이 이루어져야 한다. 본 연구에서는 온라인 교정 시스템 모델링을 통하여 온라인 환경에 적합한 교정 부호를 정의하고, 교정 대상 텍스트 영역을 편집 가능한 단위로 구분하여 효율적인 편집 연산이 이루어 질 수 있도록 하였다. 또한 웹 기반의 구조문서(HTML/XML) 편집 환경을 고려하여 편집으로 인한 문서의 구조 정보 변경을 지원하기 위하여 텍스트를 비구조 및 구조정보 텍스트로 분류하여 정의하였다. 본 연구에서는 이러한 모델에 기반하여 교정 부호의 특성에 따른 가변적인 편집 텍스트 영역 인식 규칙 모델을 정의하여 교정 부호와 편집 텍스트 영역간의 모호성을 최소화 하고, 편집으로 인한 문서의 구조 정보 변경을 지원하는 시스템을 구현하였다. 결과적으로 온라인 웹 문서 환경에서 펜기반의 모호한 교정 부호의 입력을 인지적인 관점에서 해석하여 보다 정확한 교정 작업 수행을 지원하도록 하였다.

  • PDF

XML 기반 학술지 데이터베이스 저장관리시스템의 개발 (A Development of XML-Based ]Repository Management System for a thesis database)

  • 조남선;김우성;서인홍
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2001년도 춘계학술대회 발표논문집
    • /
    • pp.330-333
    • /
    • 2001
  • 학술지 데이터 베이스 구축에 있어서 가장 주요한 문제점온 기존 문헌의 디지털화이다. 기존 문헌을 디지털화함에 있어서 택할 수 있는 방법은 문서 인식기(OCR)를 통한 자동인식과 수작업을 통해서 컴퓨터로 입력하는 방법이 있다. 전자의 방법은 현재의 한글 문서 인식기술로 볼 때 인식률이 저조하고, 인식기를 통한 자동인식에서 발생된 오류를 수정하는 비용이 수작업으로 입력하는 비용에 비해 더 크다고 판단된다. 따라서 자료의 입력은 수작업으로 하는 것이 효율적이다 학술지 데이터 베이스들 구축하고 이를 서비스하기 위해 서는 입력된 텍스트 데이터를 표준화하여 구조적으로 변환/편집해야 한다. 이는 구조문서 표준이라 할 수 있는 XML의 이용이 필요하다는 말이기도 할 것이다. 또한 디지털화 된 문서를 효율적으로 활용하고 관리하기 위해서는 비쥬얼한 구조문서 저장 관리기가 필요하다. 본 논문에서는 디지털화 된 텍스트를 구조적인 XML문서로 변환하여 효과적으로 저장 관리 할 수 있는 저장관리기를 설계하고 개발하였다.

서명값 은닉을 이용한 XML 전자서명 모델 설계 (XML Signature Model Design using Signature Value Hide)

  • 고훈;김대원;신용태
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (하)
    • /
    • pp.1873-1876
    • /
    • 2003
  • 최근 전자상거래 확산에 따라 전자서명, 키관리 및 인증서비스가 새롭게 부상하고 있으며, 여기에 적용하기 위한 정보보호 기반기술로는 암호화 기술, 인증기술, 전자서명, PKI(Pulbic Key Infrastructure) 및 WPKI(Wireless PKI)등이 있다. 암호화 기술은 합법적 참여자들 간에 메시지 변/복조 규칙에 대한 약속을 정하고, 이 규칙에 따라 송신하려는 메시지를 암호화시켜 전달 혹은 보관하며, 메시지 수신시 또는 접근 권한이 있는 사람이 필요에 따라 이를 복호화 하도록 하는 기술을 말한다. 전자서명은 종래의 종이 문서에 표기하던 수기 서명이나 인장 효과를 전자적 매체내에 저장 또는 전송되는 전자 문서상에 효과적으로 부여하는 전자적 서명 방식이다. e-business 활성화를 위한 정부의 적극적인 참여와 지원을 바탕으로 받은 전자상거래 관련 사업들이 등장하고 있다. 이러한 전자상거래에 사용되는 기반 기술로서 XML(extensible Markup Language)기술이 사용되고 있다. 본 연구에서는 서명값을 XML 문서 안에 포함해서 전송 하는 방법으로 문서의 무결성과 비밀성을 보장하고자 한다.

  • PDF