• Title/Summary/Keyword: 문서과

Search Result 2,264, Processing Time 0.032 seconds

Design of System for Prevent Forgery of Digital Document on Off-Line (오프라인상에서의 전자문서 위변조 방지 시스템 설계)

  • 이윤오;유황빈
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04a
    • /
    • pp.503-505
    • /
    • 2003
  • 현재 인터넷을 통한 상대방의 신뢰성을 보장해 주는 인증서 사용이 빈번해지고 있다. 그러나 오프라인상의 전자문서는 상대방의 신뢰성 보장과 전자문서의 위변조의 위험성이 많다. 또한 전자문서는 오프라인상의 이동성에 제악을 받게 된다. 본 논문에서는 이러한 문제를 해결하고, 사용자가 온라인과 오프라인에서도 사용하게 편리하도록 문서내용, 문서작성자의 인증서 그리고 전자서명값을 이차원 바코드로 변환하여 출력된 전자문서에서 상대방의 신뢰성과 문서의 무결성을 보장하도록 제안한다. 제안된 시스템에서는 문서내용, 문서작성자의 인증서, 전자서명값을 변환해 출력문서에 이차원 바코드를 첨부하게 된다. 출력된 문서에서 첨부된 이차원 바코드를 스케닝 하고 문서내용, 문서작성자의 인증서 그리고 전자서명값을 얻어오고 검증을 통해 위변조 여부 판단하여 상대방의 신뢰성과 문서의 무결성을 확인 하도록 한다.

  • PDF

The Classification and filing of the Official Documents of the Office of Crown Properties in the Great Han Empire (대한제국기 내장원의 공문서 편철과 분류)

  • Park, Sung-Joon
    • The Korean Journal of Archival Studies
    • /
    • no.28
    • /
    • pp.3-33
    • /
    • 2011
  • The Office of Crown Properties was established to manage the property of royal properties as an institution belonging to the Department of the Royal Household in April, 1895. However, as the Great Han Empire established and various policies enforcing the power of the emperor became introduced, the Office of Crown Properties came to be expanded to a large financial agency that would be in charge of various financial sources such as Public Land and Maritime Tax. As the Office of Crown Properties came to manage various income sources, it classified the documents dealing with various government agencies in the Capital and other countryside regions by the unit of Section. The Office of Crown Properties classified the documents by Section and filed them according to Sending/Receiving subject. Sometimes, it filed one kind of document only but sometimes many different kinds of documents were filed together. The types of the document can show the characteristics of the document and the hierarchy of the related agencies through the document name. The fact that they filed the documents with different grades in one file shows that the hierarchy of the agency they dealt with was not the primary standard of the filing and that they did not file the documents by its type. The Office of Crown Properties did not file the related documents in the same file, either. We can say the documents are related if they were corresponded with other agencies while they dealt with a specific item. However, they did not file the related documents in the same file but distinguished sending documents from receiving documents. The reason why they filed different kind documents in the same file and separated the related documents in different file was they took 'whether they were sent or received' as the primary filing standard. They separated the sending documents from the receiving documents first and then filed them according to time regardless of the region or institution. The Office of Crown Properties primarily classified the documents by Section, classified the documents with the standard of whether they were receiving documents or sending documents and then filed them in a file according to the time. It means that the Office of Crown Properties came to create the Official Document Classification and filing system.

Patent Document Categorization based on Semantic Structural Information (문서의 의미적 구조정보를 이용한 특허 문서 분류)

  • Kim, Jae-Ho;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2005.10a
    • /
    • pp.28-34
    • /
    • 2005
  • 특허 검색은 수많은 특허 문서 중에서 특정 해당분야의 문서 집합 내에서 검색을 수행하기 때문에 정확한 특허 분류에 크게 의존하게 된다. 이러한 특허 분류의 중요성에 덧붙여, 특허 문서의 수가 빠르게 증가하게 되면서 특허를 자동으로 분류하려는 요구가 더욱 필요하게 되었다. 특허문서는 일반문서와는 달리 구조화되어 있기 때문에 특허분류를 하기 위해서는 이러한 점이 고려되어야 한다. 본 논문에서는 k-NN 방법을 이용하여 일본어 특허 문서를 자동으로 분류하는 방법을 제안한다. 훈련집합으로부터 유사문서를 검색할 때, 구조화되어 있는 특허 문서의 특징을 이용한다. 문서 전체가 아닌 (기존 기술), (응용 분야), (해결하고자 하는 문제), (문제를 해결하려는 방법) 등의 세분화된 요소끼리 비교하여 유사성을 계산한다. 특허 문서에는 사용자가 정의한 많은 의미 요소가 있기 때문에 먼저 이들을 군집화한 후에 이용한다. 실험 결과 제안한 방법이 특허문서를 그대로 이용하는 것보다는 74%, 특허문서에 나타난 <요약>, <청구항>, <상세한 설명>의 큰 구조 정보를 이용하는 것보다는 4%의 성능 향상을 가져왔다.

  • PDF

Searching XML Documents based on Xtree and Documents Similarity (Xtree와 문서 유사도에 기반한 XML 문서 검색)

  • 이은정;박우창
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04a
    • /
    • pp.578-580
    • /
    • 2003
  • 인터넷의 성장으로 인해 준구조적인 문서 표준의 하나인 XML 문서의 사용이 증가하고 있다. 본 연구는 인터넷이나 XML 데이터베이스에서 저장된 스키마 정보가 주어지지 않는 많은 양의 XML 문서를 대상으로 주어진 XML 문서에 가장 가까운 문서들을 찾는 방범을 제시한다. 먼저 XML 문서들의 스키마 정보를 얻기위하여 XML 문서에 해당하는 카디널리티 정보를 포함하는 xtree로 변환하고, 변환된 문서들에 대하여 XML 각 요소에 대한 유사도와 문서 구조에 대한 유사도를 계산하여 가장 유사도가 가까운 XML 문서를 결과로 제시한다. 본 논문의 방법은 스키마가 알려지지 않는 XML의 문서들에 대한 검색을 할 수 있고 유사도를 이용하여 문서의 근사 검색을 할 수 있는 장정이 인다.

  • PDF

Query-Based Summarization using Non-negative Matrix Factorization (비음수 행렬 인수분해를 이용한 질의 기반의 문서 요약)

  • Park Sun;Lee Ju-Hong;Ahn Chan-Min;Park Tae-Su;Kim Deok-Hwan
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06a
    • /
    • pp.394-396
    • /
    • 2006
  • 기존 질의기반의 문서요약은 질의와 문서간의 사전 학습으로 요약의 질을 높이거나, 문서의 고유 구조(inherent structure)를 반영하여 요약의 정확도를 높이기 위하여 문서를 그래프로 변환한다. 본 논문은 비음수 행렬 인수분해 (NMF, Non-negative Matrix Factorization)를 이용하여 질의 기반의 문서를 요약하는 새로운 방법을 제안하였다. 제안된 방법은 질의와 문서간에 사전학습이 필요 없다. 또한 문서를 그래프로 변형시키는 복잡한 처리 없이 NMF에 의해 얻어진 의미 특징(semantic feature)과 의미 변수(semantic variable)로 문서의 고유 구조를 반영하여 요약의 정확도를 높일 수 있다. 마지막으로 단순한 방법으로 문장을 쉽게 요약 할 수 있다.

  • PDF

An Automatic Classification of Korean Documents Using Weight for Keywords of Document and Corpus : Bayesian classifier (문서의 주제어별 가중치와 말뭉치를 이용한 한국어 문서의 자동분류 : 베이지안 분류자)

  • 허준희;고수정;김태용;최준혁;이정현
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10b
    • /
    • pp.154-156
    • /
    • 1999
  • 문서 분류는 미리 정의된 두 개 또는 그 이상의 클래스에 새로 생성되는 객체들을 할당하는 방법이다. 문서의 자동 분류에 대한 연구는 오래 전부터 연구되어 왔지만 한국어에 대한 적용 및 연구는 다른 분야에 비해 아직까지 활발히 이루어지지 않고 있다. 본 논문에서는 문서를 자동으로 분류하기 위해 문서의 주제어에 가중치를 부여하고, 부족한 문서의 특징을 보충하기 위하여 말뭉치로부터 주제어들과의 상호정보에 의해 추출된 단어를 사용하여 문서를 표현한 후, 가중치를 부여한 문서의 주제어에 베이지안 분류자를 사용하여 문서분류를 수행한다. 실험은 한국어 정보검색 실험용 데이터 집합인 KTset95 문서 4,414개 중 1,300개의 문서를 학습 집합으로, 1,000개의 문서를 분류에 대한 검증 집합으로 사용하였다. 실험 결과, 순수 베이지안 확률을 사용한 기존의 방법보다 실험 집합과 검증 집합에서 각각 1.92%, 4.3% 향상된 분류 정확도를 얻었다.

  • PDF

A Design of the XML-based Converting System between Wired Internet and Wireless Internet (XML 기반의 유무선 인터넷 문서 변환 시스템의 설계)

  • 이미경;정병수;김원태
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10c
    • /
    • pp.250-252
    • /
    • 2001
  • 현재 무선인터넷 문서는 유선인터넷 문서와 호환되지 않으며 다양한 종류의 무선 마크업 언어들로 구성되어 있어서, 무선 인터넷 문서를 새롭게 구축해야하는 문제점을 가진다. 본 논문에서는 이를 해결하기 위한 방안으로 유선 인터넷 문서를 여러 종류의 문선 인터넷 문서로 변환할 수 있는 변환 시스템을 설계한다. 이 시스템은 기존의 무선 마크업 언어의 기능을 모두 지원해주는 XML응용인 XWML을 설계하여 유무선 문서의 중간모듈로 이용한다. 유선 인터넷 문서는 필터링과 포멧팅 과정을 거쳐 XWML문서로 변환된 후 문서생성모듈에서 WML, HDML mHTML등의 무선 인터넷용 문서를 생성한다. 따라서 유선 인터넷 문서를 다양한 문선인터넷 문서로 변환할 수 있기 때문에, 무선 인터넷 환경에 맞는 컨텐츠를 일일이 작성하지 않아도 되는 장점을 가진다.

  • PDF

Study on the Topic Selection of Web Documents (웹 문서의 토픽 선정 방법에 관한 연구)

  • Kong, Hyun-Jang;Hwang, Myung-Gwon;Kim, Pan-Koo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10b
    • /
    • pp.148-151
    • /
    • 2006
  • 웹 문서의 수가 기하급수적으로 늘어나는 현 시점에서 문서의 효율적인 관리을 위한 문서 클러스터링 방법은 현재 가장 요구되는 기술이다. 지금까지 문서 클러스터링의 방법 연구에서는 TF-Idf 측정값을 이용한 문서분류, Title 기반의 문서분류등과 같은 다양한 시도가 있었다. 이러한 문서 클러스터링 방법에서는 문서의 내용에 치중하거나 문서 분류를 위한 정확한 기준이 없어, 효율적인 문서의 클러스터링과 검색을 지원하지 못하였다. 그리하여, 본 연구에서는 새롭게 토픽 선정 알고리즘을 제안하고, 토픽 선정 알고리즘에 의해 결정된 토픽에 기반하여 문서 검색을 수행함으로써, 문서검색의 성능을 높일 수 있었다.

  • PDF

Improving Preprocessing step for Document retrieval system based on String Alignment (정렬을 이용한 내용기반 문서탐색 시스템의 전처리 과정 개선)

  • Kim, Hyong-Jun;Cho, Hwan-Gue
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2008.06c
    • /
    • pp.248-251
    • /
    • 2008
  • 문서 표절이 사회적으로 이슈가 됨에 따라 표절 문서를 판별할 수 있는 시스템의 필요성이 대두되었다. 문서 표절 검사 시스템에서 가장 중요한 이슈는 성능과 속도인데 이 두 가지를 모두 만족시키기 위해서는 표절을 상세하게 검사하기 전에 표절 의심 문서에 대한 비교 문서군이 크기를 최적화하여 표절 검사 범위를 최대한 작게 만들어야 한다. 비교 문서군의 크기를 최적화하기 위해서는 표절 의심 문서와 상관이 없는 문서를 필터링 하는 작업이 필요하다. 이 논문에서는 문서를 빠르게 필터링 하기 위해서 웹 문서 검색에 사용되는 Inverted Index을 이용하여 적당한 시간 안에 비교 문서군의 크기를 최적화 하는 방법들을 알아보고 각각의 방법들의 성능을 비교 분석하는 방법을 제시하며 그 방법들을 바탕으로 성능을 분석하여 최적화된 문서 필터링 방법을 알아본다.

  • PDF

A study on storing a XML/EDI document with XLink (XLink를 이용한 XML/EDI 문서의 저장에 관한 연구)

  • 김수영;윤용익
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10c
    • /
    • pp.703-705
    • /
    • 2001
  • 전통 EDI(Electronic Data Interchange) 문서는 VAN(Value Added Network) 전용망을 통하여 EDI 서비스를 하였다. 하지만, 이것은 실시간(real-time)으로 문서를 처리하는 방식보다 주로 배치(batch)방식으로 한꺼번에 문서를 처리하였으며 전용 소프트웨 어를 사용함으로써 새로운 문서를 처리할때마다 새 문서에 대한 정보를 등록하고 소프트웨어를 다시 설치 해야하는 불편함도 있었다. 기존의 전통 EDI 문서는 VAN을 통하여 처리하는 방식이었으나 현재는 인터넷에서 EDI 문서를 볼 수 있도록 하기 위해 XML(extensible Markup Language)을 이용하고 있다. 인터넷기반의 웹 브라우저 상에서 볼 수 있는 XML/EDI 구현에 힘입어 여러 문서로 분리되어진 EDI 문서를 XLink의 개념을 이용하여 문서의 삽입, 삭제 기능과 이러한 문서를 통합하여 하나의 문서로 데이터베이스에 저장할 수 있는 방법에 관하여 연구하고자 한다.

  • PDF