• 제목/요약/키워드: Document Analysis

검색결과 1,174건 처리시간 0.034초

전자식 문헌전송 시스팀에 관한 고찰 (A study on the electronic document delivery systems)

  • 박준식;김정현
    • 한국도서관정보학회지
    • /
    • 제16권
    • /
    • pp.191-220
    • /
    • 1989
  • This study is an attempt to furnish some helpful data for the design and implementation of the electronic document delivery system based on the analysis of it's cases. To begin with, the concepts and basic models of electronic document delivery system(Fig. 1) were overviewed in the second chapter, on the basis of which the concrete cases were introduced in the third chapter ; ADONIS Project, ARTEMIS Project, HERMES Project, APOLLO Project, UNIVERSE Project, DOCDEL Project, and etc. In the future rapidly developed the technology of electronic communication, there are many possibilities of the evolution of electronic document delivery system.

  • PDF

클러스터 중심 결정 방법에 따른 문서 클러스터링 성능 분석 (Analysis of Document Clustering Varing Cluster Centroid Decisions)

  • 오형진;변동률;이신원;박순철;정성종;안동언
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 하계종합학술대회 논문집(3)
    • /
    • pp.99-102
    • /
    • 2002
  • K-means clustering algorithm is a very popular clustering technique, which is used in the field of information retrieval. In this paper, We deal with the problem of K-means Algorithm from the view of creating the centroids and suggest a method reflecting document feature and considering the context of each document to determine the new centroids during the process of forming new centroids. For experiment, We used the automatic document summarizer to summarize the Reuter21578 newslire test dataset and achieved 20% improved results to the recall metrics.

  • PDF

품질경영 체제에서의 문서관리 시스템 확보 방안 (A Study on the Establishing Document Control System in Quality Management)

  • 박상필;김영세;박건우
    • 산업경영시스템학회지
    • /
    • 제18권36호
    • /
    • pp.307-313
    • /
    • 1995
  • Everyone knows that documents are very useful to obtain and transfer an information. Establishing a good document control system is difficult although it is important. In this point, document control is the base of the quality system. This paper provides possible implementation methods and achieving the method of good document control through analysis of code requirements. The best method is to provide a freedom to people.

  • PDF

디지털 정보환경과 저작권법 변화에 따른 원문제공서비스 동향분석 및 대응전략 (A Trend Analysis and Strategy for Document Delivery Service in the Changing Digital Information Environment and Copyright Law)

  • 이선희;김지영;김혜선
    • 정보관리연구
    • /
    • 제43권3호
    • /
    • pp.139-160
    • /
    • 2012
  • 원문제공서비스는 변화하는 디지털 정보환경과 저작권법에 영향을 받아왔다. 본 논문은 국내외 원문제공서비스 기관인 BL(영국), NLA(호주), subito(독일어권), JST(일본), KERIS와 KISTI(국내)의 동향을 분석하고 각국의 저작권법을 비교한 후, 시사점을 도출하였다. 본 논문은 원문제공서비스 기관이 이용자의 요구를 만족시키는 새로운 전략을 수립하는데 도움이 되고자 하였다.

과학기술분야 원문제공서비스의 협력 네트워크 분석 (A Study on the Collaboration Network Analysis of Document Delivery Service in Science and Technology)

  • 김지영;이선희
    • 한국도서관정보학회지
    • /
    • 제44권4호
    • /
    • pp.443-463
    • /
    • 2013
  • 한국과학기술정보연구원(KISTI)은 연구생산성을 향상시키고자 NDSL 원문제공서비스(NDSL Information Document Service: NIDS) 협력 네트워크를 통해 국내 연구자들에게 과학기술정보를 제공하고 있다. NIDS 협력 네트워크에서 대학도서관과 연구원 정보센터들이 중요한 역할을 수행하고 있다. 본 연구는 사회 네트워크분석을 통하여 원문제공서비스 협력기관들 간의 관계를 규명하였다. 각 기관이 네트워크에서 중심에 위치하는 정도를 분석하기 위하여 연결정도 중심성, 근접 중심성, 매개 중심성, 위세 중심성과 같은 지표들을 활용하였다. 분석결과에 의하면 원문제공서비스 네트워크의 중심에는 KISTI, KAIST, POSTECH, 외국학술지지원센터가 위치하고 있었다. 본 연구는 이러한 결과를 기초로 하여 원문제공서비스 발전 방안을 제안하였다.

주성분 분석과 퍼지 연관을 이용한 문서군집 방법 (Document Clustering Method using PCA and Fuzzy Association)

  • 박선;안동언
    • 정보처리학회논문지B
    • /
    • 제17B권2호
    • /
    • pp.177-182
    • /
    • 2010
  • 본 논문은 주성분 분석과 퍼지 연관을 이용한 새로운 문서군집 방법을 제안한다. 제안된 방법은 주성분 분석의 의미특징을 이용하여 군집 레이블과 군집의 대표 용어들을 선택하기 때문에 문서군집의 내부구조를 더 잘 표현할 수 있다. 또한 퍼지연관 값을 이용한 군집은 문서군집에 유사하지 않은 문서를 더 잘 구분함으로써 문서군집의 성능을 높일 수 있다. 실험결과 제안방법을 적용한 문서군집방법이 다른 문서군집 방법에 비하여 좋은 성능을 보인다.

SGML을 활용한 PDM에서의 설계변경문서관리 (The Engineering Change Document Management using SGML in PDM)

  • 김준오;김선호
    • 산업공학
    • /
    • 제10권2호
    • /
    • pp.79-90
    • /
    • 1997
  • Documents in a traditional PDM(Product Data Management) system have been managed in a form of scanned document files or electronic documents developed by specific tools. Though each tool manages documents with its own systematical methods, it has drawbacks in data search, data integration and interchange, etc. For this reason, in this research we propose an efficient document management system for PDM by using the SGML(Standard Generalized Markup Language), one of CALS and ISO standards for document interchanges. Among documents to be managed in PDM, the engineering change notification (ECN) is taken into account. The DTD (Document Type Definition) has been constucted based on the logical analysis of the documents format, In addition, based on the DTD, DB classes have been designed by object-oriented paradigms and a prototype for document input/output and search has been developed using UniSQL ORDBMS (Object-Relational DBMS) and PowerBuilder under the client/server environment.

  • PDF

지식정보 공유를 위한 전자원문서비스의 주요 이슈와 사례 분석 (Analysis on Current Issues and Cases of Electronic Document Delivery Service for Sharing of Knowledge Information)

  • 유수현;최희윤
    • 정보관리학회지
    • /
    • 제23권2호
    • /
    • pp.81-96
    • /
    • 2006
  • 웹기반 학술정보 커뮤니케이션이 보편화되고 정보공급자 및 이용자와의 직접적인 커뮤니케이션이 확산되는 등 원문서비스 환경의 변화는 원문서비스 기관에 적지 많은 영향을 미치고 있다. 특히 웹을 통하여 이용자에게 원문을 제공하는 전자원문서비스의 등장은 전자형태 정보의 신속하고 용이한 복제 및 배포로 인하여 그 운영에 있어서 저작권과의 마찰을 피할 수 없다. 이 연구에서는 원문서비스 환경의 주요 변화와 동향을 검토하고, 해외 전자원문서비스 사례를 파악함으로써 국내 웹기반 원문서비스인 e-DDS가 국내 저작권법에서 이슈가 되는 부분 및 향후 해결해 나가야 할 부분들을 검토하고자 한다.

Local Similarity based Document Layout Analysis using Improved ARLSA

  • Kim, Gwangbok;Kim, SooHyung;Na, InSeop
    • International Journal of Contents
    • /
    • 제11권2호
    • /
    • pp.15-19
    • /
    • 2015
  • In this paper, we propose an efficient document layout analysis algorithm that includes table detection. Typical methods of document layout analysis use the height and gap between words or columns. To correspond to the various styles and sizes of documents, we propose an algorithm that uses the mean value of the distance transform representing thickness and compare with components in the local area. With this algorithm, we combine a table detection algorithm using the same feature as that of the text classifier. Table candidates, separators, and big components are isolated from the image using Connected Component Analysis (CCA) and distance transform. The key idea of text classification is that the characteristics of the text parallel components that have a similar thickness and height. In order to estimate local similarity, we detect a text region using an adaptive searching window size. An improved adaptive run-length smoothing algorithm (ARLSA) was proposed to create the proper boundary of a text zone and non-text zone. Results from experiments on the ICDAR2009 page segmentation competition test set and our dataset demonstrate the superiority of our dataset through f-measure comparison with other algorithms.

A Text Detection Method Using Wavelet Packet Analysis and Unsupervised Classifier

  • Lee, Geum-Boon;Odoyo Wilfred O.;Kim, Kuk-Se;Cho, Beom-Joon
    • Journal of information and communication convergence engineering
    • /
    • 제4권4호
    • /
    • pp.174-179
    • /
    • 2006
  • In this paper we present a text detection method inspired by wavelet packet analysis and improved fuzzy clustering algorithm(IAFC).This approach assumes that the text and non-text regions are considered as two different texture regions. The text detection is achieved by using wavelet packet analysis as a feature analysis. The wavelet packet analysis is a method of wavelet decomposition that offers a richer range of possibilities for document image. From these multi scale features, we adapt the improved fuzzy clustering algorithm based on the unsupervised learning rule. The results show that our text detection method is effective for document images scanned from newspapers and journals.