• 제목/요약/키워드: dynamic document

검색결과 121건 처리시간 0.028초

인덱스 그래프 : 동적 문서 데이터베이스를 위한 IR 인덱스 구조 (Index Graph : An IR Index Structure for Dynamic Document Database)

  • 박병권
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제10권1호
    • /
    • pp.257-278
    • /
    • 2001
  • An IR(information retrieval) index for dynamic document databases where insertion, deletion, and update of documents happen frequently should be frequently updated. As the conventional structure of IR index is, however, focused on the information retrieval purpose, its structure is inefficient to handle dynamic update of it. In this paper, we propose a new structure for IR Index, we call it Index Graph, which is organized by connecting multiple indexes into a graph structure. By analysis and experiment, we prove the Index Graph is superior to the conventional structure of IR index in the performance of insertion, deletion, and update of documents as well as the performance of information retrieval.

  • PDF

동적 XML 문서에서 효과적인 레이블링을 위해 형제순서 값을 갖는 프라임 넘버링 기법 (A Prime Numbering Scheme with Sibling-Order Value for Efficient Labeling in Dynamic XML Documents)

  • 이강우;이준동
    • 한국컴퓨터정보학회논문지
    • /
    • 제12권5호
    • /
    • pp.65-72
    • /
    • 2007
  • 동적인 XML 문서에서 빈번히 발생하는 갱신에 대한 고려를 하지 않는 레이블링 기법들은 XML 문서 트리의 갱신이 일어날 때 마다 변화된 레이블 정보를 반영하기 위해서 전체 XML 트리를 재탐색하여 전체 노드의 레이블을 다시 계산하는 리레이블링(relabeling)과정이 필요하다. 이러한 리레이블링은 갱신이 빈번히 일어나는 동적인 XML 문서에서는 비용이 상당히 크다는 단점이 있다. 이런 단점을 해결하기 위해 리레이블링 과정이 필요 없는 레이블링 기법으로 프라임 넘버 레이블링 기법(prime number labeling scheme)이 제안되었다. 그러나 프라임 넘버 레이블링 기법은 문서가 갱신될 때 XML 문서 트리의 노드 간 형제순서(sibling order)를 갱신하는 문제는 고려하지 않고 있다. 이러한 형제순서의 갱신과정은 XML 문서 트리의 많은 부분을 재탐색하고 재기록 하여야 하므로 많은 비용이 필요하게 된다. 따라서 본 논문에서는 XML 문서 트리의 재탐색과 재기록이 필요 없이 형제순서를 유지할 수 있는 형제순서 값을 갖는 프라임 넘버 레이블링 기법을 제안한다.

  • PDF

Dynamic Text Categorizing Method using Text Mining and Association Rule

  • Kim, Young-Wook;Kim, Ki-Hyun;Lee, Hong-Chul
    • 한국컴퓨터정보학회논문지
    • /
    • 제23권10호
    • /
    • pp.103-109
    • /
    • 2018
  • In this paper, we propose a dynamic document classification method which breaks away from existing document classification method with artificial categorization rules focusing on suppliers and has changing categorization rules according to users' needs or social trends. The core of this dynamic document classification method lies in the fact that it creates classification criteria real-time by using topic modeling techniques without standardized category rules, which does not force users to use unnecessary frames. In addition, it can also search the details through the relevance analysis by calculating the relationship between the words that is difficult to grasp by word frequency alone. Rather than for logical and systematic documents, this method proposed can be used more effectively for situation analysis and retrieving information of unstructured data which do not fit the category of existing classification such as VOC (Voice Of Customer), SNS and customer reviews of Internet shopping malls and it can react to users' needs flexibly. In addition, it has no process of selecting the classification rules by the suppliers and in case there is a misclassification, it requires no manual work, which reduces unnecessary workload.

DTD 의존 스키마에 기반한 SGML 문서 저장 시스템 개발에 관한 연구 (A Study on Development of SGML Repository System Based on DTD-dependent Schema)

  • 김현기;노대식;강현규
    • 한국정보처리학회논문지
    • /
    • 제6권5호
    • /
    • pp.1153-1165
    • /
    • 1999
  • In various fields of information technology, it is growing up the needs about dynamic content management systems to store and manage SGML(Standard Generalized Markup language) documents in a database system. In this paper, we consider the issue of storing SGML documents that having complex hierarchical structure into a database system, and then propose a data model based on ODMG(Object Database Management Group) object model in order to store SGML documents without loss of information. Because the proposed data model reflects physical element structure and logical entity structure of SGML documents, it is able to store the SGML document in a database system at the system at the element- level granularity without any information loss. And also the proposed data model can be adapted among ODMG-compliant object database management systems. Finally, we will discuss on the implementation details of SGML repository system supports the functionality of automatic database schema creation for any DTD(Document Type Definition0, the functionality of storing the SGML document, the functionality of dynamic document assembly from stored database objects to SGML document, and the functionality of indexing and searching for database objects.

  • PDF

동적 순서 XML 트리에서 레이블링 기법을 이용한 효율적인 수정처리 (An Efficient Updates Processing Using Labeling Scheme In Dynamic Ordered XML Trees)

  • 이강우
    • 한국정보통신학회논문지
    • /
    • 제12권12호
    • /
    • pp.2219-2225
    • /
    • 2008
  • 동적인 XML문서에서 빈번히 발생하는 갱신에 대한 고려를 하지 않는 레이블링 기법들은 XML 문서 트리의 갱신이 일어날 때 마다 변화된 레이블 정보를 반영하기 위해서 전체 XML 트리를 재탐색하여 전체 노드의 레이블을 다시 계산하는 리레이블링 과정이 필요하다. 이러한 리레이블링은 갱신이 빈번히 일어나는 동적인 XML 문서에서는 비용이 상당히 크다는 단점이 있다. 이런 단점을 해결하기 위해 리레이블링 과정이 필요 없는 레이블링 기법으로 프라임 넘버 레이블링 기법이 제안되었다. 그러나 프라일 넘버 레이블링 기법은 문서가 갱신될 때 XML 문서 트리의 노드 간 형제순서를 갱신하는 문제는 고려하지 않고 있다. 이러한 형제순서의 갱신과정은 XML 문서 트리의 많은 부분을 재탐색하고 재기록 하여야 하므로 많은 비용이 필요하게 된다. 따라서 본 논문에서는 XML 문서 트리의 리레이블링과 재계산이 필요 없이 형제순서를 유지할 수 있는 형제순서 값을 갖는 프라임 넘버 레이블링 기법을 제안한다.

OOXML기반의 동적 그룹키를 이용한 전자문서 관리 시스템의 설계 (Design of E-Document Management System Using Dynamic Group Key based on OOXML)

  • 이영구;김현철;정택영;전문석
    • 한국통신학회논문지
    • /
    • 제34권12B호
    • /
    • pp.1407-1417
    • /
    • 2009
  • 본 논문에서는 접근제어 환경에서 하나의 문서에 대하여 세분화된 페이지 정보를 권한별로 제공할 수 있는 전자문서 관리 시스템을 제안한다. 제안하는 시스템은 일방향의 특성을 가지는 해쉬 체인을 이용해 계층식별자를 생성함으로써 기존 시스템과 달리 모든 사용자의 키 정보를 소유할 필요가 없다. 또한, 해쉬 체인 기반의 계층식별자와 랜덤하게 생성한 그룹식별자를 조합해 그룹키를 생성함으로써 페이지별 대칭키를 이용한 문서 암호화 기법에 키 생성 및 관리 문제를 해결함과 동시에 그룹 구성원 이동에 따른 동적 변화에 유연하게 대처할 수 있다. 마지막으로 실험을 통해 기존 전자문서 관리 시스템과 비교, 분석한 결과 문서 암 복호화 속도, 페이지별 암 복호화 속도에서 우수함을 확인 할 수 있었다.

동적 연결 그래프를 이용한 자동 문서 요약 시스템 (A Document Summarization System Using Dynamic Connection Graph)

  • 송원문;김영진;김은주;김명원
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권1호
    • /
    • pp.62-69
    • /
    • 2009
  • 문서 요약은 쉽고 빠르게 문서의 내용을 파악할 수 있도록 방대한 내용을 가지는 다양한 형태의 문서로부터 핵심 내용만을 추출하거나 생성하여 제공하는 것을 목적으로 한다. 본 논문에서는 효율적 문서 요약을 위해 주어진 문서의 평균 문장 길이(핵심어 개수)를 고려하여 문장 간의 핵심어 유사도를 나타내는 연결 그래프를 생성하고 분석하여 요약을 생성하는 기법을 제안한다. 또한 이러한 기법을 이용하여 응용 프로그램 문서로부터 자동으로 요약을 생성하는 자동 문서 요약 시스템을 개발한다. 제안한 방법의 객관적인 요약 성능 측정을 위해 정확한 요약문이 실린 20개의 테스트 문서를 이용하여 생성된 요약에 대해 precision(정확률)과 recall(재현율), F-measure를 측정하였으며, 실험 결과를 통해 기존 기법에 비해 우수한 요약 성능을 보임을 증명하였다.

동적 포맷팅 방식에 관한 연구 (A Study on Dynamic Formatting Method)

  • 임광택;이수연
    • 한국통신학회논문지
    • /
    • 제18권5호
    • /
    • pp.730-738
    • /
    • 1993
  • 주기억 장치의 크기등과 같은 하드웨어적 특성에 구애받지 않고, 메뉴얼등과 같은 대용량 문서를 효과적으로 제작할 수 있으며, 단일 문서내의 서로 인접하지 않는 페이지간의 상호 참조나 하이퍼텍스트 응용의 링크 설정에 긴요한 동일 스크린내 복수개 페이지의 동시 표현과 같은 사용자 인터페이스를 실현할 수 있는 동적 포맷팅 방식을 제안한다. 또한 복수개의 문서중 각각의 특정 페이지를 선택적으로 동일 스크린내 표시함으로써 문서의 일부분을 발췌하여 다른 문서에 포함시키거나, 문서간 하이퍼링크의 설정 및 상호 참조등에도 유효하게 적용할 수 있다. 본 연구에서 제안한 방식은 X 윈도우 및 Motif를 이용한 WYSIWYG방식의 전자 출판 시스템의 연구개발의 일환으로 구현하였다.

  • PDF

이메일 추천 시스템의 분류 향상을 위한 3단계 전처리 알고리즘 (A Three-Step Preprocessing Algorithm for Enhanced Classification of E-Mail Recommendation System)

  • 조동섭;정옥란
    • 대한전기학회논문지:시스템및제어부문D
    • /
    • 제54권4호
    • /
    • pp.251-258
    • /
    • 2005
  • Automatic document classification may differ significantly according to the characteristics of documents that are subject to classification, as well as classifier's performance. This research identifies e-mail document's characteristics to apply a three-step preprocessing algorithm that can minimize e-mail document's atypical characteristics. In the first 5go, uncertain based sampling algorithm that used Mean Absolute Deviation(MAD), is used to address the question of selection learning document for the rule generation at the time of classification. In the subsequent stage, Weighted vlaue assigning method by attribute is applied to increase the discriminating capability of the terms that appear on the title on the e-mail document characteristic level. in the third and last stage, accuracy level during classification by each category is increased by using Naive Bayesian Presumptive Algorithm's Dynamic Threshold. And, we implemented an E-Mail Recommendtion System using a three-step preprocessing algorithm the enable users for direct and optimal classification with the recommendation of the applicable category when a mail arrives.