• Title/Summary/Keyword: 문서 병합

Search Result 40, Processing Time 0.024 seconds

Design and Implementation of XML Document Editor for the Document Merging (문서병합 기능을 갖는 XML 문서 편집기의 설계 및 구현)

  • 김규평;이종학
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.72-74
    • /
    • 2000
  • 최근 XML(eXtensible Markup Language)문서의 효율적인 작성과 유지관리를 위해 다양한 XML 문서 편집기들이 개발되고 있다. 하지만, 기존의 편집기들의 경우 하나의 XML 문서에 대한 편집기능은 제공하고 있으나 다수의 XML 문서들에 대한 병합(merge)기능은 제공하지 못하고 있다. 본 논문에서는 다수의 XML 문서를 병합할 경우 발생할 수 있는 이름중복과, 이름충돌의 해결 방법을 제안하고, 문서병합 기능을 갖는 XML 문서 편집기를 설계하고 구현하였다. 문서병합 기능을 갖는 XML 문서 편집기는 여러 곳에 산재하고 있는 동일한 부류의 여러 XML 문서들을 병합해야 할 경우에 용이하게 사용될 수 있다.

  • PDF

Merging XML Documents Based on Insertion/Deletion Edit Operations (삽입/삭제 편집연산 기반의 XML 문서 병합)

  • Lee, Suk-Kyoon
    • The KIPS Transactions:PartD
    • /
    • v.16D no.4
    • /
    • pp.497-506
    • /
    • 2009
  • The method of effectively merging XML documents becomes necessary, as the use of XML is popular and the collaborative editing is required in the areas such as office documents and scientific documents editing works. As a solution to this problem, in this paper we present a theoretical framework for merging individual editing works by muli-users to a same source document. Different from existing approaches which merge documents themselves when they are merged, we represent editing works with a series of edit operations applied to a source document, which is called a edit script, merge those edit scripts by multi-users, and apply the merged one to the source document so that we can achieve the same effect of merging documents. In order to do this, assuming edit scripts based on insertion and deletion edit operations, we define notions such as static edit scripts, the intervention between edit scripts and the conflict between the ones, then propose the conflict conditions between edit scripts and the method of adjusting edit scripts when merged. This approach is effective in reducing network overhead in distributed environments and also in version management systems because of preserving the semantics of individual editing works.

Design and Implementation of Similar Document Merging System (유사 문서 병합 시스템의 설계 및 구현)

  • Park, Woo-Ri;Kwon, In-Teak;Kim, Jong-Ik
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06c
    • /
    • pp.164-167
    • /
    • 2011
  • 인터넷의 지속적인 발전에 따라 다양한 출처와 경로를 통해 많은 정보가 빠른 속도로 생산, 확산되고 있다. 이로 인해 중복되거나 유사한 정보들이 빈번하게 발생되고 있으며, 이러한 문제를 해결하기 위한 내용이 유사한 문서를 찾는 연구들이 많이 진행되고 있다. 유사 문서 병합에서 유사 문서를 판별하기 위해 문서 간 공통된 단어의 비율을 이용한다. 하지만 동일한 단어가 다양한 형태로 표현될 수 있어 공통된 단어의 비율만을 가지고 유사 문서를 판단하기 어렵다. 본 논문에서는 유사한 의미를 갖는 단어들을 동일한 단어로 변환하여 유사 문서들을 병합하는 시스템을 제안하고 구현 사항에 대해 설명한다.

A Deterministic Fusion Method for Multiple Lists of Documents from Heterogeneous Search Engines (이질적 검색기와 컬렉션으로부터 검색된 복수 문서 리스트의 효율적인 용합 방법)

  • Lee, Min-Ho;Myaeng, Sung-Hyon
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.13-19
    • /
    • 1999
  • 본 논문은 분산, 독립적인 다수의 문서 컬렉션으로부터의 검색결과를 병합하는 컬렉션 융합(collection fusion)문제에 대한 효과적인 랭킹방법을 제시한다. 일반적인 컬렉션 융합 문제란 분산되어 있는 다수의 문서 컬렉션에서 독립적이고 능동적인 검색기들의 검색결과를 효과적으로 랭킹(ranking) 병합하는 것인데, 각기 다른 특성을 가진 다수의 컬렉션을 동일한 검색기를 통하여 검색된 결과를 병합하는 환경과 서로 다른 알고리즘을 갖는 검색기를 통한 검색 결과 병합 환경으로 나누어 질 수 있다. 본 논문에서는 서로 다른 특성을 갖는 다수의 컬렉션을 서로 다른 알고리즘을 갖는 검색기들을 통하여 검색한 결과를 병합하는 방법을 제시한다. 각 컬렉션에 학습 질를 넣어 얻은 정보를 토대로, 실제 질의를 넣었을 때 각각의 컬렉션에서 나온 결과가 통합 결과 집합에서 차지하는 비율과 각 문서의 순위를 결정한다. 기존 연구에서 사용한 방법들은 랜덤성에 의존한 비결정적인 랭킹 방법을 제시하거나, 단순하게 검색결과 집합의 문서 수를 바탕으로 인터리빙(interleaving)하는 방법을 제시하였다. 본 논문에서는 학습 질의에서 나온 정보를 기반으로 결정적이면서도 보다 효과적인 랭킹 방법을 제시한다.

  • PDF

Re-Inference Method using Graph Merging in Graph Neural Network based Question Answering System (그래프 신경망 기반 질의응답 시스템에서 그래프 병합을 활용한 재추론 기법)

  • Lee, Pil-Won;Kim, Sang-Hoon;Shin, Yong-Tae
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.11a
    • /
    • pp.480-482
    • /
    • 2021
  • 최근 다수의 문서를 고려해야하는 다중홉(multi-hop) 추론과 같은 복잡한 문제를 해결하기 위해 계층적 그래프 신경망기반 질의응답 시스템이 제안되었다. 계층적 그래프 신경망 기반 질의응답 시스템은 사람의 정확도를 뛰어넘었으나 제한된 문서를 통해 추론을 진행하기 때문에 문서에 충분한 정보가 없을 경우 추론에 실패할 가능성이 존재한다. 따라서 본 논문에서는 위 문제를 해결하기 위해 정보를 재탐색하고 기존의 그래프 정보와 병합하여 기존의 정보와 새로운 정보를 고려하여 재추론 할 수 있는 그래프 병합 기법을 제안한다. 제안하는 그래프 병합 기법은 사전에 정의된 규칙에 의해 수행되며 노드의 병합 및 연결을 통해 새로운 그래프를 도출한다. 새로운 그래프는 그래프 신경망을 통해 추론을 진행하여 기존 정보와 새로운 정보를 고려한 정답을 도출할 수 있다.

Document Autoclustering for Web Agent (웹 에이전트를 위한 문서 자동 분류)

  • 양찬범;박영택
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10b
    • /
    • pp.54-56
    • /
    • 1999
  • 웹 에이전트는 사용자가 웹을 브라우징하는 행위를 모니터하여 사용자의 관심정보를 학습하고 사용자가 필요로 한느 웹 상의 정보를 제공하는 시스템이다. 웹 에이전트는 사용자의 관심정보를 추출하기 위해서 귀납적 기계학습을 수행한다. 이때, 학습의 효율을 높이기 위해서는 관련이 있는 문서들을 그룹화하여 학습 시스템에 제공하여야 한다. 본 논문에서는 비감독 개념 학습 알고리즘인 COBWEB을 이용하여 사용자가 관심을 표시한 문서들의 분류트리를 생성한다. 분류트리는 귀납적 기계학습 시스템의 입력으로 사용될 수 있는 형태가 아니므로 분류 트리의 분석과 문서 분류 후처리 작업을 통해서 문서 집합을 생성해야 한다. 이를 위해서는 분류트리를 분석하여 초기 클러스터를 생성하고, 유사한 클러스터들의 병합을 수행한다. 본 논문에서 제안하는 문서 자동 분류 방식은 비감독 개념 학습 알고리즘이 생성한 문서 분류 트리의 분석을 통해서 충분한 유사도와 적절한 수의 문서를 포함하는 초기 클러스터를 생성할 수 있다. 그러므로 문서 분류의 후처리 작업인 클러스터의 병합 작업에서 불필요한 작업을 제거함으로서 보다 효과적이고 합리적인 문서 분류 작업을 수행한다.

  • PDF

Design and Implementation of Differencing and Merging Scheme for Cooperative Version Control System (협동 버전제어 시스템을 위한 버전충돌 인지 및 버전병합 기능의 설계와 구현)

  • Lee, Byong-Gul
    • The Transactions of the Korea Information Processing Society
    • /
    • v.7 no.1
    • /
    • pp.126-134
    • /
    • 2000
  • Version control is an application to maintain consistency between different instances of the same document allowing operations such as navigation, differencing, and merging. Most version control systems, however, lack the support of functionality for cooperative writing environment, such as to represent and store the history of the actions of different individuals, to effectively differentiate and merge the individual actions including the text object, and to manage different access privileges for different granularity and individuals. With the help of Activity IDentification (AID) tag and its unique addressing scheme proposed in this paper, differencing and merging become simple and effective. Access and role control is improved by associating the access right table and role assignment in AID scheme also eliminates the requirements for large storage capacity for version information maintenance.

  • PDF

Adapted Sequential Pattern Mining Algorithms for Finding XML Common Structure (XML 공유 구조 발견을 위한 변형 순차패턴 마이닝 알고리즘)

  • 이정원;이기호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10c
    • /
    • pp.1-3
    • /
    • 2002
  • 최근 XML관련 연구가 급증하면서 저장 기법, 질의 최적화, 인덱싱 등의 기법이 활발히 개발되고 있다. 그러나 하나의 DTD나 XML Schema를 공유하는 문서집합이 아닌 다양한 구조를 가진 문서들을 대상으로 하는 경우, 다중 문서간의 구조적 유사성이나 차이 등을 파악할 필요가 있다. 특히 서로 다른 사이트나 문서관리 시스템에서 도출된 문서들을 병합하거나 분류할 필요가 있을 때, 두 문서의 병합 가능성 및 분류 기준을 파악하는 것은 매우 중요하다. 따라서 본 연구에서는 여러 문서들의 구조를 구성하는 경로들간의 유사성을 파악하기 위해 기존의 순차패턴 마이닝 알고리즘을 변형하였다. 변형된 순차패턴 마이닝 알고리즘[1]을 통해 두 문서간의 정확한 공유 경로를 찾을 수 있었다.

  • PDF

An Efficient Inverted Index Technique based on RDBMS for Keyword Search (키워드 검색에 대한 RDBMS에 기반을 둔 효율적인 역색인 기법)

  • Shin, Yoonmi;Jeon, Minhyuk;Ahn, Jinhyun;Im, Dong-Hyuk
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.05a
    • /
    • pp.357-359
    • /
    • 2019
  • RDBMS 상에서 문서에 포함된 키워드 검색을 위한 질의 시 병합 조인 방식을 통해 키워드 검색을 시도하게 된다. 그러나 대용량의 문서를 저장하고 있는 RDBMS 내에서 병합 조인을 사용 시 검색 키워드에 대해 불필요한 비교 연산으로 인하여 질의 문에 대한 검색시간이 길어질 수 있다. 본 논문은 행 지향 관계형 역 색인을 이용하여 키워드 검색 질의 시 병합 조인의 단점을 보완한 지그재그 병합 조인 알고리즘을 사용한다. 관계형 데이터베이스인 postgreSQL 에서 프로시저로 불필요한 비교 연산을 최소화한 지그재그 병합 조인 알고리즘을 구현하여 키워드 검색에 대한 질의 속도 향상을 확인하였다.

A Transformation of XML Documents With Semantic Constraints (DTD의 의미 구조 분석을 이용한 XML 문서의 변환)

  • 곽동규;최종명;조용윤;유재우
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.589.2-861
    • /
    • 2004
  • XML 문서를 변환하는 목적은 하나의 어플리케이션에서 사용되는 XML 문서를 다른 XML 어플리케이션에서 재 사용하여 사용자에게 동일한 정보를 제공하는데 있다 XML 문서는 어플리케이션 특성에 따라 한 문서에서 전달할 수 있는 정보의 량이 다르다. 따라서 문서를 변환하기 전에 어플리케이션의 특성에 따라 문서를 분할하거나 병합하여야 한다[1]. 또한, XML 문서의 정보는 속성에 따라 문법적인 특성을 가진다. 본 논문은 문벌적인 특성을 의미 속성이라 하고 의미 속성을 파악하기 위해 XML 문서의 의미 구조와 의미 구조 관계를 정의한다. 그리고 정의된 의미 구조와 의에 구조 관계를 이용하여 문서 정보의 속성을 분류하는 방법을 제안한다. 변환 규칙은 의ロP 구조 관계가 유사한 엘리먼트간의 대응으로 정의하고, 변환 규칙을 이용하여 문서 변환을 실행하여 변환 XML과 의미 관계 구조가 유사한 피 변환 XML 문서를 생성한다. 의미구조 분석을 이용한 변환은 기존의 사용 패턴을 분석한 변환에서 벗어나 DTD의 분석을 통한 자동화된 문서 변환 방법을 제공한다.

  • PDF