• 제목/요약/키워드: Document Model

검색결과 852건 처리시간 0.037초

DOM에 기반한 공동 문서 저작 시스템 구현에 관한 연구 (A Study pn Development of collaborative Document Authoring system based on DOM)

  • 유성주;김차종;신현섭
    • 한국정보통신학회논문지
    • /
    • 제14권12호
    • /
    • pp.2601-2608
    • /
    • 2010
  • 텍스트 문서를 대상으로 하는 대부분의 공동 문서 저작 시스템에서는 문서의 병합과 재사용이 어려우며 문서를 저장, 관리할 수 있는 저장소를 제공하지 않는다. 또한 웹을 기반으로 하기 때문에 높은 접근성을 제공하지만 보안에 취약한 문제점을 가지고 있다. 본 논문에서는 XML 문서를 대상으로 한 공동 문서 저작 시스템을 설계 구현함으로써 이들 시스템의 문제점을 개선하였다. 이를 위해 XML 문서를 객체 모델화하고 조작하기 위한 API인 DOM(Document Object Model)에 기반을 두었으며 Java 객체를 송수신하고, 구현 시 소켓통신에 대한 고려가 필요하지 않도록 RMI를 활용하였다. 또한 인증과정을 통해 보안성을 향상시켰으며 템플릿(Template) 제공, 주석달기, 문서구조 가시화가 가능한 편집기를 제공함으로써 XML 문서 공동저작의 수월성을 향상시켰다.

SGML 문서 저작 도구 (An SGML Document Authoring Tool)

  • 안보희;유재우;송후봉
    • 한국정보처리학회논문지
    • /
    • 제6권2호
    • /
    • pp.512-521
    • /
    • 1999
  • ISO 8879로 정의된 SGML은 문서의 논리적 구조를 정의하는 메타언어로서 전자문서의 기본 형식으로 많이 사용되고 있다. SGML 문서는 문서구조 정의와 이에 따라 작성된 실제문서로 구성되므로 저작 도구는 문서구조와 실제문서를 모두 작성하고 검증할 수 있어야 한다. 그러나 SGML 문서처리를 위한 정형화된 모델과 절차가 존재하지 않으므로 이러한 도구의 구성이 쉽지 않다. 본 연구에서는 SGML 구문분석기, 문서구조 정의를 위한 편집기, SGML 문서 편집기 및 형식 편집기 등으로 구성된 모형과 각 구성 요소의 정형화된 처리 방법을 제안하고 구현하였다. 사용자의 편의를 위하여 아이콘 기반의 시각 프로그래밍 기법을 사용하였으며, 한글 문제점들을 해결하는 통합적 문서 저작 환경을 윈도우즈 NT 시스템에서 java와 C++ 언어를 사용하여 구현하였다.

  • PDF

빅 데이터 환경에서 계층적 문서 유형 분류를 위한 클러스터링 기반 다중 SVM 모델 (Multi-class Support Vector Machines Model Based Clustering for Hierarchical Document Categorization in Big Data Environment)

  • 김영수;이병엽
    • 한국콘텐츠학회논문지
    • /
    • 제17권11호
    • /
    • pp.600-608
    • /
    • 2017
  • 최근 인터넷의 급격한 확장에 따른 정보의 양이 기하급수적으로 증가하고 있다. 그러나 실제 사용자에게 필요한 정보는 극히 일부분으로 사용자가 원하는 정보를 찾는데 까지는 부가적인 시간과 노력이 요구된다. 따라서 검색어로 검색된 문서에 대한 유사도 평가를 통한 계층적 유사 정보와 검색 우선순위에 대한 정보를 제공할 필요성이 있다. 이를 위해서 검색어를 구성하고 있는 키워드의 동시 발생 빈도를 고려한 검색 문서에 대한 유사도를 기반으로 문서 클러스터를 구성하고 SVM을 적용한 빅 데이터 기반 계층적 유형 분류 모델을 제안한다. 계층적 분류방법과 SVM 분류기의 결합은 문서의 계층이 기하급수적으로 늘어나는 웹 문서의 경우에 높은 성능을 얻을 수 있다. 제안된 모델은 정확하고 신속한 검색을 제공하는 정보검색시스템의 응용 모델로 활용될 수 있다.

문서 유사도를 통한 관련 문서 분류 시스템 연구 (Related Documents Classification System by Similarity between Documents)

  • 정지수;지민규;고명현;김학동;임헌영;이유림;김원일
    • 방송공학회논문지
    • /
    • 제24권1호
    • /
    • pp.77-86
    • /
    • 2019
  • 본 논문은 머신 러닝 기술을 이용하여 과거의 수집된 문서를 분석하고 이를 바탕으로 문서를 분류하는 방법을 제안한다. 특정 도메인과 관련된 키워드를 기반으로 데이터를 수집하고, 특수문자와 같은 불용어를 제거한다. 그리고 한글 형태소 분석기를 사용하여 수집한 문서의 각 단어에 명사, 동사, 형용사와 같은 품사를 태깅한다. 문서를 벡터로 변환하는 Doc2Vec 모델을 이용해 문서를 임베딩한다. 임베딩 모델을 통하여 문서 간 유사도를 측정하고 머신 러닝 기술을 이용하여 문서 분류기를 학습한다. 학습한 분류 모델 간 성능을 비교하였다. 실험 결과, 서포트 벡터 머신의 성능이 가장 우수했으며 F1 점수는 0.83이 도출되었다.

워드 임베딩 클러스터링을 활용한 리뷰 다중문서 요약기법 (Multi-Document Summarization Method of Reviews Using Word Embedding Clustering)

  • 이필원;황윤영;최종석;신용태
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권11호
    • /
    • pp.535-540
    • /
    • 2021
  • 다중문서는 하나의 주제가 아닌 다양한 주제로 구성된 문서를 의미하며 대표적인 예로 온라인 리뷰가 있다. 온라인 리뷰는 정보량이 방대하기 때문에 요약하기 위한 여러 시도가 있었다. 그러나 기존의 요약모델을 통해 리뷰를 일괄적으로 요약할 경우 리뷰를 구성하고 있는 다양한 주제가 소실되는 문제가 발생한다. 따라서 본 논문에서는 주제의 손실을 최소화하며 리뷰를 요약하기 위한 기법을 제시한다. 제안하는 기법은 전처리, 중요도 평가, BERT를 활용한 임베딩 치환, 임베딩 클러스터링과 같은 과정을 통해 리뷰를 분류한다. 그리고 분류된 문장은 학습된 Transformer 요약모델을 통해 최종 요약을 생성한다. 제안하는 모델의 성능 평가는 기존의 요약모델인 seq2seq 모델과 ROUGE 스코어와 코사인 유사도를 평가하여 비교하였으며 기존의 요약모델과 비교하여 뛰어난 성능의 요약을 수행하였다.

한국에서의 전자선화증권 운용을 위한 종합계획수립에 관한 연구 (A Study on the Establishment of Master Plan on the Operation of the Electronic Bill of Lading in Korea)

  • 최석범;신인광
    • 통상정보연구
    • /
    • 제6권1호
    • /
    • pp.129-153
    • /
    • 2004
  • In order to succeed in e-Trade Project in Korea, the related parties endeavor to introduce the e-title registry model such as Bolero model(Title Registry Model) and TEDI model (Repository Service Provider Model). Prior to mentioning the Model of e-Title Registry, desirable Global e-Trade Platform is the platform connecting Global e-Trade Platforms in each country and Bolero's Core Messaging Platform and e-Title Registry must be established in each country. Each e-Title Registry must be connected with another registry. Like Korea, Recognized Electronic Document Repository must be established as proxy for preserving, attesting, carrying out sending and receiving electronic document to prevent from disputes between parties and to carry out notarizing electronic documents and related transaction. The purpose of this paper is to promote the introduction of e-Title Registry in the e-Trade and to streamline the procedures of the electronic bill of lading.

  • PDF

조세심판 문서 검색 효율 향상 모델에 관한 연구 (A Study on the Improvement Model of Document Retrieval Efficiency of Tax Judgment)

  • 이후영;박구락;김동현
    • 한국융합학회논문지
    • /
    • 제10권6호
    • /
    • pp.41-47
    • /
    • 2019
  • 조세 심판에 대한 선결정례는 법원 판례의 경우 유사 심판례를 검색하여 파악하는 것이 매우 중요한 상황이다. 그러나 기존 심판문에 대한 검색은 사용자가 입력하는 키워드를 통하여 검색하는 방법을 사용하고 있으나, 정확한 키워드의 입력이 필요하며, 키워드를 모르는 경우 필요한 문서를 검색하는 것은 불가능하다. 또한 검색된 문서 중에는 내용이 다른 경우도 발생한다. 이에 본 논문에서는 정확한 심판례의 검색을 위하여 문서를 3차원 공간에 벡터화하고, 코사인 유사도를 계산하여, 거리상 가까운 문서를 검색하는 방법의 효율성을 향상시키기 위하여 심판례에서 사용되고 있는 단어들의 유사도를 분석한 후, 최빈값을 추출하여 본문의 텍스트에 삽입하는 방법으로 검색하고자 하는 문서의 코사인 유사도를 향상시키는 방안을 제안한다. 제안 모델을 통하여 조세와 관련된 심판례를 검색하고자 하는 사용자에게 신속하고, 정확한 검색을 제공할 수 있을 것으로 기대된다.

디지털 컨텐츠 저작권 관리를 위한 XrML 기반의 저작권 비즈니스 모델에 관한 연구 (A Study of XrML-based Rights Business Model for Digital Contents Copyright Administration)

  • 최지훈;유윤식;임산송;김진수;정회경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2003년도 춘계종합학술대회
    • /
    • pp.289-292
    • /
    • 2003
  • 디지털화된 멀티미디어 컨텐츠는 고속의 디지털 네트워크를 통해 제작자로부터 소비자에게 직접 전달되는 형태로 변화하고 있으며, 아울러 디지털 컨텐츠를 보호하기 위한 저작권의 보호라는 커다란 문제와 직면하여 이를 보호하고 디지털 컨텐츠를 활성화하기 위한 노력이 한창 진행 중이다. 또한, 보다 효율적인 체계로의 변화를 요구하고 있는 상황에서 디지털 컨텐츠 분야의 비즈니스에 사용 될 기본적인 매개체인 저작권 문서의 효율성이 강조되고 있는 실정이다. 따라서 컨텐츠를 제공하는 특정 시스템에 머무르지 않고 같은 목적을 가진 타 시스템과 컨텐츠를 공유하기 위한 범용적인 비즈니스 모델의 설계가 요구되고 있다. 이에 본 논문에서는 범용 디지털 컨텐츠에 적용 가능한 비즈니스 모델을 설계하였으며 설계된 비즈니스 모델에 따른 저작권 문서 편집 시스템을 설계 및 구현하였다.

  • PDF

그룹웨어의 현황 분석 Ⅰ (Groupware Current Status Analysis Ⅰ)

  • 김선욱;김봉진
    • 산업공학
    • /
    • 제10권3호
    • /
    • pp.75-93
    • /
    • 1997
  • Unlike individual applications, it is extremely hard to obtain user requirements for group systems, since there exists very complicated dynamics in group. This may result in spreading a great amount of products with a broad range of contents. Thus, this study presents a comparative analysis of groupware products. As a result, these products have been categorized into three areas which include cooperation/document management systems, collaborative writing systems, and decision-making/meeting systems. While the systems reviewed here focus on the cooperation/document management systems, the other two areas will be dealt in details in part Ⅱ. The first area ends up with two large categories such as proprietary groupware products and intranet groupware products. However, it has been observed that there is a natural convergence between these two categories. Consequently, the comparative analysis has been performed in terms of functions provided on the two categories and a combined category. Each group of the functions has been divided into three parts which consist of basic functions, quasi-basic functions, and others. Such a decision has been made based on the frequency rate of the functions provided in the products. With a more strict rule, the basic functions comprise electronic mail, sanction, bulletin board, document management, scheduling, security, Web browser, and Internet connectivity. This study also provides a framework for integrated functional model of groupware systems. The basic functions are merged into the model. However, the model is so flexible that it can partially include the quasi-functions in addition to the basic functions. In the future, it is expected that a large number of products will stem from the modification of the functional model.

  • PDF

XML 문서의 효율적인 검색과 재사용성을 지원하는 데이터 모델 (New Data Model for Efficient Search and Reusability of XML Documents)

  • 김은영;천세학
    • 지능정보연구
    • /
    • 제10권3호
    • /
    • pp.27-37
    • /
    • 2004
  • 인터넷상에서 데이터를 표현하고 데이터를 서로 교환하기 위한 문서 표준으로 XML이 제시되고 있다. XML은 또한 웹상에 산재되어 있는 문서에 대한 쉬운 검색 및 재사용을 지원하는 문서 표준으로도 부각되고 있다. XML 콘텐츠 관리 시스템을 구현할 때 Semi-structured 데이터를 얼마나 효율적이고 효과적으로 검색 및 관리할 수 있는 가하는 점과 XML의 특징인 재사용성을 얼마나 지원해 줄 수 있는가를 고려해서 XML 데이터를 모델링 해야한다. 또한 모델링한 데이터를 어떻게 실질적으로 저장해야 할 것인 가도 고려해야 한다. 본 논문에서는 XML 문서의 데이터를 데이터 시스템에 저장하고 검색하기 위한 새로운 데이터 모델을 제안한다. 제안하는 데이터 모델은 XML 문서의 데이터 뷰와 구조 뷰를 모두 표현하며 XML 문서를 위한 새로운 데이터 시스템이나 기존의 관계형 시스템 모두를 고려한다.

  • PDF