• 제목/요약/키워드: document structure

검색결과 592건 처리시간 0.027초

메타데이터 인터페이스를 이용한 DTD 기반 XML 문서 변환기의 골격 원시 코드 생성 (Skeleton Code Generation for Transforming an XML Document with DTD using Metadata Interface)

  • 최귀자;남영광
    • 정보처리학회논문지D
    • /
    • 제13D권4호
    • /
    • pp.549-556
    • /
    • 2006
  • 본 논문에서는 목표 문서의 DTD에 정의된 구조에 따라 원시문서를 목표 문서로 변환하는 XML 문서변환기와 골격 원시 프로그램을 생성하는 방법을 제안한다. 사용자는 생성된 프로그램을 이용하여 코드를 추가하거나 프로그램을 변경하고, 외부 클래스나 라이브러리 파일들을 연결하여 자신이 원하는 방법으로 쉽게 문서를 변환할 수 있다. 생성된 프로그램은 목표 DTD 경로(path)를 기준으로 코드를 생성하기 때문에 가독성이 높다. 현재까지의 대부분의 XML 문서변환은 XSLT를 이용하거나 XQuery를 이용하여 Java 프로그램을 생성하고 있으나, 각 요소별로 코드를 조작할 수 없는 단점이 있다. 본 논문에서 제안된 방법은 사용자가 원시/목표 문서에서 제공되는 DTD 혹은 문서에서 자동으로 추출된 DTD를 이용하여 원소 사이의 관계를 지정하면 자동적으로 문서가 변환되고 Java 원시 프로그램을 생성하기 때문에 코드 생성과정이 매우 단순하다. 메타데이터 인터페이스는 Java GUI를 이용하여 트리 형태로 표현된 DTD의 원소를 클릭하여 쉽게 생성할 수 있다. 문서변환을 위한 매핑은 원소의 특성에 따라 1:1, 1:N, N:1로 구분되며 데이터의 분해 혹은 합성을 위한 사용자 지정 함수가 메타데이터 인터페이스에 저장된다. 본 시스템은 실제 사용되고 있는 논문 XML 문서를 서지문서로 변환한 결과 및 프로그램 코드를 예제로 구현하여 결과를 제시하였다.

Paperless 해운 물류를 위한 UNeDocs 적용 방안 연구 (The study on a plan for applying UNeDocs to Maritime Logistics to achieve its paperless logistics)

  • 안경림
    • 디지털산업정보학회논문지
    • /
    • 제5권2호
    • /
    • pp.199-208
    • /
    • 2009
  • Mosts of export/import cargo has been moving using maritime transport means. Korea had been driven the system automation project using EDI document since the mid-1990s. However, this automation system comes upon about 40-50% against overall maritime business process, manual or paper document processing work is existing as ever. International e-business environment also has changing into electronic form document transaction from paper document-based transaction. International standardization organization, UN/CEFACT proposed UNeDocs for paperless jtransaction. UNeDocs is a specification to define XML data model as well as electronic form. With UNeDocs, it is not necessary to generate the duplexed data, and it can support user convenient and guarantee the flexibility. This paper defines the UNeDocs data model for EDI and Off-Line processing at the current maritime business. Then, it have to check XML syntax and structure for the defined data model through quality of document check system. Also, it explains the applying plan about the defined UNeDocs data model. It is possible to support paperless transaction as defining UNeDocs-based standard data model and converting into paper document, XML and EDI document using UNeDocs data model.

구조화된 전자문서 생성을 위한 사용자 중심의 XML 문서편집 시스템에 관한 연구 (Study of XML document editing system that is creation for structural digital document)

  • 차원준;황재각;이용준;정회경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2003년도 춘계종합학술대회
    • /
    • pp.277-280
    • /
    • 2003
  • 초기의 웹(Web)이 비구조적인 문서를 사용함으로써 발생하는 단점인 문서 처리와 교환 및 재사용성에 대한 해결책으로서 W3C(World Wide Web Consortium)에서 1998년 2월에 XML(extensible Markup Language)을 제정하였다. XML을 사용함으로써 기존 전자거래는 XML 기반 메시지 교환을 통한 기업간 전자거래 형태로 변화하고 있으며, 이러한 기업간 전자거래에 사용되는 XML 기반의 구조화된 전자문서를 저작 할 수 있는 솔루션에 대한 필요성이 대두되었다. 이에 본 논문에서는 XML 문서를 효율적으로 편집 및 저작 할 수 있는 사용자 중심의 XML 인스턴스 편집기와 XML 문서의 구조를 정의하는 XML 스키마 문서를 저작하기 위한 XML 스키마 편집기를 통합한 XML 문서편집 시스템에 관한 연구를 하였다.

  • PDF

구조화된 전자문서 생성을 위한 사용자 중심의 XML 문서편집 시스템 (XML document editing system that is creation for structural digital document)

  • 최일선;이용준;정회경
    • 한국정보통신학회논문지
    • /
    • 제7권3호
    • /
    • pp.513-518
    • /
    • 2003
  • 초기의 웹(Web)이 비구조적인 문서를 사용함으로써 발생하는 단점인 문서 처리와 교환 및 재사용성에 대한 해결책으로서 W3C(World Wide Web Consortium)에서 1998년 2월에 XML(eXtensible Markup Language)을 제정하였다. XML을 사용함으로써 기존 전자거래는 XML 기반 메시지 교환을 통한 기업간 전자거래 형태로 변화하고 있으며, 이러한 기업간 전자거래에 사용되는 XML 기반의 구조화된 전자문서를 저작할 수 있는 솔루션에 대한 필요성이 대두되었다. 이에 본 논문에서는 XML 문서를 효율적으로 편집 및 저작 할 수 있는 사용자 중심의 XML 인스턴스 편집기와 XML 문서의 구조를 정의하는 XML 스키마 문서를 저작하기 위한 XML 스키마 편집기를 통합한 XML 문서편집 시스템에 관한 연구를 하였다.

Document Clustering Using Semantic Features and Fuzzy Relations

  • Kim, Chul-Won;Park, Sun
    • Journal of information and communication convergence engineering
    • /
    • 제11권3호
    • /
    • pp.179-184
    • /
    • 2013
  • Traditional clustering methods are usually based on the bag-of-words (BOW) model. A disadvantage of the BOW model is that it ignores the semantic relationship among terms in the data set. To resolve this problem, ontology or matrix factorization approaches are usually used. However, a major problem of the ontology approach is that it is usually difficult to find a comprehensive ontology that can cover all the concepts mentioned in a collection. This paper proposes a new document clustering method using semantic features and fuzzy relations for solving the problems of ontology and matrix factorization approaches. The proposed method can improve the quality of document clustering because the clustered documents use fuzzy relation values between semantic features and terms to distinguish clearly among dissimilar documents in clusters. The selected cluster label terms can represent the inherent structure of a document set better by using semantic features based on non-negative matrix factorization, which is used in document clustering. The experimental results demonstrate that the proposed method achieves better performance than other document clustering methods.

NMF 기반의 용어 가중치 재산정을 이용한 문서군집 (Document Clustering using Term reweighting based on NMF)

  • 이주홍;박선
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권4호
    • /
    • pp.11-18
    • /
    • 2008
  • 문서군집은 정보검색의 많은 응용분야에 사용되는 중요한 문서 분석 방법이다. 본 논문은 비음수 행렬 분해(NMF, non-negative matrix factorization)를 기반한 용어 가중치 재산정 방법을 이용하여서 사용자의 요구에 적합한 군집결과를 얻도록 하는 새로운 군집모델을 제안한다. 제안된 모델은 군집형태에 대한 사용자 요구와 기계에 의한 군집 형태의 차이를 최소화하기 위하여 사용자 피드백에 의한 가중치가 재계산된 용어를 이용한다. 또한 제안방법은 용어의 가중치 재계산과 문서군집에 문서집합의 내부구조를 나타내는 의미특징행렬과 의미변수행렬 이용하여 문서군집의 성능을 높일 수 있다. 실험결과 제안방법을 적용한 문서군집방법이 적용하지 않은 문서군 방법에 비하여 좋은 성능을 보인다.

  • PDF

MS-Word 문서 접근 제어시스템 설계 (Design of the Access Control System for MS-WORD Document System)

  • 장승주
    • 한국정보통신학회논문지
    • /
    • 제22권10호
    • /
    • pp.1405-1411
    • /
    • 2018
  • 본 논문은 MS-워드 문서 시스템에 대한 접근 제어 시스템을 설계한다. 본 논문에서 설계하는 시스템은 MS-워드 문서 구조를 분석하여 문서 관련 정보를 활용한다. MS-워드문서 정보를 일부 변형하여 변형된 정보에 접근할 수 없는 사용자는 접근을 차단하도록 설계하는 것이다. 이렇게 함으로써 MS-워드문서에 대해서 접근 권한을 가진 사용자 외에는 문서를 읽을 수 없도록 한다. 즉, MS-워드문서에 대한 접근 권한을 통제할 수 있도록 한다. MS-워드문서에 대한 접근 권한을 가진 사용자는 변형된 정보를 원래 정보로 복구할 수 있도록 하여 정상적으로 문서를 읽을 수 있도록 한다. 본 논문에서 설계하는 내용을 실제 구현하고 실험을 수행하였다. 실험에서는 MS-워드문서 정보를 변형하였을 경우 문서 접근이 되는지를 수행하였다. 실험을 수행한 결과 MS-word 접근제어시스템이 정상적으로 잘 동작됨을 확인할 수 있었다.

XML을 위한 효율적인 저장구조 및 인덱싱 기법설계 (Design of Efficient Storage Structure and Indexing Mechanism for XML Documents)

  • 신판섭
    • 한국컴퓨터산업학회논문지
    • /
    • 제5권1호
    • /
    • pp.87-100
    • /
    • 2004
  • 최근에 인터넷의 급속한 발전과 더불어 대량의 정보를 효과적으로 표현 및 교환할 수 있는 새로운 데이터 표준으로 XML (extensible Markup Language)이 제안되었으며, XML 문서에 대한 저장과 인덱싱에 대한 연구가 활발하게 진행되고 있다. 본 논문에서는 실시간 XML 문서 처리에 효율적인 주기억장치 기반의 XML 전용 저장 시스템을 설계하고, 사용자 질의에 포함된 엘리먼트 타입 정보를 이용하여 XML 문서트리에 대한 순회를 최소화시킬 수 있는 구조적 검색 기법을 설계한다 또한, 엘리먼트의 삭제 및 삽입 등 동적인 변경에 빠르고 유연하게 대처할 수 있는 인덱스 구조와, 링크 정보를 가지고 있는 XML 문서의 질의 처리를 위해 XLink 표준을 준수하여 테이블 형식의 링크 정보 인덱스 구조를 설계한다.

  • PDF

인터넷 쇼핑몰에서 암호화된 XML/EDI를 위한 DTD 전자서명에 관한 연구 (A Study on the DTD Digital Signature for Cryptographic XML/EDI in an Internet Shopping Mall)

  • 홍성표;김형균;이준
    • 한국정보통신학회논문지
    • /
    • 제7권3호
    • /
    • pp.519-525
    • /
    • 2003
  • XML의 등장으로 기존의 EDI를 전자상거래 환경에 맞게 발전시킨 기술이 XML/EDI이다. DTD는 XML 문서에 표현될 자료의 의미를 정의한 메타 데이터라고 할 수 있다. 따라서 DTD 정보가 손상될 경우 이 정보를 기반으로 한 XML 문서의 보안은 심각한 문제점을 가지게 된다. 본 연구에서는 인터넷 쇼핑몰에서 암호화된 XML/EDI를 위하여 XML 문서에만 전자서명을 첨부하는 것이 아니라, DTD에 전자서명을 첨부하는 방법을 제안하였다. 전자서명 시 메시지 다이제스트 과정에서 바꿔 순서에 대해서는 검사하지 못하기 때문에 전혀 다른 다이제스트 값을 생성하는 문제가 발생되는데, 이것은 표준화된 구조와 문서에 대한 트리구조를 구현할 수 있는 DOM을 이용하여 DTD의 전자서명을 생성하는 방법으로 해결하였다.

XML 문서의 구조와 내용을 고려한 유사도 측정 (Similarity Measure based on XML Document's Structure and Contents)

  • 김우생
    • 한국멀티미디어학회논문지
    • /
    • 제11권8호
    • /
    • pp.1043-1050
    • /
    • 2008
  • XML(Extensible Markup Language)은 인터넷 상에서 데이터 표현과 교환을 위한 표준으로 자리 잡고 있다. 웹의 발전과 함께 XML문서들이 정보 검색, 문서 관리, 데이터 마이닝 등의 응용에서 폭 넓게 사용되면서 구조적으로 정보가 풍부한 이러한 문서들을 자동으로 처리하고 검색하는 기술들이 요구되고 있다. 본 연구에서는 XML 문서 의 구조와 내용을 고려하여 유사한 문서들을 검색하는 새로운 방법을 제안한다. XML 문서의 구조적 유사성은 간단한 스트링 매칭 기법으로 찾고, 문서 내용의 유사성은 문서 요소(element)들의 이름과 경로를 고려한 가중치를 통해 찾는 방법으로 전체의 시간 복잡도는 비교되는 두 문서의 크기에 선형적으로 비례한다.

  • PDF