• 제목/요약/키워드: 문서변환

검색결과 696건 처리시간 0.022초

함수 변환과 FFT에 의한 XML 문서의 구조 비교 (XML Document Structure Comparison based on Function Transform and FFT)

  • 이호석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (C)
    • /
    • pp.28-30
    • /
    • 2006
  • XML 문서의 유사성을 비교하는 연구는 XML 문서의 저장 및 검색에 유용하기 때문에 많은 연구가 진행되었다. XML 문서의 유사성 연구는 크게 edit-distance를 이용하는 방법, 문서의 그래프 모델을 이용하는 방법, 문서의 매트릭스 모델을 이용하는 방법 등이 있다. 최근에는 문서를 encoding 하고 푸리에 변환을 이용하는 방법이 보고되었다. 본 논문에서는 XML 문서를 함수로 변환하고 FFT를 적용하여 문서의 구조적 유사성을 비교하는 새로운 방법을 제안한다. 제안하는 방법은 JAXP로 구현하였으며 XML 문서의 구조를 분석하여 함수로 변환하였다. 그리고 함수에 FFT를 적용하여 XML 문서의 구조적 유사성을 비교하였다. FFT 비교 결과는 XML 문서의 함수 변환이 적합한 것임을 보여주었으며 비교 결과는 예상된 결과를 보여주었다.

  • PDF

e-비즈니스 환경 하에서의 도메인 모델 방식 기반의 전자문서 변환시스템 설계 및 구현 (The Design and Implementation of Domain Model Based Electronic Document Translation System in e-business Environment)

  • 심언섭;김진우;백두권
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (C)
    • /
    • pp.377-381
    • /
    • 2006
  • e-Business 환경이 다양화되고 활성화되면서, 전자적으로 교환되는 문서의 종류와 형태가 다양해지고 있다. 다양한 문서 형태를 지원해야 하는 요구사항이 대두되고 이를 충족하기 위해 하나 이상의 문서 변환 시스템을 도입하여 사용하고 있다. 기존의 문서 변환 시스템은 하나 또는 두 가지의 문서 형태만을 지원함으로 인해, 동시에 다양한 문서 형태를 지원할 수 없는 단점이 존재하였다. 또한 단일 형태의 문서 변환만을 지원하고 있어 문서 형태별 변환 기능을 지원할 수 없고 파싱된 문서 요소와 비즈니스 로직이 혼합되어 순차적으로 처리됨으로써, 처리가 완료되기 전까지 하나의 트랜잭션으로 처리되고 있다. 변환 절차가 하나의 트랜잭션 내에서 처리됨으로 인해 정보의 재사용성이나 효율적으로 시스템 자원을 사용할 수 없었다. 이러한 문제를 해결하기 위해 본 논문에서는 문서 형태별 비즈니스 로직을 포함하는 전자문서변환 시스템을 도메인 모델방식 개념을 기반으로 설계, 구현함으로써 개선 가능한 시스템을 제안하고자 한다. 본 논문은 제안 시스템을 통해 기능별로 모듈화가 가능하게 되고 트랜잭션도 단계별로 분리하여, 처리 복잡성을 해결할 뿐 아니라, SOA(Service Oriented Architecture)기반의 진보된 개념을 쉽게 적용 가능한 확장성을 갖추는데 그 의의가 있다.

  • PDF

전자문서의 XML 문서로의 변환 및 저장 시스템 (Rule Based Document Conversion and Information Extraction on the Word Document)

  • 주원균;양명석;김태현;이민호;최기석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (C)
    • /
    • pp.106-108
    • /
    • 2006
  • 본 논문은 HWP, DOC와 같은 전자 문서에서 사용자가 제공한 구조적인 규칙과 XML 기반 전자 문서 변환 기법을 이용함으로써, 사용자의 관심 영역에 해당하는 다양한 형태(표, 리스트 등)의 정보를 효과적으로 추출(변환)하여 저장하기 위한 방법에 관한 것이다. 본 논문에서 제시한 시스템은 3가지의 중요한 요소들로 구성되어 있는데, 1)전자문서의 원시 XML 문서로의 변환 방법 2)XML 기반 구조적인 규칙과 작성된 규칙을 이용하여 원시 XML 문서에서 정보를 추출(변환)하는 방법, 3)추출 된 정보에서 최종 XML을 생성하거나 DB에 저장하는 방법이 그것이다. 전자문서의 변환을 위해서 독립적으로 동작하는OCX 기반의 전자문서 변환 데몬(Daemon)을 개발하였고, 사용자의 정보 추출(변환)과정을 돕기 위해서 XSLT를 확장한 형태의 스크립트 언어를 개발하였다. 스크립트 언어는 비교적 간단한 문법 구조를 가지고 있고, 데이터 처리를 위한 자체 정의 함수와 변수를 사용한다. 추출된 정보는 원하는 형태의 데이터 포멧으로 생성하거나 DB에 저장할 수 있다. 본 시스템은 전자 문서 원문 정보에 대한 데이터베이스 구축 및 서비스의 제공, 혹은 구축된 데이터베이스를 이용하여 다양한 현황 통계를 제공하는 분야에서 유용하게 사용할 수 있다. 실제로 연구과제관리시스템과 성과정보시스템에 적용하여 그 성과를 입증하였다.

  • PDF

함수 변환 모델링에 의한 XML 문서의 유사성 비교에 대한 연구 (A Study on XML Document Similarity based on Function Modeling)

  • 이호석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (C)
    • /
    • pp.58-60
    • /
    • 2006
  • 근래에 XML 문서가 인터넷에서 정보 교환의 방법으로 표준화됨에 따라, 많은 양의 데이터가 XML 문서 포맷으로 저장되고 있다. XML 문서의 유사성 연구는 크게 edit-distance를 이용하는 방법, 문서의 그래프 모델을 이용하는 방법, 문서의 매트릭스 모델을 이용하는 방법 등이 있다. 최근에는 문서를 encoding 하고 푸리에 변환을 이용하는 방법이 보고되었다. 본 논문에서는 XML 문서를 함수로 변환하여 모델링하여 문서의 구조적 유사성을 비교하는 방법을 제안한다. 제안된 방법을 사용하여 XML 문서를 함수로 모델링하였으며 XML 문서 간의 유사성을 비교해 보았다.

  • PDF

XML문서에서 UML 클래스 다이어그램 자동 변환 (Automatic Conversion of XML Documents to UML Class Diagram)

  • 차남정;민미경;이숙희
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 추계학술발표논문집
    • /
    • pp.368-372
    • /
    • 2002
  • XML 문서의 구조를 파악하기 위하여 현재 많은 연구가 진행 되고 있으며, 대부분 XML 문서의 구조를 찾아 DTD나 스키마로 표현하는데 중점을 두고 있다. 본 논문에서는 XML 문서에서 구조를 추출하여 이를 UML 클래스 다이어그램으로 자동 변환하는 시스템을 제안한다. 제안된 시스템에서는 XML 문서로부터 요소-속성 트리를 구성하고, 이를 활용하여 문서 구조를 UML 클래스 다이어그램으로 쉽게 변환하도록 한다.

  • PDF

객체 식별자를 이용한 객체지향 데이터베이스의 XML 문서로의 변환 (Transformation of Object-Oriented Databases into XML Documents using Object Identifiers)

  • 윤정희;박창원;정진완
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권2호
    • /
    • pp.131-139
    • /
    • 2001
  • 데이터 변환은 데이터 재사용, 데이터 교환 및 통합 등에 사용되는 중요한 기술이다. 본 논문에서는 객체지향 데이터베이스를 유효한 XML 문서들로 변환시키는 두 가지 알고리즘을 제시한다. 먼저 객체지향 데이터베이스의 스키마, 객체지향 데이터베이스, DTD 그리고 XML 문서를 정의한 뒤 두 가지 알고리즘, 즉 객체지향 데이터베이스의 스키마를 DTD로 변환시키는 알고리즘과 객체지향 데이터베이스를 XML 문서들로 변환시키는 알고리즘을 제시한다. 그리고 제시한 두 가지 알고리즘의 결과는 항상 잘 구성된 XML 문서들이고 유효한 XML 문서들임을 증명한다. 잘 구성된 XML 문서는 XML문서가 갖추어야 하는 필수 조건이므로 반드시 필요하다. 또한 유효성은 유효한 XML 문서들을 필요로 하는 XML 응용에 유효한 XML 문서를 제공할 수 있도록 한다.

  • PDF

웹 스키마를 이용한 HTML 문서의 XML 변환 (XML Conversion of HTML Documents Using Web Schema)

  • 오금용;박동문;황인준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.175-177
    • /
    • 2001
  • 최근에 웹(Web) 사용의 지속적이 증가로 인하여 정보가 급증하고, 이로 인하여 웹은 정보교환의 의미뿐아니라 정보 저장이라는 중요한 의미를 지니게 되었다. 하지만 현재 많은 웹 페이지들이 HTML(Hyper Text Markup Language)문서로 제작되어 있어 정보관리의 의미에서 많은 부족함이 있고 이를 보완하기 위한 방법 중에 하나가 구조적이고 기능적 언어로 부상하고 있는 XML(exTensive Markup Language)을 기반으로 하여 문서를 제작하거나 변환하는 것이다. 본 논문은 HTML문서를 XML문서로 변환하는데 있어HTML문서 구조를 분석하고 분석결과를 토대로 형성되는 웹 스키마(Schema)를 이용하여 구조 중심의 변환이 이루어지도록 하는 방법에 대해서 제안한다.

  • PDF

문서 단편화 기법을 이용한 XML 변환기의 설계 및 구현 (Development of an XML Converter using Document Fragmentation Method)

  • 정창후;최윤수;주원균;진두석;김광영;이민호;서정현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.214-216
    • /
    • 2004
  • 최근 다양한 응용 분야에서 점차 증가하고 있는 XML 문서에 대한 효과적 검색을 위해서 많은 검색 시스템들이 제안되고 있다. 그러나 이러한 검색 시스템은 XML 문서의 구조적 특성을 명확하게 알지 못하거나 질의어 작성에 익숙하지 못한 사용자에게 XML 문서를 검색하는데 많은 어려움을 주고 있다. 이러한 문제를 해결하기 위해 본 논문은 복잡한 계층의 XML 문서를 의미 있는 엘리먼트를 중심으로 계층을 단순화시켜서 검색에 이용할 수 있도록 도와주는 XML 문서 변환기를 제안한다. XML 문서 변환기는 XML 문서의 부모-자식 관계, 형제 관계 등의 계층 정보를 유지하면서 문서를 단편화 시켜주는 도구이다. XML 문서 변환기와 더불어 이것을 이용하여 구현된 XML 문서 검색 시스템의 계층적 출력 인터페이스에 대하여 함께 설명하도록 한다.

  • PDF

복잡환 다단 문서 영상으로부터 구조화된 하이퍼문서의 자동 생성 (Automatic Generation of Structured Hyperdocuments from Multi-Column Document Images)

  • 이지연;강희중;이성환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.458-460
    • /
    • 1999
  • 본 논문에서는 다양한 객체를 포함한 다단 문서 영상을 원본 문서와 거의 유사한 형태의 HTML 문서로 변환할 수 있는 방법을 제안한다. 또한 논문이나 매뉴얼, 책의 한 단원 등 여러장의 입력 문서의 경우, 문서의 논리적인 구조 분석을 수행하고 장이나 절 등의 섹션 제목들을 계층화하여 다단 문서의 변환과 동시에 구조화된 목차 페이지도 함께 자동 생성하는 방법을 제안한다. 제안된 다단 문서 변환 알고리즘을 잡지, 신문, 광고지, 매뉴얼 등, 비정형화된 문서에 적용한 결과, 원본 문서의 형태와 구조에 큰 변함없이 유사하게 변환되었고, 논리적인 구조 분석 및 섹션 제목들의 계층화 작업 또한 정확히 수행되어 구조화된 목차 페이지의 자동 생성이 가능하였다.

  • PDF

표준 스키마에(XSD,DTD)에 기반한 템플릿 제공 시스템 구현 (The Implementation of template service based on the standard Schema(XSD, DTD))

  • 최경웅;이주철;박순철
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2006년도 춘계 국제학술대회 논문집
    • /
    • pp.402-406
    • /
    • 2006
  • 본 논문은 XSD(XML Schema Definition)기반의 XML 문서를 웹, 엑셀 환경에서 다양한 관점으로 볼 수 있도록 템플릿 서비스를 제공하기 위한 시스템이다. 템플릿 서비스는 데이터스킨 서버에서 스킨을 통하여 서비스되며, XML 문서를 다양한 문서로 변환할 수 있도록 한다. 예로 XML 문서를 HTML로 변경하는 경우 XSLT(Extensible Style Language Transformation) 를 사용할 수 있고, 엑셀 문서로 변환할 경우 엑셀 템플릿을 만들어 스킨으로 제공할 수 있다. 스킨은 다양한 방법으로 구현될 수 있으며, XML 문서에서 사용자가 원하는 문서로 만들기 위한 미들웨어 역할을 한다. 사용자는 데이터스킨 변환 서버에 접속하여 가지고 있는 XML 정보들을 차트, 그래프, 수식 등으로 쉽게 변환할 수 있을 뿐만 아니라 OWC(Office Web Component)로 쉽고 빠르게 문서를 변환 할 수 있도록 한다.

  • PDF