• 제목/요약/키워드: XML Document Searching

검색결과 31건 처리시간 0.026초

XML-GDM을 기반으로 한 UML 클래스 다이어그램으로 사상을 위한 XML문서와 질의의 객체 모델링 (Object Modeling for Mapping from XML Document and Query to UML Class Diagram based on XML-GDM)

  • 박대현;김용성
    • 정보처리학회논문지D
    • /
    • 제17D권2호
    • /
    • pp.129-146
    • /
    • 2010
  • 최근 다양한 분야에서 폭넓게 활용되고 있는 XML 문서는 유연하고도 개방적인 특성으로 인해 정보교환이나 전송을 위한 수단으로 널리 이용되고 있다. 한편 XML 문서를 위한 시각적, 직관적 질의 언어인 XML-GL은 질의에 대한 의미와 결과 문서의 구조를 시각적으로 표현할 수 있기 때문에 XML 문서에 대한 구조 검색과 정보의 공유가 용이하다. 그리고 UML은 정해진 표기법과 다양한 다이어그램을 이용하여 객체지향 분석과 설계를 위한 도구로 사용되고 있다. 따라서 본 논문은 XML-GL의 데이터 모델인 XML-GDM을 기반으로 표현된 XML 문서를 UML 클래스 다이어그램으로 사상하기 위한 새로운 객체 모델링 방안을 제안한다. 이를 통해서 XML 문서를 직관적인 방법으로 객체지향데이터로 변환하고 저장/관리할 수 있다. 또한 객체지향 검색방법을 적용하면 보다 효율적으로 XML 문서를 검색할 수가 있다.

XML을 이용한 구조적 문서 생성 및 탐색을 위한 깊이중심분할 색인기법에 관한 연구 (A Study on the Depth-Oriented Decomposition Indexing Method for Creating and Searching Structured Documents Based-on XML)

  • 양옥렬;이용주
    • 정보처리학회논문지D
    • /
    • 제9D권6호
    • /
    • pp.1025-1042
    • /
    • 2002
  • 본 논문은 정보검색을 위한 용어들 간에 존재하는 관련정보인 시소러스를 이용하여 정보 검색 시스템의 검색 성능을 향상시키기 위한 구조적 문서를 생성하고 이를 검색하는 검색 기법에 대하여 연구하였다. 이를 위해 시소러스를 이용한 구조적 문서의 탐색을 위한 깊이중심분할 색인(DODI : Depth-Oriented Decomposition Index) 기법을 제안하였으며, 또한 시소러를 이용한 색인 기법으로서 효과적인 정보 검색이 가능하도록 검색 알고리즘을 통해 연관관계의 정보들에 대한 검색이 가능하도록 하였다. 또한 색인기법에 의해 생성된 구조적 문서는 OpenXML을 통해 데이터베이스 내에 저장되고, ForXML 메소드를 이용하여 재구성된 XML문서를 생성하도록 구조적 문서 저장 시스템을 구현하였다.

XML기반 전자카탈로그 관리시스템의 구현에 관한 연구 (A Study on Implementation for in based Electronic Catalog Management System)

  • 김진영;김연수
    • 산업경영시스템학회지
    • /
    • 제25권1호
    • /
    • pp.35-41
    • /
    • 2002
  • XML(eXtensible Markup Language) based electronic catalog is very useful for searching target information because of its structural and contents based searching support capability. And XML document editing is easier than HTML because of XML document is divided by structure, contents and presentation. This paper is to present a prototype of XML based Electronic Catalog Management System(ECMS) whose system consists of data input, output and manipulation system for inserting, updating, editing and deletion. A proposed system could resolved the problems at virtual intermediary shopping mall invloved in the difficulty of interoperability when customer try to compare similar products at mixed shopping mall and reduced web service costs at independent shopping mall by using XML format. The proposed ECMS offers rapid response capability for product data change of electronic catalog and easy and friendly interoperability among similar products.

효율적 구조 질의를 지원하는 바다-IV/XML 질의처리기의 설계 및 구현 (Design and Implementation of BADA-IV/XML Query Processor Supporting Efficient Structure Querying)

  • 이명철;김상균;손덕주;김명준;이규철
    • 정보기술과데이타베이스저널
    • /
    • 제7권2호
    • /
    • pp.17-32
    • /
    • 2000
  • As XML emerging as the Internet electronic document language standard of the next generation, the number of XML documents which contain vast amount of Information is increasing substantially through the transformation of existing documents to XML documents or the appearance of new XML documents. Consequently, XML document retrieval system becomes extremely essential for searching through a large quantity of XML documents that are storied in and managed by DBMS. In this paper we describe the design and implementation of BADA-IV/XML query processor that supports content-based, structure-based and attribute-based retrieval. We design XML query language based upon XQL (XML Query Language) of W3C and tightly-coupled with OQL (a query language for object-oriented database). XML document is stored and maintained in BADA-IV, which is an object-oriented database management system developed by ETRI (Electronics and Telecommunications Research Institute) The storage data model is based on DOM (Document Object Model), therefore the retrieval of XML documents is executed basically using DOM tree traversal. We improve the search performance using Node ID which represents node's hierarchy information in an XML document. Assuming that DOW tree is a complete k-ary tree, we show that Node ID technique is superior to DOM tree traversal from the viewpoint of node fetch counts.

  • PDF

엘리먼트 기반 XML 검색 시스템에서의 이용자의 정보 탐색 행태 연구 (Interactive Searching Behavior with Elements-Based on XML Documents Retrieval System)

  • 정영미
    • 한국도서관정보학회지
    • /
    • 제40권4호
    • /
    • pp.159-176
    • /
    • 2009
  • 본 연구의 궁극적인 목적은 엘리먼트 기반의 구조화된 XML 검색 시스템에서 나타나는 이용자의 정보 탐색행태를 조사하여 XML 검색에 대한 이용자 기반의 효과적인 접근점을 도출하기 위한 것이다. 본 연구의 실험절차 및 방법은 INEX 2006의 iTrack(Interactive Track)을 따랐고 실험을 위해 인문계열과 이공계열의 대학생 총 16명이 참가하였다. 본 연구의 목적을 달성하기 위한 기초 데이터는 실험 참가자를 대상으로 한 실험전과 실험후의 서베이와 검색전과 검색후의 서베이를 통해 수집되었고 검색 수행의 전 과정은 시스템 로그로 자동 저장되었다. 수집된 데이터는 Excel과 SPSS 17.0을 사용하여 분석하였고 결론을 도출하였다.

  • PDF

XML 문서 관리 시스템 (XML Document Management System)

  • 나중찬;이미영;김완석;김명준;이규철
    • 한국정보처리학회논문지
    • /
    • 제7권2S호
    • /
    • pp.711-720
    • /
    • 2000
  • BADA-IV/XML is a system designed specifically for managing XML. Documents and is essential to various electronic document applications as a fundamental system. BADA-IV/XML supports all of aspects of data model, querying and manipulation operations for managing XML documents. This paper provides an overview of these aspects of the BADA-IV/XML, as well as defines schema classes for stroing, querying and maintaining hierarchical semantics of multimedia documents and structural semantics of complex documents linked with each other, Also a multimedia document query language is designed and implemented to support essential operations for efficient searching and managing multimedia documents. Finally, some simulation results show the performance of the paged VF(Virtual Fragmentation) model and the search model using element's identifier as compared with a general model.

확장된 질의 처리를 위해 경로간 의미적 유사도를 고려한 XML 문서 순위화 기법 (A Ranking Technique of XML Documents using Path Similarity for Expanded Query Processing)

  • 김현주;박소미;박석
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제37권2호
    • /
    • pp.113-120
    • /
    • 2010
  • 정보기술의 표준으로 사용되고 있는 XML환경에서 방대한 양의 데이터에 대한 사용자의 질의를 효율적이고 정확하게 처리하기 위한 연구가 이슈화되고, 특히 웹 환경에서의 XML문서들은 용어적, 구조적인 측면에서 다양한 형태로 존재하고 있다. 이러한 특성을 갖는 XML 문서들을 대상으로 사용자가 특정한 정보를 얻고자 한다면, 사용자의 질의가 가진 용어 및 구조적 특성과 정확히 일치하지 않는 문서의 정보에 대해서 추가적인 기법이 필요하다. 본 논문은 이와 같은 경우에도 동일한 용어 및 구조를 사용하던 환경에서와 마찬가지로 최상위 순위로 정보를 검색할 수 있는 기법을 제시한다. 또한 정확히 일치하지 않는 문서의 경우에 대해서도 사용자 질의 측과의 경로간 의미적 유사성을 측정하여 사용자 질의와 의미적으로 유사한 경로를 가진 순으로 문서들을 순위화하여 제공한다. 제안된 기법은 실험을 통하여 기존의 기법보다 세밀하고 정확한 검색 결과를 도출함을 보인다.

XML 문서 키워드 가중치 분석 기반 문단 추출 모델 (XML Document Keyword Weight Analysis based Paragraph Extraction Model)

  • 이종원;강인식;정회경
    • 한국정보통신학회논문지
    • /
    • 제21권11호
    • /
    • pp.2133-2138
    • /
    • 2017
  • 기존의 XML 문서나 다른 문서는 단어를 중심으로 분석이 진행되었다. 이는 형태소 분석기를 활용하여 구현이 가능하나 문서 내에 기재되어 있는 많은 단어를 분류할 뿐 문서의 핵심 내용을 파악하기에는 어려움이 있다. 사용자가 문서를 효율적으로 이해하기 위해서는 주요 단어가 포함되어 있는 문단을 추출하여 사용자에게 보여주어야 한다. 본 논문에서 제안하는 시스템은 정규화 된 XML 문서 내에 키워드를 검색하고 사용자가 입력한 키워드들이 포함되어 있는 문단을 추출하여 사용자에게 보여준다. 그리고 검색에 사용된 키워드들의 빈도수와 가중치를 사용자에게 알려주고 추출한 문단의 순서와 중복 제거 기능을 통해 사용자가 문서를 이해하는데 발생할 수 있는 오류를 최소화하였다. 제안하는 시스템은 사용자가 문서 전체를 읽지 않고 문서를 이해할 수 있게 하여 문서를 이해하는데 필요한 시간과 노력을 최소화할 수 있을 것으로 사료된다.

XSL-FO 문서를 PostScript Format으로 변환하기 위한 PostScript-Converter에 관한 연구 (A Study on PostScript-Converter for conversion XSL-FO into PostScript Format)

  • 유동석;김차종
    • 한국정보통신학회논문지
    • /
    • 제8권3호
    • /
    • pp.614-621
    • /
    • 2004
  • 현재의 전자문서처리 환경은 WYSIWYG 방식이다. 이를 위해 문서를 논리적인 구조와 물리적인 구조로 구조화하였고 이러한 구조를 마크업언어로 표현하고 있다. 특히 인터넷상의 전자문서 작성 및 교환을 위한 마크업언어로 XML이 발표되어 전자문서의 표현과 같은 전통적인 사용에서부터 검색을 위한 데이터베이스화에 이르기까지 전자문서의 활용 영역이 다양해지고 있다. 그러나 출력 품질면에서 워드프로세서나 전자출판에 의한 전자문서와 XML 문서의 출력 품질은 매우 큰 차이가 있다. 이는 비록 XML 문서가 스타일 정보를 포함하고 있긴 하지만 화면 출력과 인쇄 매체로의 출력 모두 고품질의 출력을 위한 적용이 부족했기 때문이다. 이러한 문제 해결을 위해 W3C에서는 고품질의 XML 출력 문서를 얻을 수 있도록 XSL-FO(XSL-Formatting Object)를 개발하였다. 한편 고품질의 전자출판물을 얻기 위해 폐이지 기술 언어(PDL)가 필요하고, 이의 업계표준인 Postscript가 이미 널리 사용되고 있다. 따라서 본 논문에서는 XML-FO를 PostScript에 적용함으로써 고품질의 XML 출력문서를 얻기 위한 변환기를 설계하였다.

관계형 DBMS 기반의 XML 문서 경로 통합 시스템 (Path Combining System of XML Documents based on Relational DBMS)

  • 이범석;황병연
    • 한국멀티미디어학회논문지
    • /
    • 제11권4호
    • /
    • pp.415-422
    • /
    • 2008
  • XML의 사용이 증가함에 따라 XML로 표현된 문서를 효율적으로 저장하고 검색하기 위한 XML 문서 관리 시스템에 대한 많은 연구들이 활발하게 진행되고 있다. 최근에는 주로 관계형 DBMS의 장점을 이용한 XML 문서의 저장과 검색에 대한 연구가 이루어지고 있다. XML Parser를 이용하여 문서 내용을 관계형 테이블에 매핑(Mapping)하면 안정적이고 효율적인 XML 문서 관리 시스템을 구축할 수 있다. 본 논문에서 제안하는 X-Binder 시스템은 관계형 DBMS 기반의 역 인덱스 기법을 사용한다. 역 인덱스 기법은 빠른 검색속도를 보장하지만, 많은 저장 공간을 낭비하는 단점을 가진다. 이 문제점을 해결하기 위해 XML 문서 저장시 형제 관계를 가지는 경로들을 통합하여 저장한다. 제안하는 X-Binder 시스템은 XRel과의 성능 평가에서 저장 공간을 줄이고, 검색 시간을 단축하는 성과를 보였다.

  • PDF