• Title/Summary/Keyword: XML 문서 검색

Search Result 468, Processing Time 0.03 seconds

XML Information Retrieval by Document Filtering and Query Expansion Based on Ontology (온톨로지 기반 문서여과 및 질의확장에 의한 XML 정보검색)

  • Kim Myung Sook;Kong Yong-Hae
    • Journal of Korea Multimedia Society
    • /
    • v.8 no.5
    • /
    • pp.596-605
    • /
    • 2005
  • Conventional XML query methods such as simple keyword match or structural query expansion are not sufficient to catch the underlying information in the documents. Moreover, these methods inefficiently try to query all the documents. This paper proposes document tittering and query expansion methods that are based on ontology. Using ontology, we construct a universal DTD that can filter off unnecessary documents. Then, query expansion method is developed through the analysis of concept hierarchy and association among concepts. The proposed methods are applied on variety of sample XML documents to test the effectiveness.

  • PDF

Design of an XML Documents search system (XML 문서 검색 시스템 설계)

  • 정지문;이문목;최성
    • Proceedings of the KAIS Fall Conference
    • /
    • 2000.10a
    • /
    • pp.134-139
    • /
    • 2000
  • 컴퓨터의 보급 확대, 초고속 통신망 구축 그리고 사용하기 쉬운 브라우저의 개발에 힘입은 웹의 급속한 발전에 의해 인터넷 이용자들이 기하급수적으로 증가하게 되었다. 이러한 웹의 발전에 무엇보다도 크게 영향을 끼친 것 중의 하나가 바로 HTML(Hyper-Text Markup Language)일 것이다. HTML은 SGML(Standard Generalized Markup Language)을 기반으로 한 DTD(Document Type Definition)에 의해 정의되어 있는 한정된 태그(Tag)만을 사용하도록 되어 있어 단순한 홈페이지 작업을 하기에는 매우 용이하나 대용량의 복잡하고 다양한 작업을 하기는 쉽지 않았다. HTML의 단점을 극복하기 위해 개발된 XML은 문서에 대한 의미 공유와 서로 다른 애플리케이션 및 호환이 되지 않는 데이터베이스간의 정보 전달 기능들을 효율적으로 수행할 수 있다. 하지만, 현재 대부분의 XML문서 검색 엔진들은 문서의 구조 정보에 기반한 검색에 중점을 둔 반면, 태그의 의미를 이용한 검색은 지원하지 못한다. 본 논문에서는 XML문서의 보다 효율적인 검색을 지원하기 위해 데이터 레지스트리를 이용하여 태그의 의미를 명시하고 이에 기반한 XML문서 검색 시스템을 연구하였다.

A Design and Implementation of an XML Document Storage System for Structural Query (XML 문서의 구조 검색을 위한 저장 시스템 설계 및 구현)

  • 정병인;김희준;이재완
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2000.05a
    • /
    • pp.284-287
    • /
    • 2000
  • 정보 통신 기술의 발전에 따라 복잡하고 다양한 정보들을 컴퓨터를 이용한 합리적인 방법을 통해 저장, 관리, 검색하여 활용해야 할 필요성이 높아지고 있다. 이러한 환경에서 많이 이용되고 있는 문서 포맷 중의 하나가 XML 이다. XML은 SGML과 HTML의 단점을 해결 및 보완한 것이기 때문에 인터넷을 기반으로 하여 많은 분야에서 활용이 될 전망이다. 따라서 증가하는 XML 문서들을 저장하고 관리하는 기능은 필연적으로 필요하게 된다 또 한 많은 양의 저장된 문서들에 대해서 원하는 문서를 찾을 수 있는 효율적인 검색 기능이 필요로 하게 된다. 따라서 제안한 XML 저장관리 시스템은 XML이 지닌 다양한 문서 정의들에 대한 손실이 없이 저장할 수 있는 모델과 데이터베이스에 최소한의 부하만을 주어 구조기반 검색을 수행할 수 있는 검색기 등을 설계 및 구현하였다.

  • PDF

A XML Indexing Technique based on DTD's Element Types in RDBMS (RDBMS를 이용한 DTD 엘리먼트 타입 기반의 문서 색인 기법)

  • Park Kwan-Soon;Kim Tack-Gon;Kim Woo-Saeng
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06c
    • /
    • pp.55-57
    • /
    • 2006
  • 최근 XML 문서가 인터넷 기반의 애플리케이션 간의 자료 저장 및 교환을 위한 표준으로써 부상함에 따라 XML 문서의 저장 및 관리에 대한 연구가 활발히 이루어지고 있다. 하지만 XML 문서의 검색에 관련된 많은 연구들이 모든 XML 엘리먼트 경로에 대한 색인화로 인해 인덱스의 크기가 커지고 이에 비례하여 검색성능이 뜯어지는 문제를 보이고 있다. 본 논문에서는 이를 개선하기 위해 엘리먼트 타일을 기반으로 전통적인 역색인 방법을 XML 문서에 맞게 확장하고, RDBMS에 기반하여 계층구조를 갖는 XML 문서들의 자료를 구조적 넘버링(Numbering) 방법의 인덱스로 설계 하였다. 인덱스 테이블들은 엘리먼트 타입의 정보를 담고 있는 엘리먼트 타입 테이블, XML문서의 경로를 가지고 있는 경로 테이블, 역색인으로 구성된 Term테이블. Term 경로를 나타내는 Term경로 테이블을 생성한다. 이전의 XML 인덱싱 기법에 관련된 연구들에서 보이는 XML 문서상의 모든 경로에 대한 표현을 간소화 시키고, 이를 통해 보다 좋은 검색 성능을 보이고자 하였다.

  • PDF

Design and Implementation of an XML Repository System for Structural Retrieval (구조 정보 검색을 위한 XML 저장관리시스템 설계 및 구현)

  • 이종설
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10a
    • /
    • pp.36-38
    • /
    • 1999
  • 본 논문에서는 대용량의 XML 문서를 효과적으로 저장, 관리 및 구조 기반 검색이 가능한 XML 저장관리시스템을 설계하고 구현한다. 구현한 XML 저장관리시스템은 관계형 모델을 기반으로 하고, XML 문서 전체를 저장하는 비분할 저장 모델을 사용하며, DTD에 따라 스키마가 생성되는 동적 스키마 생성 모델을 특징으로 한다. 본 논문의 XML 저장관리 시스템은 BRS 검색엔진과 ORACLE을 기반으로 하며 질의처리기 및 검색결과생성기, XML 객체관리자, XML 인덱스관리자, 구조검색엔진 등으로 구성된다. 이를 통하여 내용 및 애트리뷰트 검색 뿐만 아니라 다양한 구조 정보검색을 효율적으로 지원한다.

  • PDF

Constructing and Implementing SGML/XML Information Retrieval Systems with a Case Study : STEER-SGML/XML (SGML/XML 정보검색 시스템의 구성과 구현 방법론 사례연구 : STEER-SGML/XML)

  • Park, Young-C.;Kim, Mun-Seok;Kim, Nam-Il;Zhoo, Zong-Cheol
    • Annual Conference on Human and Language Technology
    • /
    • 1998.10c
    • /
    • pp.105-110
    • /
    • 1998
  • SGML/XML은 임의 형태 문서, 임의 응용에 대해 일반화 마크업을 정의하기 위한 방법을 기술하는 메타언어이다. 즉 문서의 작성시에 고려되는 문서의 논리적 정보를 표현 가능하다. 이러한 논리적 구분을 이용하여 정보사용자에게 좀 더 정확한 검색을 제공할 수 있다. SGML/XML을 이용하여 표현된 계층적 논리정보를 이용하여 다양한 문서 접근점을 제공할 수 있으며, 문서의 재사용 및 동적인 문서제시를 가능케 한다. 본 논문에서는 SGML/XML 정보검색의 장점과 이러한 시스템을 구현하기 위한 구현 단계 및 구성요소를 알아보고자 한다. 아울러 구현사례로 STEER-SGML/XML 검색 시스템을 알아본다.

  • PDF

A Data Registry based Environment for Sharing XML Documents (데이터 레지스트리에 기반한 XML 문서 공유 환경)

  • 나홍석;채진석;백두권
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10b
    • /
    • pp.650-652
    • /
    • 1998
  • 웹을 기반으로 하는 분산환경에서 데이터 공유 문제를 해결하기 위해서 XML을 이용한 시스템을 등장하고 있다. 하지만, XML을 이용한 데이터 공유 및 교환은 공통된 XML DTD를 이용한 다는 것을 전제로 하기 때문에, 서로 다른 DTD를 기반으로 작성된 XML 문서는 그 의미에 대한 공유가 이루어지지 못한다. 본 논문에서는 XML 태그 및 속성을 정의하는 DTD 작성시에 데이터 레지스트리를 이용하도록 함으로써 XML 태그의 의미를 공유할 수 있는 방법을 제시하였으며, 이를 기반으로 작성된 XML 문서를 교환하고 검색할 수 있는 문서 공유 환경을 설계하였다. 제시한 환경에서 유통되는 XML 문서는 서로 다른 DTD에 의해서 작성된 경우에도 그 태그의 의미를 서로 공유할 수 있어 자동화된 데이터의 교환이 가능하며, 데이터 레지스터리에 등록된 데이터 요소의 정의를 이용해서 사용자가 원하는 개념과 일치하는 문서 및 내용을 검색함으로써, 정확한 문서 검색 결과를 얻을 수 있다.

XML Document Search Technique by Signature (시그니처를 이용한 XML 문서 질의 기법)

  • Kim, Woosaeng
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2012.10a
    • /
    • pp.522-524
    • /
    • 2012
  • 인터넷의 성장과 함께 문서 교환의 표준으로 자리 잡은 대량의 XML 문서들을 효율적으로 검색하기 위한 방법이 필요하다. 기존의 방법은 주어진 질의에 답하기 위하여 모든 XML 문서들을 검색하기에 비용이 많이 든다. 따라서 본 논문에서는 시그니처 기법을 사용하여 주어진 질의와 관련된 일부 XML 문서들만을 검색하는 방법을 제안한다.

  • PDF

XML Document Retrieval Models for Heterogeneous Data Set using Independent Regular paths (독립적인 질의 경로들을 사용하여 이질적인 문서들을 검색하는 XML 문서 검색 모델)

  • 유신재;민경섭;김형주
    • Journal of KIISE:Software and Applications
    • /
    • v.30 no.1_2
    • /
    • pp.140-152
    • /
    • 2003
  • An XML document has a structure which may be irregular. It is difficult for end-users to comprehend the irregular document structure exactly. For these XML documents, an end-user has a difficulty in using structured query. Therefore, an end-user formulates no structured query or a query which has a little structure information. In this context, we propose new retrieval models which use the structured information for ranking and compensate the difference between user query structure and document structure. To ease with querying, we assume the independence among querying paths which represent structural constraints. Since this assumption makes degradation of the expression power of a query language, we also propose a model which overcome this problem. As there had been no test collections for XML documents, we made a small test collection from TIPSTER of the RTEC and experimented on this collection without a structured query, From this experiment, we showed that our models improve average precision about 67% over conventional Vector-Space model.

The Efficient Schema Conversion to map the XML Document into the RDB (XML의 RDB로의 맵핑을 위한 효율적인 스키마 변환)

  • 김태희;김선경
    • Proceedings of the Korea Society for Industrial Systems Conference
    • /
    • 2003.11a
    • /
    • pp.429-433
    • /
    • 2003
  • 웹상의 문서는 데이터 중심의 표준 언어인 XML 문서로 표현된다. XML 데이터를 범용적이고 우수한 성능의 관계형 데이터베이스와 연동하여 이용하기 위해서는 두 구조 사이의 맵핑 과정이 필요하다. 계층적 구조의 XML 문서와 데이터베이스의 평면적인 구조의 차이를 고려한 구조 맵핑을 위해서 검색 시스템에 적합한 가상분할 방식으로 엘리먼트를 분석하여 관계 스키마를 정의한 후 XML 문서를 저장한다. 이를 위해 스키마는 DTD 에 독립적인 형태로 변환하고, 엘리먼트의 추가와 삭제, 검색의 효율성을 위해 노드간의 위치 정보와 함께 독립적인 ID를 부여하여 구조적 검색을 수행할 수 있게 하였다.

  • PDF