• 제목/요약/키워드: XML 문서 검색

검색결과 468건 처리시간 0.023초

XML 문서의 내용기반 검색을 위한 인덱싱 모델 및 색인어의 가중치 부여 (Indexing Model and Weight Assignment on Keywords for Contents based Retrieval in XML Documents)

  • 한예지;한창우;서동혁;김수희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.103-105
    • /
    • 2004
  • 본 논문에서는 XML 문서의 내용을 효율적으로 검색하기 위해 필요한 메타데이터의 스키마몰 개발하고 이론 바탕으로 구축되는 내용기반 인덱싱 모델을 제안한다. 제안하는 내용기반 인덱싱 모델은 엘리먼트타입에 따라 랭킹 검색과 불리언 검색을 지원한다. 랭킹 검색 결과의 재현도와 정확도를 높이기 위해, 검색 결과의 출력 기준 노드가 리프 노드와 내부 노드인 경우를 구별하여 색인어에 대한 가중치를 부여하고, 이를 이용하여 질의와 엘리먼트간의 유사도를 계산하는 방법을 제안한다.

  • PDF

PIX: XML문서 검색을 위한 색인 분할 기법 (PIX: Partitioned Index for Keyword Search over XML Documents)

  • 이홍래;이형동;유상원;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권6호
    • /
    • pp.710-720
    • /
    • 2004
  • 정보 검색의 대상이 XML 문서가 되면서 구조 정보를 이용하는 것과 같은 단순한 텍스트 기반의 검색에서는 어려웠던 일이 가능해졌다. 그러나 문서 단위로 처리하던 정보를 엘리먼트 단위로 상세하게 해야 하므로 처리의 부담이 가중되어 많은 수의 엘리먼트를 효과적으로 처리할 수 있는 알고리즘이 필요하다. 본 논문에서는 결과가 될 가능성이 있는 엘리먼트들끼리 미리 분할 한 후 저장하여 처리 대상이되는 엘리먼트들의 수를 줄이는 역색인 방법을 제안한다. 분할은 특정 레벨을 기준으로 하여 이 레벨에서 공통 선조를 가질 수 있는 가의 여부에 따라 수행한다. 그리고 분할 병합을 통하여 분할하지 않은 것과 동일한 결과를 생성할 수 있도록 하였다. 이는 기존의 XML 문서에 대한 키워드 검색의 성능을 향상시키는 결과를 가져왔고 이를 실험적으로 검증하였다.

XML 문서에서 효율적인 키워드 검색을 위한 원소의 의미 정보 이용 검색 기법 (A Search Scheme using Semantic Information of the Element for the Efficient Keyword Search in XML Documents)

  • 김종진;김재형;이승미;손진현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.379-382
    • /
    • 2008
  • 저장하고 표현해야 할 정보의 종류가 많아지고 그 양이 증가함에 따라 사용자는 자신이 원하는 정보를 찾기 위해 정보 검색의 과정을 수행한다. 하지만 전통적인 검색 방법은 해당 사용자가 이미 정보의 표현 방법, 즉 스키마를 모두 알고 있다는 가정 하에 진행되어 진다. 키워드 검색 기법은 사용자에게 내부적인 스키마 구조를 숨기고 단지 몇 개의 키워드로 사용자에게 원하는 정보를 검색해 준다. 본 논문에서는 XML 문서 안의 정보를 찾는 새로운 키워드 검색 기법을 제안한다. 제안하는 방법으로 각 XML 문서 원소가 표현하는 의미 정보를 최대한 활용하여 사용자가 원하는 정보를 검색해 줄 수 있는 인덱스를 구축하고 이를 통해 사용자가 알고자 하는 검색의 목표가 무엇인지 그 의미도 파악할 수 있도록 지원한다. 구축된 인덱스를 바탕으로 검색에 수행되는 XML 원소 비교의 횟수를 줄여서 전체 검색 성능을 향상 시킬 수 있도록 한다.

웹 상에서 XML에 기반한 교수 지원 시스템 설계 및 구현 (Design ana Implementation of Teacher Support System based on XML on Web)

  • 김행곤;김지영;최문경
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (상)
    • /
    • pp.603-606
    • /
    • 2002
  • 최근 WWW의 기하급수적인 성장과 더불어 인터넷 서비스를 통한 정보 획득과 공유 및 원격 시스템 접속을 통한 인터넷 응용 처리 서비스에 대한 연구가 많이 이루어지고 있고, 이는 학습과 교수 업무지원 분야에서도 용용되고 있다. 특히 교수를 위한 복잡한 학교 업무의 관리와 학습자료 및 업무 자료를 지원하기 위해서는 확장성과 호환성, 편의성을 제공하는 XML 형태의 전자문서가 제공되어져야 한다. 따라서 웹을 기반으로 다수의 교수자들이 교수 업무 지원을 위해 XML 문서를 효율적으로 작성하고 공유할 수 있는 적절한 교수 지원 시스템이 필요하게 되었다. 이는 웹 상에서 XML 문서의 효과적인 생성과 검색 및 의도된 문서를 재사용 가능하도록 제공함으로써 교수자의 다양한 요구 사항을 융통성있게 수용할 수 있다. 따라서 본 논문에서는 웹 상에서 XML 문서 제공을 위한 교수 지원 시스템을 구현하였다. 본 시스템을 통해서 교수자들은 XML 문서를 효율적으로 생성, 등록, 수정하고 또한 문서를 대화적으로 검색하고 이해하며, 다양한 형태의 문서를 획득할 수 있다. 따라서 교수 지원시 업무처리의 효율성과 작성된 XML 문서의 재사용성을 증대시킬 수 있다.

  • PDF

RDBMS를 이용한 XML DTD 데이터베이스와 확장 SQL의 설계 (Design of Extended SQL and XML DTD Database using RDBMS)

  • 오준환;이병욱
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.228-230
    • /
    • 2000
  • 최근 XML 문서를 저장 및 검색하기 위한 연구가 활발히 진행되고 있다. 하지만 기존의 연구는 주로 XML문서 저장을 위한 연구들이었다. 즉 XML 문서를 정의해 주는 DTD 문서의 저장에 관한 연구는 상대적으로 적었다. 하지만 DTD 문서를 효율적으로 저장하고 관리하여 재활용함으로써 XML 문서를 효율적으로 관리할 수 있다. 본 논문에서는 DTD를 RDBMS에 저장하기 위한 스키마를 제안하고, 저장 방식은 정보의 중복저장을 막고 DTD의 모든 내용을 수용할 수 있도록 설계하였다. 또 제안하는 데이터모델에 적용하여 SQL의 DDL을 확장하였다. 제안한 DTD 데이터베이스로 인해 DTD의 재활용과 관리를 할수 있게 되었고 SQL의 확장으로 제안 시스템의 사용을 용의하게 하였다.

  • PDF

구조적 정보 검색을 위한 XQL 질의 처리 시스템 설계 (Design of XQL Query Processing System for Structural information retrieval)

  • 김상영;김철원;김광현;박종훈;정현철
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2003년도 추계종합학술대회
    • /
    • pp.892-896
    • /
    • 2003
  • XML은 단순히 웹 브라우저에 표시하기 위한 것을 넘어서 여러 다양한 시스템간, 어플리케이션간의 데이터 교환을 위한 인터페이스 포맷 등 다양한 분야에서 활용되고 있다. 이에 따라 정보의 생성, 재사용, 처리 및 지속성, 이식성 등 XML 문서를 효과적으로 관리하고 검색할 수 있는 시스템에 관한 많은 연구들이 진행되어 지고 있다. 본 논문에서는 XQL과 문서 구조 처리기와 질의 언어 처리기에 대해 설명하고 XML 문서의 내용을 트리구조로 만들어 구조정보를 파싱하는 동안 XQL을 이용해 질의에 맞는 XML 문서 트리 구조정보를 찾는 방법을 제시한다. 이를 통해 웹 상에 분산된 XML 문서를 병합하여 파싱한 후 문서의 구조 정보를 트리 구조로 구성하고 질의 언어로 제안되어진 XQL을 이용한 효율적인 XML 문서 검색 시스템의 설계 및 구현에 대하여 기술하였다.

  • PDF

노드 범위와 Pre-Order List를 이용한 XML문서의 효율적 색인기법 (An Efficient Index Scheme of XML Documents Using Node Range and Pre-Order List)

  • 김영;박상호;이주홍
    • 인터넷정보학회논문지
    • /
    • 제7권4호
    • /
    • pp.23-32
    • /
    • 2006
  • 본 논문에서는 최근 방대해지는 XML문서의 효율적인 관리를 위해서 노드 범위와 Pre-Order List를 이용한 XML문서들의 인덱싱 기법을 제안한다. 기존의 제안된 인덱싱 기법들은 크게 패스(Poth)와 넘버링(Numbering)을 기반으로 하고 있다. 그러나, 패스기반의 인덱싱 기법은 중간 노드와 최하위 노드의 검색과 조상-후손관계의 조인연산에 의해 효율이 떨어지는 단점을 가진다. 또한, 넘버링기반의 방법은 XML문서의 모든 노드에 번호를 부여하기 때문에 검색-오버헤드가 증가하는 문제를 가지며, 인덱스를 위해 많은 공간이 낭비된다. 따라서 본 논문에서는 이러한 문제점들을 해결하기 위해서 모든 XML문서에 노드범위 (Node Range)와 Pre-Order List를 이용한 인덱싱 기법을 제안한다. 이 방법은 유사한 구조의 XML문서가 많을수록 인덱스의 크기를 효과적으로 줄일 수 있으며, 검색 성능을 효율적으로 높일 수 있다. 또한 XML문서의 삽입, 삭제가 용이하다.

  • PDF

XML 문서에서 순수 구조 질의에 대한 인덱싱 및 질의 처리 (Indexing and Query Processing for Pure Structure Query on XML Documents)

  • 김성완;김연희;이재호;임해철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.220-222
    • /
    • 2002
  • XML 문서의 효율적인 저장 및 검색을 위한 많은 연구들이 수행되고 있다. 그러나 기존의 연구들에서는 주로 내용 검색의 정확도를 높이기 위해 구조적 정보를 이용하는 방법을 제시하고 있으나, 순수하게 구조만을 대상으로 하는 인덱싱 및 질의 처리 방법 특히 , 동적인 환경을 고려한 인덱싱 및 질의 처리 방법에 대해서는 많이 언급하고 있지 않다. 본 논문에서는 XML 문서에 대한 순수 구조 질의 처리가 가능하고, 엘리먼트의 삭제 및 삽입 등 동적인 변경을 처리할 수 있는 인덱스 구조를 설계한다. 또한 설계된 인덱스 구조를 기반으로 순수 질의 처리 유형을 분류하고 각각에 대한 질의 처리 방안을 제시한다.

  • PDF

KIMF를 이용한 XML 인덱싱 알고리즘 설계 및 구현 (Design and Implementation of XML-Based Indexing Algorithm Using KIMF)

  • 김광남;윤희병;김화수
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2004년도 춘계학술대회 학술발표 논문집 제14권 제1호
    • /
    • pp.13-16
    • /
    • 2004
  • XML은 사용자 정의 태그를 이용한 정보 제공의 장점으로 인하여 웹 뿐만 아니라 EDI, CALS, RDF, HDML, WML둥 많은 분야에서 사용하고 있다. 그러나 XML 문서는 다양한 사용자 정의를 포함하기 때문에 사용자 질의에 대하여 효율적으로 응답하기 위해서는 내용기반 질의로부터 구조, 내용과 구조가 포함된 질의까지 해결해 줄 수 있는 인덱싱 기법이 필요하다. 이를 해결하기 위해 DTD를 이용한 방법, K-ary 완전트리, 추상화기법, SCL 등이 제시되었으나 XML 노드의 거리관계를 이용한 방법은 제시되지 않았다. 본 논문에서는 국방대 인덱싱 모델 프레임워크인 KIMF를 이용하여 효율적으로 XML 문서를 인덱싱하고 설계 및 구현한다. 이를 위해서 KIMF 모듈에 대한 구성도를 제시하고, 깊이탐색과 최단거리, 깊이 차이를 이용하여 XML 문서를 인덱싱하는 알고리즘을 제안한다. 마지막으로 C#을 이용하여 제안한 알고리즘을 설계 및 구현하고, 이를 기반으로 한 내용검색, 구조검색 및 혼합(내용+구조) 검색 결과를 또한 제시한다.

  • PDF

온톨로지-DTD 정합에 의한 XML 질의 확장 (XML Query-Expansion by Ontology-DTD Match)

  • 김명숙;공용해
    • 정보처리학회논문지D
    • /
    • 제12D권5호
    • /
    • pp.773-780
    • /
    • 2005
  • XML 질의를 온톨로지 기반으로 확장하면 보다 폭넓은 정보검색이 가능해지는 반면에, 대상 문서의 구조에 부적합하게 확장된 질의들은 검색의 효율을 저하시킬 수 있다. 본 연구는 은톨로지와 대상 문서의 DTD를 정합한 결과인 축소된 온톨로지를 기반으로 질의를 확장함으로써 질의의 적합도를 향상시키는 방법을 제안한다. 온톨로지 개념과 DTD 엘리먼트 정합 및 온톨로지와 DTD 속성 정합에 의해 한번 축소된 온톨로지는 질의의 적중률을 높일 수 있을 뿐만 아니라 동일한 구조를 가지는 문서 집단에 재사용될 수 있으므로 검색의 효율을 향상시킬 수 있다.