• 제목/요약/키워드: XML 문서 검색

검색결과 468건 처리시간 0.027초

효율적 문서 검색 및 변경을 위한 XML문서 저장 시스템 설계 (Design of an XML Document Storage System for Efficient Document Retrieval and Updates)

  • 박충희;이상준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.548-550
    • /
    • 2003
  • 본 논문에서는 관계형 데이터베이스를 이용하여 XML 문서를 효과적으로 검색 및 갱신을 수행할 수 있는 데이터 저장 모델을 제안한다. 저장 시스템의 스키마는 DTD 독립적인 형태를 채택하였고, 가상 분할 모델과 분할 모델의 장점을 취합한 혼합형태로 설계하였다. 본 시스템에서는 엘리먼트 추가 또는 삭제시 문서의 구조정보 변경으로 인한 변경사항 발생을 방지하기 위하여 타 노드의 위치정보와 독립적인 position id를 사용하였다.

  • PDF

XML 실체뷰를 이용한 XQL 질의 분할의 성능 분석 (Performance Analysis of XQL Query Decomposition Using XML Materialized Views)

  • 문찬호;강현철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (상)
    • /
    • pp.63-66
    • /
    • 2002
  • XML 저장소 내에 XML 문서들과 그들로부터 도출된 XML 실체뷰가 있다고 가정할 때, XML 문서 검색의 성능 향상을 위해서 이들 실체뷰를 이용하여 질의를 처리할 수 있다. 즉, 하부 XML 문서에 대한 원래의 질의를 관련된 실체뷰에 대한 질의로 변환하여 수행함으로써 질의 응답시간을 줄일 수 있다. 실체뷰를 이용한 질의 처리의 유형으로는 (1) 실체뷰로부터 원하는 결과를 모두 얻을 수 있는 유형과 (2) 질의 결과의 일부는 실체뷰에 존재하지만 일부는 하부 XML 문서로부터 검색해야 하는 유형이 있다. 본 논문에서는 두번째 유형에 대하여 연구하였다. 주어진 질의를 (1) 실체뷰에 대한 질의와 하부 데이타에 대한 질의로 분할하여 처리한 후 두 결과를 통합하는 방법과 (2) 원래의 질의를 실체뷰를 이용하지 않고 처리하는 방법 간의 성능을 비교, 분석하였다.

  • PDF

함수 변환과 FFT에 의한 XML 문서의 구조 비교 (XML Document Structure Comparison based on Function Transform and FFT)

  • 이호석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (C)
    • /
    • pp.28-30
    • /
    • 2006
  • XML 문서의 유사성을 비교하는 연구는 XML 문서의 저장 및 검색에 유용하기 때문에 많은 연구가 진행되었다. XML 문서의 유사성 연구는 크게 edit-distance를 이용하는 방법, 문서의 그래프 모델을 이용하는 방법, 문서의 매트릭스 모델을 이용하는 방법 등이 있다. 최근에는 문서를 encoding 하고 푸리에 변환을 이용하는 방법이 보고되었다. 본 논문에서는 XML 문서를 함수로 변환하고 FFT를 적용하여 문서의 구조적 유사성을 비교하는 새로운 방법을 제안한다. 제안하는 방법은 JAXP로 구현하였으며 XML 문서의 구조를 분석하여 함수로 변환하였다. 그리고 함수에 FFT를 적용하여 XML 문서의 구조적 유사성을 비교하였다. FFT 비교 결과는 XML 문서의 함수 변환이 적합한 것임을 보여주었으며 비교 결과는 예상된 결과를 보여주었다.

  • PDF

버저닝을 지원하는 XHL 저장관리시스템 설계 및 구현 (Design and Implementation of an XML Repository System Supporting)

  • 손충범;유재수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (1)
    • /
    • pp.220-222
    • /
    • 2001
  • 최근 웹을 이용한 전자문서의 중요성이 부각되면서 대용량의 XML 문서에 대해 효율적으로 저장하고, 검색하며, 관리할 수 있는 XML, 저장관리 시스템의 연구가 활발히 진행되고 있다. XML 응용 중에서 특허문서 관리, 소프트웨어 설계, 시스템 매뉴얼 등의 응용과 같이 수정된 기존의 문서들이 관리되어야 하는 분야에서 버전 관리 기능이 필요하다. 본 논문에서는 문서의 수정을 효율적으로 지원하는 분할모델을 이용하여 문서 수정에 따른 버저닝을 지원하는 데이터 모델을 제안하고, 버저닝을 지원하는 XML 저장관리 시스템을 설계하고 구현한다.

  • PDF

이동 객체 데이터베이스 상에서 정보 비용 테스트를 위한 테스트 베드의 설계 및 구현 (Design and Implementation of Testbed for Information Cost Test)

  • 김태원;김경식;김창화;강태원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.73-75
    • /
    • 2002
  • 본 논문에서는 분산된 XML 문서를 수집 처리하여 상호 제공하는 과정에서 활용될 통합된 XML 문서의 전역 스키마를 생성하는 시스템을 제안한다. 제안된 시스템에서는 분산 환경에 존재하는 개별적인 XML 문서들에 대한 지역 스키마 정보를 관계형 데이터베이스로 구축하고, 통합된 XML 문서의 데이터를 기반으로 각각의 지역 스키마 데이터베이스를 검색한 후 데이터에 적합한 스키마 정의를 추출하게 된다. 또한 추출과정에서 중복 정의에 의한 충돌 범주를 분석하고, 이를 해결하는 방법도 제시하였다. 시스템 모델링 결과 XML 문서의 구조와 검증을 명확하게 보장하는 통합된 XHL 문서의 전역 스키마 생성과 지역 스키마간 발생되는 충돌문제 해결이 가능함을 알 수 있었다.

  • PDF

유사성 기반 XML 문서 분석 기법 (XML Document Analysis based on Similarity)

  • 이정원;이기호
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권6호
    • /
    • pp.367-376
    • /
    • 2002
  • XML 문서가 가지고 있는 태그의 자유로운 정의와 내포된 구조 정보는 정보 검색 및 문서 관리 분야에 많은 이점을 제공할 수 있다. 본 논문은 XML 요소(element)의 의미와 구조 정보를 반영한 문서간의 유사성을 검사할 수 있는 XML 문서 분석 기법을 제시하고자 한다. 도출된 문서간 유사성은 많은 정보 검색 및 마이닝 등의 기초 자료로 사용될 수 있다. 먼저 XML 요소를 시소러스를 이용하여 유사어와 합성어로 구성된 확장-요소 벡터로 확장하고 유사 행렬을 구축하여 요소간 유사성을 판별한다. 또한 오토마타(NFA(Nondeterministic Finite Automata)와 DFA(Deterministic Finite Automata)(를 이용하여 XML 문서의 내포된 구조를 발견하고 최소화 한다. 요소간의 유사 행렬과 최소화된 XML 구조를 이용하여 구조간의 유사성을 판별한다. 본 논문의 XML의 의미를 반영한 유사성 분석 기법은 온라인 서점의 실제 문서의 카테고리를 인식하는 데 있어 100% 정확도를 보였다.

노드정보를 이용한 문서검색의 성능에 관한 연구 (A Study on the Performance of Structured Document Retrieval Using Node Information)

  • 윤소영
    • 정보관리학회지
    • /
    • 제24권1호
    • /
    • pp.103-120
    • /
    • 2007
  • 노드는 문서를 구성하는 작은 크기의 의미 있는 정보 단위이다. 정보검색에 문서의 구조정보를 이용함과 더불어 문서보다 작은 검색단위에 대한 연구가 활발히 이루어지고 있다. 이 연구에서는 노드정보를 이용한 검색실험을 위해 벡터공간모델 검색기법을 사용하여 다양한 유사도 산출방식을 적용한 실험과 구조정보를 활용한 확장 실험을 수행하였다. 실험결과 문서의 유사도를 산출하는 방식에 따른 검색성능의 차이는 거의 나타나지 않았으며, 구조정보를 적용하는 확장 노드검색이 가장 좋은 성능을 나타냈다.

XML 시각화를 통한 자동 질의문 생성 (Auto generation of a query language through visualization of XML)

  • 송민호;이기호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.637-639
    • /
    • 2002
  • XML 문서를 효과적으로 관리하고 검색하기 위한 다양한 XML 질의 언어에 대한 연구가 활발히 수행되고 있지만 다양한 XML 질의 언어의 구문은 일반 사용자들이 숙지하는데 어려움이 있고, 또한 텍스트 형태의 XML 문서는 계층적인 구조로 되어있어 이러한 XML 문서의 구조를 알아야만 질의를 할 수 있다는 문제점이 있다. 따라서 본 논문에서는 복잡한 XML 질의어 구문과 질의 대상인 XML 문서의 구조를 동시에 시각화하고, 사용자와의 상호작용을 통해 질의문을 자동으로 생성하고자 한다. 이를 위해 본 논문에서는 다음과 같이 세 가지 컴포넌트를 기반으로 자동 질의어 생성을 위한 visual query interface를 제안하였다. 이 컴포넌트는 계층적 XML 문서 구조를 보여주는 XML structure viewer, 질의에 사용되는 연산자들을 아이콘화한 operator panel, 그리고 이 두 컴포넌트의 상호작용으로 작성된 질의 구문을 문법적으로 검사하기 위한 query statements panel로 구성된다. 이를 통해 다양한 계층적인 XML 문서의 구조와 복잡한 XML 질의 언어의 구문에 대해서 잘 모르는 초보자라 하더라도 쉽게 XML 문서 상에서 질의를 할 수 있다.

  • PDF

EJB를 이용한 XML문서 저장 (Storage of XML Documents Using EJB)

  • 허율;홍의경
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (1)
    • /
    • pp.157-159
    • /
    • 2001
  • 웹의 표준으로 자리잡고 있는 XML(eXtensible Markup language)은 정보교환을 위한 정보한 포멧으로 대두되고 있으며, 현재 EC/EDI, 전자 도서관, 전자 상거래 등 다양한 분야에서 XML이 사용되고 있다. 따라서 XML 문서를 데이터베이스에 효율적으로 저장하고 검색하기 위한 많은 연구들이 진행되고 있다. XML 문서를 저장하고 검색하고자 하는 시스템은 다양한 시스템의 변화에 효율적으로 적응하고 재사용과 확장성이 용이한 컴포넌트 기반의 소프트웨어로 변환되어야 한다. 본 논문에서는 복잡한 시스템의 개발 기간을 단축하고 소프트웨어 품질과 재사용성을 높이는 객체지향 및 컴포넌트 표준으로 알려진 EJB(Enterprise JavaBeans)를 이용해 XML 문서를 저장하는 방법을 제시 하였다.

  • PDF

SGML/XML 검색 시스템의 설케 및 구현 (Design and Implementation of a SGML/XML Document Retrieval System)

  • 고승규;조승기;최윤철;고견
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2000년도 추계학술발표논문집
    • /
    • pp.99-102
    • /
    • 2000
  • 이기종 간의 문서 교환 표준으로 제안되 SGML은 문서의 구조정보를 표현할 수 있는 장점으로 인해 CALS(Commerce At Light Speed), EC(Electronic Commerce), EDI(Electronic Data Interchange), 전자 도서관(Digital Library) 등 여러 분야에서 사용되고 있다. 이렇게 SGML이 여러 분야에서 사용됨에 따라 많은 SGML 문서 중에서 원하는 문서를 효율적으로 찾아줄 수 있는 검색 시스템의 필요성이 증가하고 있다. 이에 본 연구실에서는 기본적인 구조 검색을 지원하는 SGML 문서 관리시스템을 기개발하였다. 그러나 이 시스템은 구조 검색을 효과적으로 지원하기 못하기 때문에 본 연구에서는 구조 검색의 기능을 정의하고, 이를 지원하는 새로운 구조 질의어를 정의하였다. 또한 이러한 구조 검색을 효과적으로 지원하기 위한 구조 색인을 정의하였다. 그리고 구조 검색 방식으로 세가지 방식을 각각 구현 및 실험하여 그 중에서 성능이 뛰어난 절충식을 이용하여 검색 시스템을 구현하였다.

  • PDF