• Title/Summary/Keyword: XML 전문 검색

검색결과 13건 처리시간 0.035초

XML 문서의 변경을 고려한 XML 전문 검색 역인덱스 (Update conscious and depth insensitive inverted indexes for XML full-text queries)

  • 권국봉;홍동권;김권양
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.81-84
    • /
    • 2004
  • XML 문서는 관계형 테이블과는 달리 문서의 구조가 매우 복잡하고 불규칙하여 부분적인 정보를 최대한 활용하는 전문 검색이 일반적인 구조적 검색보다 더 중요한 역할을 한다. XML 문서는 계층이 있으므로 계층을 사용하는 전문 검색 연산은 계층을 제공함으로써 검색 공간을 줄여서 검색의 정확성과 효율성을 훨씬 더 높일 수 있다. 전문 검색 연산을 효과적으로 지원하기 위한 방법으로는 역인덱스를 (inverted index) 사용하는 것이 가장 일반적인 방법이다. 지금까지의 전문 검색을 위한 XML 문서의 구조 정보를 표현, 저장하는 방법들은 문서의 내용이 변경되지 않는 정적 문서(static documents)만을 고려하여 왔다. 이 방법들은 문서가 동적으로 변화할 경우 저장된 문서의 구조 정보 중에서 많은 부분을 다시 표현해야 하는 비효율적인 면이 있다. 본 논문은 XML 문서의 동적인 변화를 지원하면서 동시에 복잡한 XML 전문 검색을 지원하기 위한 방법으로 경로 스트링을 사용하는 효율적인 역 인덱스 구축 기법을 제안하고 제안하는 방법이 복잡한 문서의 검색과 문서의 동적인 변화를 효율적으로 검색할 수 있음을 보인다.

  • PDF

관계형 모델에서 XML 변경과 전문 검색을 지원하기 위한 역 인덱스 구축 기법 (Inverted Indexes for XML Updates and Full-Text Retrievals in Relational Model)

  • 천윤우;홍동권
    • 정보처리학회논문지D
    • /
    • 제11D권3호
    • /
    • pp.509-518
    • /
    • 2004
  • 최근 산업체를 중심으로 XML 전문 검색과 XML 문서의 변성 기능에 대한 표준의 시도가 활발히 이루어지고 있다. XML 질의어에서의 전문 검색 기능은 매우 중요한 부분을 차지한다. XML 문서는 관계형 테이블과는 달리 문서의 구조가 복잡하며 때로는 매우 불규칙하다. 이런 상황에서의 검색은 부분적인 정보를 최대한 활용해야 하는 전문 검색이 일반적인 구조적 검색보다 매우 중요한 역할을 한다. 본 논문은 XML 데이터를 관리하기 위하여 관계형 모델을 사용하는 환경에서 XML 문서의 변경과 다양한 형태의 전문 검색을 동시에 지원하기 위한 방안으로 효율적인 역 인덱스 구축 기법을 제안한다. 본 논문에서 제안한 방법은 인덱스 크기의 큰 변화 없이 역 인덱스를 구축하며, 대용량의 XML 문서의 다양한 전문 검색 기능을 성능의 저하 없이 지원한다. 또 XML 문서의 부분적인 변화에 역 인덱스의 변경이 기존의 방법들에 비해서 급격히 줄어든 좋은 성능을 보인다.

관계형 데이터베이스를 이용한 XQuery 전문 검색 (XQuery Full-Text Search in RDBMS)

  • 천윤우;홍동권
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (하)
    • /
    • pp.1339-1342
    • /
    • 2003
  • XML이 인터넷상에서 디지털 정보를 표현하고 교환하기 위한 표준이 되어감에 따라 최근까지 XML을 저장하고 검색하기 위한 역인덱스 기법에 대한 연구가 활발히 진행되고 있다. 본 논문에서는 XML 전문 검색을 위한 새로운 역인덱스 구조를 제안한다. 기존에 연구된 역인덱스 기법을 통한 키워드 검색 기능을 더욱 보완하고 최근에 W3C에서 새로운 기능으로 추가된 전문 검색 기능을 구현한다.

  • PDF

XSTAR: XML 질의의 SQL 변환 알고리즘 (XSTAR: XQuery to SQL Translation Algorithms on RDBMS)

  • 홍동권;정민경
    • 한국지능시스템학회논문지
    • /
    • 제17권3호
    • /
    • pp.430-433
    • /
    • 2007
  • XML이 다양한 분야에 널지 이용되면서 대용량의 XML을 효과적으로 관리하는 여러 가지 방법들이 연구되고 있다. 특히 지금가지 상업적, 기술적으로 성공적인 데이터 모델인 관계형 데이터베이스를 기반으로 한 여러 가지 방법들이 연구되고 있다. 본 논문은 관계형 DBMS를 사용하여 XML 질의어인 XQuery를 SQL로 변환하는 알고리즘인 XSTAR(XQuery to SQL Translation Algorithms on RDBMS)를 설계 및 구현한다. 본 연구의 XSTAR 알고리즘은 기본적인 XPath 뿐만 아니라 XQuery FLWOR 표현식, XQuery함수, 그리고 전문 검색(Fulltext 검색[8])과 관련된 몇몇 특수한 기능을 효율적으로 지원할 수 있으며, 질의의 결과 값을 XML 형태로 재생성하여 사용자에게 반환한다. 본 논문에서 제안하는 XSTAR 알고리즘은 현재 웹 상에서 공개적으로 시범 운용되고 있는 XML 문서의 관리 및 질의 처리 시스템인 XPERT(XML Query Processing Engine using Relational Technologies, http://dblab.kmu.ac.kr/project.jsp")의 질의 처리 엔진으로 사용되고 있다.

XML 문서의 효과적인 색인방법을 위한 Order-Array의 사용 (An Efficient Indexing Method For XML Documents Using Order-Array)

  • 김영;안찬민;박상호;박선;이주홍;전석주
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 추계학술발표논문집(상)
    • /
    • pp.77-80
    • /
    • 2004
  • 최근 XML은 전자상거래에서 의학, 국방, 법률 등의 전문분야에 이르기까지 많은 분야에서 활용되고 있으며, 데이터의 양 또한 방대해지고 있다. 따라서 대량의 XML 문서들을 효과적으로 저장하고 빠르게 검색할 수 있는 많은 인덱싱 기법들이 연구되고 있다. 최근의 인덱싱 기법들 중 Numbering Scheme 을 기반으로 한 인덱싱 기법들은 대부분의 검색에 우수한 성능을 보이나 하위노드의 수가 늘어나면 검색 오버헤드가 커질 수 있으며, 대량의 XML 문서의 추가 삽입 및 구조가 다른 XML 문서의 삽입시에 인덱스와 데이터 값의 재조정에 따른 많은 비용이 발생하게 된다. 이에 우리는 Numbering Scheme 을 기반으로 하지만, 각 노드별로 노드범위(Node-Range)와 Order-Array를 추가하여 검색성능을 향상시키고 대량의 XML 문서의 삽입 및 구조가 다른 XML 문서의 삽입시에 발생되는 문제를 해결하고자 한다.

  • PDF

Dewey order기법을 이용한 RBDMS 환경에서의 XQuery 질의 처리기 설계 및 구현 (Design and Implementation of XQuery Processor on the RDBMS using Dewey order)

  • 정민경;홍동권
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.3-6
    • /
    • 2005
  • 본 논문에서는 Deway order기법을 이용하여 관계형 데이터베이스 환경에서 효율적으로 XML 문서를 저장, 검색, 결과값을 반환하기 위한 XQuery 질의 처리기를 설계하고 구현한다. 우선 첫 번째로 dewey order기법을 이용하여 XML문서를 저장하기 위한 색인 모델을 관계형 데이터 베이스에 설계하고 XML문서를 저장한다. 두 번째로 이를 기반으로 XML 전문검색 언어인 XPath식을 SQL로 변환하는 전체적인 알고리즘을 제시한다. 세 번째로 위에서 변환된 SQL문의 질의 결과값을 처 음에 저장될 당시의 XML문서의 형태와 Text를 그대로 유지하면서 사용자에게 반환하는 알고리즘을 제시한다. 이 부분은 기존의 발표된 논문에서는 좀처럼 보기 드문 내용으로 XQuery에 포함되는 다양 한 형태의 Xpath식을 SQL문으로 변환할 수 있는 정확한 방법 뿐만 아니라 각각 한번의 질의로 얻고 하는 엘리먼트들과 어트리뷰트들을 찾아 XML문서 그대로 출력하는 방법에 초점을 두어 본 논문을 기 술한다. 마지막으로 이를 실제로 구현하고 Test한 결과를 바탕으로 Dewey order기법을 이용하여 XML 색인 모델을 설계 할 경우 SQL문으로 변환하여 질의를 처리하는 측면에서나 질의한 결과값을 XML문서 형태로 반환하는 측면에서나 이 기법을 사용하지 않는 Local order방식보다 성능이 훨씬 우수하다라는 결론을 제시한다.

  • PDF

XML을 이용한 의상 피스 정보의 구조적 문서 생성 및 탐색을 위한 색인기법에 관한 연구 (A Study on Fashion Pieces Goods Information Indexing and Searching Structured Documents Using XML)

  • 조진애;양옥렬;남명우;이용주;정성태;정석태;이원아
    • 한국산학기술학회논문지
    • /
    • 제7권1호
    • /
    • pp.39-45
    • /
    • 2006
  • 본 연구는 웹기반 3차원 패션몰 구축에서 의류에 대한 정보를 보다 세부적이고 전문적인 정보로 제공하기 위하여 의상 정보를 2차원 재단 패턴의 피스(piece) 정보로 구분한다. 구분된 피스는 의상에 따라 상하종속관계에 해당하는 피스정보별 상세정보를 가중치에 따라 검색하여 SVG(Scalable Vector Graphics) 파일 형태로 제공하도록 설계하였다. 이러한 의상 상세정보를 통해 디자이너가 의상구조의 다양한 조합으로 새로운 제품 디자인이 용이해지고 유사한 형태의 의상 표현이 가능해진다. 이를 통해 패션몰 상품에 대한 전문가적인 의상 분석도 가능해진다. 또한 SVG 형식의 파일을 이용하기 때문에 부하가 많은 쇼핑몰의 정보 표현에도 용이하다. 이를 위해 구축된 정보는 XML로 표준화 할 수 있도록 DTD(Document Type Definition)를 정의하여 검색 시스템을 설계하였다.

  • PDF

시각적 XML 문서 편집기 구현 (An implementation of Visual XML Document Editor)

  • 황현숙;오지훈;최병규;전양승;한성국
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (3)
    • /
    • pp.169-171
    • /
    • 2004
  • XML은 어떠한 정보든지 구조화할 수 있으며, 데이터와 스타일 정보를 철저히 분리함으로써 컴퓨터가 처리할 수 있는 메타데이터를 제공하여 정보검색의 정확성을 높이는 획기적인 계기를 마련하였다. XML 데이터와 스타일의 분리를 위해 XML 기반의 문서를 표현하기 위한 스타일시트인 XSLT가 제안되었지만, 이는 전문적인 지식이 없는 일반인이 사용하기에 매우 어려울 뿐만 아니라, 작성하는데도 많은 시간과 비용이 필요하다. 이에 대한 대안으로 현재 XSLT 문서 편집 시스템이 상용화되어 출시되고 있지만. 사용이 너무 복잡하고 어려워 문서 편집 시스템의 요구조건을 충족하기에는 미흡하다. 이에 본 논문에서는 일반인도 쉽게 XML 기반의 문서 구조와 스타일시트를 생성할 수 있는 시각적 환경 기반의 XMㄴ 기반 문서 편집 시스템을 구현하고, 이를 실제 적용하여 기존 시스템과의 성능 평가를 통해 시스템의 성능을 검증하였다. 또한 문서 구조에 따른 데이터베이스 테이블을 동적으로 생성하여 XML 기반 문서 관리의 효용성을 다각도로 제시하였다.

  • PDF

XML을 이용한 웹 문서 수집기 설계 및 구현 (Design and implementation of web-robot using XML)

  • 이새벽;임희석
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2008년도 추계학술발표논문집
    • /
    • pp.49-52
    • /
    • 2008
  • 웹2.0, RIA(Rich Internet Application)의 발전으로 웹 기반 서비스가 다양해지고 기존의 응용프로그램 역시 웹 기반 인터페이스로 제공되면서 사용자 또한 단순 사용자가 아닌 서비스를 제공하는 컨슈머(Consumer)의 형태가 되었다. 따라서 웹 문서는 더욱 방대해 지고 검색, 분류, 색인 등을 위해서 웹문서의 수집이 새로운 형태로 필요하게 되었다. 그러나 기존의 데이터베이스 사용 방법이나, 문서의 전문을 파일형식으로 저장하는 방법은 웹문서를 이용하여 다양한 컨텐츠를 제공하기에 적합하지 않다. 그러므로 본 연구는 웹 문서를 파싱(Parsing)하여 필요한 부분을 XML파일 형태로 저장하여, 재사용성을 높이는데 초점을 맞추어 HTML을 파싱하고 자동으로 임의의 파일을 수집하는 문서수집기를 구현하게 되었다.

  • PDF

디지털 도서관 콘텐츠 관리를 위한 KORMARC/EAD 통합시스템 구현 (Implementation of a KORMARC/EAD integrated system for the Myongji Digital Library Collections)

  • 김현희
    • 한국기록관리학회지
    • /
    • 제2권1호
    • /
    • pp.119-131
    • /
    • 2002
  • 본 연구는 디지털도서관 콘텐츠를 관리할 KORMARC/EAD 통합시스템을 설계하고 구현하였다. 본 연 구의 목적은 명지대학 디지털도서관의 국제한국학 콜렉션과 단행본을 관리할 메타데이터를 설계하고 아울러 기록물정보관리의 모형 구축을 위한 기초 자료를 제시하는 것을 목적으로 한다. 메타데이터를 설계하기 위해서 기록물의 목록 규칙과 관련된 네 가지 종류의 자료 즉 국제표준기록물기술[ISAD(G)], 미국 기록물/필사본 기계가독목록(USMARC AMC), EAD 및 Ebind를 참조하였다. 시스템은 검색 모드와 입력 모드로 구성된다. 검색은 KORMARC를 이용하여 단행본과 콜렉션을 통합 검색할 수 있으며 콜렉션인 경우 링크를 통해서 EAD/XML을 활용한 인벤토리로 연결된다. 인벤토리는 기록물에 대한 상세 정보 뿐 아니라 PDF 형식의 전문 이미지 데이터를 제공하며 단행본인 경우 KORMARC 의 856 태그를 이용하여 전문 이미지 데이터를 제공한다. 입력 모드는 목록과 인벤토리 정보를 입력할 수 있는 스크린을 제공한다. 시스템에 대한 이용자 만족도, 시스템의 개선점 및 향후 콜렉션을 포함한 다양한 기록물 관리 시스템을 구현하기 위한 기초 자료를 얻기 위하여 설문지를 이용하여 시스템을 평가해 보았다. 평가 분석 결과는 향후 시스템을 갱신할 때 활용할 수 있도록 정리하였고, 제안된 시스템이 좀 더 개선되기 위한 방안 세가지를 끝으로 제시하였다.