• 제목/요약/키워드: XML 데이터 필터링

검색결과 18건 처리시간 0.024초

XML 필터링을 위한 WFilter(Weighted Filter) (WFilter (Weighted Filter) for XML filtering)

  • 최정필;최오훈;백두권
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (3)
    • /
    • pp.253-255
    • /
    • 2003
  • XML 문서를 비롯하여 인터넷을 통해 교환되는 문서의 비약적인 증가로 인하여, 불필요한 문서에 대한 필터링 및 문서 내의 데이터를 필터링하여 정보를 선택적으로 사용하고자 하는 사용자의 요구가 증대되었다. 기존 XML 필터링 방식은 질의 구조에 의존적이기 때문에, 질의 증가에 따른 필터링 인덱스 구성 및 유지의 문제점을 야기할 수 있다. 본 논문에서는 정보 추출 분야에서 널리 사용되는 단어 벡터의 개념을 사용하여 선택적으로 질의에 가중치를 주어 데이터를 효율적으로 추출할 수 있는 XML WFilter (Weighted Filtering) 기법을 제안한다.

  • PDF

XML 필터링 질의의 효율적 처리를 위한 이차원 그룹핑 색인기법 (Two-Dimensional Grouping Index for Efficient Processing of XML Filtering Queries)

  • 여대휘;이종학
    • 정보화연구
    • /
    • 제10권1호
    • /
    • pp.123-135
    • /
    • 2013
  • 본 논문에서는 XML 필터링 질의의 효율적 처리를 위한 이차원 그룹핑 색인기법인 2DG-index를 제안한다. 최근 XML데이터의 질의 처리를 위해 조상-후손관계 또는 부모-자식관계 등의 구조적 관계를 효율적으로 처리하기 위한 많은 연구들이 수행되었다. 그러나 이러한 연구들은 경로 질의에만 초점을 두고 있으며 특정 조건 값을 포함하는 필터링 질의에 대해서는 고려하지 않고 있다. 2DGindex는 필터링 질의를 효율적으로 처리하기 위한 방안으로 XML 스키마의 경로 도메인과 필터링 데이터 값의 도메인으로 구성된 이차원 도메인 공간상의 색인 엔트리들의 클러스터링을 다루는 색인기법이다. 2DG-index의 성능평가를 위하여 특정 조건 값을 포함하는 질의의 유형을 세 가지로 분류하고, 이러한 질의 유형별로 2DG-index의 질의처리 성능을 기존의 일차원 색인구조를 이용하는 색인기법인 데이터 값별로 그룹핑한 DG-index와 경로별로 그룹핑한 PG-index와 비교하여 2DG-inedx의 효율성을 입증한다.

NFA 표현을 사용한 문서-중심적 XML의 키워드 기반 필터링 기법 (A Keyword-based Filtering Technique of Document-centric XML using NFA Representation)

  • 이경한;박석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (C)
    • /
    • pp.25-27
    • /
    • 2006
  • XPath 명세는 XML 원소 내용을 필터링하기 위한 질의어 작성이 어렵다. 본 논문은 이러한 문제점을 해결하기 위해 SQL의 LIKE 연산자에서 사용되던 특별한 매칭 문자 '%' 를 허용한 확장된 XPath 명세와 그것을 표준 질의어로 사용하는 문서-중심적 XML 필터링 기법인 Pfilter를 제안한다. Pfilter는 값-기반 술어(value-based predicate)에서 피연산자의 공통 앞부분 문자를 공유하여 값-기반 술어의 처리 성능을 향상시킨다. 또한 본 논문은 Pfilter와 대표적인 데이터-중심적 XML 필터링 기법인 Yfilter를 값-기반 술어 처리의 확장성과 효율성에 대해 비교하고 Pfilter의 값-기반 술어 삽입, 삭제, 처리 결과를 제공한다.

  • PDF

실시간 RFID 미들웨어시스템에서의 동기화를 고려한 필터링관리 기법의 설계 및 구현 (Design and Implementation of Filtering Management Scheme for Synchronization in the Realtime RFID Middleware System)

  • 박병섭
    • 한국콘텐츠학회논문지
    • /
    • 제7권8호
    • /
    • pp.50-58
    • /
    • 2007
  • 본 논문은 대용량 데이터 처리를 위한 실시간 RFID 미들웨어 시스템에서 요구되는 태그 데이터의 필터링 엔진의 동기화를 고려한 필터링 관리기법을 다루고 있다. 응용인터페이스는 HTTP, XML, JMS, SOAP 등의 이는 다양한 프로토콜을 지원하여 다양한 플랫폼에서 본 미들웨어 시스템을 접근하도록 개발되었다. 일반적으로, 필터를 제어하는 클라이언트가 다수가 되는 환경에서 하나의 필터링 화일을 접근하면 동기화 문제가 발생한다. 본 논문에서는 필터 관리프로세스를 통해 동기화를 고려하면서 필터링을 관리하는 기법을 설계하고 구현하였으며, 이를 RFID 미들웨어의 동작 통해 검증한다.

SemFilter: 단순하며 효율적인 시맨틱 XML 메시지 필터링 (SemFilter: A Simple and Efficient Semantic XML Message Filtering)

  • 김재훈;박석
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권7호
    • /
    • pp.680-693
    • /
    • 2008
  • XML 메시지 필터링에 관한 최근의 연구들은 모든 출판되는 데이타 소스들이 필터링 시스템에 정의된 유일한 전역 스키마를 따르는 것을 가정한다. 하지만 이러한 가정을 넘어서, 데이타 제공자들이 그들 자신의 스키마를 자유롭게 사용할 수 있는 서비스를 고려할 수 있다. 즉, 데이타 소스들이 이질적인 환경이다. 하지만 XML 필터링 시스템에서 데이타 소스는 다수이며, 또한 출판되는 데이타들은 수시로 생성되고, 갱신되며, 사라진다. 즉, 매우 다이내믹한 환경이다. 본 논문에서는 그러한 다이내믹한 환경을 고려하여 고안된 단순하며 효율적인 의미적 XPath 질의 번역 구현을 소개한다. 특별히 제안되는 질의 번역 기법은 어떤 비주얼한 데이타 가이드가 제공되지 않는 환경에서 사용자가 자신의 지식과 경험에만 의존하여 작성한 질의를 번역하는 것에 초점을 맞춘다. 이러한 환경에서, 사용자는 다수의 이질적인 데이타를 질의하기 때문에, 사용자의 기억상의 스키마에 의존하여 작성된 질의는 실제 스키마와 불일치할 수 있다. 본 연구에서는 제안하는 의미적 XPath 질의 기법이 이러한 문제를 고려하도록 설계한다. 몇 가지 실험 결과는 제안된 질의 번역 기법이 수용할 만한 질의 번역시간을 제공하며, 기존의 방법과 비교하여 실제적임을 보여 준다.

XML을 이용한 MPEG-7 내용기반 검색 시스템 (MPEG-7 Content-Based Retrieval System using XML)

  • 조철범;박만곤
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2004년도 춘계학술발표대회논문집
    • /
    • pp.632-635
    • /
    • 2004
  • 디지털 정보기술의 급속한 발전과 고속 네트워크의 보급으로 멀티미디어 데이터가 급격하게 늘어나고 있다. 이러한 데이터들을 빠르고 정확하게 검색하기 위하여 가장 중요한 기반이 되는 것이 데이터의 적절한 표현이다. 최근 최종화 단계를 거친 MPEG-7은 멀티미디어 데이터에 대한 구조화 및 의미 정보를 제공함으로써 효율적인 검색과 필터링을 가능하게 하는 멀티미디어 데이터의 표현에 대한 표준화를 다루고 있다. 본논문에서는 MPEG-7의 표준화와 내용기반 검색 시스템을 소개하고 MPEG-7의 비주얼 기술자를 내용 정보 간의 상호 연관성을 표현하기에 적합한 XML로 구조화 하여 효과 적인 검색이 가능한 내용기반 검색 시스템을 제안한다.

  • PDF

CXQuery 를 이용한 XML 스트리밍 데이터 필터링 (XML Streaming Data Filtering using CXQuery)

  • 김소라;이월영;용환승
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 추계학술발표대회 및 정기총회
    • /
    • pp.117-120
    • /
    • 2005
  • XML 은 환경에 독립적인 특징으로 인하여 다양한 환경에서 데이터 교환을 위한 표준으로서 자리잡아가고 있다. 특히 분산 환경에서 스트림 데이터들도 XML 을 이용하여 표현되고 있는데 이러한 데이터에 대해 기존의 질의 언어를 사용하여 질의하기 위해서는 사용자들은 XML 문서의 구조를 알아야 하고, 같은 질의의 내용일지라도 XML 문서의 DTD 가 다르게 되면 사용자는 상이한 DTD 에 대해서 모두 다른 질의문을 작성하여야 한다. 이러한 사용자들의 불편함을 없애기 위하여 사용자에게 XML 문서의 구조에 대해서 고려 하지 않아도 검색할 수 있는 CXQuery 의 개념을 도입하여 스트리밍 XML 데이터를 효과적으로 처리할 수 있는 질의 처리 시스템을 구현하였다.

  • PDF

PrimeFilter: 소수 인덱싱 기법에 기반한 효율적 XML 데이타 필터링 (PrimeFilter: An Efficient XML Data Filtering based on Prime Number Indexing)

  • 김재훈;김상욱;박석
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제35권5호
    • /
    • pp.421-431
    • /
    • 2008
  • 최근 이질적인 시스템 사이에서의 정보교환의 표준으로 널리 사용되는 XML을 사용하는 Publish/Subscribe 시스템의 스트리밍 XML 데이타 필터링 기법이 활발히 연구되었다. 스트리밍 XML 데이타 필터링 기법은 사용자가 등록한 질의에 대해서 신속한 질의-데이타 매칭을 목적으로 하기 때문에 효율적인 질의 처리 메커니즘이 요구된다. 현재까지 대부분의 연구는 질의 경로 표현식의 부분적인 공유를 꾀하거나 프레디킷을 효율적으로 처리함으로써 질의 처리의 시간적, 공간적 효율을 목적으로 하였다. 하지만 만약 질의간의 포함 관계를 알 수 있다면 질의 처리시에 가장 하위의 질의가 매칭되면 그 질의를 포함하고 있는 상위의 질의들은 별도의 처리 과정 없이 매칭됨을 알 수 있게 된다. 이러한 질의 포함 관계를 이용한 질의 처리 방식은 XML 스트리밍 데이타를 처리하는 또 하나의 효율적 방식이 될 수 있다. 본 논문에서는 소수 인덱싱 기법과 목표 질의 노드 중심의 포함 관계 설정에 기반하여 효율적인 스트리밍 XML 데이타 필터링을 수행하는 새로운 방법을 소개한다. 그리고 몇 가지 실험을 통하여 기존 방법과의 비교 분석 및 효율성을 보인다. 비록 각각의 실험은 서로 다른 실험 요소에 대하여 수행되었지만, 모두 제안 방법이 기존의 방법보다 두 배 이상 더 나은 성능을 가짐을 보여 주었다.

협력적 가상환경을 위한 내용기반 동적 이벤트 통지시스템 (Content-Based Dynamic Event Notification System for Collaborative Virtual Environment)

  • 장진윤;탁진현;이세훈;왕창종
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.408-410
    • /
    • 2000
  • 이 논문에서는 협력적 가상환경에서 이벤트의 내용에 기반한 동적 이벤트 통지 시스템을 제안한다. 제안된 시스템은 이벤트 송신자와 수신자 사이에 투명성을 제공하며, 다른 시스템에 영향을 주지 않고, 이벤트 수신자를 동적으로 추가, 삭제할 수 있는 노티파이어 모델을 구성한다. 시스템은 기본적인 이벤트 형태들을 정의하고, 다른 환경을 구성하고 있는 특정 응용에 독립적으로 동작하도록 하기 위해서 이벤트들을 XML로 표현한다. 본 시스템은 XML을 사용하여 이벤트를 표현하기 때문에 발생된 이벤트를 로그데이터에 저장할 수 있고, 로그 데이터를 사용하여 이벤트들을 검색하고 필터링할 수 있도록 하여 시스템의 효율성을 향상시켰다. 또한 사용자로 하여금 관심있는 이벤트들을 등록할 수 있도록 하여 필터링의 효율을 높였으며 XML 기반 애플리케이션뿐만 아니라 다른 가상환경의 애플리케이션들 사이의 상호 작용을 가능하게 하는 이벤트 통지 시스템을 설계하였다.

  • PDF

트리 데이터에서 연관규칙 추출을 위한 서브트리 마이닝 (Subtree Mining to extract Association rules from Tree Data)

  • 강우준;신준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 추계학술발표대회
    • /
    • pp.317-320
    • /
    • 2006
  • XML 트리 데이터들로부터 빈번 서브 트리들을 추출하는 기존 방법들은 복잡하고 다수의 입력데이터 스캐닝을 필요로 할 뿐만 아니라 빈번 서브 트리를 구하기 위해 에지 하나하나의 조인 작업을 필요로 하였다. 이는 결과적으로 많은 수행 시간을 요한다. 본 논문에서는 트리데이터를 레벨 별로 나누고 이를 마치 채로 거르듯이 필터링하여 특정 수치 이상의 출현 횟수를 가지는 노드들만을 남겨 빠르게 빈번한 서브 트리를 찾고, 이를 이용하여 XML 연관규칙들을 생성하는 방법을 제시한다. 제시된 방법을 위해서 PairSet 이라는 새로운 자료구조를 도입하였으며, 이를 이용하는 크로스필터링 알고리즘을 개발하여 제시하였다.

  • PDF