• 제목/요약/키워드: 질의필터링

검색결과 134건 처리시간 0.028초

역 인덱스를 사용한 스트리밍 XML 필터링 기법 (Streaming XML Filtering Technique using Inverted Index)

  • 이경한;박석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.4-6
    • /
    • 2005
  • 스트리밍 XML 필터링 기법은 사용자가 등록한 질의를 만족하는 XML 문서를 찾아 사용자에게 XML 문서의 복사본을 돌러주는 것을 목적하고 있다. 본 연구는 Xfiiter와는 차별된 방법으로 역 인덱스를 사용하여 Xfilter처럼 역 인덱스가 XML 필터링 동안 동적으로 변하는 특성을 제거한다. 또한 늦은 질의 삭제 전략을 이용함으로써 질의 삭제 시간을 $50\%$ 이상 줄인다. 따라서 본 기법은 Xfilter에 비해 적은 필터링 시간과 질의 추가/삭제 시간을 보여준다. 또한 역 인덱스를 사용한 기법들의 제한점을 Yfilter와 비교하여 보여 준다.

  • PDF

XML 필터링을 위한 WFilter(Weighted Filter) (WFilter (Weighted Filter) for XML filtering)

  • 최정필;최오훈;백두권
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (3)
    • /
    • pp.253-255
    • /
    • 2003
  • XML 문서를 비롯하여 인터넷을 통해 교환되는 문서의 비약적인 증가로 인하여, 불필요한 문서에 대한 필터링 및 문서 내의 데이터를 필터링하여 정보를 선택적으로 사용하고자 하는 사용자의 요구가 증대되었다. 기존 XML 필터링 방식은 질의 구조에 의존적이기 때문에, 질의 증가에 따른 필터링 인덱스 구성 및 유지의 문제점을 야기할 수 있다. 본 논문에서는 정보 추출 분야에서 널리 사용되는 단어 벡터의 개념을 사용하여 선택적으로 질의에 가중치를 주어 데이터를 효율적으로 추출할 수 있는 XML WFilter (Weighted Filtering) 기법을 제안한다.

  • PDF

사건트래킹과 정보필터링 기법의 사건검색 성능 비교연구 (A Comparative Study on the Event-Retrieval Performances of Event Tracking and Information Filtering)

  • 정영미;장지은
    • 정보관리학회지
    • /
    • 제20권3호
    • /
    • pp.111-127
    • /
    • 2003
  • 이 연구의 목적은 사건을 연구대상으로 하는 사건트래킹 기법이 과연 최신 사건 정보를 검색함에 있어 기존의 정보필터링 기법보다 성능이 우수한가를 살펴보는 데 있다. 따라서 이 연구에서는 특정 사건에 관한 최신 기사를 보다 효과적으로 검색하여 제공하는 기법을 찾아내기 위하여 kNN(k-Nearest Neighbors) 분류기를 응용한 사건트래킹 기법과 질의기반 정보필터링 기법을 사용하여 사건검색 실험을 수행한 후 두 기법의 검색 성능을 비교하였다. 사건트래킹 실험은 초기의 고정 학습문서 집합을 사용한 사건트래킹과 트래킹 과정에서 변화하는 동적 학습문서 집합을 사용한 사건트래킹의 두 가지 방법으로 수행되었다. 정보필터링 실험도 초기질의를 사용한 정보 필터링과 필터링 과정에서 계속 수정되는 질의를 사용한 정보필터링의 두 가지 방법으로 수행되었다. 실험 결과 사건트래킹 기법에서는 고정 학습문서 집합을 사용한 경우가 동적 학습문서 집합을 사용한 경우보다 더 우수한 성능을 보였으며, 정보필터링 기법에서는 초기질의를 사용한 경우가 수정질의를 사용한 경우보다 더 좋은 성능을 보였다. 또한 고정 학습문서 집합을 사용한 사건트래킹과 초기질의를 사용한 정보필터링을 비교한 결과 정보필터링 기법이 사건트래킹 기법에 비해 더 좋은 사건검색 성능을 보이는 것으로 나타났다.

생성된 질의응답 간 일관성을 이용한 자연어 질의 생성 (Natural question generation based on consistency between generated questions and answers)

  • 이재홍;조휘열;인수교;김성주;문기윤;민태홍;김경덕
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.109-114
    • /
    • 2022
  • 질의 생성 모델은 스마트 스피커, 챗봇, QA 시스템, 기계 독해 등 다양한 서비스에 사용되고 있다. 모델을 다양한 서비스에 잘 적용하기 위해서는 사용자들의 실제 질의 특성을 반영한 자연스러운 질의를 만드는 것이 중요하다. 본 논문에서는 사용자 질의 특성을 반영한 간결하고 자연스러운 질의 자동 생성 모델을 소개한다. 제안 모델은 topic 키워드를 통해 모델에게 생성 자유도를 주었으며, 키워드형 질의→자연어 질의→응답으로 연결되는 chain-of-thought 형태의 다중 출력 구조를 통해 인과관계를 고려한 결과를 만들도록 했다. 최종적으로 MRC 필터링과 일관성 필터링을 통해 고품질 질의를 선별했다. 베이스라인 모델과 비교해 제안 모델은 질의의 유효성을 크게 높일 수 있었다.

  • PDF

모바일 P2P 네트워크에서 효율적인 스카이라인 질의처리를 위한 필터링 기법 (Filtering Method for Efficient Skyline Query Processing in Mobile P2P Network)

  • 박선용;임종태;이석희;복경수;유재수
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2015년도 춘계 종합학술대회 논문집
    • /
    • pp.35-36
    • /
    • 2015
  • 본 논문에서는 모바일 P2P 네트워크에서 스카이라인 질의 처리를 위한 새로운 필터링 기법을 제안한다. 제안하는 기법에서는 질의처리 이전에 스카이라인 처리를 통해 필터링 객체 셋을 생성하기 위해 피어 간 데이터 배포를 수행한다. 생성된 필터링 객체를 활용하여 질의에 참여하는 객체 중 불필요한 객체를 필터링한다. 사전 스카이라인 처리를 통해 효율적인 질의처리를 수행할 수 있다.

  • PDF

고정 그리드 인덱싱에서 공간과 시간 필터링을 이용한 범위 질의 처리 (Range Query Processing using Space and Time Filtering in Fixed Grid Indexing)

  • 전세길;나연묵
    • 정보처리학회논문지D
    • /
    • 제11D권4호
    • /
    • pp.835-844
    • /
    • 2004
  • 최근 들어 이동 통신 분야에서 이동하는 고객을 위한 위치 기반 서비스가 중요한 서비스로 부각되고 있다. 이동객체 응용의 경우 갱신 연산이 많고, 부하가 특정 지역에 집중되는 특징이 있다. 윈도우 나 원형 형태의 범위질의는 위치 기반 서비스에서 중요한 질의 중 하나이다. 이러한 범위질의에서는 부분 포함된 셀과 완전 포함된 셀을 구분해야할 필요가 있다. 또한 올바른 한정된 객체를 골라내기 위해 시간 영역을 고려할 필요성이 있다. 본 논문에서는 갱신연산을 최소화하기 위해 고안되어진 2번째 단계에 고정 그리드 구조를 적용한 2단계 인덱스 구조를 적용한다. VP 필터링과 윈도우 셀 필터링 기법을 이용한 공간 셀 필터링 기법과 Time Zone 개념을 사용하여 시공간 개념이 결합된 필터링 기법을 제안한다. 제안된 방법의 성능 측정을 위해서 다른 필터링 조합을 가지고 다양한 윈도우 질의와 원 질의에 대해서 실험 결과를 보인다.

고정 그리드 인덱싱에서 VP 필터링을 이용한 범위 질의 처리 (Range Query Processing using VP Filtering in Fixed Grid Index Structures)

  • 전세길;나연묵
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (하)
    • /
    • pp.1531-1534
    • /
    • 2003
  • 최근 들어 이동 통신 서비스에서 이동하는 고객의 위치 정보와 관련된 서비스가 중요한 서비스로 부각되고 있다. 이동객체의 경우 갱신 연산이 많고, 부하가 특정 지역에 집중되는 특징이 있다. 이러한 위치 기반 서비스에서 범위질의는 중요한 질의 중 하나이다. 범위 질의는 윈도우나 원 형태로 수행되는데 윈도우의 경우에는 질의 범위 밖에 해당하는 객체를 쉽게 필터링 할 수 있는 반면 원 형태일 경우에는 대부분의 경우 거리 계산을 해야 하는 불편함이 있다. 본 논문에서는 객체의 위치 갱신 연산에 따른 인덱스 구조의 변화를 최소화하기 위해 고정 그리드 방식을 사용하고 VP 필터링 기법을 적용하여 원 범위 질의에서 범위 밖의 객체를 필터링하기 위한 방법을 제시한다.

  • PDF

RFID 미들웨어를 위한 질의 색인 기법에 관한 연구 (A Study of Query Indexing Scheme for RFID Middleware)

  • 박재관;홍봉희
    • 한국공간정보시스템학회:학술대회논문집
    • /
    • 한국공간정보시스템학회 2005년도 추계학술대회
    • /
    • pp.155-160
    • /
    • 2005
  • 최근 이동체 또는 센서 데이터에 대한 연속 질의를 처리하기 위해 다양한 질의 색인 기법들이 연구되고 있다. 그러나 RFID 미들웨어는 이전 연구에서 고려되지 않은 특징이 존재한다. 첫째, 질의 색인에 삽입되는 질의는 Industry, Product, Serial의 세 부분으로 구성되며, 각 값은 범위 값으로 표현될 수 있기 때문에 색인 공간에서 비연속적인 간격의 조각들이 반복해서 나타난다. 둘째, TagID가 가지는 Industry, Product, Serial의 값은 포함관계를 가진다. 즉, 하나의 Industry에 여러 Product가 존재하며, 하나의 Product에 여러 Serial Item이 존재한다. 따라서 이러한 특징을 고려하지 못하는 기존의 질의 색인을 적용하면 다수의 질의 조각을 삽입하게 되어 색인의 성능이 급격히 저하되는 문제점이 있다. 이 논문에서는 RFID 미들웨어의 실시간 필터링 및 컬렉션을 위해서 Tag 스트림에 대한 질의 색인 기법을 제안한다. 이 논문은 ECSpec 필터링 범위의 3단계 계층구조 특징을 고려한 코드 분할(Code Segmented) 도메인을 제시하고 이를 위한 그리드 기반 색인 구조를 제안한다. 또한 ECSpec의 필터링 패턴 특징에 의해 나타나는 질의 조각의 반복 현상을 정의하고 이를 위한 질의 처리 기법을 제시한다.

  • PDF

R-tree 계열의 인덱싱 구조에서의 효율적 질의 처리를 위한 VP 필터링 (VP Filtering for Efficient Query Processing in R-tree Variants Index Structures)

  • 김병곤;이재호;임해철
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권6호
    • /
    • pp.453-463
    • /
    • 2002
  • 정보사회가 인터넷의 보급과 더불어 복잡해짐에 따라 데이타베이스의 흐름은 문자나 숫자와 같은 일차원적인 데이타가 아닌 지리정보, 멀티미디어 데이타와 같은 다차원의 데이타를 저장하고 이에 대한 질의를 처리할 수 있는 시스템을 요구하고 있다 따라서, 다차원적인 특성을 지니는 데이타에 대한 효율적 검색을 위한 다차원 인덱싱 구조에 대한 연구가 활발히 진행되어 왔으며, 그와 동시에 이러한 인덱싱 구조하에서 효율적인 질의 처리를 위한 연구도 병행되고 있다. 다차원 데이타는 그 다양한 응용분야에 따라 요구되는 질의의 형태가 각각 다르므로 이에 대응할 수 있는 알고리즘의 연구가 필요하다. 현재, 많은 다차원 데이타 처리 시스템이 R-트리계열의 인덱싱구조를 근간으로 구성되었으나, 현재까지의 질의처리 기법은 질의처리시에 필터링 특성을 지니지 않으므로, 객체들간의 다차원 거리계산으로 인하여 많은 질의처리 시간을 소요한다. 본 논문에서는 다차원 데이타를 처리하기 위한 R-트리 계열의 다차원 인덱싱 구조에서의 효율적인 질의처리를 위하여 질의처리 대상 객체를 줄이기 위한 필터링 기법을 소개하였다. 필터링을 수행하기 위하여 VP-트리와 MVP-트리에서 사용되었던 VP(Vantage Point)를 이용한다. 먼저, VP 필터링의 개념을 소개하고, VP 필터링을 영역질의와 포인트 질의의 일종인 추가객체요구질의에 각각 적용한 알고리즘을 제시하였다. VP 필터링을 적용하기 위하여 요구되는 삽입 객체와 VP간의 거리계산 시간은 객체의 삽입시 수행되며, 질의 처리를 수행할 때에는 다시 계산되지 않는다. 논문에서는 제안된 알고리즘의 효율성을 실험을 통하여 증명하였다.

XML 필터링 질의의 효율적 처리를 위한 이차원 그룹핑 색인기법 (Two-Dimensional Grouping Index for Efficient Processing of XML Filtering Queries)

  • 여대휘;이종학
    • 정보화연구
    • /
    • 제10권1호
    • /
    • pp.123-135
    • /
    • 2013
  • 본 논문에서는 XML 필터링 질의의 효율적 처리를 위한 이차원 그룹핑 색인기법인 2DG-index를 제안한다. 최근 XML데이터의 질의 처리를 위해 조상-후손관계 또는 부모-자식관계 등의 구조적 관계를 효율적으로 처리하기 위한 많은 연구들이 수행되었다. 그러나 이러한 연구들은 경로 질의에만 초점을 두고 있으며 특정 조건 값을 포함하는 필터링 질의에 대해서는 고려하지 않고 있다. 2DGindex는 필터링 질의를 효율적으로 처리하기 위한 방안으로 XML 스키마의 경로 도메인과 필터링 데이터 값의 도메인으로 구성된 이차원 도메인 공간상의 색인 엔트리들의 클러스터링을 다루는 색인기법이다. 2DG-index의 성능평가를 위하여 특정 조건 값을 포함하는 질의의 유형을 세 가지로 분류하고, 이러한 질의 유형별로 2DG-index의 질의처리 성능을 기존의 일차원 색인구조를 이용하는 색인기법인 데이터 값별로 그룹핑한 DG-index와 경로별로 그룹핑한 PG-index와 비교하여 2DG-inedx의 효율성을 입증한다.