• 제목/요약/키워드: 질의클러스터링

검색결과 154건 처리시간 0.021초

효율적 공간 검색을 위한 새로운 색이 키 중복 기법 (A New Index Key Duplication method for Efficient Spatial Retrieval)

  • 이경모;이충호;김성희;배해영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.261-263
    • /
    • 1999
  • 공간 DBMS는 공간 데이터와 비공간 데이터를 서로 다른 물리적인 페이지에 저장한다. 공간 질의의 효율적인 처리를 위해 공간 데이터에 대한 공간 색인을 생성하며, 성능 향상을 위하여 이를 클러스터링 색인으로 사용한다. 그러나, 공간 데이터에 대한 클러스터링 성질이 비공간 데이터 페이지에는 반영되지 않아 공간 데이터와 비공간 데이터는 서로 다른 물리적 순서를 갖는다. 이로 인해 공간 조건(Spatial Predicate)에 의해 선택된 공간 데이터는 물리적 인접성을 가지는 반면, 비공간 데이터는 물리적 인접성을 갖지 않는다. 즉, 공간 질의 처리 과정에서 비공간 데이터 페이지의 잦은 디스크 I/O를 유발한다. 본 논문에서는 효율적 공간 검색을 위한 색인 키 중복 기법을 제안한다. 제안한 기법은 공간 데이터의 색인 기값을 비공간 데이터 내에 중복시키고 공간, 비공간 데이터에 대해 각각의 공간 클러스터링 색인을 생성한다. 두 클러스터링 색인에 의해 공간 데이터와 마찬가지로 비공간 데이터도 공간 조건에 대한 클러스터링 성질을 유지할 수 있다. 질의 처리 과정에서 공간 조건에 의해 선택된 공간 객체들은 공간, 비공간 데이터들 모두 물리적 인접성을 가지게 되며, 비공간 데이터 페이지에 대한 디스크 액세스 횟수를 줄여 공간 검색의 성능을 향상시킬수 있다.

  • PDF

관성을 이용한 이동체 데이터베이스의 디클러스터링 (Declustering of Moving object database based on Inertia)

  • 서영덕;김진덕;홍봉희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.734-736
    • /
    • 2003
  • 이동체의 궤적을 저장하는 대용량 이동체 DB는 대규모의 이동 객체 궤적의 효과적인 검색을 위하여 디클러스터링 기법을 통한 객체 궤적의 분산 배치가 필수적으로 요구된다. 그러나 기존 공간 객체의 디클러스터링 기법은 이동체의 특성과 시간 영역에 대한 고려 없이 디클러스터링을 수행한다. 또한, 단순히 현재 시점에서 색인 노드의 공간 관련성안을 판단의 근거로 삼고 있어서 효과적인 디클러스터링이 되지 않는 단점이 있다. 이러한 이유로 이동체 데이터베이스에서 빠른 질의 수행을 위한 디클러스터링 기법이 필요하다. 이 논문에서는 이동체 궤적에 대한 질의 시 빠른 응답 시간을 얻고 전제 시스템의 처리율 향상을 위한 디클러스터링 방법을 제시한다. 제시되는 방법은 이동체의 진행 방향에 대하여 이동 시간에 의한 이동 궤적의 관성을 정의하고, 이를 색인의 노드 단위로 확장한 노드의 관성을 정의한다. 정의된 관성을 이용하여 이동체 궤적의 노드가 저장될 디스크를 정의함으로써 궤적 데이터의 디클러스터링을 효과적으로 수행할 수 있다.

  • PDF

콘도르 정보 검색 시스템 (Information Retrieval System : Condor)

  • 박순철;안동언
    • 한국산업정보학회논문지
    • /
    • 제8권4호
    • /
    • pp.31-37
    • /
    • 2003
  • 본 연구는 다중어 질의어를 제공하는 대용량 정보검색 시스템, 콘도르에 대한 고찰이다. 이 시스템은 전북대학교, (주)서치라인, 그리고 카네기멜론 대학교가 컨소시엄 형태로 개발하였다. 이 시스템의 질의처리는 확률 모델을 기반하고 있으며 최근 정보검색 시스템에서 제공하는 문서 클러스터링 기능을 제공하고 있다. 특히 시스템의 특징은 다중어 질의어를 처리하고 질의를 중심으로 온라인으로 문서를 클러스터링하고 요약하는 것이다. 본 시스템은 이미 국내의 3,000만개 웹페이지에 대한 테스트를 마쳤으며 그 안정성을 확보하고 있다.

  • PDF

클러스터를 이용한 공간데이타 디클러스터링 (Declustering Spatial Objects by Clustering for Parallel Disks)

  • 곽지숙;김학철;이기준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.168-170
    • /
    • 1999
  • 지리정보시스템과 같은 공간 데이터베이스에서 다루는 데이터는 대용량이며, 사용자의 다양한 질의에 따라 빠르게 접근할 수 있어야 한다. 그런데 이때 성능의 대부분이 디스크 접근시간에 의해 영향을 받으므로 접근시간을 줄이는 기술이 필요하다. 이는 다수의 디스크 공간에 데이터를 분산하여 저장하는 디클러스터링 방법을 사용함으로써 효과적인 성능 향상을 기대할 수 있다. 효과적인 디클러스터링 방법은 주어진 질의에 대하여 동시에 접근될 가능성이 있는 공간 객체를 다른 디스크에 각각 저장함으로써 한번에 접근하는 병렬성을 높일 수 있다. 그러나 하나의 디스크에게 할당 가능한 공간 객체들을 서로 다른 디스크에 할당하는 것은 오히려 성능의 저하를 초래할 수 있다. 이러한 두 가지 조건을 동시에 만족하기 위해서는 공간 객체들을 클러스터링 한 후, 크러러스터 단위로 디스크로 할당하는 것이 효과적이다. 이전에 제시된 디클러스터링 방법들은 이러한 요소를 고려하지 않았다. 이에 본 논문에서는 주어진 공간 객체들에 대해서 일정한 크기의 클러스터를 만들고 클러스터 단위로 디클러스터링 하여 효율적인 성능 향상을 보이는 새로운 방법에 대해서 제시하고자 한다. 또한 이전에 제시되어졌던 여러 가지 디클러스터링 방법들과의 비교실험을 통해, 본 논문에서 제시한 방법이 가장 효과적인 방법임을 밝히고자 한다.

  • PDF

데이터 클러스터링 기법을 이용한 퍼지 질의 처리

  • 김태희;김선경
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 1997년도 춘계학술대회 발표논문집
    • /
    • pp.129-139
    • /
    • 1997
  • 다양한 실세계의 표현은 주관적인 의미가 내포되어 있어 데이터의 모델링 과정이 보다 중요하며 이 과정에서 데이터 손실을 최소화시켜야 한다. 이러한 성향의 모든 데이터를 수용하기위한 퍼지데이터베이스 시스템 구축시에는 데이터가 퍼지 집합으로 표현되어야 하고 불확실하고 다양한 형태의 질의가 가능하며 신뢰성 있는 응답 제시되어야 한다. 본 논문에서는 불활실함의 의미를 최대한 반영하여 표현을 다양화 시키고 사용자의 주관적인 인식수용을 위한 데이터의 개별화와 레벨의 다양화를 위한 클러스터링(clustering)기법을 보인다. 이를 통해 영역구조를 병합 분리시켜 데이터베이스의 릴레이션에서의 도메인요소의 첨가와 삭제를 통하여 자유로운 질의에 대한 불확실성이 감소된 응답과 융통성이 부여된 퍼지질의 처리를 보여준다.

이동 컴퓨팅 환경에서 위치 의존 질의에 적합한 선형 클러스터링을 이용한 브로드캐스팅 기법 (Using Linear Clustering for Broadcasting to support Location Dependent Query in Mobile Computing Environment)

  • 정일동;유영호;이중화;신지현;김경석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (1)
    • /
    • pp.241-243
    • /
    • 2001
  • 이동 컴퓨팅 환경에서 이동 호스트의 위치가 변함에 따라 그 의미가 달라지는 위치 의존 질의를 효과적으로 처리하기 위해서는 이동 호스트의 캐시 기법이 중요하지만, 위치 의존 질의를 효과적으로 지원할 수 있는 지구국의 브로드캐스팅 기법도 중요하다. 본 논문에서는 지구국이 담당하는 영역을 격자로 나누어 인덱싱한 데이터를 위치 의존 질의에 적합하도록 공간-채움 곡선을 이용해서 선형 클러스터링하여 구성 시간을 줄이는 브로드캐스팅 기법을 제안하고, 구성 시간을 포함시킨 이동 호스트의 활동 시간을 측정하여 그 성능을 비교한다.

  • PDF

질의응답문서 검색에서 문서구조를 이용한 질의재생성에 관한 연구 (Query Reconstruction for Searching QA Documents by Utilizing Structural Components)

  • 최상희;서은경
    • 정보관리학회지
    • /
    • 제23권2호
    • /
    • pp.229-243
    • /
    • 2006
  • 질의응답문서는 이용자가 입력한 질의, 질의설명, 답을 아는 다른 이용자가 제시한 응답으로 구성된 구조화된 문서로서, 최근 웹 문서처럼 검색이 일반적으로 일어나고 있는 정보원이다. 이 연구에서는 질의응답문서의 구조적 특성을 기반으로 질의를 재생성하여 질의응답문서의 검색효율을 향상시키고자 하였다. 질의재생성 실험에서 성능이 비교된 문서구조는 질의와 응답내용이다. 질의를 기반으로 질의를 재생성하는 방식에서는 질의응답검색 시스템에 입력되어 있는 유사질의를 활용하여 클러스터링하는 기법이 적용되었다. 응답정보를 기반으로 질의를 재생성하는 방식에서는 가장 유사한 기존 질의에 대해 응답된 내용에서 단락검색으로 적합한 문장들을 선정하여 활용하는 기법이 적용되었다. 실험 결과 응답정보를 활용하여 질의를 재생성하는 방식이 정확률은 유지하면서 더 다양한 검색결과를 제공하는 것으로 나타났다.

고차원 색인을 위한 효과적 클러스터링 기법 (Effective Clustering Method for High-Dimensional Indexes)

  • 신봉근;곽태영;최승락;이윤준;김명호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (1)
    • /
    • pp.247-249
    • /
    • 1998
  • 최근 들어 내용기반의 이미지 검색을 지원하기 위한 방법으로, 특징 벡터를 이용한 유사 질의 연구가 활발히 진행되고 있다. 이러한 유사 질의를 효율적으로 지원하기 위해서는 고차원 공간상에 존재하는 점 데이터나 공간 데이터를 효과적으로 색인할 수 있는 색인 기법이 필요하다. 하지만 R*-트리를 바탕으로 하는 기존의 방법들은 고차원 데이터에 대해서 차원의 증가함에 따라 검색 시간이 급격하게 증가하는 문제점을 안고 있다. 이러한 문제는 데이터의 클러스터링에 기반을 둔 기존의 방법들이 차원이 증가함에 따라 데이터를 제대로 클러스터링하지 못하기 때문에 발생하며, 따라서 이를 해결하기 위해서는 효과적인 클러스터링 기법이 필요하다. 본 논문에서는 하나의 최소 한계 영역(minimum bounding region)에 속하는 개체들의 응집 정도와 최소 한계 영역들간의 결합 정도를 고려하여 효과적으로 클러스터링하는 방안을 제안한다. 또한 이러한 클러스터링 기법을 수용하기 위한 색인 기법을 간략히 제시한다

요약 문서 기반 문서 클러스터링 (Document clustering based on summarized document using K-means algorithm)

  • 오형진;고지현;안동언;정성종
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (상)
    • /
    • pp.589-592
    • /
    • 2002
  • 정보검색 시스템에서 문서 클러스터링 기법은 사용자 질의에 대하여 검색된 문서를 문서간의 관련도에 따라 클러스터로 구성하고 사용자에게 검색 결과로 보여주는 것이다. 본 논문에서는 사용자의 질의에 대하여 검색된 문서를 자동 문서 요약기를 통해 얻은 요약 문서와 문서 전문을 문서들간의 유사도를 기반으로 동적으로 클러스터링 한다. 구현한 시스템의 클러스터링 효과를 검증한 결과 검색된 문서 전문을 클러스터링 한 방식에 비해 요약 문서를 클러스터링 한 방식이 정확률 측면에서 더 나은 성능을 보였다.

  • PDF

이동체 데이터의 근접성을 이용한 디클러스터링 방법 (Spatiat-temporal Declustering Method Using Proximity of Moving Object Data)

  • 홍은석;서영덕;홍봉희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.767-769
    • /
    • 2003
  • 컴퓨터와 무선 통신 기술의 발달로 인하여 LBS(Location based Service)와 같은 새로운 이동체 관련 서비스가 생겨나고 있다. 이와 같은 서비스들은 이동체들이 일정 주기를 가지고 자신의 정보를 서버로 전송하는데 이는 많은 디스크 입출력을 요구하게 된다. 그러므로 이동체 데이터에 대하여 다중 디스크를 이용한 병렬 입출력이 요구되고 있다. 그러나 기존의 디클러스터링 방법은 시간 도메인을 고려하지 않거나 공간 관련성만을 고려하여 디클러스터링을 하므로, 하나의 디스크에 특정 이동체의 궤적이 집중 되는 문제점이 있다. 이 문제점은 디스크의 병목현상으로 인한 느린 응답시간과 낮은 처리율의 결과를 발생시킨다. 그러므로 이동 객체의 빠른 질의 처리를 위한 새로운 디클러스터링 기법이 필요하다. 이 논문에서는 다중 디스크 기반의 시스템에서 이동 객체에 대한 영역질의시 빠른 응답시간과 높은 처리율물 얻기 위하여 새로운 디클러스터링 기법을 제시한다. 이동체 데이터의 궤적 MBB중 공간 좌표로부터 Predefined Disk를 생성하고 PDT-Proximity를 이용하여 시간 도메인을 고려하는 방법이다. 위와 같이 이동 객체의 특성을 고려한 새로운 디클러스터링 방법으로 시스템의 성능을 향상시킬 수 있다.

  • PDF