• 제목/요약/키워드: 공간 질의 처리

검색결과 721건 처리시간 0.025초

데이터 샘플링을 통한 각 기반 공간 분할 병렬 스카이라인 질의처리 기법 (Data Sampling-based Angular Space Partitioning for Parallel Skyline Query Processing)

  • 정재화
    • 컴퓨터교육학회논문지
    • /
    • 제18권5호
    • /
    • pp.63-70
    • /
    • 2015
  • 상호 연관되는 복잡한 데이터 조건이 존재하는 환경에서 스카이라인 질의는 의사결정 시스템 등 폭넓은 애플리케이션 활용 가능성으로 다양한 분야에서 연구되어 왔다. 중앙집중식 환경에서 스카이라인 질의처리 기법이 초기에 제안되었으며 최근 대량의 다차원 데이터에 대해 데이터 공간을 분할하여 맵/리듀스 플랫폼 상에서 병렬적으로 처리하는 기법이 제안되었다. 그러나 현재까지의 기법이 비균등적 실행과 높은 중복 작업으로 효율성이 저하된다는 문제점을 배경으로 본 논문에서는 랜덤 샘플링을 통해 데이터 분포를 추정하여 비균등 분할 문제를 해결하고 각 기반의 데이터 공간을 분할하여 스카이라인 처리 과정에서 중복 작업을 최소화한 새로운 기법 MR-DEAP를 제안한다. 마지막으로 다양한 환경에서의 실험결과 제안된 기법이 다른 각 기반 분할과 그리드 분할 기법보다 우수한 것을 입증하였다.

영역-그룹화 질의 계산 알고리즘 (An Algorithm for Computing Range-Groupby Queries)

  • 이영구;문양세;황규영
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권4호
    • /
    • pp.247-261
    • /
    • 2002
  • 온라인 분석처리(On-Line Analytical Processing: OLAP)에서 집계 연산은 중요한 기본 연산이다. 본 논문에서는 OLAP에서의 집계 질의 중 영역-그룹화(range-groupby)라는 새로운 클래스의 질의를 정의하고, 이 질의의 처리 방법을 제시한다. 영역-그룹화 질의는 n-차원 데이타 큐브의 임의의 영역에 속한 셀들에 대하여 주어진 그룹화 속성들의 조합에 따라 집계 값을 구하는 질의이다. 이 질의는 관심의 대상이 되는 임의의 영역 내에서의 경향을 다각적인 측면에서 분석하기 위해서 OLAP에서 자주 사용되는 질의이다. 일반적으로, OLAP에서는 질의를 빠르게 처리하기 위하여 전방-합 배열(prefix-sum array)이라 불리는 집계 결과를 미리 계산하여 유지하는 선계산 기법이 실제적으로 널리 사용되고 있다. 그런데, 영역-그룹화 질의의 경우에는, 그룹화 속성들의 모든 조합에 대하여 집계 결과를 저장해야 하기 때문에, 저장 공간 오버헤드가 너무 크다. 본 논문에서는 가능한 적은 공간 오버헤드를 가지고 영역-그룹화 질의를 빠르게 처리할 수 있는 방법을 제안한다. 제안한 방법은 단지 하나의 전방-합 배열만을 유지하면서도, 가능한 모든 그룹화 속성의 조합에 대하여 영역-그룹화 질의를 효율적으로 처리한다. 이 방법은 가능한 모든 그룹화 속성들의 조합에 대하여, 전방-합 배열을 선계산하여 유지하는 방법과 비교할 때 액세스되는 셀의 개수는 비슷하면 서 공간 오버헤드는 (equation omitted)(n은 디멘젼의 개수)로 줄인다.

압축된 공간 히스토그램을 이용한 선택율 추정 기법 (Selectivity Estimation Using Compressed Spatial Histogram)

  • 지정희;이진열;김상호;류근호
    • 정보처리학회논문지D
    • /
    • 제11D권2호
    • /
    • pp.281-292
    • /
    • 2004
  • 공간 질의에 대한 선택율 추정은 가장 효율적인 실행 계획을 찾는데 이용되는 매우 중요한 과정이다. 공간 도메인이 큰 경우, 기존 연구의 요약정보는 상대적으로 적은 정보로 선택율을 추정하기 때문에 좋은 선택율을 유지하기 어렵다. 따라서, 이 논문에서는 작은 저장공간에 공간요약정보를 압축하는 새로운 기법인 MW 히스토그램을 제안한다. 이 히스토그램은 MinSkew 분할 알고리즘과 웨이블릿 변환이 결합되어 적은 저장공간에서도 타당한 선택율과 압축효과를 얻을 수 있고, 동적 갱신에 대해 효율적으로 대처할 수 있는 구조를 가진다. 실험 결과를 통하여, 버켓 수가 0.3M/6인 MW 히스토그램이 5%-20% 질의에서 평균적으로 좋은 성능을 보이고 있어, MW 히스토그램이 적은 저장공간에서 더 좋은 선택율을 얻을 수 있음을 확인시켜주었다.

공간 데이터베이스 시스템에서 근사 k-최대근접질의의 처리방법 (The Method to Process Approximate k-Nearest Neighbor Queries in Spatial Database Systems)

  • 선휘준;김홍기
    • 한국컴퓨터산업학회논문지
    • /
    • 제4권4호
    • /
    • pp.443-448
    • /
    • 2003
  • 공간 데이터베이스 시스템에서는 주어진 위치에서 가장 근접한 k개의 객체를 찾는 근사 k-최대 근접질의가 자주 발생한다. 근사 k-최대 근접 질의의 성능을 높이기 위해서는 색인에서 검색되는 노드의 수를 최소화할 수 있어야 한다. 본 논문에서는 기존의 알고리즘을 확장하여 동적인 공간 데이터베이스 환경에서 R-트리 유형의 색인 구조를 이용한 근사 k-최대 근접 질의 처리방법을 제안하고 그 성능을 평가 한다. 실험결과에 의하면, 제안된 방법은 객체의 분포 형태, 질의 크기 그리고 근사율에 관계없이 항상 낮은 디스크 접근 횟수를 보였다.

  • PDF

모바일 객체의 방향성을 고려한 최근접 질의 처리 (Nearest Neighbor Query Processing using the Direction of Mobile Object)

  • 이응재;정영진;최현미;류근호;이성호
    • 한국공간정보시스템학회 논문지
    • /
    • 제6권1호
    • /
    • pp.59-71
    • /
    • 2004
  • 최근접 질의 (NN: Nearest Neighbor Query)는 질의요청자와 가상 가까운 곳에 위치한 대상 객체를 검색하기 위한 질의로서, 모바일 환경에서 빈번하게 사용되는 질의 유형이다. 이 논문에서는 모바일 환경에서 방향 성분을 가지며 연속적으로 이동하는 질의 요청자가 요구하는 최근접 대상 객체를 검색하기 위한 질의 처리 방법을 제안한다. 제안된 방법은 모바일 환경에서 특정 방향 성분을 갖고 위치를 이동하는 질의요청자의 방향 속성을 반영하여 최근접 객체를 검색할 수 있도록 유클리디안 거리 정보뿐만 아니라 사용자의 진행 방향을 고려하여 최근섭 대상 객체를 검색한다. 제안된 방법은 모바일 환경에서 최근섭 객체의 검색 기능을 요구하는 교통 정보 시스템, 관광정보 시스템, 위치 기반 추천 시스템과 같은 응용 분야에 적용할 수 있다.

  • PDF

트라이 인덱스를 이용한 DNA 시퀀스 검색 (DNA Sequence Searching Using a Trie Index)

  • 원정임;박용일;윤지희;박상현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.4-6
    • /
    • 2003
  • 본 논문에서는 대규모 DNA 시퀀스를 위한 트라이 인덱싱 기법을 기반으로 하는 효율적인 부분 시퀀스 검색 기법을 제시한다. 제안된 인덱싱 방안에서는 저장 공간 감소를 위하여 시퀀스의 각 문자를 최소 비트 정보로 표현하며, 저장 구조로서 포인터를 사용하지 않는 디스크 기반의 이진 접미어 트라이 구조를 사용한다. 질의 처리 방안에서는 포인터가 없는 이진 트라이 구조 상에서 질의 시퀀스를 검색하기 위하여 이진 정보 기반의 연산과정을 필요로 하며, 또한 단말 정보를 효율적으로 검색하기 위하여 별도의 단말정보 테이블과 인덱스 구조를 사용한다. 실험 결과에 의하면 제안된 방식은 기존의 접미어 트리 인덱싱 방식에 비하여 약 30~50%의 저장 공간 감소 효과를 가질 뿐 아니라, 평균 질의 처리 시간에 있어 약 20배까지의 성능 개선 효과를 갖는 것으로 나타났다.

  • PDF

Large Pre-trained Language Model의 P-tuning을 이용한 질의 정규화 (Query Normalization Using P-tuning of Large Pre-trained Language Model)

  • 서수빈;인수교;박진성;남경민;김현욱;문기윤;황원요;김경덕;강인호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.396-401
    • /
    • 2021
  • 초거대 언어모델를 활용한 퓨샷(few shot) 학습법은 여러 자연어 처리 문제에서 좋은 성능을 보였다. 하지만 데이터를 활용한 추가 학습으로 문제를 추론하는 것이 아니라, 이산적인 공간에서 퓨샷 구성을 통해 문제를 정의하는 방식은 성능 향상에 한계가 존재한다. 이를 해결하기 위해 초거대 언어모델의 모수 전체가 아닌 일부를 추가 학습하거나 다른 신경망을 덧붙여 연속적인 공간에서 추론하는 P-tuning과 같은 데이터 기반 추가 학습 방법들이 등장하였다. 본 논문에서는 문맥에 따른 질의 정규화 문제를 대화형 음성 검색 서비스에 맞게 직접 정의하였고, 초거대 언어모델을 P-tuning으로 추가 학습한 경우 퓨샷 학습법 대비 정확도가 상승함을 보였다.

  • PDF

무선 센서 네트워크를 위한 상황 인지 데이터 중심 저장 기법 (A Context Aware Data-Centric Storage Scheme in Wireless Sensor Network)

  • 김현주;이충희;성동욱;유재수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(A)
    • /
    • pp.381-384
    • /
    • 2011
  • 최근 무선 센서 네트워크의 수집 데이터에 대해 에너지 효율적인 저장 및 질의 처리를 위한 다양한 연구가 이루어지고 있다. 데이터 중심 저장 (DCS: Data-Centric Storage) 기법은 인-네트워크 방식 기반의 효율적인 데이터 저장과 질의 처리를 위해 제안된 기법이다. DCS 기법은 수집 데이터의 값에 따라 저장 될 위치를 미리 결정하여 각 데이터가 발생시 해당 위치에 인-네트워크 방식으로 저장한다. 이를 통해 질의 처리시 불필요한 질의 배포를 최소화 시킨다. 하지만 기존에 제안된 DCS 기법들은 수집되는 데이터의 발생 범위를 고정적으로 설정한다. 따라서 시기별로 상이한 범위의 데이터가 발생되는 실제 응용에 서는 저장 공간 활용의 불균등을 초래하여 네트워크 수명을 단축시킨다. 본 논문은 시간이 지남에 따라 변화 하는 데이터 발생 패턴에 상황 적응적인 범위 설정 기법을 적용하여 네트워크 전반에 걸쳐 노드들의 저장 공간을 균등하게 사용하는 상황 인지 데이터 중심 저장 방식을 제안한다. 또한 제안하는 기법의 우수성을 보이기 위해 기존 DCS 기법과 성능을 비교평가 한다.

고정 그리드 인덱싱에서 공간과 시간 필터링을 이용한 범위 질의 처리 (Range Query Processing using Space and Time Filtering in Fixed Grid Indexing)

  • 전세길;나연묵
    • 정보처리학회논문지D
    • /
    • 제11D권4호
    • /
    • pp.835-844
    • /
    • 2004
  • 최근 들어 이동 통신 분야에서 이동하는 고객을 위한 위치 기반 서비스가 중요한 서비스로 부각되고 있다. 이동객체 응용의 경우 갱신 연산이 많고, 부하가 특정 지역에 집중되는 특징이 있다. 윈도우 나 원형 형태의 범위질의는 위치 기반 서비스에서 중요한 질의 중 하나이다. 이러한 범위질의에서는 부분 포함된 셀과 완전 포함된 셀을 구분해야할 필요가 있다. 또한 올바른 한정된 객체를 골라내기 위해 시간 영역을 고려할 필요성이 있다. 본 논문에서는 갱신연산을 최소화하기 위해 고안되어진 2번째 단계에 고정 그리드 구조를 적용한 2단계 인덱스 구조를 적용한다. VP 필터링과 윈도우 셀 필터링 기법을 이용한 공간 셀 필터링 기법과 Time Zone 개념을 사용하여 시공간 개념이 결합된 필터링 기법을 제안한다. 제안된 방법의 성능 측정을 위해서 다른 필터링 조합을 가지고 다양한 윈도우 질의와 원 질의에 대해서 실험 결과를 보인다.

다중 공간 조인에서 간접 술어의 활용 (Using Indirect Predicates in Multi-way Spatial Joins)

  • 박호현;정진완
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권6호
    • /
    • pp.593-605
    • /
    • 2003
  • 공간 조인은 일반적으로 많은 처리 시간을 필요로 하므로 공간 조인에 대한 처리 시간을 단축하기 위해 많은 연구가 있었다. M-다중 공간 조인에서 M 개의 R-트리를 동시에 탐색하는 M-다중 R-트리 조인(MRJ)도 그 중의 하나이다. 본 논문에서는 M-다중 공간 조인에서 간접 술어(indirect predicate)개념을 소개한다. 다중 공간 조인에서 간접 술어란 질의 조건문에 직접 나타나는 술어가 아니라 이들 직접 술어들로부터 간접적으로 유도되는 술어를 말한다. 간접 술어 개념을 M-다중 R-트리 조인에 적용함으로서 다중 공간 조인의 성능을 향상시킬 수 있다. 우리는 이러한 간접 술어를 이용한 다중 공간 조인 처리 방법을 간접 술어 여과(IPF)라 부른다. 가공 데이타와 실제 지도 데이타를 이용한 실험을 통하여 우리는 IPF 기법이 M-다중 R-트리 조인의 성능을 상당히 개선한다는 것을 보였다.