• 제목/요약/키워드: 공간 질의 최적화

검색결과 88건 처리시간 0.025초

위치기반 서비스를 위한 다중레벨 DBMS에 질의 분류 컴포넌트의 설계 및 구현 (Design and Implementation of Query Classification Component in Multi-Level DBMS for Location Based Service)

  • 장석규;어상훈;김명근;배해영
    • 정보처리학회논문지D
    • /
    • 제12D권5호
    • /
    • pp.689-698
    • /
    • 2005
  • 현재 위치기반 서비스를 제공하기 위하여 다양한 시스템들이 사용되고 있다. 그러나 기존의 시스템들은 상당히 많은 사용자들에게 빠른 서비스를 제공하기에는 적합하지가 않다. 이러한 문제점을 해결하기 위하여 빠른 데이터 처리와 대용량의 데이터 관리를 동시에 지원하는 다중레벨 DBMS를 사용하여야 한다. 스냅샷을 갖는 다중레벨 DBMS는 디스크에 모든 데이터를 가지고 있으며, 빠른 처리를 요구하는 데이터는 스냅샷의 형태로 메인메모리 데이터베이스에서 관리한다. 이 시스템의 성능을 최적화하여 위치기반 서비스를 제공하기 위해서는 스냅샷에 존재하는 데이터를 효율적으로 사용할 수 있도록 질의를 분류하는 컴포넌트가 필요하다. 본 논문에서는 위치기반 서비스를 위한 다중레벨 DBMS에서 질의 분류 컴포넌트를 설계하고 구현한다. 제안된 컴포넌트는 입력된 질의를 메모리 질의, 디스크 질의, 하이브리드 질의로 분류하여 스냅샷 사용율을 높이고, 스냅샷의 일부분을 사용할 수 있도록 질의의 비공간과 공간 필터 조건을 분할하는 메커니즘을 사용하였다. 따라서, 제안된 컴포넌트는 효율적인 질의 분류를 통하여 스냅샷을 최대한 이용함으로써 시스템의 성능을 향상시킨다.

대용량 XML 문서에서 효율적인 갱신을 위한 비트-패턴 기반의 XML 레이블링 기법 (XML Labeling Scheme based on Bit-Pattern for Efficient Updates of Large Volume of XML Documents)

  • 서동민;박용훈;임종태;김명호;유재수
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권1호
    • /
    • pp.130-134
    • /
    • 2010
  • 기존에 제안된 XML 레이블링 기법은 XML 문서 변경 시, 문서 내 노드들의 구조 관계를 정확하게 유지하기 위해 재레이블링을 수행하거나 한 노드의 레이블이 많은 정보를 표현할 수 있는 레이블링 기법을 사용한다. 하지만, 대용량 XML 문서 내에서의 재레이블링은 많은 비용이 요구되고, 많은 정보를 표현할 수 있는 레이블링 기법은 많은 저장 공간이 요구돼 질의 처리 성능이 저하되는 문제를 야기한다. 그래서 본 논문에서는 재레이블링을 피하고 질의 처리 성능을 향상시키기 위해 최적화된 저장 공간을 사용하는 비트-패턴 기반의 레이블링 기법을 제안한다. 제안하는 비트-패턴 기반의 레이블링 기법은 노드들의 구조관계를 하나의 비트열에 표현함으로써 기존에 제안된 레이블링 기법들에 비해 우수한 성능을 가진다.

병렬 Shifted Sort 알고리즘의 Warp 단위 CUDA 구현 최적화 (Optimization of Warp-wide CUDA Implementation for Parallel Shifted Sort Algorithm)

  • 박태정
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권4호
    • /
    • pp.739-745
    • /
    • 2017
  • 본 논문에서는 GPU 병렬 처리 하드웨어 아키텍처 내 최소 물리적 스레드 실행 단위(warp) 내에서 shifted sort 기반 k개 최근접 이웃 검색 기법을 구현하는 방법을 논의하고 일반적으로 동일한 목적으로 널리 사용되는 GPU 기반 kd-tree 및 CPU 기반 ANN 라이브러리와 비교한 결과를 제시한다. 또한 많은 애플리케이션에서 k가 비교적 작은 값이 필요한 경우가 많다는 사실을 고려해서 k가 warp 내부에서 직접 처리 가능한 2, 4, 8, 16개일 때 최적화에 집중한다. 구현 세부에서는 사용한 CUB 공개 라이브러리의 루프 내 메모리 관리 방법, GPU 하드웨어 직접 명령 적용 방법 등의 최적화 방법을 논의한다. 실험 결과, 제안하는 방법은 기존의 GPU 기반 유사 방법에 비해 데이터 지점과 질의 지점의 개수가 각각 $2^{23}$개 일 때 16배 이상의 빠른 처리 속도를 보였으며 이러한 경향은 처리해야 할 데이터의 크기가 커지면 더욱 더 커지는 것으로 판단된다.

병렬 타부 탐색을 이용한 발전기 기동정지계획의 최적화 (Optimization of Unit Commitment Schedule using Parallel Tabu Search)

  • 이용환;황준하;류광렬;박준호
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권9호
    • /
    • pp.645-653
    • /
    • 2002
  • 발전기 기동정지 계획은 하나의 전력시스템을 형성하는 다수의 발전기에 대해서 주어진 여러 제약을 따르는 일간 또는 주간의 기동 및 정지시간을 결정하는 작업으로 다양한 제약과 방대한 탐색공간으로 인해 최적의 경제적 계획 수립이 매우 어려운 대규모 최적화 문제이다. 타부 탐색은 보통의 지역적 탐색법에 비해 국지적 최적해에 빠질 위험이 적고 다른 전역적 탐색기법에 비해 대상문제에 관한 지식을 충분히 활용하기에 유리하여 많은 최적화 문제에 사용되고 있다. 그러나 규모가 방대하면서 많은 제약조건이 존재하는 대규모 최적화 문제들은 타부 탐색으로도 빠른 시간내에 최적의 해를 찾아내기 힘들다. 본 논문은 대규모 최적화 문제의 하나인 발전기 기동정지 계획 문제를 타부 탐색의 병렬화를 통해 해결함으로써 탐색 소요시간의 단축과 함께 해의 질 또한 향상시킬 수 있음을 보여준다.

SSQUSAR : Apache Spark SQL을 이용한 대용량 정성 공간 추론기 (SSQUSAR : A Large-Scale Qualitative Spatial Reasoner Using Apache Spark SQL)

  • 김종훈;김인철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권2호
    • /
    • pp.103-116
    • /
    • 2017
  • 본 논문에서는 Apache Spark SQL을 이용하여 임의의 두 공간 객체들 간의 위상 관계와 방향 관계를 나타내는 새로운 정성 공간 지식을 효율적으로 추론해내는 대용량 정성 공간 추론기의 설계와 구현에 대해 소개한다. Apache Spark SQL은 Hadoop 클러스터 컴퓨터 시스템에서 다양한 데이터들 간의 매우 효율적인 조인 연산과 질의 처리 기능을 제공하는 분산 병렬 프로그래밍 환경이다. 본 공간 추론기에서는 정성 공간 추론의 전체 과정을 지식 인코딩, 역 관계 추론, 동일 관계 추론, 이행 관계 추론, 관계 정제, 지식 디코딩 등 크게 총 6개의 작업들로 나누고, 논리적 인과관계와 계산 효율성을 고려하여 작업들 간의 처리 순서를 결정하였다. 지식 인코딩 작업에서는 추론의 전처리 과정으로서 XML/RDF 형태의 입력 지식을 보다 간략한 내부 형태로 변환함으로써, 추론 대상인 지식 베이스의 크기를 축소시켰다. 일반적으로 이행 관계 추론 작업과 관계 정제 작업의 반복은 정성 공간 추론에 필요한 가장 많은 계산 시간과 기억 공간을 소모한다. 이 작업들을 효율화하기 위해 본 공간 추론기에서는 공간 추론에 필요한 최소한의 이접 관계들을 찾아내고, 이들을 기반으로 이행 관계 추론을 위한 조합표를 큰 폭으로 축소하고 관계 정제 작업도 최적화하였다. 대규모 벤치마킹 공간 지식 베이스를 이용한 실험을 통해, 본 논문에서 제안하는 대용량 정성 공간 추론기의 높은 추론 성능과 확장성을 확인하였다.

시그니처 기반 블록 탐색을 통한 XML 질의 최적화 기법 (An XML Query Optimization Technique by Signature based Block Traversing)

  • 박상원;박동주;정태선;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권1호
    • /
    • pp.79-88
    • /
    • 2002
  • 인터넷에서 사용되는 많은 데이터들이 XML로 표현되고 있는 추세이다. 이러한 XML 데이터는 트리 형태로 표현되므로 이것을 저장하고 질의하는 시스템으로 그 모델링 능력 때문에 객체 저장소가 적합하다. 객체 저장소에서 XML의 각 노드는 객체로 저장된다. XML 질의의 특징은 정규 경로식으로 표현되는 것이며 이것은 XML 트리의 각 객체를 탐색하면서 처리된다. 정규 경로식을 지원하기 위하여 여러 인덱스들이 제안되었지만 이러한 인덱스들은 디스크 공간이라는 제약 때문에 모든 가능한 경로에 대한 인덱스를 제공하지는 못한다. 이러한 상태에서 정규 경로식을 잘 지원하기 위해서 블록 탐색과 시그니처 방법을 이용하여 질의를 효과적으로 처리하는 최적 객체 탐색 기법을 제안하였다. 시그니처는 트리의 각 노드에 시그니처를 첨가하여 탐색 범위를 줄이는 것이다. 블록 탐색은 한 페이지 내에 있는 접근 가능한 객체들을 미리 처리함으로써 디스크 I/O를 줄이는 것이다. 이와 같은 두가지 방법을 같이 이용하면 일반적인 질의 처리보다 월등히 나은 성능을 보인다는 것을 실험을 통하여 보였다.

시공간 데이타베이스의 엔트로피 기반 동적 히스토그램 (Entropy-based Dynamic Histogram for Spatio-temporal Databases)

  • 박현규;손진현;김명호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권2호
    • /
    • pp.176-183
    • /
    • 2003
  • 질의 최적화에 사용하기 위한 선택도 추정 방법은 히스토그램, 샘플링 그리고 패러미터에 의한 요약 방법 등이 제시되고 있다. 히스토그램을 이용한 선택도 추정은 상용 데이타베이스 시스템에서 가장 보편적으로 사용되는 방법이지만, 이동 객체를 위한 시공간 데이타베이스에서는 데이타 분포가 지속적으로 변화함으로써 기존의 히스토그램 방법을 이용하는 것은 제한이 많게 된다. 특히 미래 질의를 위해서는 데이타 갱신을 반영하는 동적 관리가 가능하며, 정화도를 유지할 수 있는 다른 접근 방법이 필요하다. 따라서 시공간 객체를 위한 선택도 추정 방법은 질의 술어가 요구하는 데이타 분포에 대한 히스토그램이 필요하며, 본 논문에서는 미래의 시공간 영역 질의 술어에 대하여 신속히 히스토그램을 생성할 수 있도록 쌍대성과 한계 분포 방법을 이용한 히스토그램을 제안한다. 쌍대 공간에서 이동 객체에 대한 데이타 시놉시스를 이용하여 구성된 시공간 히스토그램은 이동 궤적의 선형성이 유지하는 시간 동안 정확성을 보장하면서 빠른 시간에 생성이 가능하다. 또한 동적 갱신을 점증적으로 지원함으로써 효율적으로 갱신된 정보를 반영할 수 있고 추정 결과의 정확성을 향상시킬 수 있다.

다차원 공간에서 거리조인 질의처리를 위한 R-트리의 효율적 접근 (Efficient Accesses of R-Trees for Distance Join Query Processing in Multi-Dimensional Space)

  • 신효섭;문봉기;이석호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권1호
    • /
    • pp.72-78
    • /
    • 2002
  • 거리조인은 R-트리를 사용하여 두 공간 데이터 집합 사이의 데이터쌍을 거리 상 가까운 순으로 검색하는 공간조인이다. 거리조인은 R-트리를 하향식으로 순회하면서 생성되는 노드쌍들을 거리값 순으로 우선순위 큐에 저장한다. 본 논문에서는 거리조인 처리시 우선순위 큐 안에서 동점자 노드쌍들의 우선 순위 정책이 알고리즘의 성능을 많이 좌우할 수 있음을 보여주고, 이를 위한 최적화된 2차 우선 순위 기법을 제안한다. 실험을 통하여, 제안한 기법이 다른 기법에 비하여 항상 좋은 성능을 나타냄을 보여준다.

미디에이터 시스템의 적응적 구체화 질의 선택방법 (An Adaptive Materialized Query Selection Method in a Mediator System)

  • 주길홍;이원석
    • 정보처리학회논문지D
    • /
    • 제11D권1호
    • /
    • pp.83-94
    • /
    • 2004
  • 다양한 분산정보의 통합을 위하여 전역 사용자들이 요구하는 데이터들을 지역서버의 자치성을 유지하면서 효과적으로 제공하기 위한 미디 에이터 시스템의 연구가 활발하게 진행되고 있다. 그러나, 미디에이터에서의 전역질의를 효율적으로 처리하기 위한 방법의 연구는 상대적으로 매우 미흡한 실정이다. 미디에이터에서 전역질의는 원격지서버의 질의처리 단위인 부분질의의 집합으로 표현되어진다. 따라서, 미디에이터가 부분질의의 결과를 구체화방법으로 관리한다면 관련된 질의의 결과를 사용자에게 신속하게 제공할 수 있다. 그러나, 미디에이터에서는 통합 스키마의 변경이 자유롭고, 사용자의 질의가 자주 변할 수 있기 때문에 최적의 구체화부분질의를 결정하기 위해서 전역질의의 빈발정도를 지속적으로 파악해야 한다. 따라서, 부분질의의 수가 증가할수록 최적화의 수행시간이 매우 길어지기 때문에 부분질의 빈도의 최근의 변화를 적절하게 반영하지 못한다. 따라서 본 논문에서는 미디에이터 시스템의 저장공간의 활용율을 극대화하는 최적의 구체화부분질의 군을 선택하는 방법을 제안한다. 또한 과거와 최근의 부분질의의 활용형태가 다양하게 변할 수 있으므로 시간에 따른 감쇄율을 활용빈도에 적용하여 최근의 활용빈도의 변화에 민감하게 반응하고 활용형태의 변화에 따라 적응적으로 새로운 구체화부분질의 군을 선택할 수 있는 방법을 제안한다.

동적 메모리 네트워크의 시간 표현과 데이터 확장을 통한 질의응답 최적화 (Question Answering Optimization via Temporal Representation and Data Augmentation of Dynamic Memory Networks)

  • 한동식;이충연;장병탁
    • 정보과학회 논문지
    • /
    • 제44권1호
    • /
    • pp.51-56
    • /
    • 2017
  • 질의응답 문제를 인공지능 모델을 통해 해결하는 연구는 메모리 네트워크의 등장으로 인해 방법론의 변화를 맞이하고 있으며, 그 중 동적 메모리 네트워크(DMN)는 인간 기억 체계에 착안하여 신경망 기반의 주의 기제를 적용하면서, 질의응답에서 일어나는 각 인지 과정들을 모듈화 했다는 특징들을 갖는다. 본 연구에서는 부족한 학습 데이터를 확장 시키고, DMN이 내포하고 있는 시간 인식의 한계를 개선해 정답률을 높이고자 한다. 실험 결과, 개선된 DMN은 1K-bAbI 문제의 테스트 데이터에서 89.21%의 정답률과, 95%를 질의응답 통과의 기준의 정답률으로 가정할 때 12개의 과제를 통과하는 성능을 보여 정확도 면에서 기존의 DMN에 비해 13.5%p 만큼 더 높고, 4개의 과제를 추가로 통과하는 성능 향상을 보여주었다. 또한 뒤이은 실험을 통해, 데이터 내에서 비슷한 의미 구조를 가지는 단어들은 벡터 공간상에서 강한 군집을 이룬다는 점과, 일화 기억 모듈 통과 횟수와 근거 사실 수의 성능에 큰 영향을 미치는 직접적인 연관성을 발견하였다.