• 제목/요약/키워드: 동적 질의 처리

검색결과 175건 처리시간 0.023초

분기한정 동적 스카이라인 질의 기법의 I/O 최적성 분석 및 실험 평가 (I/O Optimality and Performance Analysis of Branch and Bound Dynamic Skyline Query)

  • 최우성;현경석;김자연;정순영;김종완
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 춘계학술발표대회
    • /
    • pp.741-744
    • /
    • 2015
  • 최근 소셜 미디어를 이용한 대량의 데이터로부터 사용자의 의사결정을 지원하기위한 맞춤형 데이터 추천 서비스가 관심을 받고 있으며 사용자의 선호도에 근접한 데이터 추천기법으로 스카이라인 질의가 연구되어왔다. 그러나 기존의 스카이라인 질의는 데이터의 정적속성(위도, 경도, 가격 등)만을 기준으로 모든 사용자에게 동일한 데이터를 반환하기 때문에 맞춤형 데이터를 추천하기 어렵다. 본 논문에서는 사용자의 기호에 대한 정밀도를 높이기 위해 정적속성에서 동적속성(계산속성)을 유도하는 분기한정 동적 스카이라인 질의 기법(Branch and Bound Dynamic Skyline, BBDS)을 구현하였다. 시뮬레이션에서는 대규모 데이터 및 다양한 분포에 따른 실험을 수행한 결과 BBDS가 기존 기법에 비해 데이터 탐색과 추천에 있어서 향상된 성능을 나타내는 것으로 평가되었다.

물류 데이터의 연속 질의 처리를 위한 다차원 색인 기법 (Multi dimensional index technique for continuous Query of logistics data)

  • 추병조;홍봉희;김기홍
    • 한국GIS학회:학술대회논문집
    • /
    • 한국GIS학회 2008년도 공동춘계학술대회
    • /
    • pp.82-88
    • /
    • 2008
  • EPCglobal은 기업 간의 물류 활동 촉진과 글로벌 유통물류 시스템 구축을 위하여 EPCglobal Architecture Framework을 제시 하였다. EPCglobal Architecture Framework의 한 구성요소인 EPCIS(Electronic Product Code Information Services)는 EPC 기반 물류 관련 정보에 대한 저장 및 검색 서비스를 제공한다. EPCIS는 단발성 질의(poll)와 연속 질의(subscribe) 검색 서비스를 제공한다. EPCIS의 연속 질의는 시스템 자동화 및 재고 관리, 공급망 관리를 위해 다양한 응용에서 활용이 가능하다. 일반적으로 연속 질의의 성능을 향상시키기 위해서는 질의 색인을 사용한다. 그러나 EPCIS는 13차원의 도메인과 모든 데이터 필드가 필수 조건이 아니라는 것으로 인해, 차원의 저주 및 무한 영역 질의 문제를 발생 시킨다. 본 논문에서는 EPCIS의 물류 데이터의 연속 질의 처리를 위한 다차원 색인 기법을 제안한다. 13차원의 도메인을 여러 개의 질의 색인으로 구성하고, 등록된 질의 및 입력되는 데이터에 의해 변경되는 동적 질의 실행 계획을 제안함으로써, 차원의 저주와 무한 영역 질의의 문제를 해결하고, EPCIS에서 다수의 연속 질의 등록 시 효율적으로 처리가 가능하도록 한다.

  • PDF

시공간 EPC 데이터 처리를 위한 선택률 기반 효율적인 연속질의 처리 기법 (Efficient continuous query processing technique based on selectivity for EPC data with time and location)

  • 추병조;홍봉희;김기홍
    • 한국GIS학회:학술대회논문집
    • /
    • 한국GIS학회 2008년도 공동추계학술대회
    • /
    • pp.100-105
    • /
    • 2008
  • EPCglobal은 기업 간의 물류 활동 촉진과 글로벌 유통물류 시스템 구축을 위하여 EPCglobal Architecture Framework을 제시 하였다. EPCglobal Architecture Framework의 한 구성 요소인 EPCIS(Electronic Product Code Information Services)는 EPC, 시간, 위치와 같은 물류 관련 정보에 대해 저장 및 검색 서비스를 제공한다. EPCIS는 단발성 질의(poll)와 연속 질의(subscribe) 검색 서비스를 제공한다. EPCIS의 연속 질의는 시스템 자동화 및 재고 관리, 공급망 관리를 위해 다양한 응용에서 활용이 가능하다. 일반적으로 연속 질의 처리를 위해서는 등록된 연속 질의와 입력된 데이터를 순차적으로 비교하는 Sequential Matching 기법을 사용한다. Sequential Matching기법은 등록된 연속 질의 수가 증가 할 경우 많은 부하를 발생 시키고, 이로 인해 시스템 처리 지연이 발생한다. 본 논문에서는 EPCIS의 시공간 EPC 데이터의 연속질의 처리 성능 향상을 위해 선택률 기반 효율적인 연속질의 처리 기법을 제안한다. 13차원의 도메인을 여러 개의 질의 색인으로 구성하고, 등록된 질의 정보를 기반으로 선택률을 계산한다. 선택률에 의해 변경되는 동적 질의 실행 계획을 제안함으로써, EPCIS에서 시공간 EPC 데이터의 연속질의 처리에 대해 평균 60%의 성능이 향상이 가능하도록 하였다.

  • PDF

SQL을 이용한 연관 규칙 탐사 시스템 (An Association Rules Mining System based-on SQL)

  • 전수정;김영지;우용태
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 2000년도 추계학술대회 E-Business와 정보보안
    • /
    • pp.89-94
    • /
    • 2000
  • 본 논문에서는 연관 규칙 탐사 시스템을 설계하고 구현하였다. 본 시스템은 관계형 데이터베이스의 표준 질의어를 이용하여 사용자가 제시한 질의 조건을 만족하는 항목집합에 대해 다양한 형태의 연관규칙을 탐사하기 위한 시스템이다. 질의처리 모듈에서는 사용자가 제시한 조건을 만족하는 질의를 동적으로 구성하여, 연관 규칙 탐사를 위해 사용되는 대상 트랜잭션 데이타베이스의 범위를 조절할 수 있다. 연관 규칙을 발견하기 위한 후보 항목집합을 생성하기 위해 연관 규칙 탐사 알고리즘을 사용하였다. 연관 규칙 알고리즘에서는 한 트랜잭션 데이타에 대해 생성될 수 있는 후보 항목집합을 배열을 이용하여 처리하는 효율적인 방법을 제안하였다.

  • PDF

이동 객체의 궤적에 대한 최근접 탐색 기법 (The Method of Nearest Neighbor Search for Trajectory of Moving Objects)

  • 최보윤;신현호;지정희;김상호;류근호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (하)
    • /
    • pp.1595-1598
    • /
    • 2003
  • 이 논문은 질의와 검색 대상 객체가 모두 이동 객체인 경우, 즉 3 차원 폴리라인(polyline) 형태의 경로를 가지는 객체들 간의 연속(continuous) 최근접 질의 처리에 유용한 기법을 제안한다. 질의경로를 따라 객체를 탐색해가면서 질의에 대한 최근접 정보가 변하는 시점을 찾는 것이 목적인 연속 최근접 질의 처리는 전체 질의 경로에 올바른 최근접 정보 리스트를 제공하지만, 기존의 방법들은 검색 대상 객체가 동적인 경우에 적용되기에는 시간에 따라 움직이는 객체의 위치변화를 처리하지 못하고, 질의 시점과 대상 객체간의 시점을 연관시키기 어렵다는 문제점들을 가지고 있다. 따라서 이 논문에서는 데이터 객체들의 궤적 정보는 STR 트리로 유지하고, 질의 경로 세그먼트와 질의의 시간 인터벌에 포함되는 데이터 객체 세그먼트 모두에 대해 추출시간(sampling time) 선택, 스윕라인(sweep line) 적용, 위치 추정 함수 이용 등의 단계를 처리함으로써, 이 문제를 해결하고 질의 경로 전체에 정확한 최근접 객체 정보 리스트를 제공한다. 제안된 기법은 물류정보시스템, 국방정보시스템, 기상, 교통 등 시공간 이동 객체의 질의를 다루는 시스템에 적용할 수 있다.

  • PDF

맵리듀스를 이용한 효율적인 k-NN 조인 질의처리 알고리즘 (Efficient k-Nearest Neighbor Join Query Processing Algorithm using MapReduce)

  • 윤들녁;장미영;장재우
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.767-770
    • /
    • 2014
  • 대용량 데이터를 분석하기 위한 맵리듀스 기반 k-NN 조인 질의처리 알고리즘은 최근 데이터 마이닝 및 분석을 기반으로 하는 응용 분야에서 매우 중요하게 활용되고 있다. 그러나, 대표적인 연구인 보로노이 기반 k-NN 조인 질의처리 알고리즘은 보로노이 인덱스 구축 비용이 매우 크기 때문에 대용량 데이터에 적합하지 못하다. 아울러 보로노이 셀 정보를 저장하기 위해 사용하는 R-트리는 맵리듀스 환경의 분산 병렬 처리에 적합하지 않다. 따라서 본 논문에서는 새로운 그리드 인덱스 기반의 k-NN 조인 질의 처리 알고리즘을 제안한다. 첫째, 높은 인덱스 구축 비용 문제를 해결하기 위해, 데이터 분포를 고려한 동적 그리드 인덱스 생성 기법을 제안한다. 둘째, 맵리듀스 환경에서 효율적으로 k-NN 조인 질의를 수행하기 위해, 인접셀 정보를 시그니처로 활용하는 후보영역 탐색 및 필터링 알고리즘을 제안한다. 마지막으로 성능 평가를 통해 제안하는 기법이 질의 처리 시간 측면에서 기존 기법에 비해 최대 3배 높은 질의 처리 성능을 나타냄을 보인다.

맵리듀스 기반 kNN join 질의처리 알고리즘의 설계 및 성능평가 (Design and Performance Analysis of MapReduce-based kNN join Query Processing Algorithm)

  • 김태훈;이현조;장재우
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.733-736
    • /
    • 2014
  • 최근 대용량 데이터에 대한 효율적인 데이터 분석 기법이 활발히 연구되고 있다. 대표적인 기법으로는 맵리듀스 환경에서 보로노이 다이어그램을 이용한 k 최근접점 조인(VkNN-join) 알고리즘이 존재한다. VkNN-join 알고리즘은 부분집합 Ri에 연관된 부분집합 Sj만을 후보탐색 영역으로 선정하여 질의를 처리하기 때문에 질의처리 시간을 감소시킨다. 그러나 VkNN-join은 색인 구축 비용이 높으며, kNN 연산 오버헤드가 큰 문제점이 존재한다. 이를 해결하기 위해, 본 논문에서는 대용량 데이터 분석을 위한 맵리듀스 기반 kNN join 질의처리 알고리즘을 제안한다. 제안하는 알고리즘은 시드 기반의 동적 분할을 통해 색인구조 구축비용을 감소시킨다. 또한 시드 간 평균 거리를 기반으로 후보 영역을 선정함으로써, 연산 오버헤드를 감소시킨다. 아울러, 성능 평가를 통해 제안하는 기법이 질의처리 시간 측면에서 기존 기법에 비해 우수함을 나타낸다.

분산 공간 데이터베이스 시스템에서의 적응적 공간 조인 기법 (Adaptive Spatial Join Method in Distributed Spatial Database System)

  • 이재훈;김호석;이재동;배해영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.169-171
    • /
    • 2003
  • 네트워크의 빠른 발전으로 인해 분산된 공간 데이터의 질의 처리 연구가 활발히 진행되었다. 하지만 이런 질의 처리 환경에서는 질의 처리의 최적화를 위한 정확한 정보를 수집하기 어렵고 네트워크 상태의 불확실성으로 인해 데이터의 전송 상태를 예측하기가 힘들다. 이런 동적인 환경에 적응하기 위해서는 기존의 공간 조인 기법을 수정할 필요가 생겼다. 특히 기존의 공간 조인 기법은 처리 방식이 비대칭적(asymmetric)이기 때문에 데이터 전송의 지연으로 인해 처리가 잠시 중단되거나 빠른 응답 시간을 보장할 수 없다. 본 논문에서는 분산 공간 데이터베이스에서의 공간 조인의 문제점을 해결하기 위해서 대칭적인 해시 공간 조인을 사용하는 적응적 공간 조인 기법을 제안한다. 제안된 기법은 초기의 전송된 데이터들을 조인하여 조인 결과를 빠르게 보여주며 데이터 전송의 지연 시에는 이미 전송된 데이터 중 조인되지 않은 객체들을 조인함으로써 지속적으로 조인을 수행한다.

  • PDF

동적 분할에 의한 평균 빙산 질의 처리 (Computing Average Iceberg Query by Dynamic Partition)

  • 배진욱;이석호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.126-128
    • /
    • 1999
  • 평균 빙산 질의란 대용량의 데이터들에 의해 avg 집단 함수를 수행한 뒤 임계값 이상인 데이터들을 결과로 출력하는 연산을 의미한다. 이 때 데이터 도메인의 크기가 메모리에 생성할 수 있는 카운터의 수보다 크기 때문에 연산 처리가 어렵다. 지난 연구에서 빙산 질의에 대해 제안한 해시 카운터는 avg 연사의 경우 착오누락이 발생한다는 문제점이 존재한다. 그래서 이런 문제점들을 해결하며 효율적으로 연산을 수행하기 위해, 데이터베이스를 분할하며 카운터를 관리하는 '메모리 Full 분할', '후보 Full 분할'의 두 알고리즘을 제안한다. 실험결과 두 알고리즘은 메모리크기, 데이터 분포, 데이터 순서에 영향을 받았는데, 데이터들이 정렬이 되어 있거나 데이터분포가 정규분포를 이룰 때 우수한 성능을 보였다.

  • PDF

분산 시스템의 동적 파일 할당 연구 (Dynamic File Allocation Problems In Distributed Systems)

  • 서필교
    • 한국정보처리학회논문지
    • /
    • 제4권7호
    • /
    • pp.1681-1693
    • /
    • 1997
  • 분산 시스템에서 파일 할당 문제는 시스템의 운영비용을 최소화하기 위해 파일 및 그의 복제물의 최적 위치를 결정하는 것이다. 정적인 파일 할당 문제는 분산 시스템의 각 노드에서 특정 파일에 발생하는 질의 및 갱신에 관련된 비용이 일정하다는 가정에서 출발하고 있다. 그러나 실제로는 시간이 지남에 따라 질의 및 갱신 등에 관련된 매개변수들은 변하게 마련이다. 이 연구에서 다루고 있는 동적인 파일 할당 문제는 변화하는 매개변수들을 고려하고 있으며, 또한 시스템 내에 파일이 한 종류만 있는 경우뿐만 아니라 여러 종류가 있는 경우도 다루고 있다. 동적인 파일 할당 문제는 혼합 정수계획법으로 모형화 되었으며 문제 해결을 위해 Lagrange 함수를 이용한 분단탐색법(branch-and-bound method) 알고리즘이 개발되었다. 제시된 알고리즘은 포트란으로 프로그램화되었으며, 여러 종류의 문제 해결을 통하여 그의 유용성을 보여주고 있다.

  • PDF