• 제목/요약/키워드: 다중 질의 최적화

검색결과 43건 처리시간 0.03초

데이타 스트림에서의 다중 조인 질의 최적화 방법 (Optimizing Multi-way Join Query Over Data Streams)

  • 박홍규;이원석
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제35권6호
    • /
    • pp.459-468
    • /
    • 2008
  • 데이타 스트림이란 실시간에 연속적으로 빠르게 생성되는 데이타 집합을 의미한다. 이러한 데이타 스트림들은 최근 사회가 발달과 더불어 정보 환경도 급속도로 발전함에 따라 센서 데이타, 교통상황 수집 자료, 웹 클릭 모니터링 등과 같은 많은 응용 분야에서 적용되고 있다. 이러한 형태의 데이트 스트립을 처리하기 위해서는 미리 등록된 질의에 대하여 새롭게 들어오는 스트림 데이타의 결과를 계속적으로 생성하게 된다. 이와 같은 이유로 끊임없이 들어오는 스트링 데이타들을 빠르게 처리하는 것이 이 분야에서 주된 이슈가 되었으며, 이를 위한 방법으로 등록된 질의들을 효율적으로 처리하기 위한 질의 최적화분야에 많은 연구가 있었다. 그러므로 본 논문에서는 기존 연구에서 사용되었던 그리디 방법을 기반으로 비용 모델을 이용하여 최소의 비용을 갖는 질의 계획을 선택하는 확장된 그리디 방법(EGA)을 제시한다. 화장된 그리디 방법은 알고리즘의 정확성이 떨어지는 그리디 알고리즘의 단점을 극복하기 위하여 비용이 가장 작은 연산하나를 선택하는 대신 비용이 자은 연산들의 집합을 선택한다. 이 연산들의 집합의 크기는 알고리즘의 정확성과 수행 시간에 영향을 끼치며, 투 개의 변수에 의해서 적응적으로 조절 수 있다. 실험에서는 다양한 스트림 환경에서 대부분 그리디 알고리즘보다 향상된 성능을 보장하고, 두 변수에 의한 알고리즘의 성능 및 수행 시간 차이를 보여줌으로써 본 알고리즘의 효율성을 검증하였다.

데이터 스트림 상에서 다중 연속 질의 처리를 위한 속성기반 접근 기법 (Attribute-based Approach for Multiple Continuous Queries over Data Streams)

  • 이현호;이원석
    • 정보처리학회논문지D
    • /
    • 제14D권5호
    • /
    • pp.459-470
    • /
    • 2007
  • 데이터 스트림은 빠르게 연속적으로 발생하는 무제한의 데이터 튜플의 집합이다. 이러한 데이터 스트림에 대한 질의 처리 또한 연속적이고 신속해야 하며 엄격한 시공간적 제약이 요구된다. 대부분의 데이터 스트림 관리시스템(DSMS)에서는 시공간적 제약사항을 효과적으로 지키기 위해서 등록된 연속 질의들의 선택 조건(selection predicate)들을 그룹화하거나 색인처리 한다. 본 논문에서는 연속 질의들의 선택 조건들을 속성별로 그룹화한 새로운 구조체인 속성 선택체(Attribute Selection Construct)를 제안한다. 속성 선택체에는 해당 속성이 특정 질의조건에 사용되는지 여부, 부분적으로 미리 계산된 질의결과 정보, 그리고 해당 속성의 선택률 통계 등 효율적인 질의 처리를 위한 유용한 정보들이 포함된다. 또한, 대상 질의집합을 구현한 속성 선택체들 간의 처리 순서는 전체적인 질의성능에 많은 영향을 미칠 수 있기 때문에 효과적으로 속성 선택체 처리 순서를 결정할 수 있는 전략도 함께 제안된다. 마지막으로, 기존의 방법들이 포함된 다양한 실험을 통하여 제안된 방법론의 성능을 여러 각도에서 비교 검증한다.

GMS: 공간 데이터베이스 관리 시스템 (GMS: Spatial Database Management System)

  • 박상근;박순영;정원일;김명근;배해영
    • 한국GIS학회:학술대회논문집
    • /
    • 한국GIS학회 2003년도 공동 춘계학술대회 논문집
    • /
    • pp.217-224
    • /
    • 2003
  • 전통적인 관계형 데이터베이스 시스템에서 관리되고 있는 일반적인 데이터가 아닌 점, 선, 다각형 등의 다양한 공간 데이터를 관리하기 위해서는 확장된 형태의 공간데이터 타입 및 대용량성과 다양한 접근 패턴을 지니는 공간데이터의 특성을 고려한 새로운 데이터베이스 관리 시스템이 요구된다. 본 논문에서는 이와 같은 공간데이터의 특성을 고려한 저장 기법과 공간질의 처리기법을 제공하는 공간 데이터베1이스 관리 시스템인 GMS를 제안한다. GMS는 다양한 크기를 지니는 공간데이터의 특성을 고려하여 공간/비공간 통합 저장관리 및 BLOB 데이터 저장기법을 제공하며, 저장된 공간/비공간 데이터에 대한 다양한 색인기법을 제공하고 있다. 그밖에 공간 연산 및 복잡한 질의처리를 위해 확장된 질의 최적화 및 질의처리 기법을 제공하며, 다중 사용자를 위한 확장된 동시성 제어 기법과 공간/비공간 데이터에 대한 서로 다른 회복 기법을 제공한다.

  • PDF

맵리듀스에서 빅데이터 분석을 위한 다중 Group-by 질의의 효율적인 처리 기법 (Efficient Processing of Multiple Group-by Queries in MapReduce for Big Data Analysis)

  • 박은주;박소정;오소현;최혜진;이기용;심준호
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권5호
    • /
    • pp.387-392
    • /
    • 2015
  • 맵리듀스(MapReduce)는 대용량의 데이터를 다수의 컴퓨터로 병렬 처리하기 위해 사용되는 프레임워크이다. Group-by 질의는 데이터를 지정된 애트리뷰트들의 값에 따라 그룹화하고, 각 그룹에 대해 지정된 집계 함수 값을 구하는 질의이다. 본 논문에서는 둘 이상의 group-by 질의가 동시에 요청되었을 때, 이들을 맵리듀스를 사용하여 효율적으로 처리하는 기법을 제안한다. 제안 기법은 각 group-by 질의를 독립적으로 계산하는 대신, 총 수행비용을 줄이기 위해 하나 이상의 맵리듀스 잡을 통해 단계적으로 계산한다. 성능 평가 실험을 통해, 제안 기법이 각 group-by 질의를 독립적으로 계산하는 단순 방법에 비해 좋은 성능을 가짐을 보인다.

연속적인 스카이라인 질의의 정적 유효 영역을 이용한 효율적인 처리 (Efficient Processing using Static Validity Circle for Continuous Skyline Queries)

  • 이종혁;박영배
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권6호
    • /
    • pp.631-643
    • /
    • 2006
  • 시간이 변함에 따라 위치 좌표를 변경하는 모바일 환경에서 이동 객체는 자신의 위치를 기준으로 질의를 요청한다. 연속적인 스카이라인 질의 처리를 위한 효율적인 영역 결정 기법에서는 이동 객체의 속도와 방향과는 무관한 최적화된 스카이라인 영역(OSR: Optimal Skyline Region)을 미리 계산하여 질의에 답할 수 있다. 이에 따라 이동 객체의 위치를 중심으로 하고 가장 가까운 영역 변까지의 거리를 반경으로 하는 원(Vcircle: Validity Circle)을 유효 영역으로 결정하여 질의 발생 빈도를 감소하는 기법이 제안되고 있다. 그러나 원은 최초 질의가 발생한 시점의 이동 객체 위치에 따라 면적이 가변적이므로 질의 발생 빈도도 가변적이고, 객체가 최적화된 스카이라인 영역 내에서 이동하는 경우에 재질의가 빈번하게 발생하는 문제점이 발생한다. 예를 들어 사용자는 '현재 위치에서 가깝고 숙박료가 싸고, 해변과의 거리가 가까운 호텔을 검색하라'는 질의를 할 수 있다. 이 경우, 이동 객체와 대상 객체의 거리뿐만 아니라 대상 객체의 다중 속성을 고려해야하고, 스카이라인 질의 결과는 이동 객체의 현재 위치와 대상 객체의 거리에 따라 유효하지 않을 수 있으므로 이동 객체의 위치 변경에 따라 스카이라인을 재계산해야 하며, 새로운 결과를 요청하기 위해 연속적인 질의가 발생한다. 이 논문에서는 항상 볼록 다각형을 형성하는 최적화된 스카이라인 영역의 특징을 이용하여 스카이라인 영역의 최대내부원(IVcircle: Interior Validity Circle)을 정적 유효 영역으로 결정하는 기법을 제안한다. 실험을 통하여 영역내의 평균 질의 발생 빈도를 기존의 Vcircle을 이용한 동적 유효 영역 결정 기법보다 평균 52.55%가 감소함을 보인다.

Server-Side 방식의 상황 인식 기반 선박 USN 미들웨어 구현 및 설계 (A Design and Implementation Vessel USN Middleware of Server-Side Method based on Context Aware)

  • 송병호;송익호;김종화;이성로
    • 대한전자공학회논문지SP
    • /
    • 제48권2호
    • /
    • pp.116-124
    • /
    • 2011
  • 본 논문에서는 해양 환경의 특성을 고려하여 선박 환경에 적합한 방식으로 Server-side 방식에 따른 선박 USN 미들웨어를 구현하였다. 다중 질의 처리 모듈에서는 선박USN에 구성된 다차원 센서 스트림 데이터를 효율적으로 처리하기 위해서 최적화된 질의 계획으로 Mjoin 질의와 해쉬 테이블을 이용한 최적화 방법을 제시하고 모듈을 구성하였다. 상황 인식 관리 모듈에서는 해양의 특성을 고려하여 선박의 상황을 인식하고 관리하는 방법을 제시하였고 SVM 알고리즘을 이용하여 위험 상황을 판단하였다. 제안한 SVM 알고리즘을 이용하여 각 상황별로 5,000 건의 데이터를 입력 받아 실험한 결과 화재 상황과 선체 위험 상황에 대한 평균 정확도는 87.5%, 85.1%를 보였고, 측정 결과를 전송하여 선박 USN 모니터링 시스템을 구현하였다.

전력계통의 계산기제어

  • 박영문
    • 전기의세계
    • /
    • 제24권5호
    • /
    • pp.38-41
    • /
    • 1975
  • 기술 및 소개한 내용을 아래와 같이 요약할 수 있다. 1)전력계통의 계산기제어를 위한 하아드웨어시스템은 온라인리얼시스템의 구비 조건인 고속성, 신뢰성, 경제성을 기저요건으로 하여 동시에 다중프로그래밍, 다중처리가 가능한 범용전자계산기를 모체로 하고 다수의 위성계산기에 의하여 국지적 제어도 가능한 계층제어 시스템의 구성을 이루고 있는 것이 현 추세이다. 2)전력계통의 계산기제어는 전력계통의 안정제어가 그 주내용이나, 전력공급의 질을 일정수준으로 유지하면서 가장 경제적으로 전력을 안정된 상태로 공급하는 것이 더욱 바람직하다. 그러나 현단계에서는 긴급상태 및 회복상태에서는 전력의 안정공급에만 주안점을 두고 있는 실정이다. 3)전력계통의 안정제어의 기능은 상태의 감시, 해석 및 안전최적화의 3기능이며 안정최적화 기능중의 제어지령도 리얼타임으로 자동화하는 것이 궁극적 목표이나 현단계로서는 CRT 표시장치등의 맨머신 인터훼이스를 통하여 제어지령의 결정과정에서 조작원이 개입하는 것이 상례이다. 즉, 전력계통의 안정제어는 아직까지는 프로세스제어의 단계에 이르지 못하고 오퍼레이션제어의 특징을 다분히 지니고 있다. 4)조작원의 판단이나 개입을 줄이는 첩경은 하아드웨어의 개선보다는 전력계통 리얼타임 제어에 충분할 정도로 처리시간에 단축되는 전력계통제어용 각종 응용프로그램의 개발에 있으며 그 시기는 아직 먼 것으로 전망된다.

  • PDF

유전자 알고리즘을 이용한 CORBA 기반의 재사용 클래스 라이브러리 구현 (Implementation of Reusable Class Library based on CORBA using Genetic Algorithm)

  • 이병정;문병로;우치수
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제5권2호
    • /
    • pp.209-222
    • /
    • 1999
  • 개발 과정의 생산성과 프로그램의 신뢰성을 향상시키기 위하여 소프트웨어 재사용이 매우 중요하며 , 효과적인 재사용을 위해서 세밀한 분류 방법과 정확한 검색 방법에 기반한 객체 지향 재사용 라이브러리가 필수적이다. 본 연구에서는 재사용 라이브러리의 다중 클러스터링(multi-way clustering) 분류 방법과 클러스터 기반 선형 검색(cluster-based linear retrieval) 방법에 유전자 알고리즘(genetic algorithm)을 적용한다. 다중 클러스터링은 부품들이 할당된 클러스터 개수, 클러스터 내부 유사도 그리고 클러스터들 사이의 유사도를 최적화하는 클러스터링을 찾아 부품을 세밀히 분류하는 것이고, 클러스터 기반 선형 검색은 주어진 질의와 유사한 부품을 많이 포함하는 클러스터를 검색하는 것이다. 본 논문에서는 유전자 알고리즘이 시뮬레이티드 어닐링 알고리즘(simulated annealing algorithm) 보다 우수한 해를 찾는 것을 실험을 통하여 보이고, 또한 본 알고리즘을 이용한 CORBA 기반의 재사용 클래스 라이브러리(RCL)를 기술한다.

XML 공유 구조 발견을 위한 변형 순차패턴 마이닝 알고리즘 (Adapted Sequential Pattern Mining Algorithms for Finding XML Common Structure)

  • 이정원;이기호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.1-3
    • /
    • 2002
  • 최근 XML관련 연구가 급증하면서 저장 기법, 질의 최적화, 인덱싱 등의 기법이 활발히 개발되고 있다. 그러나 하나의 DTD나 XML Schema를 공유하는 문서집합이 아닌 다양한 구조를 가진 문서들을 대상으로 하는 경우, 다중 문서간의 구조적 유사성이나 차이 등을 파악할 필요가 있다. 특히 서로 다른 사이트나 문서관리 시스템에서 도출된 문서들을 병합하거나 분류할 필요가 있을 때, 두 문서의 병합 가능성 및 분류 기준을 파악하는 것은 매우 중요하다. 따라서 본 연구에서는 여러 문서들의 구조를 구성하는 경로들간의 유사성을 파악하기 위해 기존의 순차패턴 마이닝 알고리즘을 변형하였다. 변형된 순차패턴 마이닝 알고리즘[1]을 통해 두 문서간의 정확한 공유 경로를 찾을 수 있었다.

  • PDF

센서 네트워크를 위한 응용 플랫폼에 관한 연구 (A Study of the Application Platform for Sensor Networks)

  • 송태헌;양서민;이혁준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.1545-1548
    • /
    • 2004
  • 물리적 환경을 관리하기 위한 센서 네트워크 응용은 그룹관리, 질의 최적화, 데이터 처리 등을 포함한 특정 응용 방식을 모두 구현해야 하므로 응용 구조가 상당히 복잡해질 수 있다. 또한, 센서 네트워크의 싱크와 센서 노드간의 경로가 실패하는 경우에는 경로를 복구하는 동안 정보의 손실이나 지연이 발생하게 된다. 본 논문에서는 이를 개선하기위해 센서 네트워크 내에 배치되어 있는 다중 싱크로부터 각 센서 노드의 정보를 수집하고 각 노드를 효율적으로 관리하기 위한 GUI 기반의 센서 네트워크 응용 플랫폼을 설계하고 구현한다.

  • PDF