• 제목/요약/키워드: 근사 질의 처리

검색결과 58건 처리시간 0.028초

머신 러닝 모델 기반 근사 질의 처리 방법에 관한 연구 (A Study on Approximation Query Processing Method Based on Machine Learning Models)

  • 박춘서;김성수;남택용;이태휘
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.532-534
    • /
    • 2021
  • 최근 데이터의 양이 급격히 증가함에 따라 빅데이터 환경에서 데이터 질의 처리 수행 시 연산 시간이 많이 소요되는 문제점이 발생한다. 이러한 처리 시간을 줄이기 위한 방법으로 근사질의 처리에 대한 연구의 필요성이 대두되고 있다. 근사 질의 처리 방법은 정확도가 다소 떨어지더라도 빠른 결과를 요구하는 응용 분야에서 매우 유용하게 쓰일 수 있다. 본 논문에서는 사용자가 원하는 결과 정확도와 적시성 등을 지원하기 위한 근사 질의 처리 언어 확장, 실행 계획생성 및 질의 최적화 기술을 제안하고, 설계 방향 및 특징 등에 대해서 설명한다.

개념 계층을 이용한 스트리밍 데이터의 관리 기법 (Streaming Data Management Technique using Concept Hierarchy)

  • 한창희;박석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.154-156
    • /
    • 2004
  • 센서 네트웍, 유비쿼터스 컴퓨팅 환경으로 발전하면서 스트리밍 데이터와 같이 무한한 데이터의 처리에 대한 요구가 많이 커지고 있다. 스트리밍 데이터에 대한 질의 처리는 크게 실시간으로 처리가 요구되는 질의와 과거 데이터에 대한 동향 근사치 요청질의로 나누어질 수 있다. 기존의 스트리밍 데이터 처리에 대한 연구들은 실시간 질의 처리만을 고려하고 과거 데이터에 대한 질의에 대한 고려는 미약하다. 그리고 사용자가 과거의 데이터에 대한 동향 분석을 요청하는 질의, 또는 과거 어느 시점의 데이터에 대한 요청 혹은 근사치를 요구하는 질의에 대해서는 처리를 할 수 없는 한계점이 있다. 본 논문에서는 스트리밍 데이터 프로세서의 메모리의 범위를 넘어서서 삭제되는 과거 데이터를 디스크의 I/O처리 속도에 맞추기 위해서 로드 셰딩 기법을 적용해서 저장한 후에 개념 계층을 이용해서 사용자가 원하는 데이터만을 효과적으로 저장하는 기법을 제안한다.

  • PDF

공간 객체의 근사화 방법 연구 (A Study of Approximation Method of Spatial Objects)

  • 김용현;이형수;이성수;김응모
    • 한국정보처리학회논문지
    • /
    • 제3권7호
    • /
    • pp.1753-1762
    • /
    • 1996
  • 지형 정보 시스템에서 공간 객체수가 방대하여, 보조 기억 장치에 저장하는데 공간 객체의 엑세스를 빠르게 하기 위해서 공간 데이터베이스 시스템을 연구 하였다. 공간 객체들은 SAM으로 구성되었지만, 공간 다각형이 직접 SAM을 구성 할수 없다. 공간 다각형을 처리하기 위해 가장 대표적으로 MBR이 지형 키로서 공간 다각형 대신 사용한다. 질의 처리시 MBR은 빠르지만 부정확하다. 따라서, 공간 객체를 근사화하는 데 어떤 근사화 방법이 사용되느냐가 질의 처리시 성능에 영향을 미친다. 적절한 근사화 방법이 후보 집합을 줄일수 있다. 근사화의 질이 놓을수록 필요 없는 엑세스를 줄일수 있다. 본 논문에서는 Slice 분리라는 다중 용기를 이용한 근사화 방법을 제안하였고 다른 근사화 방법과 비교하였다.

  • PDF

공간 데이터베이스 시스템에서 근사 k-최대근접질의의 처리방법 (The Method to Process Approximate k-Nearest Neighbor Queries in Spatial Database Systems)

  • 선휘준;김홍기
    • 한국컴퓨터산업학회논문지
    • /
    • 제4권4호
    • /
    • pp.443-448
    • /
    • 2003
  • 공간 데이터베이스 시스템에서는 주어진 위치에서 가장 근접한 k개의 객체를 찾는 근사 k-최대 근접질의가 자주 발생한다. 근사 k-최대 근접 질의의 성능을 높이기 위해서는 색인에서 검색되는 노드의 수를 최소화할 수 있어야 한다. 본 논문에서는 기존의 알고리즘을 확장하여 동적인 공간 데이터베이스 환경에서 R-트리 유형의 색인 구조를 이용한 근사 k-최대 근접 질의 처리방법을 제안하고 그 성능을 평가 한다. 실험결과에 의하면, 제안된 방법은 객체의 분포 형태, 질의 크기 그리고 근사율에 관계없이 항상 낮은 디스크 접근 횟수를 보였다.

  • PDF

대용량 위치 데이터에서 효율적인 k-최근접 질의 처리 기법 (Efficient k-Nearest Neighbor Query Processing Method for a Large Location Data)

  • 최도진;임종태;유승훈;복경수;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제17권8호
    • /
    • pp.619-630
    • /
    • 2017
  • 스마트 기기의 대중화로 다양한 위치 기반 서비스가 제공되고 있다. 최근에는 소셜 서비스와 결합한 위치 기반 소셜 서비스들이 생겨나고 있다. 이러한 위치 기반 소셜 네트워크 서비스에서는 사용자 중심의 가장 가까운 위치를 검색하는 k-최근접 질의 처리의 요구가 증가된다. 본 논문에서는 대규모 사용자 환경에서 질의를 효율적으로 처리하기 위한 근사 k-최근접 질의 처리 기법을 제안한다. 제안하는 기법은 빅데이터 분산 처리기술을 활용하여 효율적인 스트림 처리를 수행한다. 본 논문에서는 대량의 위치 데이터에 대한 색인을 위해 전통적인 그리드 색인 기법을 변형한 색인 기법을 제안한다. 제안하는 질의 처리기법은 사용자의 진행방향을 고려하여 해당 셀을 우선적으로 탐색한다. 이를 통해 k개의 근사 결과 집합을 생성할 수 있다. 제안하는 기법의 우수성을 입증하기 위해 기존 기법과 다양한 성능 평가를 수행한다.

상대 오차의 최소화를 위한 조화 웨이블릿 기법 (Harmonic Wavelet Method for Minimizing Relative Error)

  • 함성호;강성구;이석호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.91-93
    • /
    • 2005
  • 대용량 데이타에 대한 복잡한 질의 처리가 요구되는 응용에서 빠른 시간 안에 응답을 돌려주기 위해, 데이타를 작은 크기로 근사하여 질의를 처리하는 방법이 연구되고 있다. 빠른 응답을 위해 주어진 저장 공간의 제약 하에서 얼마나 원본 데이타와 유사하게 근사할 수 있는지가 데이타 근사의 성능을 결정한다. 본 논문에서는 데이타 근사에서 유사도의 척도 중 하나인 최대 상대 오차를 줄이기 위하여 Haar 웨이블릿을 변형한 조화 웨이블릿 기법을 제안한다. 조화 웨이블릿은 데이타 변환 과정 중 조화평균을 이용하여 상대 오차 정보를 손쉽게 얻어낼 수 있어 근사 데이타의 상대 오차를 최소화하는 데 적합한 기법이다.

  • PDF

대용량 그래프 스트림 환경에서 데이터 재사용을 고려한 근사 Top-k 서브 그래프 매칭 기법 (Approximate Top-k Subgraph Matching Scheme Considering Data Reuse in Large Graph Stream Environments)

  • 최도진;복경수;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제20권8호
    • /
    • pp.42-53
    • /
    • 2020
  • 소셜 네트워크 서비스의 발전과 함께 다양한 응용에서 객체 간의 관계를 표현하기 위한 그래프 자료구조가 자주 활용되고 있다. 최근에는 실시간 그래프 스트림에서 서브 그래프 매칭의 요구가 늘어나고 있다. 따라서 실시간 그래프 스트림에서 높은 응답성을 위한 효율적인 근사 Top-k 매칭 기술이 필요하다. 본 논문에서는 그래프 스트림 환경에서 데이터 재사용을 고려한 근사 Top-k 서브 그래프 매칭 기법을 제안한다. 제안하는 기법은 대용량 스트림을 효율적으로 처리하기 위해서 기존 분산 스트림 처리 플랫폼인 스톰을 활용하고 스트림 처리 비용을 감소시키기 위한 기존 데이터 재사용 방법을 활용한다. Top-k 결과 생성을 위해서 거리 기반의 요약 색인 기법을 제안한다. 제안하는 요약 색인은 사전에 선택된 정점 간의 거리 값만을 저장하기 때문에 색인의 부하가 적다. 제안하는 요약 색인에서의 근사 Top-k를 수행하여 사용자에게 근사한 k개의 결과를 제공한다. 제안하는 기법의 우수성을 입증하기 위해 다양한 실세계 그래프 데이터 집합에서의 성능 평가를 수행한다.

도로 네트워크에서 k-최근접 이웃 검색을 위한 최단 경로 탐색 (Shortest Path Finding for k-Nearest Neighbor Searching in Road Network Databases)

  • 신성현;이상철;김상욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.336-339
    • /
    • 2009
  • 본 논문에서는 최단 경로 탐색 및 거리 계산의 필요성을 가지고 근사 인덱싱 방법의 후처리 부분을 제안한다. 근사 인덱싱 방법이란 오프라인에서 네트워크 공간상의 객체들을 유클리드 공간 상의 절대 좌표로 사상하여 인덱싱한 후, k-최근접 이웃 질의를 처리하는 방법이다. 그러나 기존 연구는 질의 점으로부터 각 정적 객체까지의 경로를 탐색해주지 않을 뿐만 아니라 착오 기각이 발생한다. 따라서 본 논문에서는 질의 점으로부터 k개의 정적 객체까지의 경로를 효과적으로 탐색할 수 있는 방법을 제안한다. 또한, 이 방법을 통하여 착오 기각 역시 완화시킬 수 있는 방법을 제안한다. 실험을 통하여 제안하는 방법이 기존 경로 탐색 기법들에 비해 노드 탐색 횟수 및 실행 성능이 크게 향상시킨 것으로 나타났다.

도로 네트워크를 위한 k-최근접 이웃 질의의 처리 방안

  • 이상철;김상욱
    • 정보와 통신
    • /
    • 제25권7호
    • /
    • pp.16-23
    • /
    • 2008
  • 텔레매틱스에서 위치 정보 서비스를 효과적으로 제공하기 위해 이동 객체와 더불어 시설물과 같은 정적 객체에 대한 위치 정보를 효과적으로 관리하는 데이터베이스 기술들이 요구된다 본 논문에서는 도로 네트워크 데이터베이스를 위한 인덱싱 및 질의 처리 기술 현황에 대하여 고찰한다. 텔레매틱스에서는 영역 질의, k-최근접 이웃 질의, 연속 k-최근접 이웃 질의, 공간 조인 질의 등이 발생하며, 이 중 k-최근접 이웃 질의가 빈발하게 발생한다. k-최근접 이웃 질의를 처리하기 위한 효과적인 방안으로 IER, INE, $VN^3$, 근사 인덱싱 기법 등이 있다. 본 논문에서는 각 기법의 개념, 알고리즘, 장단점에 대하여 고찰한다.

도로 네트워크 데이터베이스를 위한 근사 인덱싱 (Approximate Indexing in Road Network Databases)

  • 이상철;김상욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.61-62
    • /
    • 2007
  • 본 논문에서는 도로 네트워크 데이터베이스에서 k-최근접 이웃 질의를 효율적으로 처리하기 위한 방안에 대하여 논의한다. 네트워크 거리는 삼각형 부등식 성질(triangular inequality property)을 만족하지 못하므로 기존의 기법들은 네트워크 거리를 기반으로 하는 인덱스를 사용하지 않았다. 이러한 기법들은 질의 처리 시 심각한 성능 저하의 문제를 가진다. 사전 계산된 네트워크 거리를 이용하는 또 다른 기법은 저장 공간의 오버헤드가 크다는 문제를 갖는다. 본 논문에서는 이러한 두 가지 문제점들을 동시에 해결하기 위하여 객체들 간의 네트워크 거리를 근사하여 객체들에 대한 인덱스를 구축하고, 이를 이용하여 k-최근접 이웃 질의를 처리하는 새로운 기법을 제안한다. 실제 도로 네트워크를 이용한 정확도 검증 실험을 통하여 제안된 기법의 우수성을 규명한다.