• 제목/요약/키워드: 연속 질의 처리

검색결과 265건 처리시간 0.027초

시계열 데이터베이스에서 순위를 지원하는 서브시퀀스 매칭 방법을 위한 시각화 툴 (A Visualization Tool for Ranked Subsequence Matching in Time-Series Databases)

  • 이성진;이진수;조훈;한욱신
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 추계학술발표대회
    • /
    • pp.787-788
    • /
    • 2009
  • 시계열 데이터(time-series data)는 연속적인 데이터를 고정된 시간 간격으로 샘플링한 실수 값들의 연속을 의미한다. 시계열 데이터의 예로는, 음악 및 동영상 데이터, 심전도 데이터, 주식 그래프 등의 데이터가 있다. 시계열 데이터는 다시 데이터베이스에 저장 되어있는 데이터 시퀀스(data sequence)와, 사용자에 의해 주어지는 질의 시퀀스(query sequence)로 분류된다. 시계열 데이터베이스(time-series database)에서 순위를 지원하는 서브시퀀스 매칭 방법(ranked subsequence matching)은 데이터 시퀀스와 질의 시퀀스가 주어졌을 때, 질의 시퀀스의 길이와 같은 데이터 시퀀스의 서브시퀀스(subsequence)들 중에서 질의 시퀀스와 가장 유사한 상위 k개의 서브시퀀스들을 찾는 것이다. 본 논문의 목적은 사용자가 매칭 방법에 대한 인식과 이해가 부족하더라도 기존의 콘솔 기반의 매칭 프로그램을 보다 쉽게 사용할 수 있도록 이용성을 향상시키기 위하여 시각화 툴을 개발하는 것이다. 구체적으로, 5가지 시각화(visualization) 기능을 제공하는 사용자 인터페이스를 구현하였다. 구현된 사용자 인터페이스를 통해 사용자가 기존의 매칭 프로그램을 보다 쉽고 간편하게 사용할 수 있도록 기여한다.

윈도우를 이용한 스트림 데이터의 실시간 모니터링 기법 (Real-time Stream Data Monitoring Using Windows)

  • ;최옥주;이민수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 춘계학술발표대회
    • /
    • pp.1231-1233
    • /
    • 2011
  • WBAN(Wireless Body Area Network)과 같은 스트림 데이터의 환경에서는 데이터가 아닌 질의들이 등록되어 있고 데이터들이 끊임없이 시스템에 도착한다. 때문에 도착한 데이터에 대해서 처리할 수 있는 질의만을 찾아 해당 질의들만을 수행하도록 해서 시스템의 질의 부담을 덜어주는 방법이 필요하다. 기존의 단순하고 단편적인 질의의 문제점을 해결하고자 본 연구에서는 Interval Skip List 자료 구조와 시간기반 윈도우를 이용하여 효율적인 실시간 모니터링 시스템을 구현하였다. 특히 산소포화도 생체 센서들로부터 연속적으로 전송되는 스트림 데이터에 대해 다양한 조건을 포함하는 질의들이 실행 되는데 이러한 실시간 모니터링 질의들을 효율적으로 식별하기 위한 질의 인덱스를 설계하였다.

한국어 핵심어 추출 및 연속 음성 인식을 위한 다목적 전처리 프로세서 설계 (Design of Multi-Purpose Preprocessor for Keyword Spotting and Continuous Language Support in Korean)

  • 김동헌;이상준
    • 디지털융복합연구
    • /
    • 제11권1호
    • /
    • pp.225-236
    • /
    • 2013
  • 음성인식 기술은 단순한 단어 인식을 넘어 자연스럽게 발성한 연속 음성도 인식할 수 있는 수준으로 발전해 왔다. 아이폰에 탑재된 자연어 음성인식 처리 소프트웨어인 시리(Siri)가 2010년에 발표되면서, 음성인식에 대한 연구가 관심을 받고 있다. 한국어 음성 인식 소프트웨어들은 대부분 단어 위주의 인식 서비스로 구성 되어 있으며, 잡음처리 및 음성 에너지 조절 기능들이 부족해 만족할 만한 인식률을 보이지 못하고 있다. 또한 요구된 발성 규칙을 따르지 못한 음성 질의들은 아예 처리하지 못하고 있는 실정이다. 본 논문에서는 이러한 현실적 어려움을 개선할 수 있도록 다목적 전처리 프로세서를 제안하였다. 이 처리기는 음성인식 엔진에 독립적이며, 잡음 제거 기능, 규칙에 따르지 않은 음성 질의도 처리 할 수 있는 핵심어 추출 기능, 그 핵심어를 수식하는 전술부 및 그 해당 음성 질의로부터 수행하기를 원하는 후술부 까지도 추출할 수 있는 기능을 갖추도록 하였다. 실험을 통해, 잡음 제거 효과 평가, 핵심어 인식 성공률, 연속음 인식 성공률을 측정하여 제안한 방법의 타당성을 확인하였다.

효율적 공간 질의 처리를 위한 트리 구조 공간 색인의 형제 노드 클러스터링 (Sibling Node Clustering in Tree-based Spatial Indexes for Efficient Processing of Spatial Queries)

  • 김기홍;차상균
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권4호
    • /
    • pp.487-499
    • /
    • 1999
  • 공간 또는 다차원 데이터베이스에서는 노드영역의 중첩 및 다차원성 때문에 다수의 색인 노드를 읽어야 하는 질의가 빈번히 나타난다. 이와 관련하여 기존 연구에서는 질의를 처리하기 위해 읽어야하는 노드의 수를 줄일수 있는 새로운 색인방법을 다수 제안하였으며 본 논문에서는 같은 수의 노드를 디스크에서 빨리 읽을 수 있도록 클러스터링하는 간단한 방법을 제안한다. 제안된 방법은 노드를 형제 노드 군으로 분할하여 한 형제 노드군을 연속된 디스크 블록 군에 저장하고 노드 분할 또는 병합이 일어날때도 이런 클러스터링을 동적으로 유지한다. 약 130,000개의 TIGER 데이터와 Hilbert R-트리를 이용할 실험 결과 , 제안된 형제 노드 클러스터링을 통해 공간 영역 질의, 공간 근접질의, 공간조인 질의 등을 처리할 때 필요한 디스크 접근 시간을 최대 86%까지 줄일 수 있었다. 반면 색인 갱신과정에서 형제노드 클러스터링을 동적으로 유지하는 데 필요한 디스크 읽기 쓰기 회수의 증가량은 1% 미만밖에 되지 않았다.

관계형 데이터 스트림에서 키워드 검색을 위한 질의 최적화 (Query Optimization for Keyword Search on Relational Data Stream)

  • 황진호;김학수;김종진;이승미;손진헌
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.360-363
    • /
    • 2008
  • 최근 관계형 데이터 스트림에서 키워드 검색에 관한 연구가 진행되고 있다. 키워드 검색을 통해 사용자는 시스템의 복잡한 내부 데이터 스키마나 질의언어에 대한 지식이 없이도 데이터 스트림에서 정보 검색이 가능하다. 하지만, 빈번하고 동적으로 변화하는 특성을 지닌 데이터 스트림에서 수행되는 연속 질의 처리를 위해서 보다 효과적인 질의 최적화 방안이 요구된다. 따라서, 우리는 본 논문을 통해 계층적 클러스터링을 이용하여 중간결과 공유의 최대화를 통한 질의 최적화를 방안을 제안한다.

분산 그리드 기법을 위한 연속 k-최근접 질의처리 알고리즘 (Countinuous k-Nearest Neighbor Query Processing Algorithm for Distributed Grid Scheme)

  • 김영창;장재우
    • 한국공간정보시스템학회 논문지
    • /
    • 제11권3호
    • /
    • pp.9-18
    • /
    • 2009
  • 최근 GPS 및 무선 이동 컴퓨팅 기술의 발달로 인해, 텔레매틱스(telematics) 및 위치기반 서비스(LBS) 응용이 활발하게 연구되고 있다. 이러한 위치 기반 서비스 응용에서는 이동객체의 위치 정보가 시간의 흐름에 따라 계속적으로 변하기 때문에, 이를 위한 빈번한 업데이트 연산은 시스템에 많은 부하를 가중시키며 이로 인해 검색 성능의 저하를 초래한다. 이를 해결하기 위해 공간 네트워크에서 대용량 이동객체의 위치정보를 분산 처리하기 위한 DS-GRID(distributed S-GRID) 및 이를 위한 k-최근접 질의처리 알 고리즘이 제안되었다[1]. 그러나 k-최근접 질의처리 기법은 질의점 및 이동객체의 위치가 변경되면 그 결과 가 유효하지 않기 때문에, 연속 k-최근접(CKNN:continuous k-nearest neighbor) 질의처리 알고리즘의 연구가 필요하다. 본 연구에서는 DS-GRID를 위한 MCE-CKNN 알고리즘 및 MBP-CKNN 알고리즘을 제안한다. MCE-CKNN 알고리즘은 주어진 경로를 셀 단위로 분할하여 각 셀에서 질의 처리를 병렬적으로 수행하여 검색 성능을 향상시킨다. 아울러 MBP-CKNN 알고리즘은 그리드 셀의 각 경계점에서 가까운 POI를 미리 저장하여 인접셀 탐색 횟수를 줄임으로써 검색 성능을 향상시킨다. 마지막으로, 제안하는 알고리즘의 성능 분석을 통해, 기존 알고리즘보다 15-53% 검색 성능이 우수함을 나타내었다.

  • PDF

전자상거래 데이터의 실시간 분석을 위한 데이터 스트림과 다수 릴레이션 간의 효율적인 연속 조인 처리 기법 (Efficient Processing of Continuous Join Queries between a Data Stream and Multiple Relations for Real-Time Analysis of E-Commerce Data)

  • 김해리;이기용
    • 한국전자거래학회지
    • /
    • 제18권3호
    • /
    • pp.159-175
    • /
    • 2013
  • 최근 들어 전자상거래 데이터의 실시간 공급이 가능해지면서, 전자상거래 데이터를 실시간으로 분석하고자 하는 요구가 급증하고 있다. 이를 위해서는 전자상거래 데이터 스트림과 디스크에 저장된 대규모 릴레이션 간의 연속 조인 질의를 효율적으로 처리하는 것이 매우 중요하다. 본 논문에서는 전자상거래 데이터 스트림과 디스크에 저장된 다수 릴레이션 간의 효율적인 연속 조인 질의 기법을 제안한다. 제안 방법은 기존 방법에 비해 서비스율을 크게 향상시키는 한편, 메모리 사용량을 크게 줄인다. 분석과 다양한 실험을 통해, 제안 방법은 기존 방법에 비해 서비스율과 메모리 사용량에서 더 효율적임을 보인다.

거리 관계 패턴을 기반한 k-최근접 질의 처리 기법 (A k-NN Query Processing Method Based on Distance Relation Pattern)

  • 박용훈;서동민;복경수;유재수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.85-90
    • /
    • 2008
  • 최근 유클리드 공간 상에서 효율적인 연속 k-최근접(k-Nearest Neighbors) 질의 처리를 위해 그리드 구조 기반의 많은 색인 기법들이 연구되었다. 하지만 기존 기법들은 k-최근접 객체들을 연산하기 위해 불필요한 셀을 접근하여 연산 자원을 낭비하거나 근접한 셀을 알아내는데 너무 큰 연산 비용을 초래한다. 그래서 본 논문에서는 한 셀과 주변 셀과의 거리 관계 패턴을 이용하여 k-최근접 질의 처리시 적은 연산비용과 적은 저장 공간을 사용하는 새로운 k-최근접 질의 처리 기법을 제안한다. 제안하는 기법은 k-최근접 질의 처리 시 거리 값을 기준으로 정렬된 거리 관계 패턴의 상대좌표를 순차적으로 적용하여 근접한 셀을 알아내기 때문에 O(n)의 셀 검색 비용이 요구된다. 또한 본 논문에서는 CPM[1]과 성능을 비교하여 제안하는 기법의 우수성을 입증한다.

  • PDF

RFID 입력 테이터 스트림에 대한 다중 버퍼 기반의 고속 데이터 처리 알고리즘 (A High-Speed Data Processing Algorithm for RFID Input Data Stream Using Multi-Buffer)

  • 한수;신승호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (B)
    • /
    • pp.302-307
    • /
    • 2007
  • RFID를 기반으로 유비쿼터스 환경의 응용 서비스를 지원하는 미들웨어는 지속적으로 끊임없이 입력되는 데이터를 정확하게 실시간으로 처리하고 응용 서비스에서 질의하는 결과를 획득해서 전달하여야 한다. 이와 같은 지속적으로 입력되는 대량의 데이터 스트림을 처리하기 위해서 데이터 스트림 관리 시스템(Data Stream Management System: DSMS)을 개발하기 위한 연구가 진행되고 있다. 기존에 연구되는 데이터 스트림에 대한 알고리즘은 대부분 연속 질의 결과들 사이의 평균 오차를 줄이고, 부하 발생 시 데이터의 우선순위에 따라 버리는 것에 초점이 맞추어져 있다. 본 논문에서는 RFID EPC 라는 데이터 특성에 맞추어 다중버퍼를 이용함으로써 고속의 데이터 처리 능력을 얻고, 각 버퍼마다 일정한 규칙을 통해 질의에 있어서도 빠른 대응을 할 수 있는 알고리즘을 제안한다. 본 논문은 현재 DSMS의 관련 연구와 고속 데이터 처리의 필요성을 말하고, 제안하는 알고리즘 설명과 시뮬레이션을 통해 단일버퍼와 다중버퍼일 경우 데이터 처리 속도 성능 평가와 제안한 알고리즘에 맞도록 버퍼가 생성 되는지 테스트하는 것으로 구성된다.

  • PDF

3차원 R-트리를 이용한 이동체 색인에 관한 연구 (A Study on Indexing Moving Objects using the 3D R-tree)

  • 전봉기
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권4호
    • /
    • pp.65-75
    • /
    • 2005
  • 이동체 데이터베이스는 연속적으로 이동하는 이동체의 위치와 궤적을 검색하기 위한 데이터베이스 질의를 효과적으로 처리해야 한다. 질의 처리의 성능 향상을 위하여, 연속적으로 이동하는 이동체를 위한 효과적인 색인 기법이 필요하다. 3D R-tree와 TB-tree는 현재 위치에 대한 영역 질의를 처리할 수 없다. 현재와 과거 위치에 대한 영역 질의를 처리하기 위하여, 기존의 3D R-tree를 태그 now를 가지도록 수정하였다. 대부분의 시공간 색인 구조들은 이동체의 과거 위치에 대한 영역 질의를 효과적으로 처리할 수 없다. 이와 같은 쟁점을 설명하기 위하여 기존의 3D R-tree를 기반으로 하는 TA3DR-tree이라 불리는 색인 방법을 제안한다. TA3DR-tree는 기존의 3D R-tree와 TB-tree와의 성능 평가의 우수한 성능 결과를 보였다.

  • PDF