• 제목/요약/키워드: Query processing

검색결과 1,423건 처리시간 0.038초

이동체 데이타 스트림을 위한 시공간 DSMS의 설계 및 구현 (Design and Implementation of the Spatio-Temporal DSMS for Moving Object Data Streams)

  • 이기영;김정준
    • 한국인터넷방송통신학회논문지
    • /
    • 제8권5호
    • /
    • pp.159-166
    • /
    • 2008
  • 최근 위치 측위 기술, 무선 통신 기술 등이 급속도로 발달하고 이동체 데이타가 널리 활용됨에 따라 이동체 데이타 스트림을 실시간으로 서비스하기 위한 실시간 위치 추적 시스템의 연구 개발이 활발히 진행되고 있다. 그러나 이러한 시스템에서 기반 시스템으로 사용되는 MO(Moving Object) DBMS는 이동체 데이타 스트림 관리에 비효율적이고, 기존의 DSMS(Data Stream Management System)는 시공간 데이타를 효율적으로 처리하지 못하는 문제점이 있다. 따라서, 본 논문에서는 이동체 데이타 스트림의 효율적인 실시간 관리를 위한 시공간 DSMS를 설계 및 구현하였다. 본 논문에서 구현한 시공간 DSMS는 스탠포드 대학의 STREAM(STanford stREam dAta Manager)을 기반으로 이동체 데이타 스트림의 실시간 관리와 시공간 질의 처리 기능 그리고 입력 부하를 줄이기 위한 필터링 기능을 지원하는 시스템이다. 특히, 시공간 DSMS에서 사용하는 시공간 연산자는 호환성을 위해서 OGC에서 제시한 "Simple Feature Specification for SQL" 표준 명세를 확장하여 SQL 형태의 표준 인터페이스를 지원한다. 마지막으로 본 논문에서 구현한 시공간 DSMS를 이동체 데이타 스트림의 실시간 위치 추적 관리가 필요한 실시간 모니터링 분야에 적용해 봄으로써 시스템의 효용성을 입증하였다.

  • PDF

고차원 멀티미디어 데이터 검색을 위한 벡터 근사 비트맵 색인 방법 (Vector Approximation Bitmap Indexing Method for High Dimensional Multimedia Database)

  • 박주현;손대온;낭종호;주복규
    • 정보처리학회논문지D
    • /
    • 제13D권4호
    • /
    • pp.455-462
    • /
    • 2006
  • 고차원 데이터 공간에서의 효과적인 검색을 위해 최근 VA-file[1], LPC-file[2] 등과 같이 벡터 근사에 기반을 둔 필터링 색인 방법들이 연구되었다. 필터링 색인 방법은 벡터를 근사한 작은 크기의 색인 정보를 사용하여 근사 거리를 계산하고, 이를 사용하여 질의 벡터와 유사하지 않은 대부분의 벡터들을 빠른 시간 안에 검색 대상에서 제외한다. 즉, 실제 벡터 대신 근사 벡터를 읽어 디스크 I/O 시간을 줄여 전체 검색 속도를 향상시키는 것이다. 하지만 VA-file 이나 LPC-file은 근사 거리를 구하는 방법이 순차 검색과 같거나 복잡하기 때문에 검색 속도 향상 효과가 그리 크지 않다는 문제점을 가지고 있다. 본 논문은 이러한 근사 거리 계산 시간을 줄이기 위하여 새로운 비트맵 색인 구조를 제안한다. 근사 거리 계산속도의 향상을 위하여, 각 객체의 값을 특성 벡터 공간상의 위치를 나타내는 비트 패턴으로 저장하고, 객체 사이의 거리를 구하는 연산은 실제 벡터 값의 연산보다 속도가 훨씬 빠른 XOR 비트 연산으로 대체한다. 실험에 의하면 본 논문이 제안하는 방법은 기존 벡터 근사 접근 방법들과 비교하여 데이터 읽기시간은 더 크지만, 계산 시간을 크게 줄임으로써 전체 검색 속도는 순차 검색의 약 4배, 기존의 방법들보다는 최대 2배의 성능이 향상되었다. 결과적으로, 데이터베이스의 속도가 충분히 빠른 경우 기존의 벡터 근사 접근법의 필터링을 위한 계산 시간을 줄임으로써 더욱 검색 성능을 향상 시킬 수 있음을 확인할 수 있다.

다중 해시 조인의 파이프라인 처리에서 분할 조율을 통한 부하 균형 유지 방법 (A Load Balancing Method using Partition Tuning for Pipelined Multi-way Hash Join)

  • 문진규;진성일;조성현
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권3호
    • /
    • pp.180-192
    • /
    • 2002
  • Shared nothing 다중 프로세서 환경에서 조인 어트리뷰트의 자료 불균형(data skew)이 파이프라인 해시 조인 연산의 성능에 주는 영향을 연구하고, 자료 불균형을 대비하여 적재부하를 Round-robin 방식으로 정적 분할하는 방법과 자료분포도를 이용하여 동적 분할하는 두 가지 파이프라인 해시 조인 알고리즘을 제안한다. 해시 기반 조인을 사용하면 여러 개의 조인을 파이프라인 방식으로 처리할 수 있다. 다중 조인은 파이프라인 방식 처리는 조인 중간 결과를 디스크를 통하지 않고 다른 프로세서에게 직접 전달하므로 효율적이다. Shared nothing 다중 프로세서 구조는 대용량 데이타베이스를 처리하는데 확장성은 좋으나 자료 불균형 분포에 매우 민감하다. 파이프라인 해시 조인 알고리즘이 동적 부하 균형 유지 메커니즘을 갖고 있지 않다면 자료 불균형은 성능에 매우 심각한 영향을 줄 수 있다. 본 논문은 자료 불균형의 영향과 제안된 두 가지 기법을 비교하기 위하여 파이프라인 세그먼트의 실행 모형, 비용 모형, 그리고 시뮬레이터를 개발한다. 다양한 파라미터로 모의 실험을 한 결과에 의하면 자료 불균형은 조인 선택도와 릴레이션 크기에 비례하여 시스템 성능을 떨어뜨림을 보여준다. 그러나 제안된 파이프라인 해시 조인 알고리즘은 다수의 버켓 사용과 분할의 조율을 통해 자료 불균형도가 심한 경우에도 좋은 성능을 갖게 한다.

다중점 적합성 피드백방법을 이용한 영역기반 이미지 유사성 검색 (Region Based Image Similarity Search using Multi-point Relevance Feedback)

  • 김덕환;이주홍;송재원
    • 정보처리학회논문지D
    • /
    • 제13D권7호
    • /
    • pp.857-866
    • /
    • 2006
  • 질의 이미지의 시각적 특징이 사용자의 상위 수준 개념을 잘 표현하지 못하기 때문에 이미지 검색 시스템의 성능은 보통 매우 낮다. 의미적으로 유사한 이미지들이 매우 다른 시각적 특징을 보일 수도 있으며 따라서 여러 개의 군집에 분산될 수 있다. 본 논문에서는 영역기반 이미지 검색과 군집-합병을 이용한 새로운 적합성 피드백 방법을 결합한 내용기반 이미지 검색 방법을 제안한다. 주요 목표는 의미적 차이를 줄이기 위해 의미적으로 관련된 군집들을 찾는 것이다. 제안된 방법은 영역기반 군집 과정과 군집-합병 과정으로 이루어진다. 적합한 이미지들의 모든 분할된 영역들을 의미적으로 관련된 계층적인 군집으로 구성한다. 잠재된 군집의 개수를 결정하고 근접한 군집들을 합병한 후 최종 군집의 대표점들로 다중 질의를 표현한다. 군집-합병 과정에서 군집의 개수를 찾고 고차원에서 특이점 문제를 해결하기 위하여 호텔링의 $T^2$ 대신에 v개의 주성분을 이용하는 $T_v^2$를 적용하였으며 $T^2$의 성능과 $T_v^2$의 성능의 차이가 없음을 보인다. 실험 결과는 제안된 방법이 내용기반 이미지 검색 시스템의 성능을 개선하는 데 효율적임을 보여준다.

기업간 비즈니스 프로세스 등록저장소를 위한 메타데이터 온톨로지 설계 (Metadata Ontology Design for B2B Business Process Registries)

  • 김종우;김형도;윤정희;정현철
    • 정보처리학회논문지D
    • /
    • 제14D권4호
    • /
    • pp.435-446
    • /
    • 2007
  • B2B 등록저장소는 기엽의 프로파일, 비즈니스 문서, 비즈니스 프로세스, 제공 서비스 등의 B2B 관련 비즈니스 정보들을 저장하고 거래 파트너 또는 잠재 거래 파트너들에게 정보를 제공하는 시스템이다. 본 논문에서는 이 중 B2B 비즈니스 프로세스의 등록저장소의 설계에 초점을 맞추어, 이를 지원하기 위한 메타데이터 온톨로지를 제시한다. 현재 ebXML BPSS (Business Process Specification Schema), WSBPEL (Web Service Business Process Execution Language), BPMN (Business Process Modeling Notation) 등의 다수의 비즈니스 프로세스 정의 언어들이 시장에서 경쟁하고 있다. 이러한 상황을 고려하여, 다수의 다른 프레임워크에서 표현된 비즈니스 프로세스를 등록저장하기 위해서 제시된 메타 데이터 온톨로지는 3개 계층, 공통 메타데이터, 언어별 메타데이터, 상호연관관계 메타데이터로 구성된다. 제시된 메타데이터 온톨로지의 유용성을 보이기 위해서, ebXML BPSS 와 WSBPEL로 표현된 비즈니스 프로세스의 온톨로지 내에 저장을 예제로 제시한다. 또한 제시된 메타데이터 온톨로지의 구현을 위해서 ebXML 등록저장소 정보모델로의 매핑 방안을 제시한다.

사용자 중심적 GIS 인터페이스를 이용한 시계열적 원격탐사 영상의 변화탐지 기법의 개발 (Development of Change Detection Technique Using Time Seriate Remotely Sensed Satellite Images with User Friendly GIS Interface)

  • 양인태;한성만;윤희천;김흥규
    • 한국측량학회지
    • /
    • 제22권2호
    • /
    • pp.151-159
    • /
    • 2004
  • 현대사회는 인간 활동 범위의 다양함과 영역확대에 따른 급속한 도시화로 자연환경의 파괴와 천연자원의 고갈이라는 문제에 봉착되었다. 이러한 상황에서 국토의 효율적인 관리와 이용 계획을 위해서 광범위한 토지이용에 따른 변화를 신속하고 정화하게 탐지할 수 있는 변화탐지기술이 요구되었다. 본 연구에서는 원격탐사 영상의 변화탐지를 실시하기 위해 지형공간정보 시스템이 갖고 있는 공간분석기법을 적용하여 새로운 변화탐지 알고리즘과 검색, 질의 및 분석 등의 기능을 수행할 수 있는 소프트웨어를 제작하였다. 이 소프트웨어는 그래픽 사용자 인터페이스를 기본으로 하여 파일변환, 그리드연산, 통계계산, 디스플레이, 검색 등의 기능이 포함되어 있다. 본 연구의 수행 결과 다중시기의 위성영상에 대한 변화탐지를 동시에 수행할 수 있었으며, 네 시기에 대한 통합된 변화영상을 제작할 수 있었다. 또한 사용자가 토지피복에 대한 년도별 변천 내용을 질의하고 검색할 수 있게 함으로써 특정지역의 토지피복에 대한 변천 정보를 획득할 수 있었다. 마지막으로 변화탐지 수행을 위한 개개 응용프로그램의 각 모듈을 윈도우 기반의 Visual Basic으로 통합함으로써 사용자 편의 제공과 자동화를 가져올 수 있었다.

DOT 색인을 이용한 효율적인 공간 조인 기법 (An Efficient Spatial Join Method Using DOT Index)

  • 백현;윤지희;원정임;박상현
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권5호
    • /
    • pp.420-436
    • /
    • 2007
  • 지리정보시스템에서 빈번히 사용되는 공간 조인 연산자의 성능을 보장하기 위해서는 효율적인 색인 기법의 선택이 중요하며, 대표적인 색인 기법으로는 $R^*$-tree를 이용한 방법이 알려져 있다. 본 논문에서는 DOT(Double Transformation) 공간 색인을 이용한 효율적인 공간 조인 처리 기법을 제시하고 이를 $R^*$-tree를 이용한 공간 조인 처리 기법과 비교한다. DOT 공간 색인 기법은 공간 객체의 MBR 정보를 공간 순서화 곡선을 사용하여 하나의 1차원 값으로 변환한 후 그 값을 검색 키로 갖는 $B^+$-tree 색인 구조를 구성하는 방법으로서, 이를 이용하면 전통적인 데이타베이스의 주 색인을 적용할 수 있다는 중요한 특징을 가진다. 본 논문에서는 공간 객체의 MBR 정보를 하나의 1차원 값으로 변환하기 위해 사용되는 공간 순서화 곡선의 규칙성을 분석함으로써 공간 변환 연산의 횟수를 대폭 감소시킨 효율적인 DOT 색인기반의 공간 조인 알고리즘을 제안한다. 제안된 알고리즘에서는 반복적으로 수행되는 공간 변환 연산의 횟수를 줄이기 위하여 질의 영역을 공간 순서화 곡선이 연속 운행하는 가능한 최대 크기의 면적으로 분할하는 쿼터 분할 기법을 사용한다. 다양한 분포와 크기를 갖는 데이타 집합을 대상으로 $R^*$-tree를 이용한 공간 조인 처리 기법과의 비교 실험을 수행한 결과 최대 약 3배의 성능 이익을 얻을 수 있음을 확인할 수 있었다.

스타 스키마 조인 처리에 대한 세로-지향 데이터베이스 시스템과 가로-지향 데이터베이스 시스템의 성능 비교 (Performance Comparison of Column-Oriented and Row-Oriented Database Systems for Star Schema Join Processing)

  • 오병중;안수민;김경창
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권8호
    • /
    • pp.29-38
    • /
    • 2011
  • 세로-지향 데이터베이스 시스템은 기존의 가로-지향 데이터베이스 시스템과 달리 데이터를 가로(row) 위주가 아닌 세로(column) 위주로 저장한다. 최근에는 데이터 웨어하우스나 의사 결정 시스템 같은 대용량 데이터를 갖는 읽기 위주의 응용들에서 세로-지향데이터베이스의 우수성이 관찰되었다. 본 논문에서는 세로-지향데이터베이스에서의 조인 전략을 구체적으로 분석하고 데이터 웨어하우스 시스템에서 세로-지향 데이터베이스의 우수성을 검증하고자 한다. 두 시스템간의 객관적인 비교를 위해 데이터 웨어하우스 분석 모델인 스타 스키마 벤치마크를 통해 스타스키마조인 질의에 대한 성능분석을 실시하고자 한다. 또한 세로-지향 데이터베이스의 조인 전략으로 조기 실체화(early materialization)와 지연 실체화(late materialization)를 고려하였다. 성능 분석을 통해 스타 스키마 조인 질의처리에 있어 가로-지향 시스템보다는 세로-지향 시스템에서 디스크 I/O 비용이 더 효율적인 결과를 확인할 수 있었다. 세로-지향 데이터베이스 시스템 측면에서는 조기 실체화보다는 지연 실체화 조인전략이 훨씬 우수한 성능을 보였다.

내용 기반 음악 정보 검색을 위한 음악 구성 형식을 고려한 대표 선율의 추출 및 색인 (Extraction and Indexing Representative Melodies Considering Musical Composition Forms for Content-based Music Information Retrievals)

  • 구경이;임상혁;이재헌;김유성
    • 정보처리학회논문지D
    • /
    • 제11D권3호
    • /
    • pp.495-508
    • /
    • 2004
  • 최근 내용 기반 음악 정보 검색 시스템에서는 사용자의 응답 시간을 단축시키기 위해 음악의 대표성을 갖는 선율을 추출하여 색인하고, 검색시 이를 이용한다 음악에서 대표성을 갖는 선율은 해당 음악을 대표하여 사용자가 기억하고 있으며, 사용자가 질의 선율로 사용할 가능성이 높아야 한다. 그러나, 기존의 내용 기반 음악 정보 검색 시스템에서는 음악 구성 형식을 고려하지 않기 때문에 음악 구성 형식에 따라 반복, 대조되는 선율들을 해당 음악을 대표하는 선율로 추출하지 못한다. 본 논문에서는 해당 음악을 대표하는 선율을 추출하기 위하여 한 음악에서 음악 구성 형식을 반영하여 일정한 유사도내에서 반복되는 선율들을 해당 음악의 반복 주제 선율로 추출한다. 또한, 사용자가 일반적으로 인지하는 첫 동기 선율과 절정 선율에 해당되는 선율들을 인식하여 대표 선율에 추가한다. 본 논문에서 제안된 시스템의 성능을 평가하기 위해 프로토타입을 구현하고, 다른 선을 색인과 비교 실험하였다. 실험 결과, 대표 선율 색인은 전체 동기를 색인한 경우에 비해 34%의 적은 저장 공간으로 색인을 구성하여 사용자의 응답 시간을 단축시켰다. 또한, 반복 주제 선율만으로 색인한 경우에 비해 사용자가 질의 가능성이 높은 첫 동기 선율, 절정 선율 등을 대표 선율로 색인하기 때문에 추가적으로 20의 색인 공간이 필요하였으나, 다양한 사용자의 질의 선율에 대해 검색의 정확성을 증진할 수 있음을 보였다.

RFM기법과 k-means 기법을 이용한 개인화 추천시스템의 개발 (Development of Personalized Recommendation System using RFM method and k-means Clustering)

  • 조영성;구미숙;류근호
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권6호
    • /
    • pp.163-172
    • /
    • 2012
  • 기존 추천시스템의 명시적((Explicit) 협력 필터링 방법은 실용화 되었으나 정확한 아이템의 속성이 반영되지 않는 문제와 희박성과 확장성 문제가 여전히 남아 있다. 본 논문에서는 실시간성과 민첩성이 요구되는 유비쿼터스 상거래에서 고객에게 번거로운 질의 응답 과정이 없이 묵시적인(Implicit) 방법을 이용하여 RFM(Recency, Frequency, Monetary)기법과 k-means 기법을 이용한 개인화 추천시스템을 제안한다. 구매 가능성이 높은 아이템을 추출하기 위해서 고객데이터와 구매이력 데이터를 기반으로 아이템의 속성 반영이 가능한 RFM기법과 k-means 클러스터링을 이용한다. 제안 방법으로 추천의 효율성이 높은 아이템 추천이 가능하도록 고객정보의 속성 변수의 특징 벡터가 적용된 클러스터링 작업과 군집내의 아이템 카테고리 선호도 계산 작업의 전처리를 수행한다. 성능평가를 위해 현업에서 사용하는 인터넷 화장품 아이템 쇼핑몰의 데이터를 기반으로 데이터 셋을 구성하여 기존 시스템과 비교 실험을 통해 성능을 평가하여 효용성과 타당성을 입증하였다.