• 제목/요약/키워드: 다차원 인덱싱

검색결과 25건 처리시간 0.025초

R-tree 계열의 인덱싱 구조에서의 효율적 질의 처리를 위한 VP 필터링 (VP Filtering for Efficient Query Processing in R-tree Variants Index Structures)

  • 김병곤;이재호;임해철
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권6호
    • /
    • pp.453-463
    • /
    • 2002
  • 정보사회가 인터넷의 보급과 더불어 복잡해짐에 따라 데이타베이스의 흐름은 문자나 숫자와 같은 일차원적인 데이타가 아닌 지리정보, 멀티미디어 데이타와 같은 다차원의 데이타를 저장하고 이에 대한 질의를 처리할 수 있는 시스템을 요구하고 있다 따라서, 다차원적인 특성을 지니는 데이타에 대한 효율적 검색을 위한 다차원 인덱싱 구조에 대한 연구가 활발히 진행되어 왔으며, 그와 동시에 이러한 인덱싱 구조하에서 효율적인 질의 처리를 위한 연구도 병행되고 있다. 다차원 데이타는 그 다양한 응용분야에 따라 요구되는 질의의 형태가 각각 다르므로 이에 대응할 수 있는 알고리즘의 연구가 필요하다. 현재, 많은 다차원 데이타 처리 시스템이 R-트리계열의 인덱싱구조를 근간으로 구성되었으나, 현재까지의 질의처리 기법은 질의처리시에 필터링 특성을 지니지 않으므로, 객체들간의 다차원 거리계산으로 인하여 많은 질의처리 시간을 소요한다. 본 논문에서는 다차원 데이타를 처리하기 위한 R-트리 계열의 다차원 인덱싱 구조에서의 효율적인 질의처리를 위하여 질의처리 대상 객체를 줄이기 위한 필터링 기법을 소개하였다. 필터링을 수행하기 위하여 VP-트리와 MVP-트리에서 사용되었던 VP(Vantage Point)를 이용한다. 먼저, VP 필터링의 개념을 소개하고, VP 필터링을 영역질의와 포인트 질의의 일종인 추가객체요구질의에 각각 적용한 알고리즘을 제시하였다. VP 필터링을 적용하기 위하여 요구되는 삽입 객체와 VP간의 거리계산 시간은 객체의 삽입시 수행되며, 질의 처리를 수행할 때에는 다시 계산되지 않는다. 논문에서는 제안된 알고리즘의 효율성을 실험을 통하여 증명하였다.

효과적인 이미지 검색을 위한 연장 해쉬(Extendible hash) 기반 인덱싱 및 검색 기법 (Indexing and Matching Scheme for Content-based Image Retrieval based on Extendible Hash)

  • 탁윤식;황인준
    • 전기전자학회논문지
    • /
    • 제14권4호
    • /
    • pp.339-345
    • /
    • 2010
  • 보다 빠른 내용 기반 이미지 검색을 위해, 다차원 특징 정보의 효과적인 인덱싱에 대한 다양한 연구들이 수행되고 있다. 하지만, 대부분의 인덱싱 기법들은 특징 정보의 차원이 커질수록 성능이 저하되는 문제를 가지고 있으며, 이를 대체하기 위해서 '높은 확률'로써 사용자가 원하는 결과를 제공해 주기 위한 휴리스틱 (heuristic) 알고리즘을 사용한 기법들이 제안되었다. 본 논문에서는 이러한 다차원 특징 정보를 효과적으로 인덱싱 하기 위해, 연장 해쉬 기반의 새로운 인덱싱 기법을 제안한다. 제안된 인덱싱 기법은 기존의 기법들이 가졌던 문제들을 해결하기 위해, 검색의 정확도에 영향을 주지 않으면서 빠른 검색이 가능하도록 설계되었다. 다양한 실험을 통해, 제안된 기법이 월등한 성능을 가질 수 있음을 보였다.

다차원 인덱싱 구조에서의 k-근접객체질의 처리 방안 (k-Nearest Neighbor Query Processing in Multi-Dimensional Indexing Structures)

  • 김병곤;오성균
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권1호
    • /
    • pp.85-92
    • /
    • 2005
  • 최근에 데이터베이스 응용분야에서 내용기반의 검색이 가능한 이미지 데이터와 같은 다차원 정보 처리에 대한 관심이 고조되고 있다. 따라서 다차원 데이터를 효율적으로 저장하고. 사용자가 원하는 질의 결과를 신속히 제공하는 것이 중요한 연구분야이다 다차원의 데이터에 대한 질의는 대표적으로 영역질의 (Range query)와 최근접객체검색질의(Nearest Neighbor Query)로 나눌 수 있다. 본 논문에서는 $R^*-tree$와 같은 다차원의 인덱싱 구조에서 효율적이고 빠른 k-근접객체검색질의를 수행하기 위한 방안을 제시한다. k-근접객체검색질의는 질의 객체로부터 가장 근접한 k개의 객체를 반환하는 것이다. 본 논문은 이를 위하여 가지치기(Pruning) 기법을 이용하여 검색 공간을 줄이는 방법을 사용하였다. 실험을 통하여 제안된 전략의 오버헤드와 이득을 보였으며, 마지막으로 가장 효율적인 전략의 사용을 제안하였다.

  • PDF

고차원 공간에서 최근접 질의를 효과적으로 처리하기 위한 새로운 인덱싱 기법 (A New Indexing Technique for Processing Nearest Neighbor Queries in High Dimensional Space)

  • 김상욱
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.83-85
    • /
    • 2000
  • 최근접 질의(nearest neighbor query)는 멀티미디어 데이터베이스에서 주어진 질의 객체와 가장 유사한 객체를 찾기 위한 매우 중요한 연산으로 사용된다. 대부분의 최근접 질의 처리 기법들은 객체의 효과적인 인덱싱을 위하여 다차원 인덱스(multidimensional index)를 사용한다. 그러나 N차원 시각형 혹은 원을 사용하여 객체 클러스터의 캡슐을 표현하는 기존의 다차원 인덱스들은 차원 수가 높아짐에 따라 검색 성능이 크게 떨어진다. 본 논문에서는 이러한 문제를 해결하는 새로운 인덱스 구조를 제시하고, 이를 이용하는 최근접 질의 처리 방안을 제안한다. 또한, 다양한 실험에 의한 성능 평가를 통하여 제안된 기법의 우수성을 검증한다.

  • PDF

Time Slice에 따라 인덱스를 분할하는 이동경로 인덱싱 기법 (Trajectory Indexing Technique with Time-sliced Index Partitioning)

  • 강현민;김기홍;차상균
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.231-233
    • /
    • 1999
  • 시공간 상에서 움직이는 물체의 이동경로는 일반적으로 MBR이 매우 크므로, R-tree 계열의 다차원 인덱싱 기법을 적용할 때 질의시 겹침 영역이 많이 발생하는 문제점이 있다. 본 논문에서는 이러한 문제점을 해결하기 위해 time slice에 따라 이동경로의 MBR을 나누어 별도의 인덱스에 저장하는 기법을 제안한다. 이 기법을 적용하면 MBR의 평균 크기가 줄어들어 인덱스 페이지 및 데이터 페이지 접근횟수를 감소시킬 수 있을 뿐만 아니라, 시간이 지나 질의가 매우 드물게 수행되는 데이터에 대한 엔트리를 삭제하여 검색 범위를 줄이는 것이 용이하다. 또한 본 논문에서는 질의 성능을 최적화하기 위해서 time slice를 어떻게 설계해야 하는지에 대해서도 논의한다.

  • PDF

청크 기반 MOLAP 큐브를 위한 비트맵 인덱스 (A Bitmap Index for Chunk-Based MOLAP Cubes)

  • 임윤선;김명
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권3호
    • /
    • pp.225-236
    • /
    • 2003
  • 다차원 온라인 분석처리 (MOLAP, Multidimensional On-line Analytical Processing) 시스템은 데이타를 큐브라고 불리는 다차원 배열에 저장하고 배열 인덱스를 이용하여 데이타를 엑세스한다. 큐브를 디스크에 저장할 때 각 변의 길이가 같은 작은 청크들로 조각내어 저장하게 되면 데이타 클러스터링 효과를 통해 모든 차원에 공평한 질의 처리 성능이 보장되며, 이러한 큐브 저장 방법을 ‘청크기반 MOLAP 큐브’ 저장 방법이라고 부른다. 공간 효율성을 높이기 위해 밀도가 낮은 청크들은 또한 압축되어 저장되는데 이 과정에서 데이타의 상대 위치 정보가 상실되며 원하는 청크들을 신속하게 엑세스하기 위해 인덱스가 필요하게 된다. 본 연구에서는 비트맵을 사용하여 청크기반 MOLAP 큐브를 인덱싱하는 방법을 제시한다. 인덱스는 큐브가 생성될 때 동시에 생성될 수 있으며, 인덱스 수준에서 청크들의 상대 위치 정보를 보존하여 청크들을 상수 시간에 검색할 수 있도록 하였고, 인덱스 블록마다 가능한 많은 청크들의 위치 정보가 포함되도록 하여 범위 질의를 비롯한 OLAP 주요 연산 처리 시에 인덱스 엑세스 회수를 크게 감소시켰다. 인덱스의 시간 공간적 효율성은 다차원 인덱싱 기법인 UB-트리, 그리드 파일과의 비교를 통해 검증하였다.

비디오스트리밍 서비스를 위한 의미기반 비디오 표현 및 저장 기법 (Semantic-Based Video Representation and Storing Techniques for Video Streaming Services)

  • 이석룡
    • 한국경영과학회:학술대회논문집
    • /
    • 대한산업공학회/한국경영과학회 2004년도 춘계공동학술대회 논문집
    • /
    • pp.505-509
    • /
    • 2004
  • 본 논문에서는 비디오 스트림 서버에서 의미 기반 검색을 가능하게 하기 위하여 대용량 스트림 데이터를 효과적으로 표현하고 저장하는 기법을 제시한다. 비디오 스트림 내의 각 프레임을 다차원 공간상의 점으로 사상함으로써 비디오 스트림은 다차원 시퀀스(multidimensional sequence)로 표현되고, 이 시퀀스는 다시 비디오 세그먼트로 분할된다. 분할된 세그먼트로부터 정적인 특성과 연속된 프레임의 움직임을 나타내는 트랜드 벡터(trend vector)등의 의미 정보를 추출하여 모델링 함으로서 스트림 데이터를 효과적으로 표현한다. 또한 제안된 기법은 효율적인 검색을 위하여 비디오 세그먼트를 인덱싱하고 저장하는 방법을 제공함으로써 공간 사용의 효율성을 높이고 신속한 검색을 가능하게 한다.

  • PDF

LDA와 인덱싱 테이블을 이용한 피부영역 검출방법 (Skin Color Segmentation Using LDA and Indexing Table)

  • 양희성;강호진;이준호
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.341-344
    • /
    • 2000
  • 본 논문에서는 복잡한 배경이나 조명 변화가 심한 영상에서도 피부영역을 정확하게 검출할 수 있는 피부영역 검출방법을 제안한다. 제안된 방법은 오프라인(off-line) 훈련과정과 온라인(on-line) 검출과정의 두 단계로 나누어진다. 훈련단계에서는 다양한 조명하에서 얻은 피부영상과 배경영상으로 구성된 훈련영상을 다차원의 열벡터로 표현하고 열벡터에 LDA(linear discriminant analysis)를 적용하여 선형변환된 특징벡터를 가지고 인덱싱 테이블을 생성한다. 검출단계에서는 카메라로 들어온 칼라영상을 여러 개의 조각영상으로 나누고 각각의 조각영상에 대하여 LDA를 적용하여 선형변환된 특징벡터를 구한다. 구해진 특징벡터를 미리 생성한 LDA 인덱싱 테이블에서 찾아 피부영역을 검출한다. 제안된 방법을 조명을 변화시킨 다양한 영상에 적용하여 실험한 결과 검출률이 상당히 우수함을 알 수 있었다.

  • PDF

연속적 I/O와 클러스터 인덱싱 구조를 이용한 이미지 데이타 검색 연구 (A study on searching image by cluster indexing and sequential I/O)

  • 김진옥;황대준
    • 정보처리학회논문지D
    • /
    • 제9D권5호
    • /
    • pp.779-788
    • /
    • 2002
  • 이미지, 비디오, 오디오와 같은 멀티미디어 데이터들은 텍스트기반의 데이터에 비하여 대용량이고 비정형적인 특성때문에 검색이 어렵다. 또한 멀티미디어 데이터의 특징은 행렬이나 벡터의 형태로 표현되기 때문에 완전일치 검색이 아닌 유사 검색을 수행하여 원하는 이미지와 유사한 이미지를 검색해야 한다. 본 논문에서는 멀티미디어 데이터 검색에 클러스터링과 인덱싱 기법을 같이 적용하여 유사한 이미지는 인접 디스크에 클러스터하고 이 클러스터에 접근하는 인덱스를 구축함으로써 이미지 근처의 클러스터를 찾아 빠른 검색 결과를 제공하는 유사 검색방법을 제시한다. 본 논문에서는 트리 유사 구조의 인덱스 대신 해싱 방법을 이용하며 검색시 I/O 시간을 줄이기 위해 오브젝트를 가진 클러스터 위치를 찾는데 한번의 I/O를 사용하고 이 클러스터를 읽기 위해 연속적인 파일 I/O를 사용하여 클러스터를 찾는 비용을 최소화한다. 클러스터 인덱싱 접근은 클러스터링을 생성하는 알고리즘과 해싱 기법의 인덱싱을 이용함으로써 고차원 데이터가 갖는 차원의 문제를 해결하며 클러스터링 또는 인덱싱 만을 이용하는 내용기반의 이미지 검색보다 효율적인 검색 적합성을 보인다.

최근접 질의를 위한 고차원 인덱싱 방법

  • 김상욱
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권4호
    • /
    • pp.632-642
    • /
    • 2001
  • 최근접 질의(nearest neighbor query)는 멀티미디어 데이타베이스에서 주어진 질의 객체와 가장 유사한 객체를 찾기 위한 매우 중요한 연산으로 사용된다. 대부분의 최근접 질의 처리 기법들은 객체의 효과 적인 인덱싱을 위하여 다차원 인덱스(multidimensional index)를 사용한다. 그러나 N차원 사각형 혹은 원을 사용하여 객체 클러스터의 캡슐 표현하는 기존의 다차원 인덱스들은 타원 수가 높아짐에 따라 검색 성능이 크게 떨어진다. 본 논문에서는 이러한 단순한 캡슐 표현 방식이 최근접 질의 처리의 성능을 저하시키는 주요 원인임을 지적하고, (1) 클러스터에 적합한 새로운 축 시스템(axis system)의 채택, (2) 원과 사각형의 조합 에 의한 다양한 캡슐 형태의 표현. (3) 아웃 라이어(outlier)의 별도 관리 등의 해결 방안을 제안한다. 또한, 이러한 개념들을 채택하는 인덱싱 구조를 제시하고. 이를 이용하는 최근접 질의 처리 방안을 제안한다. 끝으 로, 다양한 실험에 의한 성능 평가를 통하여 제안된 기법의 우수성을 검증한다.

  • PDF