• Title/Summary/Keyword: 색인기법

Search Result 654, Processing Time 0.027 seconds

An Index System using Restrictive Distance (거리 제한을 이용한 색인 시스템)

  • Park, Chan-Ee;Kim, Sang-Bok
    • Journal of the Korea Society of Computer and Information
    • /
    • v.11 no.1 s.39
    • /
    • pp.273-282
    • /
    • 2006
  • In this paper, we propose index method introducing distance concept in word by a method weighting word. This index method is frequent representing an inquiry word and document index and compound noun or more than two adjoin nouns or noun phrase, the farther the distance between these nouns, the fewer selected ratio decreases in index point is the aiming, this choose guide word candidate by existent weight grant method and distance between candidates chose candidate finally in index within 3 sentences. Using in these way I document of 100 kinds of newspaper, scientific treatise, web document and so on, showed the correctness rate resulted of newspaper 92.03% scientific treatise 95% web document 73.33%.

  • PDF

RAH-tree : A Efficient Index Scheme for Spatial Data with Skewed Access Patterns (RAH-tree : 편향 접근 패턴을 갖는 공간 데이터에 대한 효율적인 색인 기법)

  • Choi Keun-Ha;Lee Seung-Joong;Jung Sungwon
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.31-33
    • /
    • 2005
  • GPS및 PDA의 발달로 인해서 위치 기반 서비스(LBS), 차량항법장치(CNS), 지리정보시스템(GIS)등 공간 데이터를 다루는 응용프로그램들이 급속하게 보급되었다. 이러한 응용프로그램은 높이 균등 색인 기법을 사용하여 원하는 데이터에 대한 색인을 제공하였다. 그러나 모든 공간 객체는 서로 상이한 접근 빈도를 가지고 있음에도 불구하고 기존의 공간색인 기법은 접근 빈도를 고려하지 못하는 단점을 가지고 있었다. 또한 기존의 빈도수만을 고려한 공간 객체의 색인 방법은 접근 빈도에 따른 편향성(skewed)은 제공하지만 공간 객체에 대한 지역성을 반영하지 못한다. 본 논문에서는 밀집되어 있는 공간 객체의 접근 빈도를 반영해서 편향된 색인 트리를 생성하는 기법을 제안한다. 이형 클러스터링으로 분포되어 있는 전체 영역에 대해서 Zahn의 클러스터링 알고리즘을 변형시켜서 다단계 세부영역을 구분한다. 이렇게 구간된 세부영역에 대해서 거리적 인접성과 접근 빈도수의 합을 이용해서 색인 트리를 생성한다. 다단계로 구성된 전체영역에 대해서 하향식 방식으로 편향된 색인 트리를 생성함으로써, 접근 빈도가 높은 공간 객체에 대해서 빠른 탐색이 가능하게 한다.

  • PDF

Performance Analysis of Tree-based Indexing Scheme for Trajectories Processing of Moving Objects (이동객체의 궤적처리를 위한 트리기반 색인기법의 성능분석)

  • Shim, Choon-Bo;Shin, Yong-Won
    • Journal of the Korean Association of Geographic Information Studies
    • /
    • v.7 no.4
    • /
    • pp.1-14
    • /
    • 2004
  • In this study, we propose Linktable based on extended TB-Tree(LTB-Tree) which can improve the performance of existing TB (Trajectory-Bundle)-tree proposed for indexing the trajectory of moving objects in GIS Applications. In addition, in order to evaluate proposed indexing scheme, we take into account as follows. At first, we select existing R*-tree, TB-tree, and LTB-tree as the subject of performance evaluation. Secondly, we make use of random data set and real data set as experimental data. Thirdly, we evaluate the performance with respect to the variation of size of memory buffer by considering the restriction of available memory of a given system. Fourth, we test them by using the experimental data set with a variation of data distribution. Finally, we think over insertion and retrieval performance of trajectory query and range query as experimental measures. The experimental results show that the proposed indexing scheme, LTB-tree, gains better performance than traditional other schemes with respect to the insertion and retrieval of trajectory query.

  • PDF

Linked List Based Concurrency Control Technique of B+-tree for Non-Locking Retrieval Operation (B+-Tree에서의 잠금 없는 검색 연산을 위한 연결 리스트 기반의 동시성 제어 기법)

  • Eo, Sang-Hun;Kim, Myoung-Keun;Bae, Hae-Young
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.05a
    • /
    • pp.23-26
    • /
    • 2004
  • 최근 인터넷 및 이동 통신기기의 사용이 급증하면서 각종 데이터에 대한 사용자들의 검색 요청은 빠른 응답 시간을 요구하는 경우가 늘어나게 되었다. 이를 충족시키기 위하여 주기억 상주 데이터베이스 관리 시스템들이 등장하게 되었고 또한 대량의 데이터들에 대한 색인 구조와 색인에 대한 접근 충돌을 제어하면서도 빠른 응답 시간을 보장하는 색인 동시성 제어 기법들에 관한 연구가 활발히 진행되어 왔다. 현재 대부분의 주기억 상주 데이터베이스 관리 시스템들은 색인에 대한 동시성 제어 기법으로 잠금 기반의 동시성 제어 기법들을 많이 사용하고 있다. 그러나 잠금 기반의 동시성 제어 기법들은 검색 연산을 포함한 모든 연산에 대하여 접근하려고 하는 노드에 잠금을 거는 것을 요구하기 때문에 잠금이 걸려있는 노드를 접근 하려는 연산은 잠금이 풀리기를 기다려야만 한다. 따라서 잠금 기반의 색인 동시성 제어 기법들은 동시성에 제약이 생겨 검색 요청에 대한 응답시간을 지연시킨다. 본 논문에서는 $B^+$-Tree에서의 잠금 없는 검색 연산을 위하여 엔트리간 연결 리스트 기반의 동시성 제어 기법을 제안한다. 본 논문에서 제안하는 기법은 주기억 상주 데이터베이스 관리 시스템 환경에서 검색 연산이 아무런 잠금없이 수행되는 것을 보장한다. 특히 본 논문에서 제안하는 기법은 삽입, 삭제 연산이 수행 중인 노드에서의 잠금없는 검색 연산의 수행이 가능하기 때문에 잠금 기반의 동시성 제어 기법들 보다 빠르고 예측 가능한 응답시간을 보장한다.

  • PDF

Design and Implementation of High-dimernsional Index Structure supporting Concurrency Control (필터링에 기반한 고차원 색인구조의 동시성 제어 기법의 설계 및 구현)

  • 이용주;장재우
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10a
    • /
    • pp.33-35
    • /
    • 2000
  • 최근 멀티미디어 객체를 위한 효율적인 색인 기술에 대한 많은 연구가 활발히 진행되고 있으나 이러한 색인 구조들은 단일 사용자만을 지원하는데 그치고 있는 실정이며 상용 DBMS에 통합되어 실제 응용되는 사례는 드물다. 이에 본 논문에서는 필터링에 기반한 고차원 색인구조를 위한 효율적인 동시성 제어 기법을 제안하고, 지속성 객체 시스템인 SHORE 하부 저장 구조에 통합한다. 제안하는 동시성 제어 기법은 쓰레드의 개수를 증가시켜 삽입과 검색 측면에서 실험한 결과 약 30%의 응답시간 감소를 보였다.

  • PDF

Performance Evaluation of Parallel Spatial Join for Single/Multiple-Assignment Spatial Index (단일/다중할당 공간 색인에서 병렬 공간 조인의 성능평가)

  • Kim, Jin-Deok;Hong, Bong-Hui
    • Journal of KIISE:Software and Applications
    • /
    • v.26 no.6
    • /
    • pp.763-779
    • /
    • 1999
  • 공간 조인을 위한 공간 색인은 단일할당 방식과 다중할당 방식으로 구분한다. 단일할당 공간색인은 하나의 공간색채를 단 하나의 노드에만 할당하고, 다중할당은 하나의 객체를 여러 노드에 할당하는 공간 색인으로서 R-tree 가 전자에 해당하고, Quad-tree가 후자에 해당한다. 지금까지 단일 할당과 다중 할당 공간 색인에서의 공간조인에 대한 직접적인 성능 비교 평가가 거의 없다. 왜냐하면 각 공간 색인의 구조가다르고 적용할 수 있는 공간 조인 기법 또한 전혀 달라 정확한 성능 평가가 매우 어렵기 때문이다. 그래서 이 논문에서는 고정 그리드 파일을 변형하여 다중 할당 공간 색인과 단일 할당 공간 색인을 각각 구성한 뒤 두 공간 색인의 병렬 공간 조인 성능을 평가하였다. 평가를 위해 4가지 병렬공간조인기법을 제안하였다. 그리고 태스크 할당을 위해 태스크의 크기와 객체의 공간 지역성을 이용한 준동적 태스크 할당 방법을 제안하였다. 실험은 MIMD 구조 및 공유디스크 방식의 병렬 시스템에서 수행되었고, 여과 단계 후 중복을 제거하는 다중할당-단일조인 방식이 우수함을 보였다.

Optimal Design Method of Multidimensional Nested Attribute Indexes for Object-Oriented Query Processing (객체지향 질의처리를 위한 다차원 중포 속성 색인구조의 최적 설계기법)

  • Yoon, Dong-Ha;Lee, Jong-Hak
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11c
    • /
    • pp.1863-1866
    • /
    • 2002
  • 본 논문에서는 객체지향 데이터베이스 시스템에서 중포 속성에 대한 색인구조로 다차원 색인구조를 이용하는 다차원 중포 색인구조(Multidimensional Nested Attribute Index: MD-NAI)의 최적 설계기법을 제시한다. MD-NAI는 일차원 색인구조를 이용한 중포 속성 색인구조에서 지원할 수 없는 클래스 계층상의 클래스 대치가 있는 중포 술어의 질의처리를 잘 지원할 수 있다. 그러나, MD-NAI는 사용자 질의 형태에 따라 색인검색의 성능이 매우 나빠질 수 있다. 본 논문에서는 질의 형태에 따른 MD-NAI의 성능 개선을 위하여, 먼저 중포 술어에 대한 질의 정보로서 MD-NAI의 색인 페이지 영역의 최적 모양을 결정하고, 이 최적 모양을 갖는 색인 페이지 영역의 모양이 되도록 하는 영역분할 전략을 적용한다. 성능평가의 결과에 의하면, 주어진 질의 패턴에 따라 최적의 MD-NAI를 구성할 수 있었으며, 삼차원 MD-NAI의 경우에 질의 형태에 따라 5.5배까지 성능이 향상되었다.

  • PDF

An Index Splitting Technique for Numerous Sensor Data Archiving (대용량 센서 데이터 아카이빙을 위한 색인 분할 기법)

  • Cho, Dae-Soo
    • Journal of Korea Spatial Information System Society
    • /
    • v.9 no.1
    • /
    • pp.31-43
    • /
    • 2007
  • Sensor data have the characteristics such as numerous and continuous data. Therefore, it is required to develop an index which could retrieve a specific sensor data efficiently from numerous sensed data. The index should have an efficient delete operation for the past data to support the data archiving. In this paper, we have proposed and implemented an index splitting technique to support the sensor data archiving. These splitted indexes compose of a virtual index (that is, index management component), which is shown as single tree from outside. Experimental results show that in the case of 100,000 insert operations the splitted index performs 8% better than the traditional TB-tree maximumly. And the splitted index outperforms TB-tree with retrieving queries when the region of query is small and the size of time domain is large.

  • PDF

An Experimental Approach of Keyword Extraction in Korean-Chinese Text (국한문 혼용 텍스트 색인어 추출기법 연구 『시사총보』를 중심으로)

  • Jeong, Yoo Kyung;Ban, Jae-yu
    • Journal of the Korean Society for information Management
    • /
    • v.36 no.4
    • /
    • pp.7-19
    • /
    • 2019
  • The aim of this study is to develop a technique for keyword extraction in Korean-Chinese text in the modern period. We considered a Korean morphological analyzer and a particle in classical Chinese as a possible method for this study. We applied our method to the journal "Sisachongbo," employing proper-noun dictionaries and a list of stop words to extract index terms. The results show that our system achieved better performance than a Chinese morphological analyzer in terms of recall and precision. This study is the first research to develop an automatic indexing system in the traditional Korean-Chinese mixed text.

A High-dimensional Indexing Scheme using Cell-based Filtering Technique (셀 기반 필터링 방법을 이용한 고차원 색인 기법)

  • Jang, Jae-U;Han, Seong-Geun;Kim, Hyeon-Jin
    • Journal of KIISE:Databases
    • /
    • v.28 no.2
    • /
    • pp.204-216
    • /
    • 2001
  • 최근 이미지 특징 벡터와 같은 고차원 벡터 데이터에 관한 색인 기법들이 많이 연구되고 있다. 하지만, 기존의 색인 기법들은 저차원의 데이터에 대해서는 검색 성능이 우수하지만, 차원이 증가함에 따라 검색 성능이 급격히 저하되는 'dimensional curse' 문제를 안고 있다. 따라서, 본 논문에서는 이러한 문제점을 최소화하기 위해 필터링을 이용한 새로운 색인 기법을 제안한다. 제안하는 셀 기반 필터링 기법은 셀 중심에서 객체까지의 거리값을 저장하여 필터링 효과를 증대시킨다. 또한 고차원 공간을 셀 단위로 분할하며, 각각의 셀을 시그니쳐로 표현한다. 검색을 수행하기 위해, 셀 기반 필터링 기법은 데이터 파일을 직접 접근하기 전에 전체 시그니쳐들을 탐색하여 필터링을 수행함으로써 후보 셀들을 얻는다. 성능 실험을 통해 제안하는 기법이 VA-파일보다 검색 시간에 있어서 약 20%의 성능 향상을 보인다.

  • PDF