• 제목/요약/키워드: Indexing Technique

검색결과 203건 처리시간 0.035초

T*-트리:주기억 데이터베이스에서의 효율적인 색인기법 (T*-tree:An Efficient Indexing Technique for Main Memory Database)

  • 최공림;김기룡;김경창
    • 한국통신학회논문지
    • /
    • 제21권10호
    • /
    • pp.2597-2604
    • /
    • 1996
  • 본 논문에서는 주기억 데이터베이스 시스템에서의 효율적인 데이터 처리를 위하여 T*-트리라는 새로운 색인구조를 제시한다. T*-트리 색인구조는 기존의 디스크를 기반으로 하는 색인기법과 달리 모든 데이터가 주기억장치에 적재되어 있는 시스템에서 보다 빠른 데이터 접근과 메모리 공간의 효율적인 사용을 위해 주기억 데이터베이스 시스템에서 주로 사용되고 있는 T*-트리색인구조의 장점은 그대로 계승하면서 단점을 보완한 인덱스 구조이다. 본 논문에서 제시하는 T*-트리는 데이터 아이템에 대한 검색과 저장공간의 활용면에서는 T*-트리와 대동소이한 성능을 가지고 있으나, 범위 질의에서와 데이터 아이템에 대한 검색과 삭제시 중간노드에서의 노드간의 순회경로를 줄임으로써 보다 향상된 성능을 보여준다. 또한 T*-트리와 스레드 이진트리를 조합하는 경우에는 순회경로가 다소 단축되지만 중간노드에서 자신보다 높은 레벨의 후속 노드로의 순회는 기존의 인오더 트리 순회에 의존하지만, T*-트리에서는 후위포인터를 이용하므로 직접순회가 가능하게 된다. 본 논문에서는 제안된 T*-트리의 구조와 T*-트리의 검색, 삽입 및 삭제 연산을 위한 알고리즘을 설명한 후, 기존의 T*-트리와 성능분석을 실시하고 그 결과를 제시한다. 성능 분석결과 T*-트리는 데이터 검색의 경우 기존의 T*-트리와 거의 동일한 성능을 보였으며, 삽입과 식제등 색인구조의 변경시는 약간의 성능향상을 보였으나, 범위질의와 순차질의에서는 매우 향상된 성능을 나타냈다.

  • PDF

EBSD 기법을 이용한 Gamma TiAl의 마이크로 조직파괴에 관한 연구 (A Study on Gamma TiAl Micro-structural Fracture with EBSD Technique)

  • 김윤해;우병훈;배창원;배성열;;문경만
    • Journal of Advanced Marine Engineering and Technology
    • /
    • 제31권4호
    • /
    • pp.377-384
    • /
    • 2007
  • A backscatter Kikuchi diffraction attachment to an SEM enables the convenient investigation of grain orientations on bulk or micro surface. Their relation to micro structural features gives insight into many aspects of anisotropic materials properties. In micro area such as Micro Electro Mechanical Systems(MEMS) devices is required in order to improve understanding of how they may be expected to perform upon the micro scale. Electro Back Scatter Diffraction (EBSD) helps us to find uniform area as MEMS material. The ${\gamma}-TiAl$ has two different lamellar structures ${\gamma}/{\alpha}2-Ti_3Al$ phase which have shows $\{111\}{\gamma}//\{0001\}{\alpha}2$ plane indexing. The micro size testing specimen was successfully made by this structural relation. Interlamellar structure specimen averagely show $20{\sim}25%$ lower fracture toughness value compare with translamellar specimens Moreover micro fracture surface and micro crack progress were observed.

A Semantic Service Discovery Network for Large-Scale Ubiquitous Computing Environments

  • Kang, Sae-Hoon;Kim, Dae-Woong;Lee, Young-Hee;Hyun, Soon-J.;Lee, Dong-Man;Lee, Ben
    • ETRI Journal
    • /
    • 제29권5호
    • /
    • pp.545-558
    • /
    • 2007
  • This paper presents an efficient semantic service discovery scheme called UbiSearch for a large-scale ubiquitous computing environment. A semantic service discovery network in the semantic vector space is proposed where services that are semantically close to each other are mapped to nearby positions so that the similar services are registered in a cluster of resolvers. Using this mapping technique, the search space for a query is efficiently confined within a minimized cluster region while maintaining high accuracy in comparison to the centralized scheme. The proposed semantic service discovery network provides a number of novel features to evenly distribute service indexes to the resolvers and reduce the number of resolvers to visit. Our simulation study shows that UbiSearch provides good semantic searchability as compared to the centralized indexing system. At the same time, it supports scalable semantic queries with low communication overhead, balanced load distribution among resolvers for service registration and query processing, and personalized semantic matching.

  • PDF

효율적인 이동 객체의 궤적 색인을 위한 TB-tree 갱신 기법 (TB-tree Update Technique for Efficient Indexing Trajectories of Moving Objects)

  • 고주일;김명근;정원일;김재홍;배해영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.145-147
    • /
    • 2003
  • 시간이 흐름에 따라 위치가 연속적으로 변경되는 객체를 이동 객체(Moving Objects)라고 한다. 이러한 이동 객체의 대용량 궤적 정보를 효율적으로 검색하기 위해서 색인이 필요하며 대표적인 색인으로 TB-tree가 있다. 그러나 전통적인 공간 색인인 R-tree 기반의 TB-tree는 엄격한 궤적 보존 정책에 의해 레코드가 삽입될 때마다 해당 레코드의 선행자(predecessor)를 포함하는 단말 노드를 검색해야 하며, 레코드 삽입으로 인한 단말 노드 MBB의 변경을 해당 단말 노드에서부터 루트 노드까지 반영해야하는 갱신 부하를 가지고 있다. 본 논문에서는 대용량 궤적 정보의 효율적인 색인을 위한 TB-tree 갱신 기법을 제안한다. 본 기법은 앞으로 삽입될 이동 객체의 궤적을 포함하는 예상된 MBB(EMBB: Expected Minimum Bounding Box)를 트리에 먼저 반영한다. 그 후 새로운 레코드가 삽입될 때마다 중간 노드의 MBB를 갱신하지 않고, 삽입되는 레코드의 MBB가 EMBB을 벗어났을 때 EMBB를 재설정하여 실제로 삽입된 레코드의 MBB와 재설정된 EMBB를 포함하도록 중간 노드의 MBB를 조정하므로 TB-tree의 MBB 조정 횟수를 줄인다. 또한 TB-tree에 선행자를 포함하는 단말 노드를 직접적(direct)으로 접근하기 위하여 별도의 선행자 테이블(Predecessor Table) 구조를 두어 레코드 삽입을 위해 선행자를 포함하는 단말 노드의 검색비용을 줄여 전체적인 색인 갱신 비용이 감소된다.

  • PDF

Traffic Information Service Model Considering Personal Driving Trajectories

  • Han, Homin;Park, Soyoung
    • Journal of Information Processing Systems
    • /
    • 제13권4호
    • /
    • pp.951-969
    • /
    • 2017
  • In this paper, we newly propose a traffic information service model that collects traffic information sensed by an individual vehicle in real time by using a smart device, and which enables drivers to share traffic information on all roads in real time using an application installed on a smart device. In particular, when the driver requests traffic information for a specific area, the proposed driver-personalized service model provides him/her with traffic information on the driving directions in advance by predicting the driving directions of the vehicle based on the learning of the driving records of each driver. To do this, we propose a traffic information management model to process and manage in real time a large amount of online-generated traffic information and traffic information requests generated by each vehicle. We also propose a road node-based indexing technique to efficiently store and manage location-based traffic information provided by each vehicle. Finally, we propose a driving learning and prediction model based on the hidden Markov model to predict the driving directions of each driver based on the driver's driving records. We analyze the traffic information processing performance of the proposed model and the accuracy of the driving prediction model using traffic information collected from actual driving vehicles for the entire area of Seoul, as well as driving records and experimental data.

스키마 기반의 XML문서 관리 시스템 설계 (Design of XML Document Management System based on Schema)

  • 조윤기;김영란
    • 한국컴퓨터정보학회논문지
    • /
    • 제6권4호
    • /
    • pp.85-93
    • /
    • 2001
  • 정보화 사회로의 진행이 가속화됨에 따라 정보 양이 급격히 증가하면서 XML을 이용하여 정보를 효율적으로 저장하고 검색하기 위한 많은 연구들이 진행되고 있다. 그러나 기존의 방법은 특정 엘리먼트의 부모, 자식, 형제에 대한 다양한 구조 검색을 효율적으로 지원하지 못한다. 따라서 이 논문에서는 XML 문서의 효율적인 관리와 구조검색을 위해OETID를 이용한 구조 정보 표현과 색인 기법을 제안한다. 또한 XML 문서의 구조 정보를 저장하기 위한 저장 기법과 검색 결과에 대한 문서통합 과정을 제안한다. 제안한 방법을 이용하여 XML 문서의 구조 정보를 효율적으로 표현할 수 있을 뿐 아니라 간단한 연산으로 특정 엘리먼트에 직접적인 접근과, 다양한 질의 처리가 가능하다. 따라서 보다 효율적이고 빠른 검색을 지원할 수 있다.

  • PDF

멀티 디스크 방송 환경을 위한 인덱스 기술 (An Indexing Technique for Multi-Disks Broadcast Environments)

  • 박기영;정성원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.215-218
    • /
    • 2007
  • 모바일 환경에서는 상향링크와 하향링크의 대역폭이 비대칭적이며 전력이 한정되어 있기 때문에 효율적인 데이터 전송기술로 브로드캐스팅 방법이 연구되어 왔다. 브로드캐스트에서 인덱스를 사용하면 원하는 데이터가 언제 방송되는지를 알 수 있어 튜닝 시간을 줄이고, 전력의 소비를 줄이는 효과가 있다. 지금까지 연구된 싱글 채널 인덱스 기법들은 모든 데이터 아이템이 동일한 확률로 접근되는 flat 브로드캐스트 방송에 적합한 인덱스 기법들이다. 데이터 아이템에 대한 접근 확률이 편향되는 경우에는 멀티디스크 방송 기법을 사용해야 효과적이지만, 기존의 인덱스 기법들은 인덱스가 한 방송 주기 내에서 반복되어 방송되는 데이터 아이템을 가리킬 수 없기 때문에 멀티디스크 방송 기법에는 효과적이지 않다. 본 논문에서는 싱글 채널 인덱스 기법으로서 멀티디스크 방송에 적용되는 인덱스 기법인 MDEI (Multi-disk Exponential Index) 기법을 제안한다. 제안 하는 MDEI 기법은 각 디스크 별로 인덱스를 구성하기 때문에 데이터에 대한 접근확률이 편향되는 경우에 멀티디스크 방송을 기반으로 이 인덱스 기법을 사용하면 flat 브로드캐스트를 사용하는 다른 인덱스 기법을 사용했을 때보다 평균 접근지연시간 시간을 크게 줄일 수 있다. 실험 결과는 데이터에 대한 접근 확률이 편향된 환경에서 MDEI가 평균 접근지연시간에 있어서 매우 좋은 성능을 갖는 것을 보여준다.

  • PDF

Building Hybrid Stop-Words Technique with Normalization for Pre-Processing Arabic Text

  • Atwan, Jaffar
    • International Journal of Computer Science & Network Security
    • /
    • 제22권7호
    • /
    • pp.65-74
    • /
    • 2022
  • In natural language processing, commonly used words such as prepositions are referred to as stop-words; they have no inherent meaning and are therefore ignored in indexing and retrieval tasks. The removal of stop-words from Arabic text has a significant impact in terms of reducing the size of a cor- pus text, which leads to an improvement in the effectiveness and performance of Arabic-language processing systems. This study investigated the effectiveness of applying a stop-word lists elimination with normalization as a preprocessing step. The idea was to merge statistical method with the linguistic method to attain the best efficacy, and comparing the effects of this two-pronged approach in reducing corpus size for Ara- bic natural language processing systems. Three stop-word lists were considered: an Arabic Text Lookup Stop-list, Frequency- based Stop-list using Zipf's law, and Combined Stop-list. An experiment was conducted using a selected file from the Arabic Newswire data set. In the experiment, the size of the cor- pus was compared after removing the words contained in each list. The results showed that the best reduction in size was achieved by using the Combined Stop-list with normalization, with a word count reduction of 452930 and a compression rate of 30%.

센서 네트워크 환경에서 최적화된 분산 R-tree를 이용한 에너지 인식 질의 처리 방법 (Power-Aware Query Processing Using Optimized Distributed R-tree in Sensor Networks)

  • 수라즈반데;어상훈;김호석;배해영
    • 정보처리학회논문지D
    • /
    • 제13D권1호
    • /
    • pp.23-28
    • /
    • 2006
  • 본 논문에서는 센서 네트워크 환경에서 최적화된 분산 R-tree를 사용하여 공간 범위 질의 처리시 센서들의 에너지 소모를 최소화하는 방법을 제안한다. 제안된 기법은 센서 네트워크를 이용하는 공간 범위 질의 처리시 센서들의 공간상의 위치에 대한 색인을 이용하는 새로운 방법이다. 최근들어 센서 네트워크 환경에서의 공간 범위 질의는 특정 지역에 대한 센서 노드들의 집계 값을 계산하는 방법으로 더욱 중요시되어지고 있다. 기존 연구들은 공간 범위 질의 처리의 중요성을 많이 언급을 하였지만 현재까지 이에 대한 효율적인 방법에 대해서는 제안하지 못하고 있는 실정이다. 제안된 기법에서 센서 네트워크 상의 각각의 센서 노드들은 자신과 자신의 자식 노드들의 위치를 포함하는 MBR을 갖는다. 공간 범위 질의는 제안하는 분산 R-tree를 기반으로 센서들의 공간상의 위치와 질의 범위가 서로 겹치는 지역에 대하여 평가된다. 이러한 접근방법은 공간 범위 질의에 대한 평가를 수행함에 있어 참여하지 않는 불필요한 노드들과의 통신을 방지하여 센서 노드들의 에너지 소모를 최소화한다.

RFID 태그의 이력 추적을 위한 시간 간격 색인 : SLR-트리 (A Time Interval Index for Tracking Trajectories of RFID Tags : SLR-Tree)

  • 류우석;안성우;홍봉희;반재훈;이세호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권1호
    • /
    • pp.59-69
    • /
    • 2007
  • RFID 시스템에서의 태그의 궤적은 태그가 리더의 인식영역에 들어왔을 때와 벗어날 때의 시공간 위치를 선분으로 연결하여 표현한다. 그러나 태그가 리더의 인식영역을 벗어난 후 다음 리더의 인식영역에 들어올 때까지는 태그의 위치를 파악할 수 없으므로 태그의 궤적은 연결되어 있지 않고 단절된 간격의 집합으로 표현된다. 그러므로 태그의 이력을 검색하기 위해서는 전체 색인을 검색해야 하는 문제가 발생한다. 이 논문에서는 높은 궤적 검색 비용문제를 해결하기 위해 전자태그의 간격을 연결하기 위한 기법을 제시하고 이 기법을 적용한 색인인 SLR-tree를 제안한다. 또한, 연결 정보의 추가로 인한 노드의 공간 활용도의 저하를 최소화하기 위하여 두 간격간의 연결정보를 공유하기 위한 기법을 제안하고 노드의 분할 시 공유정보를 유지하기 위한 분할 정책을 제안한다. 마지막으로 제안된 색인에 대한 성능을 비교평가 함으로써 이력검색 성능의 우수성을 입증한다.