• Title/Summary/Keyword: 색인기법

Search Result 654, Processing Time 0.03 seconds

The Experimental Study on the Relationship between Hierarchical Agglomerative Clustering and Compound Nouns Indexing (계층적 결합형 문서 클러스터링 시스템과 복합명사 색인방법과의 연관관계 연구)

  • Cho Hyun-Yang;Choi Sung-Pil
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.38 no.4
    • /
    • pp.179-192
    • /
    • 2004
  • In this paper, we present that the result of document clustering can change dramatically with respect to the different ways of indexing compound nouns. First of all, the automatic indexing engine specialized for Korean words analysis, which also serves as the backbone engine for automatic document clustering system, is introduced. Then, the details of hierarchical agglomerative clustering(HAC) method, one of the widely used clustering methodologies in these days, was illustrated. As the result of observing the experiments, carried out in the final part of this paper, it comes to the conclusion that the various modes of indexing compound nouns have an effect on the outcome of HAC.

A Study on Natural Language Keyword Indexing for Web-based Information Retrieval (웹기반 정보검색을 위한 자연어 키워드 색인에 관한 연구)

  • 윤성희
    • Journal of the Korea Computer Industry Society
    • /
    • v.4 no.12
    • /
    • pp.1103-1111
    • /
    • 2003
  • Information retrieval system with indexing system matching single keyword is simple and popular. But with single keyword matching it is very hard to represent the exact meaning of documents and the set of documents from retrieval is very large, therefore it can't satisfy the user of the information retrieval systems. This paper proposes a phrase-based indexing system based on the phrase, the larger syntax unit than a single keyword. Web documents include lots of syntactic errors, the natural language parser with high Quality cannot be expected in Web. Partial trees, even not a full tree, from fully bottom-up parsing is still useful for extracting phrases, and they are much more discriminative than single keyword for index. It helps the information retrieval system enhance the efficiency and reduce the processing overhead.

  • PDF

An Update Management Technique for Efficient Processing of Moving Objects (이동 객체의 효율적인 처리를 위한 갱신 관리 기법)

  • 최용진;민준기;정진완
    • Journal of KIISE:Databases
    • /
    • v.31 no.1
    • /
    • pp.39-47
    • /
    • 2004
  • Spatio-temporal databases have been mostly studied in the area of access methods. However, without considering an extraordinary update maintenance overhead after building up a spatio-temporal index, most indexing techniques have focused on fast query processing only. In this paper, we propose an efficient update management method that reduces the number of disk accesses required in order to apply the updates of moving objects to a spatio-temporal index. We consider realistic update patterns that can represent the movements of objects properly. We present a memory based structure that can efficiently maintain a small number of very frequently updating objects. For an experimental environment with realistic update patterns, the number of disk accesses of our method is about 40% lower than that of a general update method of existing spatio-temporal indexes.

1pCSB+ - tree: An Enhanced Main Memory Index Structure Employing Level Prefetching Technique (1pCSB+ - 트리: 레벨 프리페칭 기법을 이용하는 향상된 주기억장치 상주형 색인구조)

  • Hong, Hyun-Taek;Pee, Jun-Il;Song, Seok-Il;Yoo, Jae-Soo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11c
    • /
    • pp.1753-1756
    • /
    • 2002
  • 주기억장치 상주형 색인구조에서는 2차 캐쉬 실패가 성능에 매우 큰 영향을 미친다. 기존에 제안된 주기억장치 상주형 색인구조들은 2차 캐쉬 실패를 고려하긴 했지만 여전히 트리의 각 레벨을 접근할 때는 2차 캐쉬실패가 발생한다. 본 논문에서는 이러한 문제점을 인식하고 트리 순회시 각 레벨을 방문할 때도 캐쉬 실패가 발생하지 않는 주기억장치 색인구조를 제안한다. 제안하는 색인구조는 다음 레벨에서 방문할 가능성이 있는 노드들을 프리페칭하여 다음 레벨을 방문할 때도 캐쉬 실패가 발생하지 않도록 한다. 또한, 기본적인 구조는 노드그룹 개념을 이용하여 노드의 팬-아웃을 증가시키는 CSB+-트리에 기반하지만 CSB+-트리의 다점인 분할 비용의 증가문제를 해결하기 위한 방법을 제안한다. 시뮬레이션을 통해 기존의 색인구조와 비교하여 제안하는 색인구조의 우수성을 보인다.

  • PDF

Study on the Vocabulary Synthesis for Index Term Selection (색인어 선정을 위한 어휘결집력에 관한 연구)

  • Kim, Chul;Jeong, Jun-Min
    • Journal of the Korean Society for information Management
    • /
    • v.13 no.1
    • /
    • pp.205-226
    • /
    • 1996
  • Under the hypothesis that any pair of terms in the sentence is meaningful to present the context of the paper, the Brillouin measure of term relatedness in automatic indexing is proposed. For the experiment, the pair of terms simul-taneously appeared in two or more sentences of the paper are extracted from the title and abstract of the paper. Com-pared with the list of index terms or subject headings suggested by the author, the terms in term relatedness graph are highly matched with the terms in the list. Especially, it is revealed that the rank of terms by synthetic strength is use-ful in the selection of index terms.

  • PDF

Efficient Bidirectional linear Broadcast Indexing with Sensor Networks in road environments (도로 환경에서 센서 네트워크를 이용한 효율적인 양방향 선형 브로드캐스트 색인 기법)

  • Kang, Soo;Hwang, Dong-Kyo;Seong, Dong-Ook;You, Jae-Soo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06a
    • /
    • pp.57-60
    • /
    • 2011
  • 도로 환경에서 이동하는 객체에 효율적인 위치기반 서비스를 제공하기 위해 다양한 브로드캐스트 기법들이 연구 되어 왔다. 하지만 실시간으로 변하는 도로 환경을 고려한 효율적인 브로드캐스트 기법이 요구되고 있다. 본 논문에서는 도로 특성을 고려한 양방향 선형 브로드캐스트 색인 구조를 제안하고, 빈번하게 변화하는 도로 환경을 고려하여 센서 네트워크를 통해 수집되는 도로 정보를 기반으로 최적의 QoS(Quality of Service)를 유지시키는 브로드캐스트 전략 갱신 기법을 제안한다. 또한 질의 처리 속도 향상을 위해 서비스 지역을 센서 클러스터 기반의 지역 세그먼트로 분할하여 불필요한 데이터의 브로드캐스트를 제거하는 분산 브로드캐스트 서비스 구조를 제안한다. 제안하는 기법의 우수성을 증명하기 위해 기존에 제안된 브로드캐스트 기법과 성능을 비교 평가한다.

The GR-tree: An Energy-Efficient Distributed Spatial Indexing Scheme in Wireless Sensor Networks (GR-tree: 무선 센서 네트워크에서 에너지 효율적인 분산 공간색인기법)

  • Kim, Min-Soo;Jang, In-Sung
    • Spatial Information Research
    • /
    • v.19 no.5
    • /
    • pp.63-74
    • /
    • 2011
  • Recently, there has been much interest in the spatial query which energy-efficiently acquires sensor readings from sensor nodes inside specified geographical area of interests. The centralized approach which performs the spatial query at a server after acquiring all sensor readings, though simple, it incurs high wireless transmission cost in accessing all sensor nodes. In order to remove the high wireless transmission cost, various in-network spatial indexing schemes have been proposed. They have focused on reducing the transmission cost by performing distributed spatial filtering on sensor nodes. However, these in-network spatial indexing schemes have a problem which cannot optimize both the spatial filtering and the wireless routing among sensor nodes, because these schemes have been developed by simply applying the existing spatial indexing schemes into the in-network environment. Therefore, we propose a new distributed spatial indexing scheme of the GR-tree. The GR-tree which form s a MBR-based tree structure, can reduce the wireless transmission cost by optimizing both the efficient spatial filtering and the wireless routing. Finally, we compare the existing spatial indexing scheme through extensive experiments and clarify our approach's distinguished features.

인용문헌의 효율적인 검색을 위한 KSCI 시스템 설계

  • Lee, Gye-Jun
    • Journal of Scientific & Technological Knowledge Infrastructure
    • /
    • s.7
    • /
    • pp.113-127
    • /
    • 2001
  • 인용문헌정보의 효율적인 저장과 검색을 위하여 인용한 문헌과 인용된 문헌들의 구성요소를 추출하고 상호 인용관계에 대한 논리정보와 구조정보를 재구성을 통해 표현하고, 패스인코딩 색인기법에 의해 구성요소의 중복을 제거하였으며, 관련 있는 데이터베이스들과의 연계를 위하여 XML을 기반으로 하는 KSCI(Korea Science Citation Index)시스템을 설계하였다.

  • PDF

Indexing and Query Processing for Moving Sensor Nodes in Sensor Networks (센서네트워크에서 이동 센서노드를 위한 색인 및 질의처리)

  • Kim, Young-Jin;Chang, Jae-Woo
    • Proceedings of the Korean Association of Geographic Inforamtion Studies Conference
    • /
    • 2008.10a
    • /
    • pp.76-81
    • /
    • 2008
  • 최근 유비쿼터스 환경을 실현하는 기술로서 사물 및 환경 정보를 센싱하여 필요한 정보를 수집 및 분석. 처리하는 센서네트워크 기술에 대한 관심이 고조되고 있다. 특히 최근 국내에서는 u-City와 u-Port 사업 등, 범국가적인 차원의 도입을 통해 환경 정보 모니터링, 홈 자동화, 자산 물류 응용 등의 다양한 센서네트워크를 이용한 서비스가 등장하였다. 이러한 기존의 응용서비스는 모든 센서노드가 고정되어 있는 환경에서 응용 대상의 데이터를 수집하는 서비스가 대부분이다. 그러나 동물의 생태 모니터링 등의 응용을 위해서는 센서를 움직이는 대상에 부착하여 이동하는 센서노드로부터 효율적으로 데이터를 수집하기 위한 연구가 필요하다. 따라서 본 논문에서는 이동하는 센서로부터 효율적으로 데이터를 수집하기 위하여 이동노드 색인 기법을 설계한다. 아울러 제안하는 색인 기법을 위한 영역질의 처리 알고리즘을 제시한다.

  • PDF

A Method for Efficient Event Filtering over Continuous Data Streams (연속 데이터 스트림에서 효율적인 이벤트 필터링 기법)

  • Kim, Hyeon-Gyu;Kang, Woo-Lam;Kim, Myoung-Ho
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2008.06c
    • /
    • pp.1-6
    • /
    • 2008
  • 일반적으로 연속 데이터 스트림을 모니터링하는 응용은 다수의 범위 질의를 포함한다. 이러한 다수의 범위 질의는 술어 색인을 이용해 효율적으로 처리할 수 있다. IBS-tree는 연속 데이터 스트림 상에서 효과적으로 이용될 수 있는 술어 색인 기법 중 하나이다. 그러나 IBS-tree는 모든 노드에서 등호 검사와 부등호 검사를 함께 실시하며, 이는 검색 성능의 저하로 이어질 수 있다. 본 논문에서는 등호 검사와 부등호 검사를 분리하여 수행함으로써 검색 성능을 향상시키는 술어 색인 방법을 제안한다. 제안하는 방법은 등호 검사를 위해 해싱을 이용하고, 부등호 검사에는 균형 이진 검색 트리를 이용한다. 본 논문에서는 실험을 통해 IBS-tree와 제안하는 방법의 검색 성능을 비교하였으며, 실험 결과로부터 제안하는 방법의 성능이 더욱 우수한 것을 확인하였다.

  • PDF