• Title/Summary/Keyword: 색인기법

Search Result 654, Processing Time 0.033 seconds

A Study of Indexing Methods with weight-value of Web document (가중치를 가지는 웹문서 색인기법에 관한 연구)

  • Kim, Jong-Young;Kim, Cheol-Su
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11c
    • /
    • pp.2459-2462
    • /
    • 2002
  • 검색된 문헌들에 대한 항해 시간을 줄이기 위해서 검색된 문헌들의 문헌 순위화가 필수적이다. 문헌 순위화를 위해서는 문헌 순위화를 위한 순위화 정보가 필요하다. 본 논문에서는 검색된 문헌들에 대한 순위화를 보다 효율적으로 수행하기 위한 정보를 제공하기 위하여 HTML 문서에 대한 색인 과정에서 다양한 가중치를 가지는 색이어 추출 방법에 관하여 연구하였다. 웹문서들은 태그로 이루어지며 중요한 색인어들은 특정 태그 속에 포함되어 있다는 것에 착안하여 색인어의 중요도에 영향을 줄 수 있는 태그를 선별하고, 선별된 태그들에 대해 휴리스틱 정보를 이용하여 중요도를 부여한 후 선별된 태그에 영향을 받는 문장들에서 추출된 색인어에 대하여 가중치를 부여하는 방법을 이용하였다. 색인어 추출을 형태소 분석기를 이용하였다. 색인어들이 다양한 가중치를 가지므로 검색 과정에서 검색된 문헌들에 대하여 효율적인 순위화가 가능하여 관련 문헌을 보다 빠르게 찾을 수 있는 환경을 제공할 수 있다.

  • PDF

A Type Hierarchy Index for XML Databases with XML Schema (XML Schema에 의한 XML 데이타베이스의 타입 상속 색인구조)

  • Lim Yun-Ju;Lee Jong-Hak
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.11a
    • /
    • pp.85-88
    • /
    • 2004
  • 최근 XML데이터베이스는 웹의 발전과 더불어 광범위한 인터넷의 자원 공유에 크게 기여하고 있으며 이러한 자원 공유를 위해서는 XML데이타베이스에 대한 구조적 정의로 타입 상속 구조를 가지는 XML Schema를 사용한다. 그러므로 XML Schema를 따르는 XML데이타베이스에 대한 효율적인 색인기법에 대한 연구가 필요하다. 따라서 본 논문에서는 기존의 다차원 색인구조와 사전에 분석한 사용자 질의 패턴에 대한 정보를 이용하여 주어진 질의들에 의해서 액세스되는 색인 페이지의 평균 개수가 최소가 되게 하는 최적의 이차원 타입 색인 구조를 구성 할 수 있는 2D-THI를 제안한다. 제안한 2D-THI의 성능을 비교 평가하기 위해서 기존의 객체지향 데이터베이스에서 클래스 상속에 대한 색인구조로 널리 사용되고 있는 CH-index와 CG-tree를 XML데이타베이스에 적용하여 이들과 2D-THI를 비용모델을 통해서 비교 분석한다. 그 결과로 본 논문에서 제안한 2D-THI로서 다양한 질의 패턴에 대해서 최적의 색인구조를 구성할 수 있음을 보인다.

  • PDF

Peer Indexing Scheme using Efficient Data Dissemination in Mobile P2P Environment (이동 P2P 환경에서 효율적인 데이터 전송을 이용한 피어 색인 기법)

  • Kwak, Dong-Won;Bok, Kyoung-Soo;Park, Yong-Hun;Jeong, Keun-Soo;Choi, Kil-Sung;Yoo, Jae-Soo
    • The Journal of the Korea Contents Association
    • /
    • v.10 no.9
    • /
    • pp.26-35
    • /
    • 2010
  • In this paper, we propose the peer indexing scheme using data dissemination considering content and mobility. The proposed scheme consists of an index table, a buddy table, a routing table to support the cost of data dissemination, the search accuracy and cost. In this proposed scheme, a neighbor peer is recognized through a signal function and the cost of data dissemination is reduced by timestamp message. The transmitted messages are stored in the index structure considering timestamp and weight of interests which improves search accuracy and reduces the cost of search.

Bit-Vector-Based Space Partitioning Indexing Scheme for Improving Node Utilization and Information Retrieval (노드 이용률과 검색 속도 개선을 위한 비트 벡터 기반 공간 분할 색인 기법)

  • Yeo, Myung-Ho;Seong, Dong-Ook;Yoo, Jae-Soo
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.16 no.7
    • /
    • pp.799-803
    • /
    • 2010
  • The KDB-tree is a traditional indexing scheme for retrieving multidimensional data. Much research for KDB-tree family frequently addresses the low storage utilization and insufficient retrieval performance as their two bottlenecks. The bottlenecks occur due to a number of unnecessary splits caused by data insertion orders and data skewness. In this paper, we propose a novel index structure, called as $KDB_{CS}^+$-tree, to process skewed data efficiently and improve the retrieval performance. The $KDB_{CS}^+$-tree increases the number of fan-outs by exploiting bit-vectors for representing splitting information and pointer elimination. It also improves the storage utilization by representing entries as a hierarchical structure in each internal node.

An Efficient Processing Technique for Similarity based Visual Queries (효율적인 유사 시각질의 처리)

  • Hwang, Jun
    • Journal of Internet Computing and Services
    • /
    • v.1 no.1
    • /
    • pp.1-14
    • /
    • 2000
  • Visual information retrieval and image databases are very important applications of spatial access methods. The quaries for these applications are visual and based not on exact match but on dubjective similarity. The individual aperations of spatial access methods are much more expensive than those of conventional one-dimensional access methods. Also, because the visual queries are much more complex than textual queries, an efficient processing technique for visual queries is one of the critical requirements in the development of large and scalable image databases. Therefore, efficient translation and execution for the complex visual queries are not less important than those of textual databases. In this paper, we introduce our cognitive and topological studies that are required to process subjective visual queries effectively. Then, we propose an efficient translation and execution techniques for similarity based visual queries by conducting these related studies.

  • PDF

Query Indexing Technique for Processing Stream Data (스트림 데이터 처리를 위한 질의 색인 기법)

  • Lee, Dong-Gyu;Chung, Jae-Du;Lee, Yang-Koo;Jung, Young-Jin;Ryu, Keun-Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.11a
    • /
    • pp.381-384
    • /
    • 2006
  • 센서 네트워크 환경에서 스트림 데이터를 모니터링 하기 위해서는 스트림 데이터에 대한 연속적인 질의들을 효과적으로 처리하는 것이 필요하다. 이러한 연속적인 질의를 빠르게 검색하고 처리하기 위하여 낮은 저장 비용과 빠른 탐색 성능을 가진 질의 색인 기법이 많이 활용되고 있다. 기존 연구들은 사전에 삽입될 Interval 을 알고 트리를 구성하므로 동적인 삽입, 삭제가 불가능하거나 삽입된 Interval 수와 Interval 의 범위에 따라 높은 저장 비용이나 상대적으로 느린 탐색 속도를 보인다. 따라서 이 논문에서는 연속적인 질의 처리를 효율적으로 하기 위하여 Hashed Multiple Lists 를 제안한다. 제안된 기법은 빠른 선형 탐색 성능과 낮은 저장 비용을 요구하며 삽입, 삭제가 용이하고 다양한 범위를 표현할 수 있는 장점이 있다. 제안된 색인 기법은 센서 네트워크를 응용한 시스템과 상황 인식 시스템 등에서 연속적인 질의를 처리하는데 활용할 수 있다.

  • PDF

A Fast and Powerful Question-answering System using 2-pass Indexing and Rule-based Query Processing Method (2-패스 색인 기법과 규칙 기반 질의 처리기법을 이용한 고속, 고성능 질의 응답 시스템)

  • 김학수;서정연
    • Journal of KIISE:Software and Applications
    • /
    • v.29 no.11
    • /
    • pp.795-802
    • /
    • 2002
  • We propose a fast and powerful Question-answering (QA) system in Korean, which uses a predictive answer indexer based on 2-pass scoring method. The indexing process is as follows. The predictive answer indexer first extracts all answer candidates in a document. Then, using 2-pass scoring method, it gives scores to the adjacent content words that are closely related with each answer candidate. Next, it stores the weighted content words with each candidate into a database. Using this technique, along with a complementary analysis of questions which is based on lexico-syntactic pattern matching method, the proposed QA system saves response time and enhances the precision.

Spliting polios of interval R-Trees for tracking RFID tag objects (전자태그 객체의 추적을 위한 간격 R-트리의 분할 정책)

  • Lee, Se-Ho;Ahn, Sung-Woo;Hong, Bong-Hee;Ban, Chae-Hoon;Lim, Duk-Sung
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.40-42
    • /
    • 2005
  • RFID(Radio Frequency Identification)는 자동 인식 데이터 수집 장치의 한 분야로써 GPS장치를 장착한 차량과 같이, RFID 태그(전자태그)를 상품에 부착하여 인식, 추적할 수 있다. 이러한 전자태그 객체는 시간에 따라 경로 정보가 누적되는 이동체와 유사한 특성을 가진다. 그러나 기존의 이동체 색인과 달리 태그 객체의 위치는 판독기의 위치로 인식되며 위치보고가 판독기의 인식영역 안에서만 이루어지므로 보고 주기를 예측할 수 없다. 기존의 이동체 색인에서 전자태그의 특성을 표현하기 힘들기 때문에 전자태그의 특성을 고려란 색인이 필요하게 되었다. 최근 전자태그의 특성을 고려한 색인인 TPIR-Tree(Time parameterized Interval R-Tree)가 발표되었다. 그러나 이 색인은 기존 공간 색인에서의 균등분할 기법을 사용하여 위치보고가 시간의 순서를 가지는 전자태그의 특성을 고려하지 못하여 과거노드의 저장효율이 좋지 못하다. 이 논문에서는 TPIR-Tree의 저장효율 및 검색 성능 향상을 위해서 시간의 순서에 따라 위치를 보고하는 전자태그 객체의 특성을 고려하여 분할축 선정 기법 및 시간축 분할시 비균등 분할정책을 제안한다.

  • PDF

Efficient Range Query on Moving Object Trajectories (이동객체궤적에 대한 효율적인 범위질의)

  • Park, Young-Hee;Kim, Gyu-Jae;Cho, Woo-Hyun
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.18 no.2
    • /
    • pp.364-370
    • /
    • 2014
  • The management and analysis of spatio-temporal and multimedia data is a hot issue in database research because such data types are handled in manny applications. Querying databases of such a content is very important for these applications. This paper addresses algorithms that make index structure by using Douglas-Peucker Algorithm and process range query efficiently on moving objects trajectories. We compare and analyze our algorithms and MBR by experiments. Our algorithms make smaller size of index structure and process more efficiently.

Mapping System based on Indexing for Integrating Distributed Data (분산 데이터 통합을 위한 색인기반의 매핑 시스템)

  • 설진안;김운용;정계동;최영근
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10c
    • /
    • pp.436-438
    • /
    • 2003
  • 분산된 데이터는 이질적인 시스템 환경으로 인하여 공유하기 어렵고. 데이터의 형식 및 데이터 모델이 서로 다르게 정의되어 사용함으로서 통합하기 또한 어렵다. 본 논문에서는 이러한 문제를 해결하기 위해 분산된 데이터를 XML문서로 변환한다. 또한 색인기법으로 문서의 구조 및 컨텐츠 정보를 추출하여 서로 다르게 정의된 의미정보를 데이터 사전과 비교하여 표준문서로 통할할 수 있는 색인 기반의 매핑 시스템에 대해 기술한다. 제안된 매핑 시스템은 DOM이나 SAX와 같은 표준 인터페이스를 사용하여 XML문서를 통합하는 것보다 효율적으로 통합할 수 있다.

  • PDF