• Title/Summary/Keyword: 인덱싱

Search Result 449, Processing Time 0.026 seconds

An Efficient Future Indexing Technique for the Moving Object Location Prediction System (이동 객체 위치 예측 시스템을 위한 효율적인 미래 인덱싱 기법)

  • Lee, Kang-Joon;Kim, Joung-Joon;Han, Ki-Joon
    • 한국공간정보시스템학회:학술대회논문집
    • /
    • 2007.06a
    • /
    • pp.3-8
    • /
    • 2007
  • 최근 도로 네트워크 환경에서 이동 객체 위치 정보를 관리하고 이동 객체의 미래 위치를 예측하는 이동 객체 위치 예측 시스템의 필요성이 나날이 증가되고 있다. 이동 객체위치 예측 시스템은 교통 관제 및 다양한 응급 상황 시 이동 객체의 미래 위치를 신속히 예측하기 위해 사용되며, 보다 편리한 위치 기반 서비스의 제공을 가능하게 해준다. 이러한 시스템을 위한 대부분의 미래 인덱싱 기법은 일반적으로 이동 객체의 미래 위치 예측을 위해 과거 이동 궤적을 이용하고 있다. 그러나, 수많은 이동 객체의 과거 이동 궤적 관리가 어렵고, 실시간으로 변화하는 이동 객체의 미래 궤적을 반영하기 위한 방대한 미래 인덱스의 갱신 요청으로 인해 인덱스 유지 비용이 증가하여 미래 위치 질의 요청에 대한 신속한 처리 성능이 떨어지게 된다. 따라서 본 논문에서는 이동 객체 위치 예측 시스템에서 방대한 이동 객체의 과거 이동 궤적으로부터 효율적으로 미래 위치를 예측하기 위해 셀 기반의 미래 인덱싱 방법인 PFCT-Tree(Probability Future Cell Trajectory-Tree)를 제시한다. PFCT-Tree는 방대한 과거 이동 궤적을 셀 단위로 재구성하여 인덱스 크기를 줄이고, 셀 내부 경험치를 기반으로 장기간 질의 시 빠른 미래 위치를 예측할 수 있다. 또한 신속한 미래 이동 궤적의 갱신 속도를 향상시키기 위해 미래 시간을 미래 궤적과 분리하여 인덱싱함으로써 위치 예측 오류로 인한 미래 인덱스 갱신 비용을 최소화 할 수 있다. 마지막으로 실험을 통해 도로 네트워크 환경에서 PFCT-Tree가 기존 인덱싱 기법들보다 갱신 및 검색 성능이 우수함도 입증하였다.ential oil (Bergamot, Grapefruit, Lemon, Petigrain)은 농도 의존적으로 ROS 생성을 증가시켰다. 이상의 결과를 종합하여 볼 때 citrus essential oil은 MSH에 의한 melanin 생성을 억제하는 것으로 보아 미백제로서의 개발 가능성이 있는 것으로 사료된다.가 사용될 수 있음을 제시한다.찍 발견되어 크기는 작았으며, 육안적으로 폴립의 Yamada 형태의 분류는 II, III의 형태를 띠고 있었다.EX>로 한반도 후기 백악기의 고지자기극$(Lat./Long.=70.9^{\circ}N/215.4^{\circ}E,\;A_{95}=5.3^{\circ})$의 위치와 유사하므로 암석의 생성 시기는 후기 백악기로 판단하였다. 한편 함평분지에 분포하는 백악기 화산암류에서는 한 개의 정자화 방향과 두 개의 역자화 방향이 확인되었다. 이들 특성잔류자화 방향은 백악기 화산암 형성 당시 암석에 기록된 성분으로써 당시 지구자기장의 상태를 기록한 것으로 해석하였으며, 이중 정자화 방향을 함평분지 화산암의 대표 방향으로 채택하였다 함평분지 화산암의 고지자기 극의 위치는 정자극의 경우는 $Lat./Long.=70.2^{\circ}N/199.5^{\circ}E,\;(K=18.1,\;A_{95}=9.6^{\circ})$ 이며 역자극의 경우는 $Lat./Long.=65.5^{\circ}S/251.3^{\circ}E,\;(K=7.1,\;A_{95}=20.7^{\circ})$이다. 이중 정자극의 위치는 한반도의 후기 백악기극의 위치와 통계적으로 동일한 것으로 나타나 함평분지 화산암

  • PDF

A Design and Development of Big Data Indexing and Search System using Lucene (루씬을 이용한 빅데이터 인덱싱 및 검색시스템의 설계 및 구현)

  • Kim, DongMin;Choi, JinWoo;Woo, ChongWoo
    • Journal of Internet Computing and Services
    • /
    • v.15 no.6
    • /
    • pp.107-115
    • /
    • 2014
  • Recently, increased use of the internet resulted in generation of large and diverse types of data due to increased use of social media, expansion of a convergence of among industries, use of the various smart device. We are facing difficulties to manage and analyze the data using previous data processing techniques since the volume of the data is huge, form of the data varies and evolves rapidly. In other words, we need to study a new approach to solve such problems. Many approaches are being studied on this issue, and we are describing an effective design and development to build indexing engine of big data platform. Our goal is to build a system that could effectively manage for huge data set which exceeds previous data processing range, and that could reduce data analysis time. We used large SNMP log data for an experiment, and tried to reduce data analysis time through the fast indexing and searching approach. Also, we expect our approach could help analyzing the user data through visualization of the analyzed data expression.

A DNA Index Structure using Frequency and Position Information of Genetic Alphabet (염기문자의 빈도와 위치정보를 이용한 DNA 인덱스구조)

  • Kim Woo-Cheol;Park Sang-Hyun;Won Jung-Im;Kim Sang-Wook;Yoon Jee-Hee
    • Journal of KIISE:Databases
    • /
    • v.32 no.3
    • /
    • pp.263-275
    • /
    • 2005
  • In a large DNA database, indexing techniques are widely used for rapid approximate sequence searching. However, most indexing techniques require a space larger than original databases, and also suffer from difficulties in seamless integration with DBMS. In this paper, we suggest a space-efficient and disk-based indexing and query processing algorithm for approximate DNA sequence searching, specially exact match queries, wildcard match queries, and k-mismatch queries. Our indexing method places a sliding window at every possible location of a DNA sequence and extracts its signature by considering the occurrence frequency of each nucleotide. It then stores a set of signatures using a multi-dimensional index, such as R*-tree. Especially, by assigning a weight to each position of a window, it prevents signatures from being concentrated around a few spots in index space. Our query processing algorithm converts a query sequence into a multi-dimensional rectangle and searches the index for the signatures overlapped with the rectangle. The experiments with real biological data sets revealed that the proposed method is at least three times, twice, and several orders of magnitude faster than the suffix-tree-based method in exact match, wildcard match, and k- mismatch, respectively.

Video Retrieval System supporting Adaptive Streaming Service (적응형 스트리밍 서비스를 지원하는 비디오 검색 시스템)

  • 이윤채;전형수;장옥배
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.9 no.1
    • /
    • pp.1-12
    • /
    • 2003
  • Recently, many researches into distributed processing on Internet, and multimedia data processing have been performed. Rapid and convenient multimedia services supplied with high quality and high speed are to be needed. In this paper, we design and implement clip-based video retrieval system on the Web enviroment in real-time. Our system consists of the content-based indexing system supporting convenient services for video content providers, and the Web-based retrieval system in order to make it easy and various information retrieval for users in the Web. Three important methods are used in the content-based indexing system, key frame extracting method by dividing video data, clip file creation method by clustering related information, and video database construction method by using clip unit. In Web-based retrieval system, retrieval method ny using a key word, two dimension browsing method of key frame, and real-time display method of the clip are used. In this paper, we design and implement the system that supports real-time display method of the clip are used. In this paper, we design and implement the system that supports real-time retrieval for video clips on Web environment and provides the multimedia service in stability. The proposed methods show a usefulness of video content providing, and provide an easy method for serching intented video content.

Algorithms for Indexing and Integrating MPEG-7 Visual Descriptors (MPEG-7 시각 정보 기술자의 인덱싱 및 결합 알고리즘)

  • Song, Chi-Ill;Nang, Jong-Ho
    • Journal of KIISE:Software and Applications
    • /
    • v.34 no.1
    • /
    • pp.1-10
    • /
    • 2007
  • This paper proposes a new indexing mechanism for MPEG-7 visual descriptors, especially Dominant Color and Contour Shape descriptors, that guarantees an efficient similarity search for the multimedia database whose visual meta-data are represented with MPEG-7. Since the similarity metric used in the Dominant Color descriptor is based on Gaussian mixture model, the descriptor itself could be transform into a color histogram in which the distribution of the color values follows the Gauss distribution. Then, the transformed Dominant Color descriptor (i.e., the color histogram) is indexed in the proposed indexing mechanism. For the indexing of Contour Shape descriptor, we have used a two-pass algorithm. That is, in the first pass, since the similarity of two shapes could be roughly measured with the global parameters such as eccentricity and circularity used in Contour shape descriptor, the dissimilar image objects could be excluded with these global parameters first. Then, the similarities between the query and remaining image objects are measured with the peak parameters of Contour Shape descriptor. This two-pass approach helps to reduce the computational resources to measure the similarity of image objects using Contour Shape descriptor. This paper also proposes two integration schemes of visual descriptors for an efficient retrieval of multimedia database. The one is to use the weight of descriptor as a yardstick to determine the number of selected similar image objects with respect to that descriptor, and the other is to use the weight as the degree of importance of the descriptor in the global similarity measurement. Experimental results show that the proposed indexing and integration schemes produce a remarkable speed-up comparing to the exact similarity search, although there are some losses in the accuracy because of the approximated computation in indexing. The proposed schemes could be used to build a multimedia database represented in MPEG-7 that guarantees an efficient retrieval.

Trajectory Indexing for Efficient Processing of Range Queries (영역 질의의 효과적인 처리를 위한 궤적 인덱싱)

  • Cha, Chang-Il;Kim, Sang-Wook;Won, Jung-Im
    • The KIPS Transactions:PartD
    • /
    • v.16D no.4
    • /
    • pp.487-496
    • /
    • 2009
  • This paper addresses an indexing scheme capable of efficiently processing range queries in a large-scale trajectory database. After discussing the drawbacks of previous indexing schemes, we propose a new scheme that divides the temporal dimension into multiple time intervals and then, by this interval, builds an index for the line segments. Additionally, a supplementary index is built for the line segments within each time interval. This scheme can make a dramatic improvement in the performance of insert and search operations using a main memory index, particularly for the time interval consisting of the segments taken by those objects which are currently moving or have just completed their movements, as contrast to the previous schemes that store the index totally on the disk. Each time interval index is built as follows: First, the extent of the spatial dimension is divided onto multiple spatial cells to which the line segments are assigned evenly. We use a 2D-tree to maintain information on those cells. Then, for each cell, an additional 3D $R^*$-tree is created on the spatio-temporal space (x, y, t). Such a multi-level indexing strategy can cure the shortcomings of the legacy schemes. Performance results obtained from intensive experiments show that our scheme enhances the performance of retrieve operations by 3$\sim$10 times, with much less storage space.

Multimedia Contents Streaming Service On P2P Environment Using Section Information (P2P 환경에서 구간 정보를 이용한 멀티미디어 컨텐츠의 스트리밍 서비스)

  • Lee Ji-Hyun;Ryu Je;Han Kwang-Rok;Lee Young-Bum;Kim Jung-Tae
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.05a
    • /
    • pp.411-414
    • /
    • 2006
  • 최근 몇 년 사이 인터넷의 발전으로 인해 대용량의 멀티미디어 서비스가 가능해졌다. 특히 요즘에는 컨텐츠 공급자들의 저작권을 고려함으로 인해 스트리밍 서비스를 선호하는 추세이다. 이러한 추세는 사용자가 스트리밍 컨텐츠에 존재하는 정보를 보다 편하게 추출할 수 있는 방법에 대한 요구를 증대시키고 있다. 이에 따라 본 논문에서는 각각의 스트리밍 컨텐츠에 존재하는 정보들 중에서 사용자가 원하는 정보가 있는 구간들을 인덱싱 할 수 있는 도구를 제공하고 인덱싱 된 정보 구간을 스트리밍 할 수 있는 시스템을 구현하였다. 본 논문에서는 특히 P2P 환경에서 사용자간에 정보 공유를 목적으로 하는 시스템의 구현에 초점을 맞추었다.

  • PDF

Indexing Mechanism for Efficient Semantic Query Processing (효율적인 시멘틱 질의 처리를 위한 인덱싱 기법)

  • Kim Hak-Soo;Cha Hyun-Seok;Son Jin-Hyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.05a
    • /
    • pp.97-100
    • /
    • 2006
  • RDF 는 트리플의 집합으로서 그래프 데이터 모델로 표현되며, 사용자는 RDF 그래프 모델로부터 정보를 검색하기 위해 시멘틱 질의 언어를 사용한다. 그러나 이러한 접근 방식은 최악의 경우 전체 그래프 데이터 모델을 검색해야 되는 문제점이 발생한다. 이에 따라 최근의 연구에서는 시멘틱 질의를 효율적으로 처리하기 위해서 인덱스를 사용한다. 시멘틱 질의 언어(RDQL, SPARQL)의 핵심은 RDF 트리플에 대한 패턴을 기술함으로써 원하는 트리플 정보를 검색할 수 있게 하는 것이다. 따라서, 기존의 인덱스는 단일 트리플을 효율적으로 검색하는 데 초점을 둔다. 거라나 트리플 패턴의 집합으로 질의가 표현될 경우에는 트리플 패턴 사이의 상관관계 때문에 조인비용이 많이 발생하는 문제점이 있다. 본 논문에서는 조인 비용이 발생되는 문제점을 해결하기 위한 인덱싱 기법을 제안한다. RDF 그래프 모델에서 유지해야 할 정보를 줄이기 위해서 RDF 그래프 모델에 존재하는 유사한 서브 그래프를 하나의 서브 그래프로 병합한다. 병합절차를 마친 여러 서브 그래프에 존재하는 모든 경로를 인덱스에 유지 함으로써 조인 비용을 제거한다.

  • PDF

An Efficient Dictionary for Syllable-based Korean Morphological Analyzer (음절 기반 형태소 분석을 위한 효율적인 사전 구성)

  • Kim, Nam-Churl;Seo, Young-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 1997.10a
    • /
    • pp.411-415
    • /
    • 1997
  • 형태소 분석기의 처리 속도는 분석 알고리즘과 형태소 사전의 탐색 기법에 따라 크게 좌우된다. 형태소 분석 성능의 향상을 위하여 많은 형태소 분석 방법이 제안되었으며, 음절 정보를 이용하는 형태소 분석기는 한국어 음절의 통계적 특성 정보를 이용함으로써, 분석 후보의 개수를 최대한 적게 하여 처리 속도를 향상시켰다. 본 논문은 형태소 분석시 발생하는 분석 후보들의 특성을 고려하여 사전 탐색 요구시 가장 많은 처리 시간을 필요로 하는 디스크 읽기 횟수를 줄일 수 있도록 음절별 블록 인덱싱한 사전 구성 방법을 제안한다. 이 방법은 형태소 사전을 첫 음절별로 블록화하고 인덱싱하여 3개의 추가적인 인덱스 테이블을 구축하는 사전 구성 방법으로, 인덱스 테이블을 모두 주기억장치에 적재하였을 때에는 평균 61.6%, 크기가 작은 두 개의 인덱스 테이블만 주기억장치에 적재하였을 때에는 평균 25%의 디스크 읽기 횟수를 줄일 수 있다.

  • PDF

An Indexing Method to Prevent Attacks based on Frequency in Database as a Service (서비스로의 데이터베이스에서 빈도수 기반의 추론공격 방지를 위한 인덱싱 기법)

  • Jung, Kang-Soo;Park, Seog
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.16 no.8
    • /
    • pp.878-882
    • /
    • 2010
  • DaaS model that surrogates their data has a problem of privacy leakage by service provider. In this paper, we analyze inference attack that can occur on encrypted data that consist of multiple column through index, and we suggest b-anonymity to protect data against inference attack. We use R+-tree technique to minimize false-positive that can happen when we use an index for efficiency of data processing.