• 제목/요약/키워드: Index Database

검색결과 868건 처리시간 0.021초

Efficient Query Retrieval from Social Data in Neo4j using LIndex

  • Mathew, Anita Brigit
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권5호
    • /
    • pp.2211-2232
    • /
    • 2018
  • The unstructured and semi-structured big data in social network poses new challenges in query retrieval. This requirement needs to be met by introducing quality retrieval time measures like indexing. Due to the huge volume of data storage, there originate the need for efficient index algorithms to promote query processing. However, conventional algorithms fail to index the huge amount of frequently obtained information in real time and fall short of providing scalable indexing service. In this paper, a new LIndex algorithm, which is a heuristic on Lucene is built on Neo4jHA architecture that holds the social network Big data. LIndex is a flexible and simplified adaptive indexing scheme that ascendancy decomposed shortest paths around term neighbors as basic indexing unit. This newfangled index proves to be effectual in query space pruning of graph database Neo4j, scalable in index construction and deployment. A graph query is processed and optimized beyond the traditional Lucene in a time-based manner to a more efficient path method in LIndex. This advanced algorithm significantly reduces query fetch without compromising the quality of results in time. The experiments are conducted to confirm the efficiency of the proposed query retrieval in Neo4j graph NoSQL database.

데이터베이스 색인선택 문제에 대한 Davis-Putnam 기반 최적화 알고리즘의 성능 분석 (Analyzing the Performance of a Davis-Putnam based Optimization Algorithm for the Index Selection Problem of Database Systems)

  • 서상구
    • 정보기술과데이타베이스저널
    • /
    • 제7권2호
    • /
    • pp.47-59
    • /
    • 2000
  • In this paper, we analyze the applicability of a general optimization algorithm to a database optimization problem. The index selection problem Is the problem to choose a set of indexes for a database in a way that the cost to process queries in the given workload is minimized subject to a given storage space restriction for storing indexes. The problem is well known in database research fields, and many optimization and/or heuristic algorithms have been proposed. Our work differs from previous research in that we formalize the problem in the form of non-linear Integer Programming model, and investigate the feasibility and applicability of a general purpose optimization algorithm, called OPBDP, through experiments. We implemented algorithms to generate workload data sets and problem instances for the experiment. The OPBDP algorithm, which is a non-linear 0-1 Integer Programming problem solver based on Davis-Putnam method, worked generally well for our problem formulation. The experiment result showed various performance characteristics depending on the types of decision variables, variable navigation methods and ocher algorithm parameters, and indicates the need of further study on the exploitation of the general purpose optimization techniques for the optimization problems in database area.

  • PDF

STADIUM: Species-Specific tRNA Adaptive Index Compendium

  • Yoon, Jonghwan;Chung, Yeun-Jun;Lee, Minho
    • Genomics & Informatics
    • /
    • 제16권4호
    • /
    • pp.28.1-28.6
    • /
    • 2018
  • Due to the increasing interest in synonymous codons, several codon bias-related terms were introduced. As one measure of them, the tRNA adaptation index (tAI) was invented about a decade ago. The tAI is a measure of translational efficiency for a gene and is calculated based on the abundance of intracellular tRNA and the binding strength between a codon and a tRNA. The index has been widely used in various fields of molecular evolution, genetics, and pharmacology. Afterwards, an improved version of the index, named specific tRNA adaptation index (stAI), was developed by adapting tRNA copy numbers in species. Although a subsequently developed webserver (stAIcalc) provided tools that calculated stAI values, it was not available to access pre-calculated values. In addition to about 100 species in stAIcalc, we calculated stAI values for whole coding sequences in 148 species. To enable easy access to this index, we constructed a novel web database, named STADIUM (Species-specific tRNA adaptive index compendium). STADIUM provides not only the stAI value of each gene but also statistics based on pathway-based classification. The database is expected to help researchers who have interests in codon optimality and the role of synonymous codons. STADIUM is freely available at http://stadium.pmrc.re.kr.

버킷인덱스와 블룸필터를 이용한 범위형 의료정보 암호화기법 (A Mechanism of Medical Data Encryption Method Using Bucket Index and Bloom filter with the range property.)

  • 김창규;김정태;유천영;김지홍
    • 한국정보통신학회논문지
    • /
    • 제15권2호
    • /
    • pp.371-381
    • /
    • 2011
  • 최근 데이터베이스내의 개인정보의 유출이 사회적으로 이슈가 되고 있다. 개인의 민감한 정보를 보호하기 위한 최선의 방법은 데이터 암호화이다. 그러나 데이터를 암호화하면 질의어 처리가 어렵게 된다. 그러므로 데이터베이스를 보호하고 질의어 처리를 효율적으로 하기 위한 많은 방법들이 제안되고 있다. 본 논문에서는 기존의 연구에 대한 방법을 분석하고, 의료정보 데이터베이스내의 범위특성을 가진 데이터를 암호화하기 위한 방안으로서 버킷 방식과 블룸필터 방식을 이용한 복합적인 방법을 제안하였다. 버킷방식만을 적용한 경우에 비하여 본 논문에서 제안한 버킷방식과 블룸필터방식을 융합하여 적용한 경우에는 버킷의 개수를 늘일 수 있고, 이에 따른 사용자 데이터의 분포 노출을 방지할 수 있으며, 결과적으로 검색속도를 높일 수 있음을 알 수 있다.

분할된 압축 인덱스를 이용한 컬럼-지향 플래시 스토리지의 검색 성능 개선 (Search Performance Improvement of Column-oriented Flash Storages using Segmented Compression Index)

  • 변시우
    • 한국산학기술학회논문지
    • /
    • 제14권1호
    • /
    • pp.393-401
    • /
    • 2013
  • 대부분의 기존 데이터베이스들은 빠른 저장 성능을 얻기 위하여 한 레코드의 속성들을 하드 디스크에 연속적으로 배치하는 레코드-지향 저장 모델을 사용하였다. 하지만 검색이 대부분인 데이터웨어하우스 시스템에는 월등한 읽기 성능 때문에 컬럼-지향 저장 방식이 적합한 모델이 되고 있다. 또한, 현재 플래시 메모리가 고속 데이터베이스 시스템을 위한 선호 저장 매체로 인정되고 있다. 본 논문에서는 고속 컬럼-지향 데이터베이스 모델을 도입하고, 고속 컬럼-지향 데이터웨어하우스 시스템을 위한 컬럼-인지 인덱스 관리 기법을 제안한다. 본 인덱스 관리 기법은 개선된 B트리에 기반하며, 중간 노드와 리프노드에서 내장 플래시 인덱스와 빈공간 압축을 통하여 높은 검색 성능을 얻는다. 성능 평가 결과를 기반으로 본 인덱스 관리 기법이 기존 기법보다 검색 처리 및 응답 시간 측면에서 더 우수함을 확인하였다.

국내 기계관련 저널의 KSCI(Korean Science Citation Index) 분석 (Analysis of KSCI(Korean Science Citation Index) of Domestic Journals in Mechanical Engineering)

  • 유완석
    • 대한기계학회:학술대회논문집
    • /
    • 대한기계학회 2001년도 춘계학술대회논문집B
    • /
    • pp.259-264
    • /
    • 2001
  • This paper presents impact factors of domestic journals in mechanical engineering area to present an objective data for journal evaluation. For this purpose, reference data of 47 Korean journals are databased and analyzed. From the developed database, impact factor, immediacy index and self citation index are calculated.

  • PDF

서지마크 데이터베이스로부터의 색인어 추출과 색인어의 검색 활용에 관한 연구 - 경북대학교 도서관 학술정보시스템 사례를 중심으로 - (A Study on the Extraction and Utilization of Index from Bibliographic MARC Database)

  • 박미성
    • 한국도서관정보학회지
    • /
    • 제36권2호
    • /
    • pp.327-348
    • /
    • 2005
  • 본 연구의 목적은 서지정보검색시스템의 색인 정의의 중요성을 강조하고 최적 색인의 기초 자료를 마련하기 위함이다. 이를 위해 서지마크 데이터베이스로부터 색인 태그 정의 및 정규화를 통한 색인어추출이론에 대해 고찰하고, 이론에 따라 생성된 색인어의 검색 활용도를 분석하였다. 실험은 서지 2,200,488건에서 생성된 색인어 29,219,853건을 텍스트형 색인과 코드형 색인으로 나누어 이용자 왱 검색 로그에 나타난 색인 항목과 비교하여 어떤 색인 정의가 얼마나 활용되는가를 분석하였다. 결과에 따르면 서명, 저자, 출판사, 주제와 같은 텍스트형 색인어는 높은 검색 활용도를 보인 반면에 코드형 색인어는 검색 활용도가 낮아 검색에 활용되지 않는 불필요한 색인 정의들은 과감하게 제거하여 색인 정의를 최적화해야 함을 제안하였다.

  • PDF

모형자동차 충돌시험의 데이터베이스를 이용한 측면 충돌사고 재구성 (A Study on the Side Collision Accident Reconstruction Using Database of Crush Test of Model Cars)

  • 손정현;박석천;김광석
    • 한국자동차공학회논문집
    • /
    • 제17권2호
    • /
    • pp.49-56
    • /
    • 2009
  • In this study, a side collision accident reconstruction using database based on the deformed shape information from the collision test using model cars is suggested. A deformation index and angle index related to the deformed shape is developed to set the database for the collision accident reconstruction algorithm. Two small size RC cars are developed to carry out the side collision test. Several side collision tests according to the velocity and collision angles are performed for establishing the side collision database. A high speed camera with 1000fps is used to capture the motion of the car. A side collision accident reconstruction algorithm is developed and applied to find the collision conditions before the accident occurs. Two collision cases are tested to validate the database and the algorithm. The results obtained by the reconstruction algorithm show good match with original conditions with regard to the velocity and angle.

암호화된 데이터베이스에서 인덱스 검색 시스템 구현 (The Implementation of the Index Search System in a Encrypted Data-base)

  • 신승수;한군희
    • 한국산학기술학회논문지
    • /
    • 제11권5호
    • /
    • pp.1653-1660
    • /
    • 2010
  • 데이터베이스에 저장된 고객 정보들에 대한 유출 사례가 빈번히 발생하고 있다. 악의적인 목적을 갖고 있는 내부 관리자나 외부 공격자로부터 정보를 막기 위해서는 정보를 암호화하여 DB에 저장하는 것이 가장 효율적인 방법 중 하나이다. 암호화를 해 놓고선 DB에 저장만 하여놓고 다른 어떤 활용도 할 수 없다면 차라리 파기하는 편이 나을 것이다. 암호화된 DB 검색시스템이 다양하게 발전하고 있고 여러 분야에서 활용되고 있다. 본 논문에서는 모바일 디바이스에서 신뢰할 수 없는 서버에게 사용자의 정보를 노출하지 않고 암호화된 문서를 검색할 수 있는 스킴을 구현하고 비교분석을 하였다. 구현 결과를 대칭키 기반의 DES, AES, ARIA별로 검색시간을 비교 분석하였다.

Treatment Patterns, Costs, and Survival among Medicare-Enrolled Elderly Patients Diagnosed with Advanced Stage Gastric Cancer: Analysis of a Linked Population-Based Cancer Registry and Administrative Claims Database

  • Karve, Sudeep;Lorenzo, Maria;Liepa, Astra M;Hess, Lisa M;Kaye, James A;Calingaert, Brian
    • Journal of Gastric Cancer
    • /
    • 제15권2호
    • /
    • pp.87-104
    • /
    • 2015
  • Purpose: To assess real-world treatment patterns, health care utilization, costs, and survival among Medicare enrollees with locally advanced/unresectable or metastatic gastric cancer receiving standard first-line chemotherapy. Materials and Methods: This was a retrospective analysis of the Surveillance, Epidemiology, and End Results-Medicare linked database (2000~2009). The inclusion criteria were as follows: (1) first diagnosed with locally advanced/unresectable or metastatic gastric cancer between July 1, 2000 and December 31, 2007 (first diagnosis defined the index date); (2) ${\geq}65$ years of age at index; (3) continuously enrolled in Medicare Part A and B from 6 months before index through the end of follow-up, defined by death or the database end date (December 31, 2009), whichever occurred first; and (4) received first-line treatment with fluoropyrimidine and/or a platinum chemotherapy agent. Results: In total, 2,583 patients met the inclusion criteria. The mean age at index was $74.8{\pm}6.0years$. Over 90% of patients died during follow-up, with a median survival of 361 days for the overall post-index period and 167 days for the period after the completion of first-line chemotherapy. The mean total gastric cancer-related cost per patient over the entire post-index follow-up period was United States dollar (USD) $70,808{\pm}56,620$. Following the completion of first-line chemotherapy, patients receiving further cancer-directed treatment had USD 25,216 additional disease-related costs versus patients receiving supportive care only (P<0.001). Conclusions: The economic burden of advanced gastric cancer is substantial. Extrapolating based on published incidence estimates and staging distributions, the estimated total disease-related lifetime cost to Medicare for the roughly 22,200 patients expected to be diagnosed with this disease in 2014 approaches USD 300 millions.