• 제목/요약/키워드: SQL-database

검색결과 428건 처리시간 0.028초

Use of Graph Database for the Integration of Heterogeneous Biological Data

  • Yoon, Byoung-Ha;Kim, Seon-Kyu;Kim, Seon-Young
    • Genomics & Informatics
    • /
    • 제15권1호
    • /
    • pp.19-27
    • /
    • 2017
  • Understanding complex relationships among heterogeneous biological data is one of the fundamental goals in biology. In most cases, diverse biological data are stored in relational databases, such as MySQL and Oracle, which store data in multiple tables and then infer relationships by multiple-join statements. Recently, a new type of database, called the graph-based database, was developed to natively represent various kinds of complex relationships, and it is widely used among computer science communities and IT industries. Here, we demonstrate the feasibility of using a graph-based database for complex biological relationships by comparing the performance between MySQL and Neo4j, one of the most widely used graph databases. We collected various biological data (protein-protein interaction, drug-target, gene-disease, etc.) from several existing sources, removed duplicate and redundant data, and finally constructed a graph database containing 114,550 nodes and 82,674,321 relationships. When we tested the query execution performance of MySQL versus Neo4j, we found that Neo4j outperformed MySQL in all cases. While Neo4j exhibited a very fast response for various queries, MySQL exhibited latent or unfinished responses for complex queries with multiple-join statements. These results show that using graph-based databases, such as Neo4j, is an efficient way to store complex biological relationships. Moreover, querying a graph database in diverse ways has the potential to reveal novel relationships among heterogeneous biological data.

Modeling and Implementation of Public Open Data in NoSQL Database

  • Min, Meekyung
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제10권3호
    • /
    • pp.51-58
    • /
    • 2018
  • In order to utilize various data provided by Korea public open data portal, data should be systematically managed using a database. Since the range of open data is enormous, and the amount of data continues to increase, it is preferable to use a database capable of processing big data in order to analyze and utilize the data. This paper proposes data modeling and implementation method suitable for public data. The target data is subway related data provided by the public open data portal. Schema of the public data related to Seoul metro stations are analyzed and problems of the schema are presented. To solve these problems, this paper proposes a method to normalize and structure the subway data and model it in NoSQL database. In addition, the implementation result is shown by using MongDB which is a document-based database capable of processing big data.

Integrated Methods of Various Media Generators in The SuperSQL Query Process System

  • Shin Sang-Gyu;Kim Tai-Suk;Toyama Motomichi
    • 한국멀티미디어학회논문지
    • /
    • 제9권6호
    • /
    • pp.720-727
    • /
    • 2006
  • In this paper, we propose a method which allows the SuperSQL query processor to share as much code as possible among various, generators, each of which is responsible for the output of a certain medium. SuperSQL is an enhanced query-processing system that converts database records into a variety of formats such as XML, HTML, PDF and etc. However, the existing SuperSQL media generator would require creation of a different processor for each medium, causing duplicated development cost. This research makes three main contributions: First, it analyzes the structures of various media, examining any possibility of integration based on their common structure. Second, it also facilitates the addition of a new output media generator by separating constructors and decorators from each medium. Last, it provides an integrated user interface to each media by method of the Media Abstraction Table Concept. We also show the performance and feasibility of our system using experimental results.

  • PDF

A Development of Forward Inference Engine and Expert Systems based on Relational Database and SQL

  • Kim, Jin-Sung
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 추계 학술대회 학술발표 논문집
    • /
    • pp.49-52
    • /
    • 2003
  • In this research, we propose a mechanism to develop an inference engine and expert systems based on relational database and SQL (structured query language). Generally, former researchers had tried to develop an expert systems based on text-oriented knowledge base and backward/forward (chaining) inference engine. In these researches, however, the speed of inference was remained as a tackling point in the development of agile expert systems. Especially, the forward inference needs more times than backward inference. In addition, the size of knowledge base, complicate knowledge expression method, expansibility of knowledge base, and hierarchies among rules are the critical limitations to develop an expert systems. To overcome the limitations in speed of inference and expansibility of knowledge base, we proposed a relational database-oriented knowledge base and forward inference engine. Therefore, our proposed mechanism could manipulate the huge size of knowledge base efficiently, and inference with the large scaled knowledge base in a short time. To this purpose, we designed and developed an SQL-based forward inference engine using relational database. In the implementation process, we also developed a prototype expert system and presented a real-world validation data set collected from medical diagnosis field.

  • PDF

소용량 데이터베이스 처리를 위한 DBMS의 성능 비교 (Comparison of DBMS Performance for processing Small Scale Database)

  • 장시웅
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2008년도 추계종합학술대회 B
    • /
    • pp.139-142
    • /
    • 2008
  • 대규모 용량의 데이터베이스를 처리하기 위한 상용 DBMS에 대한 성능의 비교는 벤치마크 테스트로 결과가 주어진 경우가 많은 반면, 소규모 용량의 데이터베이스를 처리하기 위한 DBMS의 성능에 대해서는 많이 알려져 있지 않다. 따라서 본 연구에서는 소규모 용량의 데이터베이스를 처리하기 위한 상용 DBMS 및 공개용 DBMS의 성능에 대해 비교하고 분석하였다. 분석결과, 오라클은 데이터 갱신 및 삽입에 관한 연산에서는 데이터의 안전성 보장을 위한 rollback 기능의 준비 작업이 많아 좋지 못한 성능을 보인 반면, MySQL이나 MS-SQL 등의 경우에는 별다른 오버 헤드가 없어 오라클에 비해 좋은 성능을 보였다.

  • PDF

오픈소스 DBMS 성능비교분석 (Performance Comparison and Analysis between Open-Source DBMS)

  • 장래영;배정민;정성재;소우영;성경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2014년도 추계학술대회
    • /
    • pp.805-808
    • /
    • 2014
  • DBMS(Database Management System)는 다수의 사용자들이 데이터베이스에 접근하여 손쉽게 데이터를 사용할 수 있도록 해주는 소프트웨어 시스템이다. 오라클(Oracle)을 선두로 한 상용서비스들과 MySQL을 중심으로 하는 오픈소스 DBMS가 있다. MySQL이 오라클에 인수된 이후 MariaDB가 발표되어 수요가 증가하고 있으며, 기존 SQL과 다른 성격의 NoSQL DBMS들도 상황에 따라 관심이 늘어나고 있는 추세이다. 동일한 형태의 대용량 데이터들을 바탕으로 오픈소스 DBMS간 실제 성능비교분석이 필요함에 따라 본고에서는 오픈소스DBMS의 MariaDB와 문서중심(Document-Centric) 데이터베이스인 MongoDB간의 성능비교분석을 연구하였고, 나아가 그에 따른 결과를 바탕으로한 빅데이터관련 데이터베이스관리시스템을 제안하고자 한다.

  • PDF

Mr.Data 칼럼(4) SQL내의 중복성에 관해

  • 한국데이터베이스진흥센터
    • 디지털콘텐츠
    • /
    • 11호통권66호
    • /
    • pp.98-102
    • /
    • 1998
  • 장황한(redundant) ; 쓸모없는(detrop), 산만한(diffuse), 과잉의(excessive), 필수적이지 않은(inessential), 완곡한(periphrastic), 반복적인(repetitious), 원하지 않는(unwanted), 불필요한(unnecessary) 등은 Chambers Twentieth Century 유의어 사전에서 발췌된 redundant의 유사어들이다(동 사전은 concise, essential, necessary 등과 같은 redundant의 반의어들의 명단도 잘 정리되어 있다). GROUP BY와 HAVING(이후부터는 GBH로 칭하기로 한다)으로 시작하는 절(clauses)들이 SQL내에서 반복적으로 사용된다는 사실을 알고 있는지에 대한 의문을 제기할 수 있다. 다시 말해, SQL 내에서 표현되고, 상기의 절들 모두 또는 어느 한쪽이 포함된 어떠한 종류의 상식적인 질문도 그러한 절들을 사용하지 않고도 표현될 수 있다는 것이다(필자가 여기서 '상식적'이란 말로 한정한 이유는 나중에 설명하겠다). 필자는 중복성에 관해 설명하고 이것이 내포하고 있는 의미에 관해 논의코자 한다.

  • PDF

분산병렬처리 환경에서 오토매핑 기법을 통한 NoSQL과 RDBMS와의 연동 (Interoperability between NoSQL and RDBMS via Auto-mapping Scheme in Distributed Parallel Processing Environment)

  • 김희성;이봉환
    • 한국정보통신학회논문지
    • /
    • 제21권11호
    • /
    • pp.2067-2075
    • /
    • 2017
  • 최근 빅데이터가 주목받게 되면서 빅데이터를 처리하기 위한 시스템들도 중요하게 여겨지고 있다. 빅데이터 처리 시스템으로 분산파일시스템인 Hadoop과 비정형 데이터 처리를 위한 NoSQL 데이터 스토어가 주목받고 있다. 하지만 아직까지 NoSQL을 사용함에 있어 어려움이나 불편함도 존재한다. 저용량 데이터인 경우 NoSQL의 MapReduce는 불필요한 작업시간을 소모하게 되며, RDBMS 보다 상대적으로 많은 데이터 탐색 시간이 소요되기도 한다. 본 논문에서는 이러한 NoSQL의 문제점을 해결하기 위해 NoSQL과 RDBMS 간의 연동 기법을 제안하였다. 개발한 오토매핑 기법은 처리할 데이터의 양에 따라 적합한 데이터베이스를 사용하게 하여 결과적으로 검색시간을 빠르게 할 수 있다. 실험 결과 제안한 데이터베이스 연동 기법은 특정 데이터 셋의 경우 검색시간을 최대 35%까지 줄일 수 있다.

관계형 데이터베이스에서 효과적 데이터 마이닝 정보 추출을 위한 관계 연산자의 정의 (Definition of Relational Operators for Effective Extracting Data Mining Information from Relational Relational Database)

  • 송지영
    • 한국컴퓨터산업학회논문지
    • /
    • 제2권2호
    • /
    • pp.123-130
    • /
    • 2001
  • 데이터베이스의 크기가 증대함에 따라, 데이터의 분석 및 데이터베이스로부터의 지식 습득필요성이 대두되고 있다. 데이터 마이닝 기법은 그 대표적인 예이다. 대부분의 마이닝 대상 데이터 집합은 규모가 매우 크고, 데이터베이스 내에 저장되어 있다. 효과적인 마이닝 기능을 구현하기 위해서는 기존의 데이터베이스로부터 분석 대상 데이터 집합을 추출하고, 일반화시켜 함께 유지 관리함이 요구된다. 본 논문에서는 새로운 미이닝 연산자를 정의함으로써 기존 SQL 언어를 확장하여 릴레이션으로부터 분석 대상 데이터를 도메인 중심 방법으로 추출 후 일반화시킨다. 분석 대상 애트리뷰트 값과 일반화된 정보를 포함하는 배경지식은 관계형 데이터베이스의 릴레이션과 동일한 구조로 저장 및 관리된다. 또한 본 논문에서 제안된 배경지식 추출을 수행하는 SQL 유사 연산자와 집단 함수를 예제를 통하여 그 사용 예를 보임으로써, 마이닝 표현력을 나타낸다.

  • PDF

Microsoft SQL Server의 원본 수집 방식에 따른 삭제 데이터의 복구 가능성 비교 (Comparing Recoverability of Deleted Data According to Original Source Collection Methods on Microsoft SQL Server)

  • 신지호
    • 정보보호학회논문지
    • /
    • 제28권4호
    • /
    • pp.859-868
    • /
    • 2018
  • 데이터베이스의 삭제된 데이터 복구와 관련된 그간의 연구는 삭제된 레코드가 트랜잭션 로그에 존재하는 경우이거나 데이터베이스 원본을 물리적 방식으로 수집하여 삭제 데이터의 탐지와 복구를 진행하는 방식이 주를 이루었다. 그러나 트랜잭션 로그가 존재하지 않거나 증거수집 현장에서 물리적 방식의 원본수집이 불가능한 경우 즉, 데이터베이스 서버 정지로 인해 피압수인이 업무상 손실 또는 권리침해를 이유로 거부하는 경우에는 적용하기 곤란한 한계가 있었다. 그러므로 증거수집 현장의 제약을 대비하기 위해 다양한 수집 방식을 살펴보고 이에 따른 삭제된 레코드의 복구 가능성에 대해서 확인해볼 필요가 있다. 이 논문에서는 Microsoft SQL Server 데이터베이스를 대상으로 하는 디지털포렌식 조사 시 원본 수집의 논리적 물리적 방식별로 수집된 원본 파일 내 삭제된 데이터의 잔존 여부를 실험하여 각 수집 방식에 따른 데이터 복구 가능성을 확인하였다.