• 제목/요약/키워드: MySQL database analysis

검색결과 19건 처리시간 0.029초

MySQL MyISAM 데이터베이스의 삭제 레코드에 대한 복구 기법 (The Method of Deleted Record Recovery for MySQL MyISAM Database)

  • 노우선;장성민;강철훈;이경민;이상진
    • 정보보호학회논문지
    • /
    • 제26권1호
    • /
    • pp.125-134
    • /
    • 2016
  • MySQL 데이터베이스는 현재 데이터베이스 시장에서 높은 점유율을 보이며 많은 사용자들이 사용한다. MyISAM 스토리지 엔진의 경우, 이전에 디폴트 엔진으로 사용되었음에도 불구하고 실질적인 레코드 복구 방법이 존재하지 않았다. 삭제된 레코드에는 데이터베이스 수사 시 중요한 증거로 쓰일 수 있는 정보가 존재할 가능성이 높으며, 수사관이 방대한 양의 데이터베이스를 직접 조사하여 일일이 정보를 판별하는 것은 거의 불가능하다. 본 논문에서는 MySQL MyISAM 데이터베이스 구조를 분석하여 삭제된 레코드의 복구 기법을 제안하며 이를 도구로 구현하여 실험한 결과를 제시한다.

오픈 소스 RDBMS 동향 분석 (Trend Analysis of Open Source RDBMS)

  • 정성재;배유미;박정수;성경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2014년도 춘계학술대회
    • /
    • pp.631-634
    • /
    • 2014
  • 웹과 클라우드 컴퓨팅 환경 구축시에 필수적으로 사용되는 것이 데이터베이스 시스템이다. 이러한 데이터베이스 시스템에는 오라클과 MS-SQL 등과 같은 상용 프로그램도 있지만, 상용 프로그램에 필적할 성능을 가진 무료 프로그램도 다수 존재한다. 특히, PostgreSQL, MySQL, MariaDB 등은 비용도 들지 않지만, 소스도 공개되어 있어서 다양한 환경에 적용할 수 있다. 본 논문에서는 소스가 공개된 관계형 데이터베이스 관리 시스템의 동향에 대해 알아본다.

  • PDF

오픈소스 DBMS 성능비교분석 (Performance Comparison and Analysis between Open-Source DBMS)

  • 장래영;배정민;정성재;소우영;성경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2014년도 추계학술대회
    • /
    • pp.805-808
    • /
    • 2014
  • DBMS(Database Management System)는 다수의 사용자들이 데이터베이스에 접근하여 손쉽게 데이터를 사용할 수 있도록 해주는 소프트웨어 시스템이다. 오라클(Oracle)을 선두로 한 상용서비스들과 MySQL을 중심으로 하는 오픈소스 DBMS가 있다. MySQL이 오라클에 인수된 이후 MariaDB가 발표되어 수요가 증가하고 있으며, 기존 SQL과 다른 성격의 NoSQL DBMS들도 상황에 따라 관심이 늘어나고 있는 추세이다. 동일한 형태의 대용량 데이터들을 바탕으로 오픈소스 DBMS간 실제 성능비교분석이 필요함에 따라 본고에서는 오픈소스DBMS의 MariaDB와 문서중심(Document-Centric) 데이터베이스인 MongoDB간의 성능비교분석을 연구하였고, 나아가 그에 따른 결과를 바탕으로한 빅데이터관련 데이터베이스관리시스템을 제안하고자 한다.

  • PDF

소용량 데이터베이스 처리를 위한 DBMS의 성능 비교 (Comparison of DBMS Performance for processing Small Scale Database)

  • 장시웅
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2008년도 추계종합학술대회 B
    • /
    • pp.139-142
    • /
    • 2008
  • 대규모 용량의 데이터베이스를 처리하기 위한 상용 DBMS에 대한 성능의 비교는 벤치마크 테스트로 결과가 주어진 경우가 많은 반면, 소규모 용량의 데이터베이스를 처리하기 위한 DBMS의 성능에 대해서는 많이 알려져 있지 않다. 따라서 본 연구에서는 소규모 용량의 데이터베이스를 처리하기 위한 상용 DBMS 및 공개용 DBMS의 성능에 대해 비교하고 분석하였다. 분석결과, 오라클은 데이터 갱신 및 삽입에 관한 연산에서는 데이터의 안전성 보장을 위한 rollback 기능의 준비 작업이 많아 좋지 못한 성능을 보인 반면, MySQL이나 MS-SQL 등의 경우에는 별다른 오버 헤드가 없어 오라클에 비해 좋은 성능을 보였다.

  • PDF

소용량 데이터베이스 처리를 위한 DBMS의 성능 비교 (Comparison of DBMS Performance for processing Small Scale Database)

  • 장시웅
    • 한국정보통신학회논문지
    • /
    • 제12권11호
    • /
    • pp.1999-2004
    • /
    • 2008
  • 대규모 용량의 데이터베이스를 처리하기 위한 상용 DBMS에 대한 성능의 비교는 벤치마크 테스트로 결과가 주어진 경우가 많은 반면, 소규모 용량의 데이터베이스를 처리하기 위한 DBMS의 성능에 대해서는 많이 알려져 있지 않다. 따라서 본 연구에서는 소규모 용량의 데이터 베이스를 처리하기 위한 상용 DBMS 및 공개용 DBMS의 성능에 대해 비교하고 분석하였다. 분석 결과, 오라클은 데이터 갱신 및 삽입에 관한 연산에서는 데이터의 안전성 보장을 위한 rollback 기능의 준비 작업이 많아 좋지 못한 성능을 보인 반면, MySQL이나 MS-SQL등의 경우에는 별다른 오버헤드가 없어 오라클에 비해 좋은 성능을 보였다.

클라우드 환경에서 MongoDB 기반의 비정형 로그 처리 시스템 설계 및 구현 (Design and Implementation of MongoDB-based Unstructured Log Processing System over Cloud Computing Environment)

  • 김명진;한승호;최운;이한구
    • 인터넷정보학회논문지
    • /
    • 제14권6호
    • /
    • pp.71-84
    • /
    • 2013
  • 컴퓨터 시스템 운용 간에 발생하는 많은 정보들이 기록되는 로그데이터는 컴퓨터 시스템 운용 점검, 프로세스의 최적화, 사용자 최적화 맞춤형 제공 등 다방면으로 활용되고 있다. 본 논문에서는 다양한 종류의 로그데이터들 중에서 은행에서 발생하는 대용량의 로그데이터를 처리하기 위한 클라우드 환경 하에서의 MongoDB 기반 비정형 로그 처리시스템을 제안한다. 은행업무간 발생하는 대부분의 로그데이터는 고객의 업무처리 프로세스 간에 발생하며, 고객 업무 프로세스 처리에 따른 로그데이터를 수집, 저장, 분류, 분석하기 위해서는 별도로 로그데이터를 처리하는 시스템을 구축해야만 한다. 하지만 기존 컴퓨팅환경 하에서는 폭발적으로 증가하는 대용량 비정형 로그데이터 처리를 위한 유연한 스토리지 확장성 기능, 저장된 비정형 로그데이터를 분류, 분석 처리할 수 있는 기능을 구현하기가 매우 어렵다. 이에 따라 본 논문에서는 클라우드 컴퓨팅 기술을 도입하여 기존 컴퓨팅 인프라 환경의 분석 도구 및 관리체계에서 처리하기 어려웠던 비정형 로그데이터를 처리하기 위한 클라우드 환경기반의 로그데이터 처리시스템을 제안하고 구현하였다. 제안한 본 시스템은 IaaS(Infrastructure as a Service) 클라우드 환경을 도입하여 컴퓨팅 자원의 유연한 확장성을 제공하며 실제로, 로그데이터가 장기간 축적되거나 급격하게 증가하는 상황에서 스토리지, 메모리 등의 자원을 신속성 있고 유연하게 확장을 할 수 있는 기능을 포함한다. 또한, 축적된 비정형 로그데이터의 실시간 분석이 요구되어질 때 기존의 분석도구의 처리한계를 극복하기 위해 본 시스템은 하둡 (Hadoop) 기반의 분석모듈을 도입함으로써 대용량의 로그데이터를 빠르고 신뢰성 있게 병렬 분산 처리할 수 있는 기능을 제공한다. 게다가, HDFS(Hadoop Distributed File System)을 도입함으로써 축적된 로그데이터를 블록단위로 복제본을 생성하여 저장관리하기 때문에 본 시스템은 시스템 장애와 같은 상황에서 시스템이 멈추지 않고 작동할 수 있는 자동복구 기능을 제공한다. 마지막으로, 본 시스템은 NoSQL 기반의 MongoDB를 이용하여 분산 데이터베이스를 구축함으로써 효율적으로 비정형로그데이터를 처리하는 기능을 제공한다. MySQL과 같은 관계형 데이터베이스는 복잡한 스키마 구조를 가지고 있기 때문에 비정형 로그데이터를 처리하기에 적합하지 않은 구조를 가지고 있다. 또한, 관계형 데이터베이스의 엄격한 스키마 구조는 장기간 데이터가 축적되거나, 데이터가 급격하게 증가할 때 저장된 데이터를 분할하여 여러 노드에 분산시키는 노드 확장이 어렵다는 문제점을 가지고 있다. NoSQL은 관계형 데이터베이스에서 제공하는 복잡한 연산을 지원하지는 않지만 데이터가 빠르게 증가할 때 노드 분산을 통한 데이터베이스 확장이 매우 용이하며 비정형 데이터를 처리하는데 매우 적합한 구조를 가지고 있는 비관계형 데이터베이스이다. NoSQL의 데이터 모델은 주로 키-값(Key-Value), 컬럼지향(Column-oriented), 문서지향(Document-Oriented)형태로 구분되며, 제안한 시스템은 스키마 구조가 자유로운 문서지향(Document-Oriented) 데이터 모델의 대표 격인 MongoDB를 도입하였다. 본 시스템에 MongoDB를 도입한 이유는 유연한 스키마 구조에 따른 비정형 로그데이터 처리의 용이성뿐만 아니라, 급격한 데이터 증가에 따른 유연한 노드 확장, 스토리지 확장을 자동적으로 수행하는 오토샤딩 (AutoSharding) 기능을 제공하기 때문이다. 본 논문에서 제안하는 시스템은 크게 로그 수집기 모듈, 로그 그래프생성 모듈, MongoDB 모듈, Hadoop기반 분석 모듈, MySQL 모듈로 구성되어져 있다. 로그 수집기 모듈은 각 은행에서 고객의 업무 프로세스 시작부터 종료 시점까지 발생하는 로그데이터가 클라우드 서버로 전송될 때 로그데이터 종류에 따라 데이터를 수집하고 분류하여 MongoDB 모듈과 MySQL 모듈로 분배하는 기능을 수행한다. 로그 그래프생성 모듈은 수집된 로그데이터를 분석시점, 분석종류에 따라 MongoDB 모듈, Hadoop기반 분석 모듈, MySQL 모듈에 의해서 분석되어진 결과를 사용자에게 웹 인터페이스 형태로 제공하는 역할을 한다. 실시간적 로그데이터분석이 필요한 로그데이터는 MySQL 모듈로 저장이 되어 로그 그래프생성 모듈을 통하여 실시간 로그데이터 정보를 제공한다. 실시간 분석이 아닌 단위시간당 누적된 로그데이터의 경우 MongoDB 모듈에 저장이 되고, 다양한 분석사항에 따라 사용자에게 그래프화해서 제공된다. MongoDB 모듈에 누적된 로그데이터는 Hadoop기반 분석모듈을 통해서 병렬 분산 처리 작업이 수행된다. 성능 평가를 위하여 로그데이터 삽입, 쿼리 성능에 대해서 MySQL만을 적용한 로그데이터 처리시스템과 제안한 시스템을 비교 평가하였으며 그 성능의 우수성을 검증하였다. 또한, MongoDB의 청크 크기별 로그데이터 삽입 성능평가를 통해 최적화된 청크 크기를 확인하였다.

효율적인 트윗 분석 시스템 설계 및 구현 방법 (An Efficient Method for Design and Implementation of Tweet Analysis System)

  • 최민석
    • 디지털융복합연구
    • /
    • 제13권2호
    • /
    • pp.43-50
    • /
    • 2015
  • 다양한 소셜 네트워크 서비스의 등장과 사용자의 급증으로 소셜 네트워크 상에서 생산되는 데이터가 급증하고 있다. 전파 속도가 빠르고 개인적 성향의 의견들을 많이 포함하고 있는 소셜 네트워크 데이터의 특성으로 이를 분석하여 다양한 방면으로 활용하려는 요구도 증가하고 있다. 이러한 요구에 부응하여 실시간으로 대용량 데이터를 분석 처리하기 위한 다양한 기술 및 서비스들이 등장하고 있지만, 단기간에 적은 비용으로 그것들을 적용하기에는 어려움이 따른다. 본 논문에서는 새로운 기술이나 서비스의 도입 없이 효과적으로 트윗을 분석하기 위한 시스템 설계 및 구현 방법을 제안한다. 리눅스 기반의 호스팅 서버에 MySQL 데이터베이스와 PHP 스크립트를 이용하여 트윗 데이터를 수집하고 분석하는 모니터링 시스템을 구축하여 제안된 방법을 검증하였다.

관계형 데이터베이스를 이용한 수문자료 관리시스템 개발 (Development of Hydrologic Data Management System Based on Relational Database)

  • 김학관;박승우;김상민
    • 한국수자원학회논문집
    • /
    • 제39권10호
    • /
    • pp.855-866
    • /
    • 2006
  • 본 연구에서는 유역 수문자료를 효율적으로 관리할 수 있는 수문자료관리시스템(HDMS)을 개발하였으며 경기도 화성시에 위치한 발안시험유역을 대상으로 시스템의 적용성을 보여주었다. MySQL 5.0을 사용하여 관계형 데이테베이스를 설계하였으며, MS-Visual Basic 6.0을 이용하여 윈도우 기반의 시스템을 개발하였다. HDMS는 자료검색시스템, 자료관리시스템, 자료분석시스템으로 구성되었다. 자료검색시스템과 자료관리시스템은 자료검색, 자료저장, 자료갱신, 자료추출의 기능을 제공하며, 자료분석시스템은 저장된 자료로부터 다양한 수문통계정보를 제공하며, 자료의 정확성 및 품질을 분석하고 평가한다.

반도체 공정의 생산성 향상을 위한 실시간 대용량 데이터의 효율적인 저장 기법 (An Efficient Storing Scheme of Real-time Large Data to improve Semiconductor Process Productivities)

  • 정원일;김환구
    • 한국산학기술학회논문지
    • /
    • 제10권11호
    • /
    • pp.3207-3212
    • /
    • 2009
  • 반도체 산업이 발전함에 따라 생산 효율을 높이기 위해 무인 자동 생산 공정이 요구되고 있다. 이러한 무인자동화 생산 관리 시스템은 생산성 향상을 위해 생산 공정에서 발생하는 대량의 실시간 데이터 분석 및 관리를 필요로 한다. 따라서 실시간으로 발생하는 대용량 데이터를 저장하기 위한 저장 관리 시스템이 요구된다. 기존의 저장 관리 시스템으로 오라클, MY-SQL, MS-SQL 등의 디스크 기반 DBMS가 있다. 하지만 기존의 디스크 기반 DBMS는 반도체 장비로부터 실시간으로 발생하는 대용량 데이터 처리에 한계가 있다. 본 논문에서는 대용량 데이터를 저비용으로 실시간 저장하기 위해 블록 단위 삽입 트랜잭션을 이용한 압축-합병 저장 기법을 제안한다. 제안 기법은 블록 단위 트랜잭션을 이용하여 실시간 데이터를 빠르게 저장하며 데이터를 압축하고 압축된 데이터를 합병하여 저장하기 때문에 보다 적은 디스크 공간을 사용하여 저장할 수 있다. 따라서 반도체 공정에서 빠르게 발생하는 대용량 데이터를 기존 DBMS보다 빠르게 저장이 가능하고 저장 공간 비용을 감소시킨다.

InnoDB 기반 DBMS에서 다중 버퍼 풀 오버헤드 분석 (An Analysis of the Overhead of Multiple Buffer Pool Scheme on InnoDB-based Database Management Systems)

  • 송용주;이민호;엄영익
    • 정보과학회 논문지
    • /
    • 제43권11호
    • /
    • pp.1216-1222
    • /
    • 2016
  • 대규모 웹 서비스의 등장으로 데이터의 규모가 점차 증가하는 추세이다. 이러한 대규모 데이터를 효율적으로 관리하기 위해 MySQL과 MariaDB와 같은 DBMS가 주로 사용되고 있으며, 이들은 데이터 관리를 위한 스토리지 엔진으로 InnoDB를 주로 사용한다. InnoDB는 ACID를 보장할 뿐만 아니라 대규모 데이터 처리에 적합하다는 장점이 있기 때문이다. InnoDB의 경우, I/O 성능 향상을 위해 버퍼 풀을 통해 데이터와 인덱스를 캐싱하며 락 경쟁(lock contention)을 줄이기 위해 다중 버퍼 풀을 지원한다. 그러나 다중 버퍼 풀 기법은 데이터 일관성 오버헤드를 증가시킨다. 본 논문에서는 다중 버퍼 풀 기법의 오버헤드를 분석한다. 실험 결과, 다중 버퍼 풀 기법을 사용함에 따라 락 경쟁이 최대 46.3%까지 완화되었지만 디스크 I/O와 fsync 명령이 증가하면서 DBMS의 처리량이 50.6%까지 떨어지는 현상을 확인하였다.