• 제목/요약/키워드: 분산 데이터베이스

검색결과 607건 처리시간 0.026초

분산 공간 데이터베이스 시스템에서의 적응적 공간 조인 기법 (Adaptive Spatial Join Method in Distributed Spatial Database System)

  • 이재훈;김호석;이재동;배해영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.169-171
    • /
    • 2003
  • 네트워크의 빠른 발전으로 인해 분산된 공간 데이터의 질의 처리 연구가 활발히 진행되었다. 하지만 이런 질의 처리 환경에서는 질의 처리의 최적화를 위한 정확한 정보를 수집하기 어렵고 네트워크 상태의 불확실성으로 인해 데이터의 전송 상태를 예측하기가 힘들다. 이런 동적인 환경에 적응하기 위해서는 기존의 공간 조인 기법을 수정할 필요가 생겼다. 특히 기존의 공간 조인 기법은 처리 방식이 비대칭적(asymmetric)이기 때문에 데이터 전송의 지연으로 인해 처리가 잠시 중단되거나 빠른 응답 시간을 보장할 수 없다. 본 논문에서는 분산 공간 데이터베이스에서의 공간 조인의 문제점을 해결하기 위해서 대칭적인 해시 공간 조인을 사용하는 적응적 공간 조인 기법을 제안한다. 제안된 기법은 초기의 전송된 데이터들을 조인하여 조인 결과를 빠르게 보여주며 데이터 전송의 지연 시에는 이미 전송된 데이터 중 조인되지 않은 객체들을 조인함으로써 지속적으로 조인을 수행한다.

  • PDF

분산 데이터베이스 시스템에서의 색인 구성비용 절감을 위한 효율적인 색인 전송기법 (An Efficient Index Transfer Method for Reducing Index Organization Cost In Distributed Database Systems)

  • 박상근;김호석;이재동;배해영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.223-225
    • /
    • 2003
  • 분산 데이터베이스 시스템 환경에서는 특정 노드로 집중되는 부하의 분산이나 가용성 및 안정성 제공을 위해 데이터 분할기법 (fragmentation)과 복제기법(replication)을 사용한다. 이때 전송된 데이터에 대한 기존의 색인 재활용 기법과 벌크 로딩(bulk loading) 기법은 효율적인 색인 구성을 위해 논리적인 페이지 포인터를 물리적 주소로 변환하는 물리적 사상구조를 필요로 하거나, 색인 구성시간과 검색성능 모두를 향상시키지 못하는 문제점을 지닌다. 본 논문에서는 이와 같은 문제점을 해결하기 위해 색인 전송기법을 제안한다. 본 기법은 색인 재활용을 위해 물리적 사상구조를 추가로 유지하거나, 검색 성능을 향상시키기 위해 전체 데이터 집합을 정렬하는 것이 아니라, 데이터가 전송될 사이트에 색인구조물 저장하기 위한 물리적 공간은 예약하고 예약된 공간에 색인구조를 전송, 기록함으로써 색인 구성비용을 줄이게 된다. 또한 예약된 공간을 연속적인 페이지구조로 구성함으로써 색인 구성 시 자식노드에 대한 위치정보를 예상하여 부모노드가 지니는 자식노드에 대한 위치정보 기록 비용을 줄일 수 있다.

  • PDF

분산 병렬 질의 처리를 지원하는 CUBRID 기반 미들웨어 개발 (Development of CUBRID based Middleware supporting Distributed Parallel Query Processing)

  • 김형일;윤민;조아라;최문철;장재우
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.714-717
    • /
    • 2014
  • 최근 SNS의 발전으로 인해 정보의 양이 급격히 증가하였으며, 이에 따라 빅데이터 처리를 위한 NoSQL에 대한 연구가 활발히 진행되고 있다. 그러나 NoSQL은 데이터베이스의 ACID 조건을 만족하지 못하는 문제점이 존재한다. 따라서 RDBMS를 기반으로 빅데이터 처리를 수행하는 연구가 활발히 진행되고 있다. 이를 위한 대표적인 기법인 CUBRID Shard는 데이터베이스를 Shard 단위로 수평 분할하여 각기 다른 물리 노드에 데이터를 분산 저장한다. 그러나 해당 기법은 한 클라이언트의 질의가 다수의 서버에서 실행되어야 하는 경우를 에는 질의를 처리하지 못하는 단점을 보인다. 따라서 본 논문에서는 병렬 질의 처리를 지원하는 CUBRID 기반 분산 미들웨어를 제안한다.

XML기반의 가상 스키마를 이용한 정보 통합 검색시스템 설계 (Design of Virtual Schema using Information Integeration Search System based on XML)

  • 문석재;정계동;국윤규;최영근
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.187-189
    • /
    • 2004
  • XML을 기반으로 한 시스템간의 통합하는 과정에서 발생하는 데이터 정의 이질성 문제, 데이터 표현의 이질성 문제, 유사표준의 중복 개발 등이 야기되므로, 이에 대한 대비책이 필요하다. 따라서 분산된 이 기종 시스템들마다 각기 구조화된 데이터베이스틀 통합하는 과정에 발생하는 시스템간의 불일치 문제를 해결할 수 있는 방법이 메타데이터를 이용하는 것이다. 본 논문에서는 이질적이면서도 분산되어 있는 정보 저장소로부터 메타데이터틀 수집하고. 이를 통합된 메타데이터 베이스로 구축하여, 분산된 데이터베이스에 대한 검색정보 및 데이터 트랜잭션을 할 수 있도록 제안한다. 정보 통합 방법으로는 메타데이터를 기반으로 한 가상 스키마를 이용한다. 스키마 이질성과 데이터 이질성 해결하기 위한 방법으로 메타데이터 가상 스키마를 설계하였다. 메타데이터 가상 스키마 기반으로 한 정보 통합은 XML 뷰어 어인 XDR을 기반으로 한다. 이는 XMVS 템플릿으로 분해하여, 통합 처리 할 수 있는 XML기반의 가상 스키마를 이용한 정보 통합 검색시스템을 설계 제안한다.

  • PDF

Multi-SDBMS 디렉토리서비스 (Directory Service in Multi-SDBMS)

  • 김호석;정보홍;이순조;배해영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (1)
    • /
    • pp.328-330
    • /
    • 2001
  • 클라이언트-서버환경에서 클라이언트가 다수의 서버에 분산되어 저장 관리되는 대용량의 공간데이터와 공간 뷰에 대해 효율적으로 접근을 하기 위해서는 서버는 분산 저장되어 있는 공간데이터간의 위치정보를 파악하고 있어야하며 서버는 이를 이용하여 클라이언트의 질의요청에 답해야 한다. 본 논문에서는 공간데이터베이스에 흩어져 있는 공간데이터와 공간 뷰에 대한 접근 방법으로 공간데이터베이스의 공간메타정보에 대한 디렉토리서비스를 제안하며, 이러한 디렉토리서비스를 이용하여 분산된 공간데이터와 공간 뷰에 대한 접근을 할 수 있는 Multi-SDBMS 시스템에서의 디렉토리서비스 관리기의 실계 및 구현을 제안한다. 디렉토리서비스를 구현하기 위해서 LDAP(Lightweight Directory Access Protocol) 모델을 사용하며, LDAP의 스키마를 공간데이터와 공간 뷰에 대한 메타데이터를 지원하기 위해서 확장한다.

  • PDF

이미지 검색 시스템을 위한 Spark 기반의 이미지 벡터 추출 기법 (Image Vector Extraction Method using Spark Framework for Image Retrieval System)

  • 김태연;서호진;이영구
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 춘계학술발표대회
    • /
    • pp.726-729
    • /
    • 2015
  • 최근 네트워크 및 카메라 모듈의 발전으로 인해 생성되는 이미지 데이터의 양이 대용량화 되고 있으며, 이미지 데이터를 이용한 이미지 검색 서비스가 제공되고 있다. 이미지 검색 서비스를 제공하기 위해 이미지 데이터베이스 구축이 요구된다. 효율적인 데이터베이스 구축을 위해 Bow 기법을 이용하여 데이터의 차수를 낮춘 후 이미지 벡터를 저장하는 방식을 사용한다. 그러나 이미지 데이터의 수가 급격히 증가하여 오랜 수행 시간을 요구한다. 본 논문에서 인-메모리 기반 분산 프레임워크인 스파크를 이용한 이미지 벡터 생성 과정을 분산 설계하였다. 실험을 통해 제안하는 분산 처리 기법이 기존방법에 비해 효율적임을 보인다.

분산 실시간 데이터베이스 시스템을 위한 효율적인 동시성제어 기법 (An Efficient Concurrency Control Scheme for Distributed Real-time Database Systems)

  • 이종설;신재룡;유재수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 제13회 춘계학술대회 및 임시총회 학술발표 논문집
    • /
    • pp.61-66
    • /
    • 2000
  • 본 논문에서는 분산 실시간 데이터베이스 시스템을 위한 효율적인 동시성 제어 기법을 제안한다. 제안하는 기법은 분산 실시간 환경에서 완료준비 단계에 도달한 트랜잭션의 우선 순위를 상승시킴으로써 트랜잭션의 재시작에 의한 낭비를 줄이고, 트랜잭션의 완료를 최대한 보장하며, 잠금 지연 시간을 최소화하는 장점을 갖는다. 또한, 제안하는 기법은 우선 순위가 상승된 트랜잭션의 완료를 보장하며 데이터 차용(borrowing)을 통해 다른 트랜잭션의 지연시간을 줄여줌으로써 전체적인 시스템 성능을 향상시킨다.

  • PDF

데이터베이스 시스템에서 디지털 포렌식 조사를 위한 체계적인 데이터 추출 기법 연구 (Research of organized data extraction method for digital investigation in relational database system)

  • 이동찬;이상진
    • 정보보호학회논문지
    • /
    • 제22권3호
    • /
    • pp.565-573
    • /
    • 2012
  • 기업의 탈법, 비리 등 부정행위를 조사할 경우 인사, 회계, 물류, 생산 등의 업무데이터(Business Data)의 확보가 필요하다. 다수의 기업들은 분산된 업무 데이터를 데이터베이스(Database)화하여 통합적으로 관리하고 있기 때문에 디지털 포렌식 조사를 위하여 데이터베이스에 대한 체계적인 업무데이터 추출기법 연구가 중요하다. 일반적인 정보체계 환경에서 데이터베이스는 상위 어플리케이션 및 대용량 파일 서버와 통합된 정보체계 내의 부분적 형태로 존재한다. 또한 사용자가 입력한 원시 업무 데이터는 정규화 과정을 거친 테이블 설계에 의해 하나 이상의 테이블에 분산되어 저장된다. 기존 데이터베이스 구조 분석에 관한 연구들은 데이터베이스의 최적화와 시각화를 위하여 테이블 간 연관관계 분석이 가장 중요한 연구대상이었다. 그러나 원시 업무데이터를 획득해야 하는 디지털 포렌식 관점의 연구는 테이블 간 연관관계 시각화보다 데이터의 해석이 더 중요한 연구대상이다. 본 논문에서는 데이터베이스 내부에서 미리 정의된 테이블 간 연관관계 분석기술뿐만 아니라 도메인 전문 지식(domain knowledge)을 활용한 체계화된 분석절차를 제시하여 데이터베이스에 저장된 원시 업무 데이터 구조를 분석하고 사건관련 데이터를 추출할 수 있는 분석방안을 제안한다.

다중 웹 데이터베이스에서 SQL 질의 처리를 위한 가상 처리장치 아키텍처 설계 (Designing The Architecture of A Virtual Processor for Processing SQL Queries Using Multiple Web Databases)

  • 성동훈;최덕원
    • 한국경영과학회:학술대회논문집
    • /
    • 대한산업공학회/한국경영과학회 2000년도 춘계공동학술대회 논문집
    • /
    • pp.774-777
    • /
    • 2000
  • 인터넷의 발빠른 성장으로 모든 비즈니스가 웹에 집중되고 있다. 현재 웹에서 접할 수 있는 사이트들의 대부분은 하나의 DB에서 모든 작업을 처리하고 있는 실정이다. 데이터베이스들이 각각의 다른 지역 DBMS에 흩어져 있고 상이한 DBMS 테이블 사이에 하나 이상의 relation이 존재할 경우에는 한번의 질의로 서로 다른 DBMS로부터 트랜잭션을 처리하는데는 많은 문제가 발생할 수 있다. 일반적으로, 데이터베이스는 한 지역에서 하나의 DBMS에 의해 관리되지만, 효율적인 관리를 위해서 다른 지역으로 분산되어 존재하기도 한다. 더 나아가 독려된 데이터베이스를 서로 다른 지역에서 다수의 DBMS로 관리하는 다중 데이터베이스 시스템을 이용하기도 한다. 다중 데이터베이스 시스템을 이용하면 각 지역적으로 독립적인 관리 전략을 세울 수 있다는 장점을 가지고 있지만, 트랜잭션을 처리하기 위해서 더 복잡한 질의 처리 시스템을 필요로 하게 된다. 이것은 데이터베이스의 무결성과 동시처리 성능으로 직결되는 중요한 문제이다. 본 논문에서는 기존의 C/S 시스템을 이용한 다중 데이터베이스 시스템 설계를 웹으로 확장시켜 무결성 제약사항을 유지하고, 동시처리를 가능하도록 가상 처리장치(virtual processor) 아키택처를 설계하는 데 그 목적이 있다

  • PDF

분산 주기억장치 데이터베이스에서 카탈로그 관리 기법의 성능평가 (Performance Evaluation of Catalog Management Schemes for Distributed Main Memory Databases)

  • 정한라;홍의경;김명
    • 한국멀티미디어학회논문지
    • /
    • 제8권4호
    • /
    • pp.439-449
    • /
    • 2005
  • 분산 주기억장치 데이터베이스 관리 시스템 (DMM-DBMSs)은 데이터베이스를 참여 사이트의 주기억 장치에 저장한다. 지역 데이터베이스에 신속하게 접근할 수 있고 사이트들 사이에 고속 통신이 가능하므로 DMM-DBMS는 높은 성능을 보장한다. 최근 들어 DMM-DBMS에 대해 많은 연구 결과가 발표되었으나 아직까지 DMM-DBMS의 카탈로그 관리 기법에 대한 성능 분석 결과는 발표된 것이 없다. 본 연구에서는 높은 사이트 자치성을 보장하는 DMM-DBMS의 분할식 카탈로그 관리 기법의 성능을 실험적으로 평가하였다. 분할식 카탈로그 관리 기법을 캐시없는 분할식 카탈로그 방식(PCWC), 점진적 캐시를 이용한 분할식 카탈로그 방식(PCWIC), 완전 캐시를 이용한 분할식 카탈로그 방식(PCWFC)으로 분류하였고, 성능평가는 사이트 수, 사이트 당 터미널 수, 버퍼 크기, 쓰기 질의 비율, 지역 질의 비율 등을 중심으로 분석하였다. 분석 결과 PCWFC가 모든 경우에 가장 높은 성능을 보였다. 이는 또한 PCWIC가 시간이 흐름에 따라 더욱 높은 성능을 보인다는 것을 뜻한다. PCWFC 방식은 디스크 기반 분산 DMBS에서는 사이트 부하가 크거나 카탈로그 쓰기 비율이 높거나 원격 데이터 객체가 빈번히 액세스되는 상황에서 고성능을 보장하지 못하지만, DMM-DBMS에서는 원격 데이터 객체의 카탈로그가 자주 갱신된다고 해도 질의 컴파일과 원격 카탈로그 액세스가 고속으로 이루어질 수 있기 때문에 높은 성능을 보장하는 것이다.

  • PDF