• 제목/요약/키워드: 분산 데이터베이스

검색결과 607건 처리시간 0.027초

자바와 미들웨어를 이용한 분산형 자료 관리 시스템(DDM) 구현 (Implementation of Distributed Data Manager(DDM) with Java and middleware)

  • 양은샘;김화종;최경;정충교;이구연
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 하계종합학술대회 논문집(3)
    • /
    • pp.89-92
    • /
    • 2000
  • 최근 인터넷 이용이 증가하면서 원격 교육자료, 전자상거래용 자료 등 여러 이용자가 사용하는 자료를 하나의 서버가 아니라 분산된 형태로 나누어 관리하는 것이 통신량을 줄이기 위해 점차 중요시되고 있다. 특히 멀티미디어 자료는 데이터 량이 많으므로 이용자에게 가까운 서버에 분산 관리하는 것이 더욱 필요하다. 본 논문에서는 CORBA 표준을 따르는 미들웨어를 사용하여 인터넷으로 상호 연결된 임의의 시스템에 자료를 분산 관리할 수 있는 분산형 자료 관리 시스템 DDM(Distributed Data Manager)을 구축하였다. DDM은 크게 나누어 사용자 관리, 데이터 관리, 시스템 상태 관리 기능을 제공하며 단순히 분산 자료의 위치만을 관리하는 것이 아니라, 자료를 종류별 또는 용도별로 통합된 category를 관리한다. DDM은 분산 자료의 통합관리와 시스템 상태 관리를 위해서 주 에이전트(Primary Agent, 이하 PA)와, 이용자에게 직접 서비스를 제공하는 보조 에이전트(Local Agent, 이하 LA)를 중심으로 구성된다. DDM은 모든 자료에 대한 현재 상태를 관리하는데, 자료의 등록, 수정, 삭제 등의 요구가 보조 에이전트를 통하여 실시간으로 이루어지며 자료의 통합 관리와 백업 관리는 주 에이전트가 담당한다. 한편 DDM는 자바와 JDBC를 사용하여 구축함으로써 임의의 플랫폼과 데이터베이스를 이용할 수 있게 하였다.

  • PDF

분산 CUBIRD 상에서 세타 조인 및 중첩 SQL 병렬 질의처리를 지원하는 질의 재구성 기법 (Query Reorganization Scheme supporting Parallel Query Processing of Theta Join and Nested SQL on Distributed CUBRID)

  • 양현식;김형진;장재우
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2014년도 추계 종합학술대회 논문집
    • /
    • pp.37-38
    • /
    • 2014
  • 최근 SNS의 발전으로 인해 데이터의 양이 급격히 증가하였으며, 이에 따라 빅데이터 처리를 위한 분산 DBMS 기반 질의 처리 연구가 활발히 진행되고 있다. 이를 위해 CUBRID는 CUBRID Shard 서비스를 통해 데이터베이스를 shard 단위로 수평 분할하여 각기 다른 물리 노드에 데이터를 분산 저장하도록 지원한다. 그러나 CUBRID Shard는 shard간 데이터가 독립적으로 관리되기 때문에 세타 조인 및 중첩 질의와 같이 다수 서버에서의 테이블 참조가 필요한 질의는 처리가 불가능하다. 따라서 본 논문에서는 분산 CUBRID 상에서 세타 조인 및 중첩 SQL를 지원하는 질의 재구성 기법을 제안한다.

  • PDF

분산 환경에서의 클러스터화된 밀집 인덱스 기반 효율적인 불균등 분포 데이터의 조인 기법 (Dense Clustering Index Based Efficient Join Method to Handle Skewed Data in Distributed Environment)

  • 김재형;박상현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 춘계학술발표대회
    • /
    • pp.656-659
    • /
    • 2014
  • 오픈소스로부터 촉발된 분산 시스템의 보편화로 기존 상용 시스템으로는 제공하지 못한 다양한 종류의 서비스가 각광받고 있다. 특히, 테라바이트 단위를 넘어 페타바이트 단위의 데이터를 다루는 서비스의 등장으로 드러난 오픈소스 분산 시스템의 문제를 개선하기 위한 시도가 학계 및 업계에서 다각적으로 이뤄지고 있다. 이러한 시도는 새로운 방법론을 제시하는 것에서부터 기존 분산 데이터베이스 관리 시스템(Distributed DBMS)에서 사용된 방법론들을 적용하는 것까지 다양하게 이뤄지고 있다. 본 논문에서는 특정 키 값(Key Value)에 불균등 분포된 데이터에 대한 조인 연산의 탐색 공간을 밀집 인덱스를 통해 줄여 비교적 높은 시간 복잡도를 완화하는 방법론을 제시하고자 한다.

HBase를 이용한 분산 시맨틱 웹 데이터 저장소에 대한 연구 (A Study on Distributed Semantic Web Data Repository Using HBase)

  • 조대웅;김명호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 춘계학술발표대회
    • /
    • pp.111-114
    • /
    • 2012
  • 실시간으로 발생되는 대량의 데이터를 효율적으로 저장하기 위한 연구는 분산/병렬 처리를 위한 하둡 및 NoSQL과 관련한 빅 데이터 처리 기술을 통해 진행 중에 있다. 하지만 시맨틱 웹 분야에서 발생되는 대량의 데이터를 처리하기 위한 모델은 현재 연구가 진행되고 있지 않다. 본 논문에서는 시맨틱 웹 환경에서 발생되는 대량의 온톨로지 데이터를 빅 데이터 처리가 가능한 NoSQL 분야인 HBase 데이터베이스에 분산 저장할 수 있는 매핑 규칙을 제안한다. 이와 같은 매핑 규칙을 통해 시맨틱 웹 환경에서도 대량으로 발생될 수 있는 데이터들을 효율적으로 분산 저장 할 수 있다.

데이터 통합검색을 위한 XMDR기반의 OGSA-DAI 시스템 설계 및 구현 (Design and Implementation of XMDR based on OGSA-DAI System for Data Integration retrieval)

  • 마진;문석재;정계동;최영근
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 추계학술발표대회
    • /
    • pp.173-174
    • /
    • 2009
  • 기업이 관리하고 있는 중요한 정보자원들은 대부분이 여러 레거시 시스템에 분산 저장되어 있다. 그리고 저장되어 있는 정보 자원들 또한 서로 호환되지 않는 다양한 형태로 존재하고 있다. 이러한 문제를 해결하기 위해 분산된 데이터의 통합과 지식 공유를 위한 시스템이 필요하다. 데이터 통합의 목적은 기업의 조직과 주요 업무, 핵심 어플리케이션으로부터 발생하는 데이터 소스들의 표준 규칙과 메타 데이터를 이용하여 중복성을 제거하고, 오직 단일 데이터를 제공하는데 있다. 본 논문에서는 XMDR 기반의 OGSA-DAI를 이용하여 통합 검색 시스템을 설계 및 구현하였고, 분산되어 있는 레거시 시스템간의 데이터 통합검색이 가능한 시스템을 제안한다. 제안한 시스템은 분산된 레거시 데이터베이스간의 협업 환경 구성에 적합하며, 실시간 기업환경에서 빠른 정보 전달과 업무 지원 환경에 적절한 시스템이다.

압축 방식에 따른 분산 메시징 시스템 성능 분석 (Performance Analysis of Distributed Messaging System by Compression Method)

  • 황윤영;김수진;신용태
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.524-527
    • /
    • 2021
  • 인터넷 서비스의 발전으로 프로젝트의 규모가 커짐에 따라 발생하는 문제를 해결하기 위해 프로젝트의 구조가 Monolith 구조에서 Micro Service 구조로 변하는 중이다. Micro Service 구조는 각각 독립된 데이터베이스를 가지기 때문에 각 서비스들 간에 데이터를 공유하고 관리하는 것에 어려움이 있다. Apache Kafka와 같은 분산 메시징 시스템은 여러 개로 분산된 서비스 간에 메시지를 전송 및 수신하여 데이터의 통신과 교환을 가능하게 한다. 본 논문에서는 분산 메시징 시스템에서 지원하는 압축 방식 별로 성능을 측정하고 분석하고자 한다.

바이오그리드 컴퓨팅과 생명과학 연구에의 활용 (Bio Grid Computing and Biosciences Research Application)

  • 김태호;김의용;염재범;고원규;곽희철;주현
    • Bioinformatics and Biosystems
    • /
    • 제2권2호
    • /
    • pp.37-45
    • /
    • 2007
  • 생물정보학은 컴퓨터를 이용하여 방대한 양의 생물학적 데이터를 처리하고 그 결과를 분석하는 학문으로서 IT의 고속성장과 맞물려 점차 그 활용도를 넓혀가고 있다. 특히 의학, 생명과학 연구에 사용되는 데이터는 그 종류도 다양하고 크기가 매우 큰 것이 일반적인데, 이의 처리를 위해서는 고속 네트워크가 바탕이 된 그리드-컴퓨팅(Grid-Computing) 기술 접목이 필연적이다. 고속 네트워크 기술의 발전은 슈퍼컴퓨터를 대체해 컴퓨터 풀 내에 분산된 시스템들을 하나로 묶을 수 있는 그리드-컴퓨팅 분야를 선도하고 있다. 최근 생물정보학 분야에서도 이처럼 발전된 고성능 분산 컴퓨팅 기술을 이용하여 데이터의 신속한 처리와 관리의 효율성을 증대시키고 있는 추세이다. 그리드-컴퓨팅 기술은 크게 데이터 가공을 위한 응용 프로그램 개발과 데이터 관리를 위한 데이터베이스 구축으로 구분 지을 수 있다. 전자에 해당하는 생물정보 연구용 프로그램들은 mpiBLAST, ClustalW-MPI와 같은 MSA서열정렬 프로그램들을 꼽을 수 있으며, BioSimGrid, Taverna와 같은 프로젝트는 그리드-데이터베이스 (Grid-Database)기술을 바탕으로 개발되었다. 본 고에서는 미지의 생명현상을 탐구하고 연구하기 위하여 현재까지 개발된 그리드-컴퓨팅 환경과 의생명과학 연구를 위한 응용 프로그램들, 그리고 그리드-데이터베이스 기술 등을 소개한다.

  • PDF

웹 정보원 통합을 위한 내용 기반의 스키마 자동생성시스템 (An Automatic Schema Generation System based on the Contents for Integrating Web Information Sources)

  • 곽준영;배종민
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권6호
    • /
    • pp.77-86
    • /
    • 2008
  • 웹 정보원은 사용자에게 제공되는 가장 큰 분산 데이터베이스로 간주될 수 있다. 분산된 웹 정보원을 가상적으로 통합하여 하나의 정보원으로 보고, 이 가상의 데이터베이스에 대하여 데이터베이스 질의어를 이용하여 검색하는 기능은 여러 가지 웹 기반 응용프로그램 개발에서 중요한 역할을 한다. 이러한 기능을 지원하기 위해서 브라우징 중심의 웹 문서로부터 데이터베이스 스키마를 추출해야 한다. 본 논문은 반 구조적인 웹 문서로부터 XML 스키마를 자동으로 생성하는 경험적 알고리즘을 제시한다. 이를 위하여 미리 정의된 구조태그 기반으로 후보패턴영역을 추출하고 후보패턴영역으로부터 패턴영역을 경험적으로 결정한다. 그리고 패턴영역으로부터 스키마생성규칙을 유도한다. 스키마생성규칙은 XQuery로 표현되기 때문에 공개된다양한 XML 도구를 사용하여 응용시스템을 개발할 수 있다. 개발된 시스템의 유효성을 보이기 위하여 다양한 웹정보원에 대하여 실험한 결과를 제시한다.

  • PDF

교량의 유지관리를 위한 멀티레이어 데이터베이스 개념 (A Concept of Multi-Layered Database for the Maintenance and Management of Bridges)

  • 김봉근;이진훈;이상호
    • 한국전산구조공학회논문집
    • /
    • 제20권3호
    • /
    • pp.393-404
    • /
    • 2007
  • 본 연구에서는 교량정보의 통합 운용을 지원하기 위해 멀티레이어 데이터베이스의 프레임워크를 제시하였다. 멀티레이어 데이터베이스란 표준화된 정보 레이어로 이루어진 논리적으로 통합된 데이터베이스를 말한다. 표준화된 정보 레이어는 한 부류로 구분할 수 있는 데이터 집합을 나타내며, 정보모델에 의해 정의된다. 본 연구에서 제시한 교량의 멀티레이어 데이터베이스 개념은 구조요소의 분류를 나타내는 정보체계를 기반으로 하며, 구조요소의 분류체계에 따른 코드를 사용함으로써 여러 정보계층에 분포된 데이터를 통합하도록 하였다. 또한 멀티레이어 데이터베이스 프레임워크의 한 축으로서 데이터 레벨을 설정하였다. 데이터 레벨은 정보계층에 포함된 데이터들의 재활용성에 따른 중요도를 의미하며, 이에 따라 정보모델의 세분화되는 정도를 정의하여 방대한 양의 교량정보 데이터베이스 구축을 위한 효과적인 전략수립이 가능하도록 하였다. 제시된 개념의 검증을 위해 객체지향개념의 3-D 형상정보 계층과 구조계산서 정보계층으로 이루어진 시범 데이터베이스를 구축하였다. 또한 두 계층으로 분산되어 있는 데이터의 일치여부를 자동으로 검토하는 실험을 통하여 본 연구에서 제시된 멀티레이어 데이터베이스 개념이 교량정보를 관리하는데 있어 정보의 무결성과 일관성을 보장할 수 있음을 보였다.

트랜잭션 우선 순위 상승을 이용한 분산 실시간 병행수행제어 기법 (A Distributed Real-Time Concurrency Control Scheme using Transaction the Rise of Priority)

  • 이종설;신재룡;조기형;유재수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권3호
    • /
    • pp.484-493
    • /
    • 2001
  • 실시간 데이터베이스 시스템이 분산환경으로 확장됨에 따라 기존의 실시간 병행수행 제어 기법을 분산환경으로 적용할 필요성이 대두되었다. 이에 본 논문에서는 중복 저장(replication)을 지원하는 분산 실시간 데이터베이스 시스템을 위한 효율적인 병행수행 제어 기법을 제안한다. 제안하는 기법은 중복 저장을 지원하는 분산 실시간 환경에서 완료준비 단계에 도달한 트랜잭션의 우선 순위를 상승시킴으로써 트랜잭션의 완료를 최대한 보장하며 완료 준비 단계에서 재시작 되는 트랜잭션을 줄이고 잠금 지연 시간을 최소화한다. 도한, 우선 순위가 상승된 트랜잭션이 점유한 데이터에 대한 대여(lending)를 허용함으로써 데이터를 차용(borrowing)한 트랜잭션의 대기시간이 감소되고 전체적인 시스템 성능이 향상되었다. 제안한 기법에 대한 성능 평가에서는 Firm 실시간 데이터베이스 환경에서 2단계 완료 기법을 기반으로 DO2PL_PA와 MIRROR 기법을 대상으로 트랜잭션의 도착율, 크기, 쓰기 가능성 및 데이터 중복율에 대한 마감시한 초과비율을 비교한다.

  • PDF