• 제목/요약/키워드: 분산 처리

검색결과 4,226건 처리시간 0.031초

위성 데이터 분산처리 시스템 최적화 및 안정화 (Optimization and Stabilization of Satellite Data Distributed Processing System)

  • 최윤수;이원구;이민호;김선태;이상환
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권11호
    • /
    • pp.13-21
    • /
    • 2013
  • 본 논문은 다양한 분야에서 활용되고 있는 초기의 위성 데이터가 자체적으로 내포하고 있는 많은 왜곡 요소(구름, 광휘 등)에 대한 보정 작업을 클러스터에서 분산 처리함으로써 성능 향상 및 안정성을 제공해 주는 것이 목적이다. 이를 위해 로컬 스토리지와 상태 테이블을 이용한SGE(Sun Grid Engine) 기반 분산 처리 방식을 제안하였고, 시스템으로 구현하였다. 이를 검증하기 위해 7개의 실행노드를 이용한 실험 결과에서는 기존 시스템보다 138.81%의 성능 향상을 가져옴을 알 수 있었으며, 분산 처리 작업에 대한 안정성 또한 확보됨을 보여주었다. 이는 위성 데이터에 대한 분산 처리 작업이 I/O바운드 작업보다는 CPU 바운드 작업에 보다 더 적합하다는 것을 보여주며, 이러한 SGE 기반 분산 처리 방식은 위성영상 데이터를 처리해야하는 다양한 분야에서의 데이터 처리 및 분석 속도 향상을 가져올 수 있고, 더 나아가 근실시간적 서비스를 가능하게 할 것으로 기대한다.

분산 스트림 컴퓨팅 기술 동향 (Technology of Distributed Stream Computing)

  • 이미영
    • 전자통신동향분석
    • /
    • 제26권1호
    • /
    • pp.80-88
    • /
    • 2011
  • 데이터의 효과적인 활용이 경쟁력 확보에 주요한 요인이나, 데이터 폭증은 유용한 정보를 얻는데 필요한 처리 시간의 지연을 야기하고 있다. 개인 맞춤형 서비스, 방범 방재 서비스 등 모니터링 & 대응 서비스를 위해 분석할 데이터의 양이 급증하고 있으며, 텍스트, 영상, 오디오 등 비정형 데이터에 대한 실시간 분석 필요성이 증대하고 있다. 대량의 폭증하는 데이터에 대한 실시간 분석 처리 환경을 제공하기 위해 분산 병렬 컴퓨팅 기술과 데이터 스트림 연속 처리 기술이 활용되고 있다. 본고에서는 폭증하는 데이터 스트림 처리를 위하여 확장성 및 유연한 처리 환경을 제공하는 분산 스트림 컴퓨팅 기술에 대해 소개한다.

  • PDF

광역 분산 컴퓨팅 환경에서 혼합서비스(네이밍/트레이딩)를 이용한 중복객체의 관리에 관한 연구 (A Study on the Management of Replica Object by Using Mixed-Service(Naming/Trading) based on Wide Area Distributed Computing Environment.)

  • 이원중;신창선;주수종
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 춘계학술발표논문집 (상)
    • /
    • pp.287-290
    • /
    • 2001
  • 최근의 급속한 인터넷 성장에 힘입어 분산처리의 기술 및 환경은 인터넷을 기반으로 광역환경으로 확장될 전망이다. 이러한 환경은 사용자에게 보다 투명한 분산객체간의 효율적인 상호접속이 요구될 뿐 아니라, 광역환경에서 이름이나 속성에 의해 다양한 중복된 성질을 갖고 있는 객체들의 관리가 요구된다. 또한 광역 분산 환경에서 최적의 객체를 선정하는데 분산된 시스템들간의 부하분배를 고려하여 투명성을 제공하는 메카니즘이 필요하게 된다. 따라서, 본 논문에서는 광역분산 컴퓨팅 환경에서 광역 서비스를 지원할 수 있는 이름/속성기반의 중복객체들을 관리를 위한 통합 트리 구성방법을 제안한다. 그리고 이를 통한 혼합(네이밍/트레이더)된 위치서비스(Location service)를 이용하여 무수히 산제한 중복된 분산 객체들을 효율적으로 유지하고, 최적의 객체 선정을 통해 부하균형을 유지할 수 있는 방안을 제시한다.

  • PDF

대용량 로그 데이터 처리를 위한 분산 실시간 자가 진단 시스템 (A Distributed Real-time Self-Diagnosis System for Processing Large Amounts of Log Data)

  • 손시운;김다솔;문양세;최형진
    • 데이타베이스연구회지:데이타베이스연구
    • /
    • 제34권3호
    • /
    • pp.58-68
    • /
    • 2018
  • 분산 컴퓨팅이란 다수의 서버로 구성된 분산 시스템에서 데이터를 효율적으로 저장 및 처리하는 기술이다. 따라서 분산 시스템을 구성하는 서버의 상태에 따라 분산 컴퓨팅의 성능에 큰 영향을 미친다. 본 논문은 분산 시스템에서 실시간으로 발생하는 시스템 자원의 로그 데이터를 수집하고 이상을 탐지하여 결과를 시각화하는 자가 진단 시스템을 제안한다. 먼저, 자가 진단 과정을 수집, 전달, 분석, 저장, 시각화의 다섯 단계로 구분한다. 다음으로, 자가 진단 과정이 실시간성, 확장성, 고가용성의 목표를 만족하도록 실시간 자가 진단 시스템을 설계한다. 본 시스템은 대표적인 실시간 분산 기술인 Apache Flume, Apache Kafka, Apache Storm을 기반으로 구현되어 실시간성, 확장성, 고가용성의 세 가지 목표를 만족할 수 있다. 또한, 자가 진단 과정에서 로그 데이터 처리의 지연을 최소화하도록 간단하지만 효과적인 이동 평균 및 3-시그마 기반 이상 탐지 기법을 사용한다. 본 논문의 결과를 통해, 분산 시스템 내에서 서버 상태를 실시간으로 진단할 수 있는 분산 실시간 자가 진단 시스템을 구축할 수 있다.

딥러닝 분산처리 기술동향 (Trends on Distributed Frameworks for Deep Learning)

  • 안신영;박유미;임은지;최완
    • 전자통신동향분석
    • /
    • 제31권3호
    • /
    • pp.131-141
    • /
    • 2016
  • 최근 알파고를 통해 인공지능 기술이 전 세계인의 이목을 집중시켰던 반면, 인공지능 연구자들은 인공지능 부활에 결정적 역할을 한 딥러닝 기술에 주목하고 있다. 딥러닝은 다계층 인공신경망 기반의 기계학습 기술로서 최근 컴퓨터 비전, 음성인식, 자연어 처리 분야에서 인식 성능을 높이는 데 중요한 역할을 하고 있다. 딥러닝 기술을 이용하여 기계가 수천만장의 이미지를 학습하여 객체를 인식하게 하고, 수천 시간의 음성 데이터를 학습하여 사람의 말을 알아듣게 처리하는 데에는 다수의 고성능 컴퓨터가 필요하다. 따라서 딥러닝에는 다수의 컴퓨터를 효율적으로 이용하기 위한 분산처리 기술이 필수적이며 관련 연구들이 활발히 진행되고 있다. 이에 본고는 다중 컴퓨터 노드들에서 딥러닝 모델을 분산처리할 수 있는 기존의 프레임워크들을 비교 분석하고 딥러닝 분산처리 기술에 대한 발전 방향을 전망한다.

  • PDF

클라우드 기반 대규모 데미터 처리 및 관리 기술 (Big Data Processing and Management Service on Cloud)

  • 이미영
    • 전자통신동향분석
    • /
    • 제24권4호
    • /
    • pp.41-54
    • /
    • 2009
  • 인터넷 서비스 데이터량의 지속적인 증가로 대량의 원시 데이터로부터 정보를 가공 처리하는 과정, 체계화된 정보의 저장 관리 및 유용한 정보를 추출하기 위한 분석 등에 분산 컴퓨팅 기술을 적용하는 움직임이 활발히 진행되고 있다. 기존의 RDBMS 기술, MPI 분산 처리 기술 등은 대규모 데이터 처리 환경에 적용하기에는 운영 환경, 기능/성능면에서 확장성 혹은 고비용 문제가 따른다. 그러므로 저가의 서버들로 구성된 대규모 클러스터 환경을 기반으로 분산 컴퓨팅 기술을 적용한 새로운 시스템들이 대규모 데이터 처리를 요하는 인터넷 서비스 응용에 이용되고 있다. 이를 기반으로 바이오인포매틱스, 과학 시뮬레이션, 비즈니스 인텔리전스 등 다른 응용 영역으로 확대하여 클라우드 서비스로 제공하려는 비즈니스 모델이 제시되고 있다. 본 논문에서는 이와 같은 분산 컴퓨팅 기술을 적용한 대규모 데이터 저장 관리 및 처리 기술 동향을 조사하고 클라우드 기반 서비스로의 발전 방향을 서술한다.

HBase를 이용한 분산 시맨틱 웹 데이터 저장소에 대한 연구 (A Study on Distributed Semantic Web Data Repository Using HBase)

  • 조대웅;김명호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 춘계학술발표대회
    • /
    • pp.111-114
    • /
    • 2012
  • 실시간으로 발생되는 대량의 데이터를 효율적으로 저장하기 위한 연구는 분산/병렬 처리를 위한 하둡 및 NoSQL과 관련한 빅 데이터 처리 기술을 통해 진행 중에 있다. 하지만 시맨틱 웹 분야에서 발생되는 대량의 데이터를 처리하기 위한 모델은 현재 연구가 진행되고 있지 않다. 본 논문에서는 시맨틱 웹 환경에서 발생되는 대량의 온톨로지 데이터를 빅 데이터 처리가 가능한 NoSQL 분야인 HBase 데이터베이스에 분산 저장할 수 있는 매핑 규칙을 제안한다. 이와 같은 매핑 규칙을 통해 시맨틱 웹 환경에서도 대량으로 발생될 수 있는 데이터들을 효율적으로 분산 저장 할 수 있다.

Industrial IoT 환경에서의 분산 게이트웨이를 이용한 센서 데이터 처리 (Sensor Data Processing using Distributed Gateway in Industrial IoT)

  • 이태호;김세준;이병준;김경태;윤희용
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2018년도 제58차 하계학술대회논문집 26권2호
    • /
    • pp.193-194
    • /
    • 2018
  • 본 논문에서는 IIoT(Industrial IoT) 환경에서 사용되는 수 천 개 이상의 센서 데이터를 효율적으로 처리하기 위하여 분산 게이트웨이 시스템을 제안한다. 이 시스템은 대량의 센서에서 측정되는 데이터를 단일 게이트웨이 단위로 처리할 때 늘어나는 작업부하와 처리 시간 지연, 신뢰성 및 정확성 저하를 해결하기 위하여 복수의 게이트웨이 간 연계를 통해 대량의 센서에서 측정되는 데이터를 실시간 처리가 가능한 게이트웨이로 지연시간 없이 균등 할당함으로써 작업부하의 완화와 처리 시간의 가속화, 신뢰성 및 정확성 확보를 이루어낼 수 있다. 본 논문에서는 단일 게이트웨이 시스템과 분산 게이트웨이 시스템의 비교를 통해 수천 개 이상의 센서에서 측정되는 데이터 처리 시간의 차이를 확인함으로써 IIoT 환경에서 분산 게이트웨이의 활용도 면에서 우수함을 보인다.

  • PDF

분산 구조를 위한 텔레프레즌스 클라이언트 구현 방법 (Implementation of telepresence client system for distributed network architecture)

  • 황인기;강헌식;김도영
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2013년도 하계학술대회
    • /
    • pp.375-377
    • /
    • 2013
  • 텔레프레즌스 시스템은 기존의 영상회의 시스템과 비교하여, 라이프 사이즈의 출력, 고품질의 영상 및 음성 출력을 가능하게 함으로써 참석자로 하여금 실제 회의에 참석하고 있는 듯한 몰입도를 제공하여 원거리의 출장을 대체할 수 있는 시스템이다. 기존의 텔레프레즌스 시스템은 각 클라이언트의 미디어 정보를 중앙 서버에서 취합, 재구성하여 각각의 클라이언트로 전달하는 구조를 갖는다. 이러한 구조는 기능의 구현은 용이하나 모든 트래픽이 서버로 집중되어 서버가 설치되어 있는 통신 노드에 부하가 집중되는 단점을 갖는다. 이러한 문제점을 해결하기 위해 중앙 서버의 호처리 기능과 미디어 처리 기능을 통신망에 분산시키는 구조가 분산형 텔레프레즌스 구조이며, 분산 구조 하에서 각각의 클라이언트는 기존의 중앙 서버에서 처리되었던 미디어의 재구성 기능, 텔레프레즌스 서비스를 위한 고품질의 비디오 및 오디오 처리 기능, 협업을 위한 문서 공유 기능 등이 요구된다. 본 논문에서는 분산형 구조에서 요구사항을 만족하는 텔레프레즌스 클라이언트 시스템의 구현 방법에 대하여 기술한다.

  • PDF

인메모리 기반 딥러닝 기술을 위한 분산 프레임워크에 관한 연구 (A Study on In-memory based Distributed Frameworks for Deep Learning)

  • 조혜영;유정록
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2016년도 추계학술발표대회
    • /
    • pp.45-46
    • /
    • 2016
  • 최근 GPU를 비롯한 하드웨어의 성능이 급격이 증가하면서 인공지능, 딥러닝 기술에 대한 관심이 높아지고 있다. 또한 데이터가 더욱 방대해 지면서 대용량 데이터를 처리하고 위한 딥러닝 분산 프레임워크에 대한 필요성이 제기되고 있다. 이에 본 논문에서는 대규모의 분산 환경에서 딥러닝 고속 처리를 위한 분산 프레임워크를 비교 분석하였다. 특히 최근 주목받고 있는 인메모리 기반 분산 프레임워크인 Spark, SparkNet, HeteroSpark의 특징을 비교 분석하였다.