• Title/Summary/Keyword: Parallel computing

검색결과 810건 처리시간 0.033초

병렬 분산 처리를 이용한 영상 기반 실내 위치인식 시스템의 프레임워크 구현 (Framework Implementation of Image-Based Indoor Localization System Using Parallel Distributed Computing)

  • 권범;전동현;김종유;김정환;김도영;송혜원;이상훈
    • 한국통신학회논문지
    • /
    • 제41권11호
    • /
    • pp.1490-1501
    • /
    • 2016
  • 본 논문에서는 인메모리(In-memory) 병렬 분산 처리 시스템 Apache Spark(이하 Spark)를 활용하여 사용자에게 실시간 측위 정보를 제공할 수 있는 영상 기반 실내 위치인식 시스템을 제안한다. 제안하는 시스템에서는 사용자에게 실시간 측위 정보를 제공하기 위해서, Spark를 이용한 영상 특징점 추출 알고리즘의 병렬 분산화를 통해 알고리즘 연산 시간을 단축시킨다. 하지만 기존의 Spark 플랫폼에서는 영상 처리를 위한 인터페이스가 존재하지 않아, 영상 처리와 관련된 연산을 수행하는 것이 불가능하였다. 이에 본 논문에서는 Spark 영상 입출력 인터페이스를 구현하여 측위 연산을 위한 영상 처리를 Spark에서 수행 가능하게 하였다. 또한 무손실 압축(lossless compression)기법을 이용하여 특징점 기술자(descriptor)를 압축된 형태로 데이터베이스에 저장하여, 대용량의 실내 지도 데이터를 효율적으로 저장 및 관리하는 방법을 소개한다. 측위 실험은 실제 실내 환경에서 수행하였으며, 싱글 코어(Single-core) 시스템과의 성능 비교를 통해 제안하는 시스템이 최대 약 3.6배 단축된 시간으로 사용자에게 측위 정보를 제공 할 수 있다는 것을 입증하였다.

다분야통합해석에 기반한 설계문제의 병렬처리를 위한 부하분산알고리즘 (Load Balancing Algorithm for Parallel Computing of Design Problem involving Multi-Disciplinary Analysis)

  • 조재석;주민식;송용호;최동훈
    • 한국전산구조공학회논문집
    • /
    • 제20권3호
    • /
    • pp.281-286
    • /
    • 2007
  • 다분야통합해석에 기반한 설계문제는 일반적으로 전체 설계과정에서 매우 큰 계산시간을 요구하며, 이러한 계산시간을 단축하기 위해 병렬처리시스템을 도입하는 것이 필수적이다. 그러나 다분야통합해석에 기존의 병렬처리기법을 적용하기 위해서는 해석에 필요한 모든 CAE 소프트웨어들이 병렬처리시스템의 모든 서버에 설치되어 있어야 하며, 이는 매우 큰 CAE 소프트웨어의 비용을 필요로 한다. 본 논문에서는 이러한 문제점을 해결하기 위해 가중치 기반 멀티큐 부하분산 알고리즘을 제안하였다. 제안된 알고리즘은 서버들의 성능과 설치된 CAE 소프트웨어들의 종류가 각기 다른 이종 병렬처리시스템을 고려하였으며 성능검증을 위해 선입선출(First Come First Servre) 알고리즘을 적용한 경우와 비교한 전산실험을 수행하였다.

DWM: 이기종 클러스터 시스템의 동적 자원 관리자 (A Dynamic Work Manager for Heterogeneous Cluster Systems)

  • 박종현;김준성
    • 전자공학회논문지CI
    • /
    • 제46권6호
    • /
    • pp.56-62
    • /
    • 2009
  • 고속 네트워크를 통해 연결된 다수의 컴퓨터를 호환성 있는 통신 라이브러리를 활용하여 병렬처리를 수행하는 클러스터 컴퓨팅은 가격대 성능비에서 장점을 가지며 다양한 응용분야에서 실용화되고 있다. 이기종 클러스터 환경에서는 클러스터 시스템을 구성하는 개별 노드의 성능이 직접적인 영향을 주기 때문에 효율적인 자원 관리가 매우 중요하다. 본 논문에서는 DWM(Dynamic Work Manager)라 불리우는 동적 자원 관리자를 제안한다. DWM은 성능이 다른 이기종 클러스터 시스템에서 각 노드의 자원을 충분하게 활용할 수 있도록 설계되었다. DWM을 사용하여 다양한 벤치마크 프로그램을 클러스터 시스템에서 실행시켜 봄으로써 DWM의 성능과 프로그램의 복잡도를 측정한다. 실험 결과로부터 DWM의 사용은 이기종 클러스터 시스템의 성능을 효율적으로 활용하는 동시에 MPI 병렬처리 프로그램의 작성을 용이하게 함을 알 수 있다.

OpenCL을 이용한 돈사 감시 응용의 효율적인 태스크 분배 (Efficient Task Distribution for Pig Monitoring Applications Using OpenCL)

  • 김진성;최윤창;김재학;정연우;정용화;박대희;김학재
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제6권10호
    • /
    • pp.407-414
    • /
    • 2017
  • 다수의 태스크로 구성된 돈사 감시 응용은 내재된 데이터 병렬성을 활용하고 성능가속기를 사용하여 병렬 처리가 가능하다. 본 논문에서는 멀티코어 CPU와 매니코어 GPU로 구성된 이기종 컴퓨팅 플랫폼에서 돈사 감시 응용 수행 시 태스크 분배 방법을 제안한다. 즉, 각 태스크별로 OpenCL을 이용한 병렬 프로그램을 작성한 뒤, deviceCPU와 deviceGPU 각각에서 수행시켜 측정된 수행시간을 기준으로 가장 적합한 처리기를 결정한다. 제안 방법은 간단하지만 매우 효과적이고, CPU와 GPU로 구성된 이기종 컴퓨팅 플랫폼에서 다수의 태스크로 구성된 다른 응용을 병렬화하는 경우에도 적용될 수 있다. 실험 결과, 상이한 이기종 컴퓨팅 플랫폼에서 최적의 태스크 분배로 수행한 경우 가 전체 태스크들을 deviceGPU에서 수행한 GPU-only 방법에 비교하여 각각 2.7배, 8.7배, 2.7배 성능 개선이 되었음을 확인하였다.

CUDA를 활용한 병렬 $B^+$-트리 벌크로드 기법 (A Parallel Bulk Loading Method for $B^+$-Tree Using CUDA)

  • 성주호;이윤우;한아;최원익;권동섭
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권6호
    • /
    • pp.707-711
    • /
    • 2010
  • 대부분의 관계형 데이터베이스 시스템은 대량의 키 값을 효율적으로 검색하고 관리하기 위하여 $B^+$-트리 기반의 인덱스 구조를 사용하며, $B^+$-트리를 효율적으로 생성하기 위해 일반적으로 상향식 벌크로드 기법을 사용한다. 비록 벌크로드 기법이 키를 하나씩 삽입하여 인덱스를 생성하는 방식보다 효율적이긴 하지만, 데이터가 클 경우 전체 데이터를 정렬해야하기 때문에 많은 시간을 필요로 한다. 벌크로드 기법의 성능을 개선하기 위하여, 본 논문에서는 NDIVIA에서 제공하는 병렬 컴퓨팅 아키텍쳐인 CUDA를 활용한 GPU 기반의 효율적인 $B^+$-트리 병렬 벌크로드 기법을 제안한다. 제안하는 병렬 벌크로드 기법의 성능을 증명하기 위하여 실험을 수행한 결과, 기존 CPU 벌크로드 방법보다 약 70% 이상 성능이 향상됨을 확인하였다.

IBM Aglets를 기반으로 하는 가상 병렬 컴퓨팅 시스템에서 작업 할당 기법과 성능 비교 (Work Allocation Methods and Performance Comparisons on the Virtual Parallel Computing System based on the IBM Aglets)

  • 김경하;김영학;오길호
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제8권4호
    • /
    • pp.411-422
    • /
    • 2002
  • 최근에 다중 에이전트를 기반으로 하는 가상 병렬 컴퓨팅 시스템에 관한 적극적인 연구가 이루어지고 있다. 가상 병렬 컴퓨팅 시스템은 많은 계산을 요구하는 복잡한 문제들을 해결하기 위해 고비용수퍼 컴퓨터를 사용하는 대신에, 인터넷상에 산재되어 있는 개인용 컴퓨터 혹은 워크스테이션을 사용한다. 가상 병렬 컴퓨팅 시스템은 인터넷상에 이용 가능한 자원에 의존하여 동질 혹은 이질형의 컴퓨터들로 구성될 수 있다. 본 논문에서는 IBM Aglets를 기반으로 하는 가상 병렬 컴퓨팅 환경에서 작업자 에이전트와 작업 패키지를 효율적으로 분산하는 새로운 방법을 제안한다. 기존의 방법들은 작업자 에이전트와 작업 패키지를 분산하기 위해서 주로 마스터/슬레이브 유형을 사용한다. 그러나 이러한 방법에서 에이전트의 수가 증가하게되면 중앙 마스터에서 작업부하가 급속하게 증가된다. 이러한 문제에 대한 해결로서 본 논문에서는 작업자 에이전트와 작업 패키지의 분산을 작업자 에이전트에게 위임하는 방법을 사용한다. 제안된 방법은 가상 병렬 컴퓨팅 시스템에서 다양한 방식으로 평가되었으며, 그 결과는 기존의 방법에 비해서 괄목할 만한 수준으로 개선되었다.

병렬 웹 서비스를 이용한 조립체 모델 데이터의 획득 (Retrieval of Assembly Model Data Using Parallel Web Services)

  • 김병철;한순흥
    • 한국CDE학회논문집
    • /
    • 제13권3호
    • /
    • pp.217-226
    • /
    • 2008
  • Web Services for CAD (WSC) aims at interoperation with CAD systems based on Web Services. This paper introduces one part of WSC which enables remote users to retrieve assembly model data using Web Services. However, retrieving assembly model data takes long time. To resolve this problem, this paper proposes using parallel Web Services. As assembly models comprise a set of part models, it is easy to separate the problem domain into smaller problems. In addition, Web Services inherently supports distributed computing. This characteristic makes the parallel processing of Web Services easy. Firstly, the implementation of WSC which retrieves assembly model data based parallel Web Services is shown. And then, for the comparison, the experiments on the retrieval of assembly model data based on single Web Services and parallel Web Services are shown.

Adaptive Parallel Decomposition for Multidisciplinary Design

  • Park, Hyung-Wook;Lee, Se J.;Lee, Hyun-Seop;Park, Dong-Hoon
    • Journal of Mechanical Science and Technology
    • /
    • 제18권5호
    • /
    • pp.814-819
    • /
    • 2004
  • The conceptual design of a rotorcraft system involves many different analysis disciplines. The decomposition of such a system into several subsystems can make analysis and design more efficient in terms of the total computation time. Adaptive parallel decomposition makes the structure of the overall design problem suitable to apply the multidisciplinary design optimization methodologies and it can exploit parallel computing. This study proposes a decomposition method which adaptively determines the number and sequence of analyses in each sub-problem corresponding to the available number of processors in parallel. A rotorcraft design problem is solved and as a result, the adaptive parallel decomposition method shows better performance than other previous methods for the selected design problem.