• 제목/요약/키워드: Parallel task

검색결과 234건 처리시간 0.026초

Lagrangian 기법에 의한 충돌 해석 시 접촉처리의 병렬화 및 병렬효율 평가 (Parallel Contact Treatment and Parallel Performance of Impact Simulation Based on Lagrangian Scheme)

  • 백승훈;김승조;이민형
    • 대한기계학회논문집A
    • /
    • 제30권11호
    • /
    • pp.1447-1454
    • /
    • 2006
  • The evaluation of parallel performance of a high speed impact simulation is not an easy task because not only the development of parallel explicit code is difficult but also a large number of processors is not easily accessible. In this paper, the parallel performance of a new Lagrangian FEM impact code carried out on cluster supercomputer has been described in high speed range. In the case of metal sphere impacting to oblique plate, the overall speed-up continuously increases even up to 128 CPUs. Investigation of elapsed time of each part reveals that most of the inefficiency comes from the load imbalance of contact.

OpenCL을 이용한 돈사 감시 응용의 효율적인 태스크 분배 (Efficient Task Distribution for Pig Monitoring Applications Using OpenCL)

  • 김진성;최윤창;김재학;정연우;정용화;박대희;김학재
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제6권10호
    • /
    • pp.407-414
    • /
    • 2017
  • 다수의 태스크로 구성된 돈사 감시 응용은 내재된 데이터 병렬성을 활용하고 성능가속기를 사용하여 병렬 처리가 가능하다. 본 논문에서는 멀티코어 CPU와 매니코어 GPU로 구성된 이기종 컴퓨팅 플랫폼에서 돈사 감시 응용 수행 시 태스크 분배 방법을 제안한다. 즉, 각 태스크별로 OpenCL을 이용한 병렬 프로그램을 작성한 뒤, deviceCPU와 deviceGPU 각각에서 수행시켜 측정된 수행시간을 기준으로 가장 적합한 처리기를 결정한다. 제안 방법은 간단하지만 매우 효과적이고, CPU와 GPU로 구성된 이기종 컴퓨팅 플랫폼에서 다수의 태스크로 구성된 다른 응용을 병렬화하는 경우에도 적용될 수 있다. 실험 결과, 상이한 이기종 컴퓨팅 플랫폼에서 최적의 태스크 분배로 수행한 경우 가 전체 태스크들을 deviceGPU에서 수행한 GPU-only 방법에 비교하여 각각 2.7배, 8.7배, 2.7배 성능 개선이 되었음을 확인하였다.

병렬 공간 조인 시 정적 부하 균등화를 위한 작업 생성 및 할당 방법 ((Task Creation and Allocation for Static Load Balancing in Parallel Spatial Join)

  • 박윤필;염근혁
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권3호
    • /
    • pp.418-429
    • /
    • 2001
  • 현재의 지리 정보 시스템(GIS : Geographical Information System)은 컴퓨터 응용 시스템의 중요한 분야로서 도시 정보 시스템, 교통 정보 시스템 등에 활용되고 있다. 이들 응용 분야 는 대용량의 공간 데이터를 다루기 때문에 효율적인 공간 연산 수행을 위한 기본 연산자를 필요로 한다. 특히, 기본 연산자 중에서 공간 조인은 연산에 참여하는 객체의 수가 증가함에 따라 수행 시간이 지수적으로 증가하는 특성을 가지고 있으므로 빠른 응답 시간을 요구하는 시스템에는 부적합하다. 따라서 이러한 요구 사항을 만족시키기 위해서는 공간 조인의 효율 적인 병렬 수행이 필요하다. 본 논문에서는 공간 조인의 효율적인 병렬수행을 위하여 정적 부하 균등화를 위한 작업 생성 및 할당 방법을 제시한다. 이 방법은 공간 지역성을 고려하 여 작업을 생성하고, 비용 모댈을 통하여 작업량을 예측하여 표현한 뒤 작업 그래프로 나타 낸다. 그리고 생성된 작업 그래프를 그래프 분할 알고리즘을 통하여 균등하게 할당한다. 본 논문에서 제시된 방법은 독일 Parsytec 사의 CC16 병렬머쉰에서 실험한 결과로 볼 때, 기 존의 정적 할당을 통한 작업 생성 및 할당 방법에 비하여 각 프로세서간의 작업 수행시간의 편차를 줄임으로써 부하 균등화의 효과를 가져온다.

  • PDF

변화탐지와 회상 과제에 기초한 시각작업기억의 통합적 객체 표상 검증 (Integrated Object Representations in Visual Working Memory Examined by Change Detection and Recall Task Performance)

  • 이인애;현주석
    • 인지과학
    • /
    • 제35권1호
    • /
    • pp.1-21
    • /
    • 2024
  • 본 연구는 두 가지 이론적 모델인 통합된 객체 모형과 특장 병렬-독립 저장 모형을 검증함으로써 시각작업기억 표상의 특성을 조사하였다. 실험 I에서 참가자들은 색상 사각형, 방위 막대 또는 두 가지 모두로 구성된 배열을 기억한 뒤 이를 토대로 변화탐지과제를 수행했다. 단일 특징 조건에서 기억배열은 하나의 특징(방위 또는 색상)으로만 구성된 반면, 두 가지 특징 조건은 둘 모두를 포함했다. 두 조건간 변화탐지 수행의 차이는 없었으며 이는 병렬-독립 저장 모형보다는 통합된 객체 모형을 지지한다. 실험 II에서는 이등변삼각형의 방위, 색상 사각형 또는 두 특징 모두로 구성된 기억배열을 대상으로 회상과제가 실시되었으며, 단일 특징과 두 가지 특징 조건 간 회상 수행이 비교되었다. 두 조건 간 회상 정확도에는 차이가 없었으나 표상 선명도와 추측반응에 대한 분석 결과는 강한 객체 모형보다는 약한 객체 모형을 시사했다. 본 연구의 결과는 시각작업기억의 표상 특성을 둘러싼 현시점의 논쟁에 있어서 병렬-독립 저장 모형이 아닌 통합된 객체 모형의 우세를 지지한다.

Task based design of modular robot manipulator using efficient genetic algorithms

  • Han, Jeongheon;Chung, Wankyun;Youm, Youngil;Kim, Seungho
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 1996년도 Proceedings of the Korea Automatic Control Conference, 11th (KACC); Pohang, Korea; 24-26 Oct. 1996
    • /
    • pp.243-246
    • /
    • 1996
  • Modular robot manipulator is a robotic system assembled from discrete joints and links into one of many possible manipulator configurations. This paper describes the design method of newly developed modular robot manipulator and the methodology of a task based reconfiguration of it. New locking mechanism is proposed and it provides quick coupling and decoupling. A parallel connection method is devised and it makes modular robot manipulator working well and the number of components on each module reduced. To automatically determine a sufficient or optimal arrangement of the modules for a given task, we also devise an algorithm that automatically generates forward and inverse manipulator kinematics, and we propose an algorithm which maps task specifications to the optimized manipulator configurations. Efficient genetic algorithms are generated and used to search for a optimal manipulator from task specifications. A few of design examples are shown.

  • PDF

직렬.병렬 혼합구조의 휴머노이드 상체로봇의 기구학 해석 및 움직임 구현 (Kinematic Analysis and Motion Implementation of a Humanoid Robot with a Serial and Parallel Structure)

  • 배영걸;정슬
    • 제어로봇시스템학회논문지
    • /
    • 제15권9호
    • /
    • pp.952-958
    • /
    • 2009
  • This article presents a combined structure of serial and parallel mechanisms for a humanoid robot. The 3 DOF parallel structure is designed and added to the waist of the humanoid robot arm to give flexible bending and rotating motions. Forward and inverse kinematics of a serial and parallel robot have been analyzed to generate motions. Simulation studies of verifying kinematics solutions of the parallel robot have been done. Experimental studies of mimicking shake-hands motion have been conducted to show the feasibility and usability of the combined structure.

프로세서 farm 모델을 이용한 광추적 알고리듬 (A Ray-Tracing Algorithm Based On Processor Farm Model)

  • 이효종
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제2권1호
    • /
    • pp.24-30
    • /
    • 1996
  • 광추적표현(ray tracing rendering) 기법은 컴퓨터를 이용하여 현실감 있는 영상을 얻기 위한 음영처리 방법의 하나로 오랜 컴퓨터 처리시간을 필요로 한다. 병렬처리 기법을 적용함으로서 컴퓨터 처리시간을 효과적으로 줄일 수 있어, 본 논문에서는 광추적 기법을 위한 병렬 알고리듬을 구현하고 트랜스퓨터시스템 상에서 실험하였다. 또한 알고리듬의 확장성과 부하균형을 위하여 프로세서 farm 모델을 응용하였다. 전체의 영상을 균일한 크기로 분할하고 각각의 프로세서 farm에 분배하는 방식을 사용하였기 때문에 제안된 알고리듬에서는 병렬시스템의 확장성과 부하의 균형문제를 자연스럽게 해결하였다. 구현된 병렬 알고리듬은 가변의 일꾼을 가지는 트랜스퓨터에서 실행하였으며 효율은 9개의 프로세서를 사용하였을 때 65% 이상으로 나타났다. 가장 우수한 성능을 가지는 경우는 작업의 분할 크기가 256~1024개의 화소를 가질 때인 것으로 측정되었다. 이와 같은 높은 효율과 우수한 확장성 이외에도 트랜스퓨터시스템이 지니고 있는 가격 대 성능비의 우수성으로 인하여, 트랜스퓨터는 확장성 있는 병렬시스템으로 적합한 것을 알 수 있다.

  • PDF

Petri Net 이론 관점에서 본 소프트웨어 혁신의 확산 (Diffusion of software innovation: a Petri Net theory perspective)

  • 한지연;안종창;이욱
    • 한국산학기술학회논문지
    • /
    • 제14권2호
    • /
    • pp.858-867
    • /
    • 2013
  • 본 연구에서는 MPSOC(Multiprocessor System-on-Chip) 환경의 소프트웨어적인 측면을 주 연구대상으로 하였고 범용 전문 프로그래머들에게 병렬 애플리케이션 프로그래밍을 위한 패턴언어를 제공한다면 병렬처리의 장점을 호소할 수 있을 것으로 보았다. 특히 자체적인 분류에 따른 Data, Tasks, Data flow 모델을 선별하고 그중 CUDA와 HOPES를 경험한 대상으로 Petri Net을 활용, 그들의 숙련도를 확인하는 과정을 포함한다. 각 영역의 숙련 정도, 서로 다른 모델에 대한 이해도를 실험을 통해 검증하였다. 페트리넷은 병렬프로그래밍의 설명에 용이한 모델로 특히 동시성과 병렬성을 설명하는데 탁월한 모형을 제시 할 수 있었다. 실험대상자들에게 페트리넷에 관한 4시간의 선행학습을 시킨 후 56명에게 실험을 실시하여 독립표본 t-검정을 수행했다. 비록 설정된 두 가지 가설이 지지되지 않았지만, 각 영역에서의 숙련자들이 Tasks 중심 혹은 Data 중심의 모형을 얼마나 상호 이해하는가를 판단 할 수 있었다.

고정 그리드를 이용한 병렬 공간 조인의 태스크 할당에 관한 연구 (A Study on Task Allocation of Parallel Spatial Joins using Fixed Grids)

  • 김진덕;서영덕;홍봉희
    • 정보처리학회논문지D
    • /
    • 제8D권4호
    • /
    • pp.347-360
    • /
    • 2001
  • 공간 조인은 두 개의 데이터 집합으로부터 공간적인 조건을 만족하는 두 객체 쌍의 집합을 구하는 것으로 비용이 매우 큰 연산자이다. 지난 수년동안 공간 조인의 순차 수행 시간은 많이 향상되었지만, 그 응답시간은 사용자의 요구를 만족시키지 못하고 있다. 따라서 최근 병렬 시스템을 이용하여 이러한 문제를 해결하려는 연구가 진행되고 있다. 그렇지만 프로세서의 수가 증가할수록 병렬 처리에 의한 프로세서의 효율성은 급격히 떨어진다. 이것은 병렬 공간 조인을 수행할 경우 순차 공간 조인 보 다 디스크 병목 현상과 메시지 전송 오버헤드가 심하게 발생하기 때문이다. 이 논문에서는 공유 디스크 구조에서 다중 프로세서의 디스크 동시 접근으로 인한 병목 현상을 완화하고, 메시지 전송을 최소화하기 위한 태스크 할당 방법을 제안한다. 제안한 태스크 할당 방법을 두 가지 공간 조인 기법에 각각 적용하여 디스크 접근 횟수와 메시지 전송 횟수의 감소 효과를 실험으로 평가한다. MIMD 구조 및 공유디스크 방식의 병렬 시스템에서의 다양한 실험에서 이 논문에서 제안한 준동적 태스크 할당 방법이 정적 할당과 동적 할당 방법에 비해 우수함을 보였다.

  • PDF

ParaC 언어의 설계 및 구현 (The Design and Implementation of the ParaC Language)

  • 이경석;우영춘;김진미;지동해
    • 한국정보처리학회논문지
    • /
    • 제4권11호
    • /
    • pp.2903-2913
    • /
    • 1997
  • 본 논문은 공유 및 분산 메모리 구조를 가진 병렬 컴퓨터의 프로그래밍 환경을 지원하기 위하여 ParaC 언어를 설계하고 구현한 내용을 기술한다. ParaC 언어는 확장성 높은 병렬 컴퓨터의 시스템 자원을 사용자가 효과적으로 이용할 수 있도록 설계되었다. 이것은 C 언어에 공유 메모리 환경을 위한 병렬 구문과 동기화 구문, 그리고 분산 메모리 환경을 위한 원격 태스크 구문을 추가함으로써 이루어졌다. 언어의 구현을 위하여 C 언어로의 번역 방법을 기술하였으며, 이 방법을 사용한 번역기와 확장 구문을 위한 실행시간 라이브러리를 구현하였다.

  • PDF