• 제목/요약/키워드: message-passing

검색결과 296건 처리시간 0.025초

컴퓨터 비젼 응용을 위한 태스크 레벨 파이프라인 멀티컴퓨터 RV860-PIPE의 구현 (Implementation of a Task Level Pipelined Multicomputer RV860-PIPE for Computer Vision Applications)

  • 이충환;김준성;박규호
    • 전자공학회논문지B
    • /
    • 제33B권1호
    • /
    • pp.38-48
    • /
    • 1996
  • 본 논문에서는 컴퓨터 비젼응용을 위한 태스크레벨 파이프라인 멀티컴퓨터인 "RV860-PIPE(Realtime Vision i860 system using PIPEline)"를 구현하고 성능평가 하였다. RV860-PIPE는 MIMD형태의 아키텍쳐를 가지며, 시각처리에 적합한 ring 형태의 상호연결망(interconnection network)을 갖는 매시지 패싱타입의 컴퓨터로 구현되었다. RV860-PIPE의 단위 노드 컴퓨터는 일반적인 시각알고리즘의 수행을 위하여 법용성과 강력한 처리능력을 갖도록 64-bit 프로세서를 사용하여 설계하였다. 또한 단위 노드간 양방향 통신 및 영상 입출력기와의 통신 부담을 덜기 위한 전용화된 고속 통신 채널을 설계하였다. 구현된 시스템은 edge 검출, 실시간 이동물체 추적, 실시간 얼굴인식과 같은 시각 처리 응용프로그램들을 성능평가함으로써 컴퓨터 비젼응용에 실용적으로 적용가능함을 보였다.

  • PDF

효율적인 HDL 디버깅을 위한 아키텍쳐 자동 생성 시스템 (Automatic Visual Architecture Generation System for Efficient HDL Debugging)

  • 문대철;;박인학
    • 한국정보통신학회논문지
    • /
    • 제17권7호
    • /
    • pp.1653-1659
    • /
    • 2013
  • 본 논문은 Verilog HDL이나 VHDL로 설계된 디지털 회로의 구조를 효율적으로 분석하고 디버깅 할 수 있는 ECAD 소프트웨어를 제안한다. 이 소프트웨어는 HDL 코드를 파싱하여 내부 구조에 대한 정보를 추출한 후 여러 가지 종류의 그래픽 도우미 예를 들면, 배치배선 알고리즘을 적용하여 생성된 계층구조의 논리회로도, 각 모듈을 구성하는 요소들을 나타내는 객체 나무 그래픽, 인스턴스들의 계층구조를 나타내는 인스턴스 나무 그래픽, 내부 시그널 간의 관계를 나타내는 시그널 관계도(SPD, signal propagation diagram) 등으로 표현된다. 디버깅에 가장 중요한 기능은 여러 가지 다른 관점의 설계 정보(HDL 코드, 객체 나무, 인스턴스 나무, SPD, 파형 등)에서 임의의 객체로부터 출발하여 동일한 설계 정보를 찾아내는 기능이다. 이러한 기능들은 설계자가 수작업으로 HDL 코드를 분석하고 버그를 찾아내는 기능을 효율적으로 수행할 수 있도록 돕는다.

InterCom : 에이전트 기반 인터넷 컴퓨팅 환경 설계 및 구현 (InterCom : Design and Implementation of an Agent-based Internet Computing Environment)

  • 김명호;박권
    • 정보처리학회논문지A
    • /
    • 제8A권3호
    • /
    • pp.235-244
    • /
    • 2001
  • 네트워크와 컴퓨터 기술의 발달로 물리적으로 분산된 컴퓨터를 하나의 자원으로 사용하려는 연구가 많이 진행되고 있다. 일반적으로 이러한 연구들은 메시지 패싱을 기반으로 하는 환경을 개발하는 것이 주류를 이루고 있다. 이러한 환경은 보통 과학계산용 문제를 풀기 위해 많이 사용되고 주어진 문제의 내부병렬성을 이용하여 병렬처리 하게 된다. 따라서 보통 이러한 환경에서는 고도의 병렬성을 얻을 수 있다는 장점이 있는 반면에, 프로그래밍이 어렵고, 사용하기가 어려우며, 분산된 컴퓨터에 사용자의 계정이 있어야 한다는 단점이 있다. 그런데 만일 주어진 문제가 완전히 독립적인 작은 문제를 분할된다면 더욱 효율적인 환경을 만들 수 있다. 이러한 문제 유형은 생물정보학, 3차원 애니메이션, 그래픽스 등에 많이 준재하며, 이를 위한 새로운 환경 개발은 매우 중요한 연구라 할 수 있다. 따라서 본 논문에서는 이러한 문제를 효율적으로 처리하는 프록시 컴퓨팅 기반의 InterCom이라는 새로운 환경을 제안하고, 이들 구현한 것에 대해서 설명한다. 이 환경은 에이전트, 서버, 클라이언트로 구성되어 있다. 이 환경의 장점은 프로그래밍하기가 쉽고 분산된 모든 컴퓨터에 사용자 계정이 없어도 되며, 분산되는 코드를 자동 컴파일해 줌으로써 사용하기 쉽다는 것이다.

  • PDF

프로세스의 수와 실행시간에 따른 NOW의 성능 분석 (Performance Analysis of a NOW According to the Number of Processes and Execution Time)

  • 조수현;김영학
    • 한국콘텐츠학회논문지
    • /
    • 제2권3호
    • /
    • pp.135-145
    • /
    • 2002
  • 최근에 고비용 수퍼 컴퓨터를 대신하여 네트워크 상에 연결된 저가의 H와 워크스테이션으로 구성된 NOW(Network of Workstations) 시스템이 널리 활용되고 있다. NOW에서 병렬처리를 위한 성능은 각 컴퓨터의 계산능력과 통신시간에 의존한다. 현재 NOW에서 병렬처리 성능을 향상하기 위한 다양한 방법들이 제안되고 있다. 그러나 기존의 결과들은 각 컴퓨터의 계산능력에 따른 작업 부하의 균형 관점에서 연구를 수행하였다. 만일 NOW에서 한 컴퓨터가 다수의 작업 프로세스를 가질 경우 메시지 패싱에 필요한 통신시간의 감소를 예측할 수 있다. 따라서 본 논문에서는 작업 프로세스 관점에서 성능 개선 요인을 분석하고, 작업 프로세스 수를 증가할 때 전체 성능에 미치는 영향을 실험적으로 평가한다. 또한 본 논문의 실험에 사용될 새로운 브로드캐스팅 방법을 제안한다. 본 논문에서는 실험적 평가를 위해 LAM/MPI를 사용한다.

  • PDF

PC Network Cluster를 사용한 대규모 재료 시뮬레이션에 관한 연구 (A Study on a large-scale materials simulation using a PC networked cluster)

  • 최덕기;류한규
    • 한국항공우주학회지
    • /
    • 제30권5호
    • /
    • pp.15-23
    • /
    • 2002
  • 분자 동역학 기법을 사용한 재료 파괴 시뮬레이션은 계산량의 방대함으로 인하여 극히 최근까지 활발한 연구가 진행되지 못하였으나 최근 컴퓨터의 성능향상으로 인하여 새로운 연구분야로 떠오르고 있다. 분자 동역학은 그 특성상 계산 집약적인 환경을 요구함으로 대규모의 연산을 위해서는 슈퍼컴퓨터나 클러스터(cluster)의 사용이 필수적이나 고가의 장비와 사용료로 인하여 많은 제한을 받아왔다. 본 연구에서는 PC를 사용하여 클러스터를 제작하고, 균열이 있는 시편을 사용하여 파괴현상에 대한 분자 수준의 거동을 시뮬레이션 하였으며, 클러스터의 노드(node) 수, 효율, 분자 수, 노드간의 통신시간 등의 상호관계를 파악하여 최적의 성능을 가진 클러스터를 구성하는 데 필요한 요소들을 분석하였다. 제작된 PC 클러스터를 사용하여 약 50,000개의 분자를 사용한 재료 파괴 시뮬레이션을 수행하였다.

수직자기기록 채널에서 기록 밀도에 따른 반복복호 기법의 성능 (Performance Of Iterative Decoding Schemes As Various Channel Bit-Densities On The Perpendicular Magnetic Recording Channel)

  • 박동혁;이재진
    • 한국통신학회논문지
    • /
    • 제35권7C호
    • /
    • pp.611-617
    • /
    • 2010
  • 본 논문에서는 직렬 연접 길쌈 부호와 LDPC 부호를 이용하여 수직자기기록 채널에서의 성능을 조사하였다. 실험과정에서 기록 밀도는 1.7, 2.0, 2.4, 2.8 일 때를 각각 실험하였다. 직렬 연접 길쌈 부호는 LDPC 부호보다 복호기의 구현 복잡도가 더 낮다. 직렬 연접 부호는 순환 구조적 길쌈 부호의 부호기와 복호기, 그리고 프리코더와 인터리버로 이루어져 있다. 본 실험에서 직렬 연접 길쌈 부호의 복호 알고리즘은 메시지 전달 알고리즘을 이용하였으며, LDPC 부호의 복호 알고리즘은 Sum Product 알고리즘을 이용하였다. 신호 검출기와 오류정정부호 사이에 반복 복호 기법을 적용한 터보등화기 기법을 적용하였고, 기록 밀도가 높아짐에 따라 직렬 연접 길쌈 부호가 LDPC 부호 보다 더 효율 적인 것을 보였다.

이벤트 지향 DEVS 실행 환경의 설계, 구현 및 성능 비교 (Design, Implementation and Performance Analysis of Event-oriented Execution Environment for DEVS)

  • 권세중;김탁곤
    • 한국시뮬레이션학회논문지
    • /
    • 제20권1호
    • /
    • pp.87-96
    • /
    • 2011
  • DEVS는 이산 사건 시스템을 명세하는 집합론에 근거한 수학적인 틀이다. 이러한 DEVS를 통해 시스템을 시뮬레이션할 때는 명세된 DEVS로부터 구현된 모델과 시뮬레이션 엔진으로 이루어진 실행 환경이 필요하다. 시뮬레이션 엔진은 스케줄링 알고리즘을 통해 모델을 해석하고 실행하는데, 주로 DEVS의 계층적이고 모듈러한 특성을 따라 계층적인 스케줄링 방법을 사용한다. 그러나 이 방법은 계층적인 구조로 인해 시간 관리와 메시지 패싱에 있어서 오버헤드가 존재한다. 본 논문에서는 이러한 오버헤드를 해결하기 위해 이벤트 지향 시뮬레이션을 적용한다. 이벤트 지향의 시뮬레이션은 이벤트에 의해서 모델이 실행되며 이벤트 리스트에 의해 이벤트가 관리된다. 이벤트 리스트에 의해서 시간 관리가 되고 메시지 패싱이 이루어지기 때문에 계층적인 오버헤드를 줄이고 성능 향상을 이룰 수 있다. 본 논문은 이벤트 리스트를 이용한 실행 환경을 제안하고 이러한 실행 환경을 위한 모델 구현 방안에 대해 논하며, 각 실행 환경의 성능을 비교, 분석한다.

LDPC 부호의 복호를 위한 양자화 성능과 반복 횟수 통계 (Quantization Performances and Iteration Number Statistics for Decoding Low Density Parity Check Codes)

  • 서영동;공민한;송문규
    • 대한전자공학회논문지TC
    • /
    • 제45권2호
    • /
    • pp.37-43
    • /
    • 2008
  • LDPC 복호기의 성능과 하드웨어 복잡도는 양자화 과정의 설계 변수인 클리핑 임계치(clipping threshold) $c_{th}$와 양자화 비트 수 q, 그리고 복호과정의 최대 반복 횟수에 의존한다. 본 논문에서는 이상적인 Min-Sum 알고리즘과 양자화된 Min-Sum 알고리즘을 비교하기 위해서 시뮬레이션을 통해 클리핑 임계치 $c_{th}$와 양자화 비트 수 q에 따른 LDPC 부호의 비트 오율 성능을 평가하였다. 시뮬레이션 결과 클리핑 임계치 $c_{th}=2.5$, 양자화 비트 수 q=6일 경우에 이상적인 Min-Sum 알고리즘에 가장 근접한 비트 오율이 나타남을 확인할 수 있었다. 또한 반복 횟수의 통계적 분석을 통한 반복 횟수의 확률 밀도 함수를 이용하여 q와 반복 횟수에 따른 복호 복잡도를 계산하고, 부호어 에러율(word error rate; WER) 성능을 추정하였다. 이상의 결과는 LDPC 복호기 설계에서 부호의 성능과 복호 복잡도 사이의 절충을 위해 사용될 수 있다.

분산공유 메모리 시스템 상에서의 효율적인 자료분산 방법 (An Efficient Data Distribution Method on a Distributed Shared Memory Machine)

  • 민옥기
    • 한국정보처리학회논문지
    • /
    • 제3권6호
    • /
    • pp.1433-1442
    • /
    • 1996
  • 자료 분산은 SPMD(Single Program Multiple Data)형태의 병렬성을 제공하는 HPF (High Performance Fortran)의 주기능으로 구현 방법에 따라 컴파일러 성능을 좌우한 다. 본 논문에서는 SPAX(Scalable Parallel Architecture computer based on X-bar network)상에 자료 분산 기능을 제공하기 위한 설계 주안점과 효율적인 모델에 관하 여 기술하였다. SPAX는 분산공유 메모리 (DSM:distributed shared memory)를 사용한 계층적 클러스터링 구조를 가진다. 이러한 메모리 구조에서는 분산 메모리 자료 분산 (DMDD:Distributed Memory Data Distribution)이나 공유 메모리 자료 분산(SMDD: Shared Memory Data Distribution)방법으로는 시스템 가용성을 만족할 수 없다. 그래 서 계층적 마스터-슬래브 형태의 분산공유 메모리 자료분산(DSMDD:Distributed Shared Memory Data Distribution)모델을 설계하였다. 이 모델은 각 노드에 원격 마 스터와 슬래브들을 할당하고 노드내에서는 공유 메모리를 그리고 노드간에는 메세지 전달 인터페이스를 사용한다. 시뮬레이션을 수행한 결과, 시스템 성능 저하를 최소화 하는 노드 크기로 DSMDD를 수행하였을 때 SMDD나 DMDD보다 훨씬 더 효율적이였다. 특 히, 논리적 프로세서 갯수가 많을수록, 분산된 자료들 간의 자료 종속성이 적을수록 성능이 우수하였다.

  • PDF

레이레이 계수의 최소화에 의한 내부고유치 계산을 위한 병렬준비행렬들의 비교 (Comparisons of Parallel Preconditioners for the Computation of Interior Eigenvalues by the Minimization of Rayleigh Quotient)

  • 마상백;장호종
    • 정보처리학회논문지A
    • /
    • 제10A권2호
    • /
    • pp.137-140
    • /
    • 2003
  • 최근에 CG 반복법을 이용하여 레이레이 계수를 최소화함으로써 대칭행렬의 내부고유치를 구하는 방법이 개발되었다 그리고 이 방법은 병렬계산에 매우 적합하다. 적절한 준비행렬의 선택은 수렴속도를 향상시킨다. 우리는 본 연구에서 이를 위한 병렬준비행렬들을 비교한다. 고려된 준비행렬들은 Point-SSOR, 다중색채하의 ILU(0)와 Block SSOR이다. 우리는 128개의 노드를 가진 CRAY-T3E에서 구현하였다. 프로세서간의 통신은 MPI 리이브러리를 사용하였다. 최고 512$\times$512 행렬까지 시험하였는데 이 행렬들은 타원형 편미분방정식의 근사화에서 얻어졌다. 그 결과 다중색채 Block SSOR이 가장 성능이 우수한 것으로 판명되었다.