• 제목/요약/키워드: parallel communication

검색결과 1,114건 처리시간 0.028초

클러스터 컴퓨팅 환경에서 병렬루프 처리를 위한 재구성 가능한 부하 및 성능 균형 방법 (A Reconfigurable Load and Performance Balancing Scheme for Parallel Loops in a Clustered Computing Environment)

  • 김태형
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제10권1호
    • /
    • pp.49-56
    • /
    • 2004
  • 부하 불균형은 병렬처리에 있어서 좋은 성능을 얻기 위한 주요한 방해 요소 중의 하나이다. 전역(全域) 부하균형 기법은 하나의 응용에서 발생된 병렬 태스크를 취급하는데 적절하지 않다. 동적 루프 스케줄링 기법은 공유 메모리 멀티프로세서 병렬구조에서 병렬 루프의 부하균형에 효과적인 것으로 알려져있다. 하지만 이 기법의 중앙집중적 특성은 워크스테이션 클러스터 환경에서 프로세서 수가 상대적으로 많지 않은 경우에도 병목현상을 일으킬 수 있는 요인이 된다. 워크스테이션 클러스터 환경에서의 통신 오버헤드는 공유 메모리 멀티프로세서 병렬 구조와 비교할 때 수십배의 차이가 생기기 때문이다. 더구나 병렬 루프에서 발생하는 단위 태스크가 불규칙적인 작업량을 갖는 경우에는 기본 루프 스케줄링 기법의 단점을 보완한 개선된 방법들을 적용할 수가 없다. 본 논문에서는 이러한 불규칙적인 작업량을 갖는 병렬루프를 서로 다른 성능을 갖는 워크스테이션들의 네트워크 환경에서 효율적으로 부하를 분배하기 위한 재구성 가능한 분산 부하 균형 기법을 제시한다. 이러한 재구성 가능한 기법은 전통적인 부하균형 방법과 함께 성능균형을 가능하게 함으로써 전체수행시간을 최소화할 수 있음을 보였다.

유한체 $GF(2^m)$상의 비트-병렬 곱셈기의 설계 (Design of Bit-Parallel Multiplier over Finite Field $GF(2^m)$)

  • 성현경
    • 한국정보통신학회논문지
    • /
    • 제12권7호
    • /
    • pp.1209-1217
    • /
    • 2008
  • 본 논문에서는 $GF(2^m)$ 상에서 표준기저를 사용한 두 다항식의 곱셈을 비트-병렬로 실현하는 새로운 형태의 비트-병렬 곱셈기를 제안하였다. 곱셈기의 구성에 앞서, 피승수 다항식과 기약다항식의 곱셈을 병렬로 수행 한 후 승수 다항식의 한 계수와 비트-병렬로 곱셈하여 결과를 생성하는 VCG를 구성하였다. VCG의 기본 셀은 2개의 AND 게이트와 2개의 XOR 게이트로 구성되며, 이들로부터 두 다항식의 비트-병렬 곱셈을 수행하여 곱셈 결과를 얻도록 하였다. 이러한 과정을 확장하여 m에 대한 일반화된 회로의 설계를 보였으며, 간단한 형태의 곱셈회로 구성의 예를 $GF(2^4)$를 통해 보였다. 또한 제시한 곱셈기는 PSpice 시뮬레이션을 통하여 동작특성을 보였다. 본 논문에서 제안한 곱셈기는 VCG의 기본 셀을 반복적으로 연결하여 구성하므로, 차수 m이 매우 큰 유한체상의 두 다항식의 곱셈에서 확장이 용이하며, VLSI에 적합하다.

Hybrid Atmospheric Compensation in Free-Space Optical Communication

  • Wang, Tingting;Zhao, Xiaohui
    • Journal of the Optical Society of Korea
    • /
    • 제20권1호
    • /
    • pp.13-21
    • /
    • 2016
  • Since the direct-gradient (DG) method uses the Shack-Hartmann wave front sensor (SH-WFS), based on the phase-conjugation principle, for atmospheric compensation in free-space optical (FSO) communication, it cannot effectively correct high-order aberrations. While the stochastic parallel gradient descent (SPGD) can compensate the distorted wave front, it requires more calculations, which is sometimes undesirable for an FSO system. A hybrid compensation (HC) method is proposed by properly using the DG method and SPGD algorithm to improve the performance of FSO communication. Simulations show that this method can well compensate wave-front aberrations and upgrade the coupling efficiency with few computations, preferable correction results, and rapid convergence rate.

진화 하드웨어 시스템을 위한 재구성 가능한 디지털 신호처리 구조 (A Reconfigurable Digital Signal Processing Architecture for the Evolvable Hardware System)

  • 이한호;최창석;이용민;최진택;이종호;정덕진
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2006년도 하계종합학술대회
    • /
    • pp.663-664
    • /
    • 2006
  • This paper presents a reconfigurable digital signal processing(rDSP) architecture that is effective for implementing adaptive digital signal processing in the applications of smart health care system. This rDSP architecture employs an evolution capability of FIR filters using genetic algorithm. Parallel genetic algorithm based rDSP architecture evolves FIR filters to explore optimal configuration of filter combination, associated parameters, and structure of feature space adaptively to noisy environments for an adaptive signal processing. The proposed DSP architecture is implemented using Xilinx Virtex4 FPGA device and SMIC 0.18um CMOS Technology.

  • PDF

MPI 집합통신 성능 향상 연구 동향 (Research Trends for Improving MPI Collective Communication Performance)

  • 안후영;박유미;김선영;한우종
    • 전자통신동향분석
    • /
    • 제37권6호
    • /
    • pp.43-53
    • /
    • 2022
  • Message Passing Interface (MPI) collective communication has been applied to various science and engineering area such as physics, chemistry, biology, and astronomy. The parallel computing performance of the data-intensive workload in the above research fields depends on the collective communication performance. To overcome this limitation, MPI collective communication technology has been extensively researched over the last several decades to improve communication performance. In this paper, we provide a comprehensive survey of the state-of-the-art research performed on the MPI collective communication and examine the trends of recently developed technologies. We also discuss future research directions for providing high performance and scalability to large-scale MPI applications.

비균등 트래픽을 위한 MIN의 설계 및 성능 평가 (Design and Performance Evaluation of MIN for Nonuniform Traffic)

  • 최창훈;김성천
    • 전자공학회논문지CI
    • /
    • 제37권6호
    • /
    • pp.1-9
    • /
    • 2000
  • 본 논문에서는 클러스터 지향 다단계 상호 연결 망(Cluster Oriented Multistage Interconnection Network)인 COMR을 소개한다. COMR은 통신이 빈번하게 발생되는 프로세서-메모리 클러스터에 보다 짧은 경로를 제공하여 지역화 된 통신 형태를 갖는 병렬 응용 분야에 적합하도록 구성할 수 있다. COMR에 대한 성능 분석은 네트워크에서의 경로 설정 성공 확률(probability of acceptance), 대역폭(bandwidth), 지역 참조성의 변화에 따른 평균 거리(weighted average distance) 및 비용-효율성(cost-effectiveness)에 대해 평가하였다. 성능 평가에 대한 분석 결과에 따르면, COMR은 지역화의 정도가 높은 통신 형태에서 동일한 네트워크 크기를 갖는 MIN보다 높은 성능을 나타내었다. 최악의 경우(worst case)에서의 N×N COMR의 직경(diameter)은 n+1로서 이것은 동일한 네트워크 크기의 MIN과 비교했을 때 단지 1개의 스테이지만을 더 가지고 있는 것이다. 따라서 COMR은 공유 메모리 다중 프로세서 시스템(shared memory multiprocessor system)에서 지역화 된 통신 분포뿐만 아니라 균등 분포 통신를 갖는 병렬 응용 분야에 적합한 MIN으로 활용될 수 있을 것이다.

  • PDF

PALM시스템의 구조와 네트웍 성능 (The PALM system : Architecture and Network Performance)

  • 김석일
    • 한국정보처리학회논문지
    • /
    • 제1권1호
    • /
    • pp.105-113
    • /
    • 1994
  • 본 논문에서는 HCH(m,p)에 기반을 둔 PALM 시스템의 구조와 네트웍의 성능을 연구 하였다. HCH(m,p)는 하나의 CP를 중심으로 p개의 AP를 연결하여 클러스터를 구성하고, 클러스터를 m-p 차원의 하이퍼큐브로 연결한 소결합 다중프로세서 시스템이다. 본 시스템에서는 AP와 CP 및 CP와 CP간을 DPR로 연결하여 워드단위의 통신이 가능하도록 구성하여 빠르고 안정된 메세지 전송을 가능하게 하였다. PALM 시스템에 사용된 네트 웍은 여러 가지 HCH 네트웍 중에서 시스템에 포함되는 AP의 갯수가 최대이나 CP 및 링크(또는 DPR)의 합이 최소인 최적 HCH(m,2) 네트웍이다. 본 논문에서는 HCH(2,2) 인 실험시스템을 구성하고 네트웍의 통신성능을 측정하였으며, PALM시스템의 작은 통 신/연산비는 메세지 통신형 다중프로세서 시스템에서도 화인 그레인(fine grain) 병렬성을 다룰 수 있음을 보인다.

  • PDF

적응적 임계치를 적용한 멀티 채널 소리 기반의 데이터 전송 시스템 (Data Transmission System Applying An Adaptive Threshold Based Multi-channel Sound)

  • 강현모;정진우;최천용;권영훈;이성구
    • 디지털콘텐츠학회 논문지
    • /
    • 제15권1호
    • /
    • pp.93-99
    • /
    • 2014
  • 최근 스마트폰의 보급화로 기기 간 근거리 무선통신에 관련된 기술이 주목받고 있다. 하지만 NFC의 저 보급화로 근거리 무선통신에 별도 추가의 H/W 설치 없이, S/W기반으로 무선통신을 이루어 내는 통신 기술이 필요한 실정이다. 이에 모든 기기에 탑재되어있는 마이크와 스피커를 활용하여 소리를 활용한 근거리 무선통신 기술이 주목받고 있다. 본 논문에서는 소리의 다중채널 병렬식 전송으로 전송속도를 개선함과, 적응적 임계치를 활용하여 잡음 및 기기 마이크별 특성에 따른 상이한 전송률을 개선하는 방법을 제안한다. 이러한 연구는 기업홍보 목적이나 결제시스템과 같은 특정 제한된 조건이 아닌, 일반 사용자를 대상으로 빠르고 편리한 데이터 전송 시스템을 제공하는데 이용될 수 있다.

DEVS 형식론을 이용한 다중프로세서 운영체제의 모델링 및 성능평가

  • 홍준성
    • 한국시뮬레이션학회:학술대회논문집
    • /
    • 한국시뮬레이션학회 1994년도 추계학술발표회 및 정기총회
    • /
    • pp.32-32
    • /
    • 1994
  • In this example, a message passing based multicomputer system with general interdonnedtion network is considered. After multicomputer systems are developed with morm-hole routing network, topologies of interconecting network are not major considertion for process management and resource sharing. Tehre is an independeent operating system kernel oneach node. It communicates with other kernels using message passingmechanism. Based on this architecture, the problem is how mech does performance degradation will occur in the case of processor sharing on multicomputer systems. Processor sharing between application programs is veryimprotant decision on system performance. In almost cases, application programs running on massively parallel computer systems are not so much user-interactive. Thus, the main performance index is system throughput. Each application program has various communication patterns. and the sharing of processors causes serious performance degradation in hte worst case such that one processor is shared by two processes and another processes are waiting the messages from those processes. As a result, considering this problem is improtant since it gives the reason whether the system allows processor sharingor not. Input data has many parameters in this simulation . It contains the number of threads per task , communication patterns between threads, data generation and also defects in random inupt data. Many parallel aplication programs has its specific communication patterns, and there are computation and communication phases. Therefore, this phase informatin cannot be obtained random input data. If we get trace data from some real applications. we can simulate the problem more realistic . On the other hand, simualtion results will be waseteful unless sufficient trace data with varisous communication patterns is gathered. In this project , random input data are used for simulation . Only controllable data are the number of threads of each task and mapping strategy. First, each task runs independently. After that , each task shres one and more processors with other tasks. As more processors are shared , there will be performance degradation . Form this degradation rate , we can know the overhead of processor sharing . Process scheduling policy can affects the results of simulation . For process scheduling, priority queue and FIFO queue are implemented to support round-robin scheduling and priority scheduling.

  • PDF

한국과 중국의 병행수입제도에 관한 비교연구- 지적재산권을 중심으로 (A Comparative Study on Parallel Import between Korea and China- Focused on Intellectual Property Rights)

  • 황의청;조현숙
    • 통상정보연구
    • /
    • 제16권4호
    • /
    • pp.79-102
    • /
    • 2014
  • 병행수입은 진정상품을 제3자가 국내의 상표권자 또는 전용사용권자의 허락 없이 수입하는 행위를 말한다. 이는 국가 간 가격 차이에 의해서 발생하게 되고 일반적으로 국제무역과 지적재산권에 영향을 주게 된다. 본 논문은 한국과 중국의 병행수입제도에 대해 특허권, 상표권, 저작권 등 지적재산권법을 중심으로 살펴보고 양국의 병행수입 허용여부와 그 기준을 비교분석한다. 양국 모두 지적재산권법 상에서 병행수입제도를 규정하고 있지 않으나 법원의 판례를 통해 병행수입이 허용되고 있다. 중국은 특히 상표법과 저작권법과 달리 특허법상에 병행수입의 이론의 근거가 되는 권리소진에 대해 최초로 규정하고 있다. 한국은 권리소진에 대한 규정 또한 두고 있지 않지만 관세청고시를 통해 병행수입의 허용과 상표에 있어서 그 기준을 고시하고 있다. 그러나 양국의 이러한 규정은 병행수입의 지적재산권 침해 여부의 실체법적인 기준이 되지 못하는 한계가 있다. 향후 양국에 있어 병행수입이 더욱 확대될 것으로 예상될 때 무역마찰을 피하고 지적재산권을 보호하기 위해 이에 대한 대책이 필요하다. 즉 지적재산권법상 병행수입에 대한 정의, 절차, 책임문제와 상대방의 구제 등에 대한 규정이 마련되어야 할 것이며, 병행수입의 활성화를 위해 독점수입대리점의 권리남용을 억제할 수 있어야 하고 소비자 보호를 위한 사후서비스 관리 등의 조치가 필요하다. 나아가 병행수입에 대한 양국의 실무적인 논의의 장이 마련될 수 있도록 하여야 할 것이다.

  • PDF