• 제목/요약/키워드: message-passing

검색결과 296건 처리시간 0.024초

체크 노드 분할에 의한 LDPC 부호의 새로운 메시지 전달 복호 알고리즘 (New Message-Passing Decoding Algorithm of LDPC Codes by Partitioning Check Nodes)

  • 김성환;장민호;노종선;홍송남;신동준
    • 한국통신학회논문지
    • /
    • 제31권4C호
    • /
    • pp.310-317
    • /
    • 2006
  • 본 논문에서는 체크 노드 분할에 의한 low-density parity-check(LDPC) 부호의 새로운 직렬 메시지 전달 복호 알고리즘을 제안한다. 이 새로운 복호 알고리즘은 특히 적은 반복 횟수에 대하여 기존의 메시지 전달 복호 알고리즘의 비트 오율(BER) 성능보다 더 우수한 성능을 보인다. 체크 노드의 분할된 부분 집합의 개수가 증가함에 따라 비트 오율 성능이 보다 좋아진다는 사실을 분석적 결과로 확인할 수 있다. 또한 가우시안 근사화를 이용한 밀도 진화를 이용하여 변수 노드에서 메시지들의 평균값에 대한 재귀 방정식을 유도하고, 모의 실험을 이용하여 분석적인 결과를 검증하였다.

메시지 패싱 시스템의 통신 특성을 고려한 개선된 태스크 스케줄링 기법 (Improved Task Scheduling Algorithm Considering the Successive Communication Features of Heterogeneous Message-passing System)

  • 노두호;김성천
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제31권5_6호
    • /
    • pp.347-352
    • /
    • 2004
  • 본 논문에서는 메시지 패싱 시스템에서의 태스크 스케줄링에 대해 다룬다. 병렬/분산 시스템의 어플리케이션의 태스크에 대한 적절한 스케줄링이 이루어지지 않는 경우, 병렬/분산 처리를 이용한 이득을 기대하기는 어렵기 때문에 이 주제에 대한 연구는 컴퓨터 아키텍처의 발달과 함께 지속되고 있으며, 많은 연구들이 태스크 스케줄링에 대한 다양한 기법들을 제안하고 있다. 기존의 연구들은 공유 메모리 시스템을 가정하여 이루어졌기 때문에, 메시지 패싱 시스템에 기존의 기법을 적용하기가 힘들다. 본 논문에서는 기존 연구의 모델과 메시지 패싱 시스템의 통신 모델의 차이점으로 발생하는 통신비용의 누적을 고려하여 리스트 스케줄링 기법에 기초한 개선된 우선 순위 함수와 새로운 프로세서 선택 기준을 제안한다. 이들 두 가지 제안을 적용한 태스크 스케줄링 기법은 통신비용의 누적을 고려하지 않아 발생하는 비효율적인 스케줄링을 개선한다.

Message Passing Parallel System에서 효과적인 s-step GMRES 알고리즘 (Efficient s-step GMRES Algorithm on a Message Passing Parallel System)

  • 김선경
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2000년도 추계학술대회 학술발표 논문집
    • /
    • pp.484-488
    • /
    • 2000
  • 병렬 컴퓨터를 사용하는 경우 하드웨어만으로 모든 것이 해결되지 않으며 병렬처리 기법의 도입이 불가피하다. 효과를 극대화하기 위하여서는 각 병렬 컴퓨터의 하드웨어적인 특징을 극대화할 수 있는 병렬 알고리즘과 병렬 프로그램 등 소프트웨어 개발이 필수적이다. GMRES(Generalized Minimal residual) 방법은 아주 큰 대칭 또는 비대칭 선형시스템의 해를 구하는 반복법 중의 하나로 일반적으로 많이 사용되고 있다. 서로 직교인 벡터를 하나씩 구하는 대신에 선형인 s개의 벡터를 구하고 각 그룹간에는 직교가 되게하는 s-step GMRES 알고리즘은 병렬적 성질을 더 많이 가지고 있다. 이 병렬 알고리즘의 전반부는 이미 개발된 s-step Arnoldi 알고리즘을 이용할 수 있다. s-step GMRES 알고리즘은 message passing 병렬 시스템에서 모든 프로세서들 사이의 자료 교환 시간을 줄임으로써 기존의 GMRES 방법에 비해 훨씬 더 병렬성을 증가시킨다. 본 논문에서는 초병렬 시스템(MPP)인 Cray T3E에서 많은 프로세서를 이용할 경우 개발된 s-step 알고리즘이 기존의 알고리즘에 비하여 얼마나 더 효과적으로 빨리 수행될 수 있는지 분석한다.

  • PDF

병렬처리를 위한 고성능 라이브러리의 구현과 성능 평가 (Implementation and Performance Analysis of High Performance Computing Library for Parallel Processing)

  • 김영태;이용권
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제31권7호
    • /
    • pp.379-386
    • /
    • 2004
  • 본 연구에서는 병렬프로그램을 효율적으로 개발할 수 있고 병렬처리 프로그램의 성능을 향상시키는 이식성을 갖는 고성능 병렬 라이브러리인 HPCL(High Performance Computing Library)을 구현하였다. HPCL은 C 언어와 Fortran 언어로 구현되었으며, Fortran 프로그램에서 메시지 전송 인터페이스인 MPI(Message Passing Interface)를 효율적으로 사용할 수 있도록 하였다. 성능 분석은 PC 클러스터와 상업용 슈퍼컴퓨터인 IBM SP4를 이용하여 병렬프로그램의 성능 향상 및 통신 오버헤드 등에 대하여 다양하게 이루어졌다.

압축 센싱을 이용한 3D 방송 신호 전송 시스템 (Novel Transmission System of 3D Broadcasting Signals using Compressed Sensing)

  • 이선의;차재상;박구만;김진영
    • 한국위성정보통신학회논문지
    • /
    • 제8권4호
    • /
    • pp.130-134
    • /
    • 2013
  • 본 논문에서는 3D 방송의 기본적인 원리를 설명하고 3D 방송을 CS 기술을 적용하여 데이터 용량을 줄이는 방식을 제안한다. 샘플링 이론과 CS 기술의 차이점을 설명하고 개념과 동작원리를 설명한다. 최근 제안된 CS 센싱의 복원 알고리즘인 AMP(Approximate Message Passing)와 CoSaMP(Compressive Sampling Matched Pursuit)를 소개하고 이를 이용하여 이미지 데이터를 압축 복원하여 비교한다. 두 알고리즘의 계산시간을 비교하여 낮은 복잡도를 갖는 알고리즘을 판단한다.

통신에서의 무선 데이터 방송을 위한 샘플링 기법 (Sampling Techniques for Wireless Data Broadcast in Communication)

  • 이선의;박구만;김진영
    • 한국위성정보통신학회논문지
    • /
    • 제10권3호
    • /
    • pp.57-61
    • /
    • 2015
  • 본 논문에서는 3D 방송의 기본적인 원리를 설명하고 실감영상 CS 기술을 적용하여 데이터 용량을 줄이는 방식을 제안한다. 샘플링 이론과 CS 기술의 차이점을 설명하고 개념과 동작원리를 설명한다. 압축 센싱의 복원 알고리즘인 SS-CoSaMP(Single-Space Compressive Sampling Matched Pursuit) 와 AMP(Approximate Message Passing)를 소개하고 이를 이용하여 이미지 데이터를 압축 복원하여 비교한다. 계산시간을 비교하여 낮은 복잡도를 갖는 알고리즘을 판단한다.

스몰-셀 네트워크에서 에너지 효율 향상을 위한 메시지 전달 기반 분산 사용자 연계 (Distributed User Association Based on Message Passing for Energy Efficiency in a Small-Cell Network)

  • 정현우;김윤희
    • 한국통신학회논문지
    • /
    • 제40권8호
    • /
    • pp.1518-1520
    • /
    • 2015
  • 본 레터는 매크로-셀 위에 스몰-셀이 중첩된 셀룰러 망에서 전력 소모를 최소화하도록 사용자와 기지국을 연계하고 동작 스몰-셀 기지국을 결정하는 문제를 고려한다. 상기 문제의 해를 분산적으로 구하는 메시지 전달 알고리즘을 유도하고, 모의실험을 통해 기존 방식 대비 제안 알고리즘의 우수성을 보인다.

MPSoC를 위한 저비용 하드웨어 MPI 유닛 설계 (The Design of Hardware MPI Units for MPSoC)

  • 정하영;정원영;이용석
    • 한국통신학회논문지
    • /
    • 제36권1B호
    • /
    • pp.86-92
    • /
    • 2011
  • 본 논문에선 분산 메모리 아키텍처를 사용하는 멀티프로세서 시스템에서 메시지 전달을 지원하는 하드웨어 MPI(Message Passing Interface) 유닛을 설계하였다 데이터 전송 동기화 및 데이터 전송, 완료까지의 과정을 하드웨어 MPI 유닛이 담당하여 동기화에 따른 오버헤드를 경감시켰다. 또한 동기화 메시지를 저장 관리하는 요청 큐(Request Queue), 준비 큐(Ready Queue), 예약 큐(Reserve Queue)를 내장하여 병렬적으로 입력받은 동기화 메시지를 관리하고 비순차적 종료(out of order completion)을 지원한다. BMF(Bus Functional Medel)을 제작해 제안한 구조에서의 전송 대역폭 성능을 확인한 결과 다대다 통신에서 25% 이상의 성능 향상이었음을 확인할 수 있었다. 그 후 HDL로 기술된 하드웨어를 Magnachip 0.18 공정 라이브러리에서 합성하였으며 프로토 타입 chip으로 제작하였다. 제안한 MPI 유닛은 전체 칩 사이즈의 1% 이하의 크기로 높은 성능 향상을 기대할 수 있어, 저비용 설계와 확장성 측면에서 임베디드 MPSoC(Multi-Processor System-on-Chip)의 전체적인 성능을 높이는데 유용하다.

Parallel FFT and Quick-Merge Sort on the Reflective Memory Networked Computers and a Cluster of Work-stations

  • Lee, Changhun;Kwon, Wook-Hyun
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2002년도 ICCAS
    • /
    • pp.94.1-94
    • /
    • 2002
  • This paper is concerned with parallel FFT and Quick-Merge Sort. They are implemented on computers interconnected by VMIC 5579 reflective memory and a cluster of workstations (PCs) interconnected via Fast Ethernet. Message passing interface (MPI) parallel library is used for communication in a cluster of workstations. An improved parallel FFT is also presented to decrease an execution time in the case of a small number of hosts. Distributed shared memory (DSM), VMIC 5579 reflective memory (RM), a cluster of workstations (COW) and message passing interface (MPI) parallel library are described.

  • PDF

Application of a Parallel Asynchronous Algorithm to Some Grid Problems on Workstation Clusters

  • Park, Pil-Seong
    • Ocean and Polar Research
    • /
    • 제23권2호
    • /
    • pp.173-179
    • /
    • 2001
  • Parallel supercomputing is now a must for oceanographic numerical modelers. Most of today's parallel numerical schemes use synchronous algorithms, where some processors that have finished their tasks earlier than others must wait at synchronization points for correct computation. Hence, the load balancing is a crucial factor, however, it is, in general, difficult to achieve on heterogeneous workstation clusters. We devise an asynchronous algorithm that reduces the idle times of faster processors, and discuss application of the algorithm to some grid problems and implementation on a workstation cluster using Message Passing Interface (MPI).

  • PDF