• 제목/요약/키워드: message-passing

검색결과 296건 처리시간 0.03초

병렬 연역 데이타베이스에서 확장된 평가 알고리즘 (An Extended Evaluation Algorithm in Parallel Deductive Database)

  • 조우현;김항준
    • 한국정보처리학회논문지
    • /
    • 제3권7호
    • /
    • pp.1680-1686
    • /
    • 1996
  • 연역 데이타베이스가 병렬 컴퓨터 구조에 분할 적재될 때, 내포 술어에 대한 갱신이 결정적일 필요가 있으며, 이 결과를 이용한 내포 술어의 병렬 평가 알고리즘이 요구된 다. 본 논문에서는 병렬 연역 데이타베이스의 내포 술어에 대한 삽입과 삭제가 결정적 인 방법을 제안하고 병렬 영역 데이타베이스를 휘한 병렬 컴퓨터 구도에서 갱신 방 법이 고려된 확장된 병렬 평가 알고리즘을 제안한다. 연역 데이타베이스는 외연적 데이타베이스 즉 사실들의 집합과, 내포적 데이타베이스 즉 규칙들의 집합으로 구성된다. 이 집합들을 여러개의 처리기에 분산 적재 하였을 때, 각각의 처리기에서 갱신 방법과 그 결과를 이용한 병렬 평가방법을 연구한다. 각각의 처리기는 자신의 지역 기억장치를 가지며 연결망을 통하여 서로 메세지를 교환함으로써 통신한다.

  • PDF

국가 대기질 예보 시스템의 모델링(기상 및 대기질) 계산속도 향상을 위한 전산환경 최적화 방안 (Optimization of the computing environment to improve the speed of the modeling (WRF and CMAQ) calculation of the National Air Quality Forecast System)

  • 명지수;김태희;이용희;서인석;장임석
    • 한국환경과학회지
    • /
    • 제27권8호
    • /
    • pp.723-735
    • /
    • 2018
  • In this study, to investigate an optimal configuration method for the modeling system, we performed an optimization experiment by controlling the types of compilers and libraries, and the number of CPU cores because it was important to provide reliable model data very quickly for the national air quality forecast. We were made up the optimization experiment of twelve according to compilers (PGI and Intel), MPIs (mvapich-2.0, mvapich-2.2, and mpich-3.2) and NetCDF (NetCDF-3.6.3 and NetCDF-4.1.3) and performed wall clock time measurement for the WRF and CMAQ models based on the built computing resources. In the result of the experiment according to the compiler and library type, the performance of the WRF (30 min 30 s) and CMAQ (47 min 22 s) was best when the combination of Intel complier, mavapich-2.0, and NetCDF-3.6.3 was applied. Additionally, in a result of optimization by the number of CPU cores, the WRF model was best performed with 140 cores (five calculation servers), and the CMAQ model with 120 cores (five calculation servers). While the WRF model demonstrated obvious differences depending on the number of CPU cores rather than the types of compilers and libraries, CMAQ model demonstrated the biggest differences on the combination of compilers and libraries.

딥러닝 기술을 활용한 압축센싱 신호 복원방법 분석 (Analysis of Signal Recovery for Compressed Sensing using Deep Learning Technique)

  • 성진택
    • 한국정보전자통신기술학회논문지
    • /
    • 제10권4호
    • /
    • pp.257-267
    • /
    • 2017
  • 압축센싱(Compressed Sensing)은 선형 역문제(inverse problem)를 다루고 있으며, 그 이론적 연구결과는 관련 분야에 많은 영향을 주어 놀랄 만한 연구성과를 발표하였다. 그러나 압축센싱을 실제 환경에 적용하기 위해서는 두 가지 중요한 문제가 남아 있다. 하나는 실시간에 가까운 복원 성능이 보장되어야 하며, 다른 하나는 신호가 희소성을 갖도록 전처리가 가능해야 한다는 점이다. 이에 대한 문제들을 해결하고자 딥러닝(deep learning) 기술을 활용한 압축센싱 신호 복원방법이 최근에 등장하였다. 본 논문에서는 딥러닝 기반의 압축센싱 신호 복원방법을 고찰하고 최신 연구결과를 비교 분석하고자 한다. 관련 연구결과에서는 실시간에 가까운 복원 시간에 도달하였으며, 기존 복원방법 대비 더 우수한 복원 성능을 보여 주었다. 최근 연구에서 보여준 딥러닝을 활용한 압축센싱 신호 복원방법은 압축센싱의 활용가치를 더욱 높일 뿐만 아니라 신호처리와 통신분야에서 크게 활용될 수 있을 것으로 기대된다.

슈퍼컴퓨팅환경에서의 대규모 계산 작업 처리 기술 연구 (HTCaaS(High Throughput Computing as a Service) in Supercomputing Environment)

  • 김석규;김직수;김상완;노승우;김서영;황순욱
    • 한국콘텐츠학회논문지
    • /
    • 제14권5호
    • /
    • pp.8-17
    • /
    • 2014
  • 슈퍼컴퓨팅 자원들은 주로 MPI와 같은 메시지 교환 인터페이스에 기반한 통신 집적도가 높은 고성능 컴퓨팅(HPC: High Performance Computing) 응용 분야를 지원하는데 활용되어 왔다. 반면에, 대규모 계산처리 컴퓨팅(HTC: High Throughput Computing) 방식의 패러다임은 주로 계산 집적도가 높고(상대적으로 적은 I/O 연산), 독립적인(작업들 간의 통신이 적음) 많은 수의 작업을 처리하는 것을 요구하고 있다. 국내에서도 고에너지 물리, 신약개발, 핵물리와 같은 연구 분야를 중심으로 대규모 컴퓨팅 자원을 요구하는 계산처리에 대한 수요가 증가하고 있다. 본 논문에서는 이러한 HTC 과학 응용들에 대한 효율적인 지원을 국가차원의 슈퍼컴퓨팅 분산 환경에서 제공하기 위해 연구/개발되어진 대규모 계산처리 서비스(HTCaaS: High Throughput Computing as a Service)의 전체 구조 및 구성 요소, 실행 시나리오 및 실제 응용 적용 사례 등에 대해 서술한다.

기상조건별 비산먼지 관리체계 최적화 연구 (Optimization of Fugitive Dust Control System for Meteorological Conditions)

  • 김현구
    • 한국대기환경학회지
    • /
    • 제21권6호
    • /
    • pp.573-583
    • /
    • 2005
  • Fugitive dust, which is emitted in the ambient air without first passing through a stack or duct designed to control flow, is frequently generated by means of wind erosion from storage yards at Pohang Steel Wokrs. The size distribution of fugitive dust is mostly in the range of coarse particulate which is deposited as soon as emitted and less harm to human health; however $20\%$ of fugitive dust contains PM 10 known as one of most harmful airborne pollutant. Consequently, effective control and reduction of fugitive dust is strongly requested by the local society, but it is not easy so far because the generation and dispersion of fugitive dust highly depends on meteorological conditions, and it being occurred for irregularity. This research presented a fugitive dust control system for each meteorological condition by providing statistical prediction data obtained from a statistical analysis on the probability of generating the threshold velocity at which the fugitive dust begins to occur, and the frequency occurring by season and by time of the wind direction that can generate atmospheric pollution when the dispersed dust spreads to adjacent residential areas. The research also built a fugitive dust detection system which monitors the weather conditions surrounding storage yards and the changes in air quality on a real-time basis and issues a warning message by identifying a situation where the fugitive dust disperses outside the site boundary line so that appropriate measures can be taken on a timely basis. Furthermore, in respect to the spraying of water to prevent the generation of fugitive dust from the storage piles at the storage yard, an advanced statistical meteorological analysis on the weather conditions in Pohang area and a case study of fugitive dust dispersion toward outside of working field during $2002\∼2003$ were carried out in order to decide an optimal water-spraying time and the number of spraying that can prevent the origin of fugitive dust emission. The results of this research are expected to create extremely significant effects in improving surrounding environment through actual reduction of the fugitive dust produced from the storage yard of Pohang Steel Works by providing a high-tech warning system capable of constantly monitoring the leakage of fugitive dust and water-spray guidance that can maximize the water-spraying effects.

MULTI-BLOCK 격자 기법을 이용한 초소형 비행체 주위 공력 특성 해석 (Numerical Investigation of Aerodynamic Characteristics around Micro Aerial Vehicle using Multi-Block Grid)

  • 김영훈;김우례;이정상;김종암;노오현
    • 한국항공우주학회지
    • /
    • 제31권6호
    • /
    • pp.8-16
    • /
    • 2003
  • 3차원 비정상, 비압축성 Navier-Stokes 방정식 해석코드를 이용하여, 초소형 비행체 주위에 형성되는 저 레이놀즈수 유동장의 공력 특성을 연구하였다. 비정상 유동장의 효율적인 계산을 위하여, 개발된 코드는 MPI 프로그래밍 기법을 이용하여 병렬처리 하였으며, single partitioning 방법을 적용하여 3차원 형상에 대한 multi-block 격자계를 효율적으로 해석 하였다. 비교적 형상이 복잡하지 않은 초소형 비행체 주위 날개에 대해 해석한 후 초소형 비행체 전 형상에 대해 받음각을 변화시키며 공력계수 및 정안정성을 살펴보았다. 해석 결과, 서울대학교 미소공기역학실험실에서 수행한 아음속 풍동 실험데이터와 비교하여 보았을 때 대체로 잘 일치하였으며, 개념 설계한 비행체가 공기역학적으로 정안정성을 갖고 있음을 보일 수 있었다.

MPI 브로드캐스트 통신을 위한 서킷 스위칭 기반의 파이프라인 체인 알고리즘 설계 (A Design of Pipeline Chain Algorithm Based on Circuit Switching for MPI Broadcast Communication System)

  • 윤희준;정원영;이용석
    • 한국통신학회논문지
    • /
    • 제37B권9호
    • /
    • pp.795-805
    • /
    • 2012
  • 본 논문에서는 분산 메모리 아키텍처를 사용하는 멀티프로세서에서 가장 병목 현상이 심한 집합통신 중 브로드캐스트를 위한 알고리즘 및 하드웨어 구조를 제안한다. 기존 시스템의 파이프라인 브로드캐스트 알고리즘은 전송 대역폭을 최대로 활용하는 알고리즘 이다. 하지만 파이프라인 브로드캐스트는 데이터를 여러 조각으로 나누어서 전송하기 때문에, 불필요한 동기화 과정이 반복된다. 본 논문에서는 동기화 과정의 중복이 없는 서킷 스위칭 기반의 파이프라인 체인 알고리즘을 위한 MPI 유닛을 설계하였고, 이를 systemC를 통하여 모델링하여 평가하였다. 그 결과 파이프라인 브로드캐스트 알고리즘과 비교하여 브로드캐스트 통신의 성능을 최대 3.3배 향상 시켰고, 이는 통신 버스의 전송대역폭을 거의 최대로 사용하였다. 그 후 verilogHDL로 하드웨어를 설계하였고, Synopsys사의 Design Compiler를 사용하여 TSMC 0.18 공정 라이브러리에서 합성하였으며 칩으로 제작하였다. 합성결과 제안하는 구조를 위한 하드웨어는 4,700 게이트(2-input NAND gate) 면적으로, 전체 면적에서 2.4%을 차지하였다. 이는 제안하는 구조가 작은 면적으로 MPSoC의 전체적인 성능을 높이는데 유용하다.

Building Light Weight CORBA Based Middleware for the CAN Bus Systems

  • Hong, Seongsoo
    • Transactions on Control, Automation and Systems Engineering
    • /
    • 제3권3호
    • /
    • pp.181-189
    • /
    • 2001
  • The software components of embedded control systems get extremely complex as they are designed into distributed systems get extremely complex as they are designed into distributed systems consisting of a large number of inexpensive microcontrollers interconnected by low-bandwidth real-time networks such as the controller area network (CAN). While recently emerging middleware technologies such as CORBA and DCOM address the complexity of distributed programming, they cannot be directly applied to distributed control system design due to their excessive resource demand and inadequate communication models. In this paper, we propose a CORBA-based middleware design for CAN-based distributed embedded control systems. Our design goal is to minimize its resource need and make it support group communication without losing the IDL (interface definition language) level compliance to the OMG standards. To achieve this, we develop a transport protocol on the CAN and a group communication scheme based on the well-known publisher/subscriber model. The protocol effectively realizes subject-based addressing and supports anonymous publisher/subscriber communication. We also customize the method invocation and message passing protocol, referred to as the general inter-ORB protocol (GIOP), of CORBA so that CORBA method invocations are efficiently serviced on a low-bandwidth network such as the CAN. This customization includes packed data encoding and variable-length integer encoding for compact representation of IDL data types. We have implemented our CORBA-based middleware on the mArx real-time operating system we have developed at Seoul National University. Our experiments clearly demonstrate that it is feasible to use CORBA in developing distributed embedded control systems possessing severe resource limitations. Our design clearly demonstrates that it is feasible to use a CORBA-based middleware in developing distributed embedded systems on real-time networks possessing severe resource limitations.

  • PDF

Quasi-Cyclic Low Density Panty Check 복호기의 다양한 설계 관점에 대한 성능분석 (Performance Analysis on Various Design Issues of Quasi-Cyclic Low Density Parity Check Decoder)

  • 정수경;박태근
    • 대한전자공학회논문지SD
    • /
    • 제46권11호
    • /
    • pp.92-100
    • /
    • 2009
  • 본 논문은 LLR-BP 복호 알고리즘을 사용하는 LDPC 복호기의 하드웨어 구조 분석하고 효율적인 복호기의 설계 방법들을 제시하였다. 또한 설계 시 복호 성능 및 하드웨어 복잡도에 영향을 미칠 수 있는 다양한 설계 이슈들을 제시하고 복호 성능의 변화를 모의실험을 통하여 분석하였다. 오류확률을 전달하는 메시지의 양자화는 정수부 3비트, 소수부 4비트를 할당하였고, 복호 성능이 저하되지 않도록 사전정보에 정수부 2비트, 소수부 4비트를 할당하였으며 LUT로 구현되는 $\Psi$(x) 함수를 조합회로인 PWL 블록으로 대체하여 하드웨어 구조의 개선에 대해 논의하였다. 복호 시간을 단축하기 위하여 중첩 스케줄링을 적용하고, 각 복호기 구조 및 설계 변수들의 제한에 따른 하드웨어 자원을 비교함으로써, 하드웨어 복잡도를 분석하였다.

대심도 신금호역사의 화재 유동에 대한 고찰 (Investigation for Fire Flow of the Deeply Underground Shin-Gum-Ho Subway Station)

  • 장용준;박일순;김진호;정우성;김학범;이창현
    • 한국철도학회:학술대회논문집
    • /
    • 한국철도학회 2010년도 춘계학술대회 논문집
    • /
    • pp.110-115
    • /
    • 2010
  • 최근 도심지의 지하철 노선들은 과거에 지어진 지하철 노선들에 비하여 대심도 터널이 증대하고 있다. 신금호 역사(5호선, 깊이 : 46m)는 수도권에 있는 지하철 역사 중에서 3번째로 깊은 역사로서 대심도 역사의 모델로 선정되었으며, 신금호 전체 역사에 대한 화재시뮬레이션을 시도하였다. 신금호 역사는 3개의 출입구, 지하 1층 대합실, 지하 2층 대합실, 지하 2층에서 8층으로의 연결통로, 지하 8층 승강장으로 구성되어 있다. 본 연구에서는 지하 8층 승강장에서 지상 출입구 까지 전체 역사를 대상으로 연기거동을 해석하기 위하여 9,000,000개의 격자를 생성하였으며, 계산 효율을 증대시키기 위하여 19개의 블록으로 나누어서 처리하였다. 화재해석은 화재에 특화된 CFD 코드인 FDS를 사용하였으며 난류해석 기법은 LES가 사용되었다. MPI의 병렬처리기법을 이용하여 19개의 블록을 각각의 CPU에서 분산처리 하였다. 본 전산수치해석에 사용된 CPU 자원은 Intel 3.0 GHz Dual CPU 10개 (Core 20개)이다.

  • PDF