• 제목/요약/키워드: 병렬시스템

검색결과 2,501건 처리시간 0.03초

PC 클러스터를 위한 TCP/IP 기반 하이퍼큐브 네트워크 구현 (Implementations of Hypercube Networks based on TCP/IP for PC Clusters)

  • 이형봉;홍준표;김영태
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권2호
    • /
    • pp.221-233
    • /
    • 2008
  • 일반적으로 병렬처리가 필요한 경우 병렬처리 전용으로 제조된 시스템을 사용하지만, 가까운 주위에서 쉽게 얻을 수 있는 PC들을 클러스터로 구축하여 병렬처리에 활용할 수도 있다. PC들을 클러스터로 구축하기 위한 가장 쉬운 방법은 PC들을 스위치 허브 중심의 스타 네트워크로 연결하는 방법이지만, 이 논문에서는 병렬처리 연구 및 활용에 더 적합하도록 8개의 PC들이 직접 연결된 클러스터 구축을 위한 TCP/IP 기반 하이퍼큐브 네트워크의 효율적인 구현 방안을 모색하고, 그 기능 및 효율성을 ping, netperf, MPICH 등의 도구를 이용하여 검증하였다. 구현 방안으로 링크 위주의 IP 설정 방법과 노드 위주의IP 설정 방법을 제안하고 두 방법을 비교 분석하였는데, 그 결과 두 방법간에 시간적 성능 차이는 없지만 라우팅 테이블의 단순화 측면에서 노드 위주의 IP설정 방법이 우수함을 볼 수 있었다. 기능적 측면을 검증하기 위하여 응용프로그램의 병렬처리 결과를 스타 네트워크 기반클러스터에서의 결과와 비교하였는데, 두 방법 모두 완벽한 병렬처리 환경을 지원하는 것으로 나타났다.

  • PDF

협동 병렬 X-Match 데이타 압축 알고리즘 (The Cooperative Parallel X-Match Data Compression Algorithm)

  • 윤상균
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제30권10호
    • /
    • pp.586-594
    • /
    • 2003
  • X-Match 알고리즘은 비교적 간단하여 하드웨어로 구현하는 데에 적합한 무손실 압축 알고리즘이다. X-Match 알고리즘은 사이클 당 32비트의 압축이 가능하므로 고속 압축에 적합하다. 그렇지만 버스 폭이 증가됨에 따라서 이에 맞추어서 압축 단위를 증가시킬 필요가 있게 되었다. 본 논문에서는 X-Match 알고리즘을 병렬로 수행하여 압축 속도를 2배 향상시키고 X-Match 알고리즘 거의 비슷한 압축률을 제공하는 협동 병렬 X-Match 알고리즘, 즉 X-MatchCP 알고리즘을 제안한다. 기존의 병렬 X-Match 알고리즘이 X-Match 알고리즘을 병렬로 수행할 매에 각자의 사전을 검색하는 데 비해서 X-MatchCP 알고리즘에서는 X-Match 알고리즘이 병렬로 수행되지만 전체 사전을 검색하여 매칭빈도를 높이도록 하였고 run-length 부호화도 두 워드에 대해서 한꺼번에 하는 방식으로 서로 협동하면서 동작한다 메모리 데이타와 파일 자료를 사용한 시뮬레이션 결과 X-MatchCP 알고리즘은 같은 사전 크기의 X-Match 알고리즘과 거의 비슷한 압축률을 보였다. 그리고 X-MatchCP 알고리즘의 하드웨어 구현을 위한 전체적인 구조 설계를 Verilog 언어를 사용하여 수행하였다.

내포병렬성을 가진 공유메모리 프로그램의 수행중 최초경합 탐지를 위한 효율적 기법 (Efficient On-the-fly Detection of First Races in Shared-Memory Programs with Nested Parallelism)

  • 하금숙;전용기;유기영
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제30권7_8호
    • /
    • pp.341-351
    • /
    • 2003
  • 내포병렬성을 가진 공유메모리 병렬프로그램의 효과적인 디버깅을 위해서, 프로그램의 비결정적 수행을 최초로 초래하는 경합을 효율적으로 탐지하는 것이 중요하다. 이러한 최초경합을 수행 중에 탐지하는 기존의 기법은 두 번의 프로그램 수행을 통해서 탐지하면서 각 공유변수마다 프로그램의 최대병렬성에 의존적인 크기의 접근역사를 유지하므로 비효율적인 수행시간과 기억공간을 요구한다. 본 논문에서는 두 번의 프로그램 수행을 통해서 수행 중에 각 공유변수에 대한 접근역사를 상수적 크기로 유지하므로, 각 접근사건의 수행 시에 상수적 복잡도의 사건비교 횟수와 기억 공간만을 요구하는 새로운 최초경합 탐지기법을 제안한다. 그러므로 본 기법은 내포병렬성을 가진 공유메모리 병렬프로그램의 디버깅을 위해서 보다 효율적이고 실용적인 경합탐지를 가능하게 한다

수질예보를 위한 3차원 모형의 최적 운영 기법 (Optimal Operation of the 3D Water Quality Model for Water Quality Forecast)

  • 이승재;김현식;사성오;황현식
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2016년도 학술발표회
    • /
    • pp.72-72
    • /
    • 2016
  • 최근 발생하고 있는 기후변화로 인하여 하천 및 저수지의 수질문제가 커지고 있다. 특히 여름철 부영양화로 인해 발생하는 녹조현상은 사회적인 문제로 과학적인 수질사고에 대한 예측과 관리가 필요한 실정이다. 수질예보는 정기적으로 하천 및 저수지의 수질을 예측하여 사용자에게 제공하는 분석기법으로 수질현황을 파악하고 수질을 관리하고 의사결정을 하는데 도움을 줄 수 있다. 수질예보에 사용되는 모형은 유역모형, 하천모형, 저수지모형이 있으며, 이중 하천 및 저수지에 주로 적용되고 있는 3차원 수리수질모형의 경우 격자의 개수가 많아 모의시간이 길어지게 되고 이로 인해 일일 수질 예보가 어렵게 된다. 3차원 수리수질모형의 모의속도를 개선하는 방법에는 하드웨어의 성능을 높이는 방법과 병렬화를 이용한 소프트웨어적인 방법이 있다. 이중 하드웨어의 성능을 높이는 방법은 컴퓨터의 사양을 높이는 방법으로 높은 비용이 소요된다. 하지만 병렬화 방법은 컴퓨팅 기술의 발전으로 멀티코어가 대중화가 된 최근에 코드의 적용만으로 모의속도를 향상시킬 수 있다. 본 연구에서 사용된 모형은 서호주대학에서 개발한 3차원 수리 수질모형인 ELCOM-CAEDYM 모형으로 적용된 병렬화 기법은 OpenMP(Open Multi-Processing)방법이다. 기존 직렬 컴퓨팅 방식으로 구성되어 한번에 한 개의 명령어 밖에 처리할 수 없었던 작업방법을 동시에 여러 개의 처리요소를 이용하여 명령을 실행할 수 있게 하는 방식이다. 하지만 CPU의 개수는 제한되어 있으며, Amdahl's law에 따르면 OpenMP방식의 병렬화시 속도개선효과는 95% 병렬화 프로그램에서 최대 CPU 개수의 제한이 없다면 20배 까지 속도향상이 가능하다고 하였다. 본 연구에서는 3차원 수리 수질예측 모형인 ELCOM-CAEDYM에 적용된 병렬화 기법을 적용하는데 있어 최적 CPU사용 개수를 파악 하고자 하였으며, 이를 통해 수질예보시스템을 운영하는데 가장 효율적인 방법을 찾아 적용하고자 하고자 한다.

  • PDF

효율적인 자동 주석을 위한 단어 임베딩 인공 신경 정리 증명계 구축 (Neural Theorem Prover with Word Embedding for Efficient Automatic Annotation)

  • 양원석;박한철;박종철
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.79-84
    • /
    • 2016
  • 본 연구는 전문기관에서 생산되는 검증된 문서를 웹상의 수많은 검증되지 않은 문서에 자동 주석하여 신뢰도 향상 및 심화 정보를 자동으로 추가하는 시스템을 설계하는 것을 목표로 한다. 이를 위해 활용 가능한 시스템인 인공 신경 정리 증명계(neural theorem prover)가 대규모 말뭉치에 적용되지 않는다는 근본적인 문제를 해결하기 위해 내부 순환 모듈을 단어 임베딩 모듈로 교체하여 재구축 하였다. 학습 시간의 획기적인 감소를 입증하기 위해 국가암정보센터의 암 예방 및 실천에 대한 검증된 문서들에서 추출한 28,844개 명제를 위키피디아 암 관련 문서에서 추출한 7,844개 명제에 주석하는 사례를 통하여 기존의 시스템과 재구축한 시스템을 병렬 비교하였다. 동일한 환경에서 기존 시스템의 학습 시간이 553.8일로 추정된 것에 비해 재구축한 시스템은 93.1분 내로 학습이 완료되었다. 본 연구의 장점은 인공 신경 정리 증명계가 모듈화 가능한 비선형 시스템이기에 다른 선형 논리 및 자연언어 처리 모듈들과 병렬적으로 결합될 수 있음에도 현실 사례에 이를 적용 불가능하게 했던 학습 시간에 대한 문제를 해소했다는 점이다.

  • PDF

Myrinet 클러스터링 시스템에서 순위차원 라우팅을 사용하는 통신들의 최적 스케줄링 방법 (Optimal Schedules for Dimension-Ordered Routing Communications in Myrinet Clustering Systems.)

  • 박상명;이상규;문봉희
    • 한국정보과학회논문지:정보통신
    • /
    • 제28권1호
    • /
    • pp.71-81
    • /
    • 2001
  • 최근 병렬처리 시스템에 대한 연구는 마이크로 프로세서 제작 기술과 네트워크 기술이 발달함에 따라 고성능의 PC와 워크스테이션 여러대를 고속의 네트워크로 연결하여 구축하는 클러스터링 환경에 관심이 고조되고 있다. 그런데 이러한 클러스터링 시스템의 성능은 수행되는 애플리케이션 프로그램의 병렬성이나 xdhtls 빈도 등의 특성에 따라 달라진다. 그러므로 클러스터링 시스템의 성능을 향상시키기 위해서는 애플리케이션의 이러한 특성을 고려하여 최상의 효과를 얻기 위한 조정작업이 필요하며 그 방법중의 하나가 시스템 상에서 발생하는 통신들에 대하 스케줄링을 수행하는 것이다. 본 논문에서는 Myrinet 스위치를 사용하여 선형으로 구성한 클러스터링 시스테과 2차원 메쉬 형태로 구성한 클러스터링 시스템의 두 가지 모델을 가정하고 이들 모델 상에서 특성 시간에 주어지는 통신요청들에 대하여 순위차원 라우팅을 사용하여 메시지들을 최단시간에 전송할 수 있는 최적 통신스케줄링 알고리즘을 제안한다. 시스템 상에서 같은 방향으로 동시에 링크를 공유한는 통신들의 개수의 최대값을 $L_{MAX}$로 시스템에서 하나의 메시지가 전달되는데 걸리는 시간을 T로 정의하면 알고리즘에 의해 선형 네트워크에서의 통신 요청 집합에 대한 메시지 전송 완료 시간은 최대 $L_{MAX}{\cdot}T$, 메쉬 네트워크에서의 통신요청 집합에 대한 메시지 전송 완료시간은 최대 $frac{3}{2}{\cdot}T$임을 증명하였다.

  • PDF

이기종 클러스터 시스템에서 Cilk와 MPI 특성 비교 (Comparing Cilk and MPI on a heterogeneous cluster system)

  • 이규호;김준성
    • 전자공학회논문지CI
    • /
    • 제44권4호통권316호
    • /
    • pp.21-27
    • /
    • 2007
  • 최근 수년간의 급속한 기술의 발전과 대량생산 체제의 영향으로 개인용 컴퓨터와 간단한 네트워크 장비를 이용한 클러스터 시스템 구현이 용이해졌으나 개인용 컴퓨터의 교체 주기가 짧아짐에 따라 시스템 구성을 자유롭게 할 수 있는 클러스터 시스템의 이기종화를 초래하였다. 이기종 클러스터 시스템을 이용하여 구축된 병렬처리 시스템의 경우 그 성능을 효율적으로 사용하기 위해서는 각 노드의 성능을 고려한 작업 관리가 필요하다. 본 연구에서는 이기종 클러스터 시스템에서 MPI와 Cilk 병렬처리 시스템의 특성을 성능측면에서의 speedup과 활용도측면에서의 프로그램 코드의 복잡도를 정량적으로 살펴보았다. 실험에 따르면 작은 데이터를 이용하는 경우 Cilk가, 큰 데이터를 이용하거나 정규화된 데이터 교환 형태를 갖는 경우 MPI가 더 좋은 성능을 보였으며 코드 복잡도의 경우 Cilk가 간결한 프로그래밍 스타일을 제공함을 보였다.

효율적인 자동 주석을 위한 단어 임베딩 인공 신경 정리 증명계 구축 (Neural Theorem Prover with Word Embedding for Efficient Automatic Annotation)

  • 양원석;박한철;박종철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.79-84
    • /
    • 2016
  • 본 연구는 전문기관에서 생산되는 검증된 문서를 웹상의 수많은 검증되지 않은 문서에 자동 주석하여 신뢰도 향상 및 심화 정보를 자동으로 추가하는 시스템을 설계하는 것을 목표로 한다. 이를 위해 활용 가능한 시스템인 인공 신경 정리 증명계(neural theorem prover)가 대규모 말뭉치에 적용되지 않는다는 근본적인 문제를 해결하기 위해 내부 순환 모듈을 단어 임베딩 모듈로 교체하여 재구축 하였다. 학습 시간의 획기적인 감소를 입증하기 위해 국가암정보센터의 암 예방 및 실천에 대한 검증된 문서들에서 추출한 28,844개 명제를 위키피디아 암 관련 문서에서 추출한 7,844개 명제에 주석하는 사례를 통하여 기존의 시스템과 재구축한 시스템을 병렬 비교하였다. 동일한 환경에서 기존 시스템의 학습 시간이 553.8일로 추정된 것에 비해 재구축한 시스템은 93.1분 내로 학습이 완료되었다. 본 연구의 장점은 인공 신경 정리 증명계가 모듈화 가능한 비선형 시스템이기에 다른 선형 논리 및 자연언어 처리 모듈들과 병렬적으로 결합될 수 있음에도 현실 사례에 이를 적용 불가능하게 했던 학습 시간에 대한 문제를 해소했다는 점이다.

  • PDF

직교 다항식의 근사화를 적용한 다중 사용자 간섭 제거기법 (Multiuser Interference Cancellation Scheme using Orthogonal Polynomial Approximation for Multiuser Signal Detection in CDMA Systems)

  • 노재호;최수용;이미숙;신기수;홍대식;강창언
    • 한국통신학회논문지
    • /
    • 제26권7B호
    • /
    • pp.928-936
    • /
    • 2001
  • 본 논문은 CDMA 시스템을 근간으로 향후 서비스 될 3세대 이동통신 시스템에 선택적으로 적용될 수 있는 다중 사용자 간섭 제거 기법을 제안한다. 제안 방식은 다단계 간섭 제거기의 각 단계에 직교 다항식의 근사화 기법을 적용하여 제거될 간섭 신호의 양을 결정하고, 이를 상호 보완적으로 제거한다. 사용자 용량의 포화도에 따른 최적해로의 수렴성을 각 방식의 스펙트럼 반경의 분석을 통해 비교하였으며, 제안한 방식이 병렬 간섭 제거 기법(Parallel Interference Cancellation, PIC)을 사용한 방식과 비교하여 2배 이상의 적은 단계를 사용했음에도 거의 같은 정도의 오차 성능을 보였으며, 실험을 통해 비트 오율이 $10^{-5}$을 기준으로 약 30% 정도의 사용자 수용 능력이 증대되었다. 또한 전력 제어의 적용 여부에 대한 시스템의 비트 오율 측면의 성능 비교, 원근 효과의 관점에서 성능을 비교하여 제안된 간섭 제거 기법이 비적응형 가중치를 적용한 병렬 간섭 제거 기법보다 우수함을 보였다.

  • PDF

병렬 컴퓨터 시스템에서의 상호연결망 인터페이스 (Interconnection Network Interfaces in Parallel Computer Systems)

  • 모상만;신상석;한우종;윤석한
    • 전자통신동향분석
    • /
    • 제12권5호통권47호
    • /
    • pp.62-72
    • /
    • 1997
  • 상호연결망 인터페이스는 병렬 컴퓨터 시스템에서 노드 또는 프로세서를 상호연결망에 연결하는 다리 역할을 수행하는 정합 장치로서, 상호연결망으로 메시지를 송수신하는 기능을 수행한다. 본 논문에서는 상호연결망 인터페이스의 구조와 동작, 프로세서와의 인터페이스, 여러 종류의 상호 연결망 인터페이스에 대한 사례조사 결과, 상호연결망 인터페이스의 성능 및 설계 고려사항 등을 기술 한다. 상호연결망 인터페이스 설계의 초점은 상호연결망 인터페이스가 시스템의 병목지점이 되지 않도록 하는데 맞추어져야 하며, 이를 위하여 응용 분야를 충분히 고려하고 전송 대역폭을 극대화하고 지연 시간을 최소화하도록 구현되어야 한다. 또한, 오류 제어를 통하여 높은 전송 신뢰도를 제공하고, 효율적인 프로세서 인터페이스 및 프로그래밍 인터페이스를 제공해야 한다.