• 제목/요약/키워드: 병렬 알고리즘

검색결과 1,326건 처리시간 0.032초

슈퍼컴퓨터상에서 광선추적 알고리즘의 병렬화에 대한 성능분석 (A Performance Analysis of the Parallel Ray Tracing Algorithm on a Supercomputer)

  • 이효종;강줄기
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (상)
    • /
    • pp.617-620
    • /
    • 2000
  • 컴퓨터를 활용하여 사진영상을 얻는 기술은 여러 분야에서 많은 응용이 이루어지고 있는데, 그 중에서도 광선추적기법은 가장 많이 쓰이면서도 현실감 있는 사진영상을 얻는 음영처리 기법중의 하나이다. 하지만 영상이 복잡해짐에 따라 컴퓨터로 처리하는 시간도 그만큼 많이 소요되는데 슈퍼컴퓨터 상에서 병렬처리기법을 적용함으로써 처리시간을 상당히 줄일 수가 있다. 본 논문에서는 IBM RS/6000 SP 슈퍼컴퓨터를 활용하여 순차적 광선추적 알고리즘을 메시지 교환방식을 통한 병렬처리 기법으로 성능분석을 하고자 하였다. 실험을 위해서 슈퍼컴퓨터의 노드수를 최대 16개까지 증가시켜 가면서 복잡한 영상에 대해 병렬 광선추적 알고리즘의 성능분석을 하였고, 메시지 교환방식 중에서 블락킹 통신과 비블락킹 통신에 대해서 그 성능을 각각 비교하였다.

  • PDF

MIN-based 다중 처리 시스템을 위한 효율적인 병렬 Branch-and-Bound 알고리즘 설계 및 성능 분석 (Design and Performance Analysis of a Parallel Optimal Branch-and-Bound Algorithm for MIN-based Multiprocessors)

  • 양명국
    • 전기전자학회논문지
    • /
    • 제1권1호
    • /
    • pp.31-46
    • /
    • 1997
  • 본 논문에서는 다층 연결 구조(Multistage Interconnection Network, MIN)를 기반으로 하는 병렬 컴퓨터 환경에서 효과적으로 운용할 수 있는 병렬 Optimal Best-First search Branch-and-Bound 알고리즘(pobs)을 제안하고, 성능을 분석하였다. 제안된 알고리즘은 먼저 해를 얻고자 하는 문제를 임의의 G개 부 문제로 분할하고 소수 프로세서로 구성된 프로세서 그룹들에 할당하여 각각의 지역 해를 산출하도록 하였다. 따라서 N개의 프로세서를 갖는 시스템은 G개 프로세서 그룹으로 구분되고 각 프로세서 그룹은 P(=N/G)개 프로세서를 보유하게 된다. 각 프로세서 그룹은 할당된 부 문제의 지역 해를 얻는 과정에 병렬 sub-Global Best-First B&B 알고리즘을 수행한다. 프로세서 그룹들이 산출한 지역 해들 가운데 최선의 값을 갖는 지역 해가 문제의 전역 해로 결정되는데, 이를 위하여 각 프로세서 그룹의 대표 프로세서는 할당된 부 문제의 지역 해를 다른 그룹들에게 전파하도록 하였다. 지역 해 전파는 프로세서 그룹들의 지역 해 비교를 통한 전역해 선정 기능과 함께 프로세서 그룹간 작업 불균형 문제를 상당 부분 해소하는 효과를 제공한다. 알고리즘 설계에 이어 성능 평가를 위한 분석 모형을 제시하였다. 제안한 모형은 B&B 알고리즘 수행에 따른 연산 소요시간과 통신 소요시간을 분리하여 처리함으로 병렬 처리 환경에서 보다 실질적인 알고리즘 성능 평가가 가능하게 함과 동시에, 다양한 컴퓨터 연결 구조에서의 알고리즘 성능 예측을 용이하게 하였다. B&B 알고리즘의 확률 특성을 토대로 작성된 성능 분석 연구의 실효성 검토를 위하여 MIN 기반 시스템을 대상으로 병행된 시뮬레이션 결과는 상호 미세한 오차 범위 내에서 일치하는 결과를 보여 제시한 성능 분석 기법의 타당성을 입증하였다. 또한, 본 논문에서 제안한 병렬 알고리즘을 MIN 기반 시스템에 적용하여 기존 알고리즘의 성능과 비교 평가 결과 제안한 pobs가 문제 해결 과정에서 전개되는 부 문제 수를 줄이고 프로세서간의 효율적인 작업 분배 효과를 제공하는 한편 프로세서간의 주된 통신 활동 범위를 국부적으로 제한하여 성능면에서 우수함을 입증하였다.

  • PDF

클러스터 데이터 매핑을 위한 혼합형 휴리스틱 (A Hybrid Heuristic for Clustered Data Mapping)

  • 박경모
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (3)
    • /
    • pp.662-664
    • /
    • 2000
  • 병렬 컴퓨팅에서 중요 문제의 하나는 다중 태스크를 다중 프로세서 병렬 시스템의 여러 노드에 대한 최적의 매핑을 찾는 것이다. 이러한 매핑의 목적은 솔루션 품질에 손상 없이 총 실행시간을 최소화시키는 것이다. 이 분야에서는 많은 휴리스틱 방법들을 사용하여 나름대로 매핑 문제를 해결해 왔다. 본 논문에서는 효율적인 클러스터 데이터 매핑을 위한 혼합형 휴리스틱 기법에 대하여 기술한다. 제시하는 휴리스틱 기법은 유전알고리즘과 평균장어닐링 알고리즘을 혼합시킨 것으로 두 가지 방법의 장점들을 합하여 성능을 향상시킬 수 있음을 보여준다. 혼합형 휴리스틱 알고리즘의 솔루션과 실행시간을 기존 매핑 알고리즘들과 비교한 시뮬레이션 결과를 보고한다.

  • PDF

다중의 결함을 갖는 하이퍼큐브 진단 알고리즘 (Hypercube Diagnosis Algorithm for Large Number of Faults)

  • 최혜연;김동군;이충세
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.878-880
    • /
    • 2003
  • 대부분의 진단 알고리즘은 PMC 모델을 바탕으로 결함의 개수가 t개를 초과하지 않는다는 t-진단가능 시스템의 특성을 이용한다. 하지만, 병렬처리 시스템의 규모가 커짐에 따라 시스템 내에서 발생되는 결함의 빈도가 높아지게 된다. 즉, 진단 알고리즘에서 가정하는 결함의 개수 t는 병렬처리 시스템 안에 있는 노드의 수에 비해 상당히 작은 개수이며, 결함의 개수가 t를 초과할 경우는 거의 고려하지 않았다. 본 논문에서는 결함의 개수가 t개를 초과하는 경우에 대하여 진단의 정확여부를 판단할 수 없는 충분히 작은 개수의 노드가 존재한다는 것을 허락함으로서, 진단 가능한 결함의 최대 수를 증가시키는 알고리즘을 제안한다.

  • PDF

내부 순환문 개선을 통한 Linux 기반의 D-클래스 계산 고효율 순차 알고리즘 (Serial Algorithm for D-Class computation with an Improved Inner Loop on the Linux Platform)

  • 신철규;한재일
    • 한국IT서비스학회:학술대회논문집
    • /
    • 한국IT서비스학회 2005년도 춘계학술대회
    • /
    • pp.526-531
    • /
    • 2005
  • D-클래스는 보안에 응용될 수 있는 가능성을 가지고 있으나 D-클래스의 계산은 NP-완전문제로서 행렬크기 증가에 의한 연산 량 증가 문제 해결을 위해 병렬 컴퓨팅 환경에서의 병렬 알고리즘 설계 및 구현이 필요하다. 본 논문은 그리드 컴퓨팅 환경에서의 D-클래스 계산을 위해 Globus 가 설치된 클러스터를 구축하고. MPICH를 이용 효율적인 D-클래스 계산 알고리즘을 설계 및 구현, 실행 결과 그리고 연산 량을 줄일 수 있는 수식 연구와 연구한 수식에 기반한 순차 알고리즘을 논한다.

  • PDF

반도체 공정 시뮬레이션을 위한 초고속 병렬 연산 알고리즘 (Massive Parallel Processing Algorithm for Semiconductor Process Simulation)

  • 이제희;반용찬;원태영
    • 전자공학회논문지D
    • /
    • 제36D권3호
    • /
    • pp.48-58
    • /
    • 1999
  • 본 연구에서는 3차원 반도체 공정 시뮬레이션의 효율성과 성능을 향상시키기 위하여, 병렬 유한요소법 수치해석에 사용이 적합한 디라우니 병렬 메쉬 생성기 및 표면 전진 메쉬 생성기를 개발하였고, 이를 위하여 개선된 성능을 보이는 수정된 하부구조법 병렬 유한요소법 수치해석기를 개발하였다. 또한, 행렬 계산 알고리즘의 병렬화를 확산 및 산화 시뮬레이터에 적용하여, 직렬 계산 시 3시간이 소요되는 확산 시뮬레이션과 비평탄 구조를 지니는 R-LOCOS 등의 연산을 8개의 프로세서를 병렬로 사용하여 15분만에 계산하였다. 과다한 계산 시간을 요하는 몬테카를로 수치해석 방법의 효율성을 높이고자, 병렬 연산 알고리즘을 몬테카를로 연산에 적용하였다. 또한, 스퍼터링 증착장치 시스템의 타켓 입자 분포 특성을 병렬 연산 몬테카를로 방식으로 계산하였다. 3000개의 이온을 주입하였을 겨우 단일 프로세서에서 13,000초의 계산시간이 소요되었으나, 30개의 프로세서를 병렬로 사용하였을 때 520초의 시간을 소비하여,25 이상의 스피드업 특성을 얻었다. 또한, 몬테카를로 계산의 최적화 연구를 통해서 3차원 스퍼터링 증착장치에서 연쇄 충돌 계산 수행시의 최적이온의 개수는 30,000임을 확인하였다.

  • PDF

고성능 병렬화일 시스템을 위한 디스크 할당 방법 (A Disk Allocation Scheme for High-Performance Parallel File System)

  • 박기현
    • 한국정보처리학회논문지
    • /
    • 제7권9호
    • /
    • pp.2827-2835
    • /
    • 2000
  • 최근, 멀티미디어 정보처리와 같은 대규모 데이터 처리에 필수적인 입출력 시스템의 성능을 높이기 위하여 많은 관심이 집중되고 있으며, 고성능 병렬화일 시스템에 관한 연구도 이런 노력에 속한다. 본 연구에서는 고성능 병렬화일 시스템을 위한 효율적인 디스크 할당 방법을 제안한다. 즉, 병렬화일의 자료 분산(data declustering)특성을 이용하여 병렬화일에 대한 병렬도 개념을 정의하고, 이를 기반으로 여러 병렬화일들이 동시에 처리되는 경우에, 최대의 작업처리량(throughput)을 얻기 위한 각 병렬화일에 적합한 디스크상의 자료 분산 정도를 계산하는 방법을 제안한다. 또한 동시에 처리되는 병렬화일들이 많이 늘어날수록, 최대의 작업처리량을 얻기 위한 계산이 너무 복잡해지므로, 효율적인 근사 디스크 할당 알고리즘도 아울러 제안한다. 제안된 근사 알고리즘은 계산이 간단하고, 특히 입출력 작업부하(workload)가 높은 환경에서는 매우 효율적임을 보여준다. 또한 입출력 요구들의 도착 비율이 무한대일 경우, 근사 알고리즘만을 이용하여도 최대 작업처리량을 위한 최적 디스크 할당을 얻을 수 있음을 증명하였다.

  • PDF

2차원 토러스 기반 다중 디스크 데이터 배치 병렬 유전자 알고리즘 (A 2-Dimension Torus-based Genetic Algorithm for Multi-disk Data Allocation)

  • 안대영;이상화;송해상
    • 전자공학회논문지CI
    • /
    • 제41권2호
    • /
    • pp.9-22
    • /
    • 2004
  • 본 논문에서는 NP-Complete 부류에 속하는 다중 디스크 데이터 배치 문제를 해결하기 위한 병렬 유전자 알고리즘을 제안한다. 이 문제는 디스크 입출력 처리의 병렬성이 극대화되도록 Binary Cartesian Product File의 데이터 블록들을 디스크어레이에 배치하는 방식을 찾는 것이다. 이 문제를 해결하기 위하여 제안되었던 DAGA 방식은 순차 유전자 알고리즘(Genetic Algorithm)으로서, 이전에 제안되었던 다른 방식에 비해 디스크 수에 대한 제약을 없애면서도 우수한 결과를 제공함을 보여 주었으나 시뮬레이션 시간이 너무 커서 큰 용량의 데이터 구성에 대한 시뮬레이션을 어렵게 하는 문제점이 있었다. 본 논문에서는 DAGA의 시뮬레이션 시간 단축을 위한 방식으로서, 2차원 토러스(2-Dimension Torus) 기반 병렬 유전자 알고리즘(ParaDAGA)을 제안한다. ParaDAGA는 분산 객체 모형을 기반으로 설계되었으며, 단일 프로세서 시스템에서 구현된 병렬처리 컴퓨터 시뮬레이터에서 수행되도록 구현하였다. 시뮬레이션 연구를 통하여, ParaDAGA의 시뮬레이션 변수 값이 결과에 주는 영향을 분석하였고, ParaDAGA 방식이 DAGA 방식에 비해 우수한 결과를 제공할 수 있는지를 실험하였다. 실험 결과는 ParaDAGA 방식이 순차 알고리즘인 DAGA보다 알고리즘 수행 시간 뿐 아니라, 찾아낸 결과도 우수함을 보여준다.

변형 물체를 위한 GPU 기반 병렬 충돌 감지 (GPU-Based Parallel Collision Detection for Deformable Objects)

  • 성낙준;김민상;홍민;최유주
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권1호
    • /
    • pp.25-32
    • /
    • 2018
  • 변형물체 시뮬레이션은 강체 시뮬레이션에 비해 많은 연산량을 요구하기 때문에 효과적인 충돌 검사 방법을 필요하다. 그러나 CPU 기반의 충돌 검사 알고리즘을 그대로 GPU 환경에 적용할 경우 GPU의 성능을 제대로 사용할 수 없기 때문에 GPU 환경에 최적화된 충돌 감지 알고리즘과 자료구조가 필요하다. 따라서 본 연구에서는 변형 물체 표현을 위해 널리 사용되고 있는 질량-스프링 시스템을 위한 GPU 기반의 병렬 충돌 감지 알고리즘을 제안한다. 제안하는 방법은 AABB-옥트리 구조를 이용한 GPU 기반의 컬링 알고리즘을 통해 충돌 감지 비용을 줄이는 병렬 알고리즘과 자료 구조를 사용하였다. 본 연구에서는 모든 삼각형 쌍의 충돌을 병렬로 검사하는 기존 방법과의 비교실험을 통하여 제안 알고리즘의 효율성을 입증하였다. 실험결과, 제안된 방법은 기존의 방법에 비해서 평균 약 24%의 성능 개선을 보였다. 따라서 제안하는 방법을 통해서 변형 물체에 대한 실시간 시뮬레이션의 성능 개선이 가능할 것으로 기대한다.

WCDMA 소프트 핸드오버 시 하향 병렬 전송 전력 제어 알고리즘 (Downlink Parallel Transmit Power Control Algorithm during Soft handover for WCDMA System)

  • 한영욱;서경진;박승권
    • 한국통신학회논문지
    • /
    • 제30권4A호
    • /
    • pp.271-281
    • /
    • 2005
  • 본 논문에서는 무선 인터페이스에서 최저의 간섭 레벨을 유지하고 요구된 QoS를 제공하기 위해 사용되는 SIR(signal-to-Interference Ratio) 기반의 폐루프 전력 제어 알고리즘 대신 Soft Symbol을 이용한 Soft Symbol 알고리즘과 함께 병렬 알고리즘을 적용한 폐루프 전력 제어에 대한 연구를 하였다. SIR 기반 알고리즘과 Soft Symbol 기반 알고리즘을 이용한 전력 제어에 대한 성능 평가를 하여 Soft Symbol 기반 알고리즘을 이용한 전력 제어 성능이 향상 되었고, 병렬 알고리즘을 이용한 폐루프 전력 제어에서는 SIR 기반의 전력 제어보다 $15\sim20\%$의 우수한 성능을 보였다.