• 제목/요약/키워드: Parallel computation

검색결과 594건 처리시간 0.025초

HEVC 다단계 움직임 추정 기법에서 단위 연산기 개수의 최적화 방법 (Optimization Method on the Number of the Processing Elements in the Multi-Stage Motion Estimation Algorithm for High Efficiency Video Coding)

  • 이성수
    • 전기전자학회논문지
    • /
    • 제21권1호
    • /
    • pp.100-103
    • /
    • 2017
  • 움직임 추정기는 동영상 압축에서 가장 많은 연산량을 차지하는 연산으로, 처리 속도를 맞추기 위해 다수의 단위 연산기를 병렬로 사용하는 경우가 많다. 단위 연산기를 많이 사용할수록 처리 속도가 빨라지지만 하드웨어 면적도 커지기 때문에 단위 연산기의 개수를 최적화하는 것이 중요하다. HEVC(high efficiency video coding)의 경우 연산량을 줄이고 성능을 높이기 위해서 다단계 움직임 추정 기법을 주로 사용하는데, 각 단계마다 탐색점의 개수 및 위치가 다르기 때문에 단위 연산기의 사용률이 항상 100%가 되지 않으며 단위 연산기의 개수에 따라 사용률이 크게 달라진다. 본 논문에서는 단위 연산기의 사용률과 연산 사이클을 계산하여 주어진 움직임 추정 기법에 최적화된 단위 연산기 개수를 찾아 내는 방법을 제안한다.

저속 네트웍 PC 클러스터상에서 NOW-Sort의 성능향상 (Enhanced NOW-Sort on a PC Cluster with a Low-Speed Network)

  • 김지형;김동승
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제29권10호
    • /
    • pp.550-560
    • /
    • 2002
  • 병렬 외부정렬을 클러스터형 분산 컴퓨터에서 실행하는 경우에는 순수하게 주메모리에서 부분적인 정렬과 머지를 위해 실행되는 과정(순수 계산)뿐만 아니라 디스크로부터의 입출력 과정 및 각 노드들간의 데이타 교환에 따르는 통신과정을 적절히 배치, 설계함이 필요하다. 그 주된 이유는 전체 수행시간이 순수 계산시판보다는 디스크 입출력에 소요되는 시간 및 통신의 소요시간의 비중이 크기 때문이다. 본 연구에서는 저속 네트웍 PC 클러스터를 계산도구로 하여 단위시간당 정렬 자료규모를 최대화함을 목표로 하여, 알고리즘적인 최적화를 통해서, 즉, 정렬 도중 통신과정에서 발생하는 지체시간을 최소화하여 전체적인 통신 성능을 높이고, 디스크 입출력 작업은 전송 규모와 횟수를 조절하여 계산과 통신작업등과의 중첩정도를 극대화시켜 외부정렬의 성능을 개선하였다. 실험 결과 새 알고리즘이 기존의 NOW-sort 알고리즘[1]에 비해서 동일한 PC 클러스터 경에서 최대 45% 정도까지 실행시간을 단축시킬 수 있고, 확장성 면에 있어서도 더 우수한 것을 확인하였다.

Co-rotational 비선형 정식화 및 FETI-local 기법을 결합한 비선형 대용량/다물체 구조 해석 알고리듬 개발 (Computational Algorithm for Nonlinear Large-scale/Multibody Structural Analysis Based on Co-rotational Formulation with FETI-local Method)

  • 조해성;주현식;이영헌;곽민철;신상준;여재익
    • 한국항공우주학회지
    • /
    • 제44권9호
    • /
    • pp.775-780
    • /
    • 2016
  • 본 논문에서는 비선형 다물체 동역학 해석에 적용 가능한 구조해석을 개발하였다. 비선형 구조 해석을 위해 Co-rotational 이론 기반의 유한요소를 개발하였다. 그리고 국부 Lagrange 승수를 활용한 영역분할해석 기법을 적용하여 대용량/다물체 해석이 가능한 구조해석 알고리듬을 개발하였다. 기 개발한 구조 해석은 외팔보 및 다물체 구조에 대한 비선형 정적 해석 예제에 적용하였다. 병렬 계산에 따른 성능 평가는 희박행렬 계산 라이브러리인 PARDISO와 비교하였다. 이를 통해 기 개발 구조해석의 계산 속도 향상을 확인하였다.

개인정보보호를 위한 데이터 수집 프로토콜의 성능 분석 (Performance Analysis for Privacy-preserving Data Collection Protocols)

  • 이종덕;정명인;유진철
    • 한국정보통신학회논문지
    • /
    • 제25권12호
    • /
    • pp.1904-1913
    • /
    • 2021
  • 스마트폰의 대중화와 IoT 기술의 발달로 데이터 수집이 쉬워지며 공익을 위해 이를 분석하는 것이 가능해졌지만, 개인정보 유출의 가능성으로 인해 다수의 사용자는 자발적으로 데이터를 제공하는 것에 우려를 표한다. 이러한 문제해결을 위해 개인정보를 보호하면서 데이터 수집을 가능하게 하는 프로토콜에 관하여 연구하였다. 본 연구에서는 자료 교란, 전통 암호, 그리고 동형암호를 이용한 알고리즘들의 성능에 대해 분석하였으며 정확도, 메시지 길이, 그리고 계산 지연시간의 3가지 단위를 이용하여 비교 분석하였다. 실험 결과를 통해 자료 교란 방식은 연산 속도가 빠르고 정확도는 낮으며, 반면에 전통 암호 알고리즘은 효율성이 떨어지지만 100%의 정확도를 보장한다는 점을 확인하였다. 동형 암호 알고리즘은 암호화된 데이터에 대해 복호화 없이 연산을 수행하는 방식이므로 상대적으로 개인정보보호에 효과적이지만, 높은 비용이 발생하였다. 그러나 동형 암호 알고리즘의 주요 비용인 사칙연산은 분산 처리하여 비용을 낮출 수 있으며, 통계수치 분석과 같은 연산은 데이터 개수와 상관없이 복호화가 단 한 번만 수행된다는 장점을 확인하였다.

Experiment of proof-of-principle on prompt gamma-positron emission tomography (PG-PET) system for in-vivo dose distribution verification in proton therapy

  • Bo-Wi Cheon ;Hyun Cheol Lee;Sei Hwan You;Hee Seo ;Chul Hee Min ;Hyun Joon Choi
    • Nuclear Engineering and Technology
    • /
    • 제55권6호
    • /
    • pp.2018-2025
    • /
    • 2023
  • In our previous study, we proposed an integrated PG-PET-based imaging method to increase the prediction accuracy for patient dose distributions. The purpose of the present study is to experimentally validate the feasibility of the PG-PET system. Based on the detector geometry optimized in the previous study, we constructed a dual-head PG-PET system consisting of a 16 × 16 GAGG scintillator and KETEK SiPM arrays, BaSO4 reflectors, and an 8 × 8 parallel-hole tungsten collimator. The performance of this system as equipped with a proof of principle, we measured the PG and positron emission (PE) distributions from a 3 × 6 × 10 cm3 PMMA phantom for a 45 MeV proton beam. The measured depth was about 17 mm and the expected depth was 16 mm in the computation simulation under the same conditions as the measurements. In the comparison result, we can find a 1 mm difference between computation simulation and measurement. In this study, our results show the feasibility of the PG-PET system for in-vivo range verification. However, further study should be followed with the consideration of the typical measurement conditions in the clinic application.

고해상도 SAR 영상처리 고속화를 위한 병렬 성능 최적화 기법 연구 (A Study on Parallel Performance Optimization Method for Acceleration of High Resolution SAR Image Processing)

  • 이규범;김규빈;안솔보름;조진연;임병균;김동현;김정호
    • 한국항공우주학회지
    • /
    • 제46권6호
    • /
    • pp.503-512
    • /
    • 2018
  • SAR(Synthetic Aperture Radar)는 레이더를 이용하여 얻은 신호를 처리해 영상을 획득하는 기술로서, SAR 영상의 활용도와 고해상도 영상에 대한 요구가 증가하고 있는 상황이다. 따라서 본 연구에서는 고해상도 영상 데이터의 고속 처리를 위해 SAR 영상처리 알고리즘을 다중코어 기반의 컴퓨터 구조에서 최적의 성능을 낼 수 있도록 구현하기 위한 연구를 수행했다. 고해상도 영상에 따른 방대한 양의 입출력에 의한 성능 저하를 개선시키기 위해 메모리를 최대한 활용하는 성능 최적화 기법을 적용하고 OpenMP의 동적 스케쥴링 기법과 중첩 병렬성(nested parallelism)을 사용해 코드의 병렬화 비율을 높였다. 그 결과 전체 계산시간을 줄일 뿐만 아니라 병렬 성능의 최대 한계치를 크게 높일 수 있었으며, 제안된 기법을 10개 코어를 가진 다중코어 시스템에 적용한 결과 기존 대비 8배 이상의 성능 향상이 있었다. 본 연구 결과는 대용량 메모리를 가진 다중코어 시스템을 대상으로 하는 고해상도 SAR 영상처리 소프트웨어 개발에 효과적으로 활용될 수 있을 것으로 기대된다.

메모리 사용을 최적화한 부분 병렬화 구조의 CMMB 표준 지원 LDPC 복호기 설계 (A Memory-efficient Partially Parallel LDPC Decoder for CMMB Standard)

  • 박주열;이소진;정기석;조성민;하진석;송용호
    • 대한전자공학회논문지SD
    • /
    • 제48권1호
    • /
    • pp.22-30
    • /
    • 2011
  • 본 논문에서는 CMMB (China Mobile Multimedia Broadcasting) 표준의 LDPC(Low Density Parity Check) 부호 복호기를 효과적으로 구현하는 방법을 제안한다. 본 논문은 AGU(Address Generation Unit)와 Index 행렬을 이용하여 효율적으로 주소 값을 생성함으로써, 메모리 사용량을 줄이고 복잡도를 감소시켰다. 또한 LDPC 부호 복호기의 throughput을 향상시키기 위해 한 클럭에 여러 메시지를 전달하는 부분 병렬 구조를 사용하였고, 하나의 주소를 사용하여 병렬적으로 동작이 가능하도록 노드 그룹핑을 진행하였다. 제안하는 LDPC 부호 복호기는 Verilog HDL로 구현하였으며, Synopsys사의 Design Compiler를 이용하여 Chartered $0.18{\mu}m$ CMOS cell library 공정으로 합성하였다. 제안된 복호기는 455K(in NAND2)의 크기를 가지며, 185MHz의 클럭에서 1/2 부호는 14.32 Mbps의 throughput을 갖고, 3/4 부호는 26.97Mbps의 throughput을 갖는다. 또한 기존의 CMMB용 LDPC의 메모리와 비교하여 0.39% 의 메모리만 사용된다.

효율적인 임무 피해 평가를 위한 자산-임무 의존성 모델 적용 및 최적화된 구현 (An Asset-Mission Dependency Model Adaptation and Optimized Implementation for Efficient Cyber Mission Impact Assessment)

  • 전영배;정현숙;한인성;윤지원
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권10호
    • /
    • pp.579-587
    • /
    • 2017
  • 사이버 임무 피해 정량화는 정해져있는 임무에 따라 움직여 집단의 목표를 이룩하거나 이윤을 창출하는 군(軍)이나 기업들에게 빠질 수 없는 필수적인 작업이다. 조직이 지닌 자산에 대한 피해가 발생하였을 때, 수행 목표에 대한 피해를 최소화하기 위해 남은 자산만으로 달성할 수 있는 임무의 최대 수용력(capacity)을 정량화하고 빠른 시간 안에 새로운 차선책을 마련하여야 한다. 이를 위해서자산과 임무에 대한 관계를 모델링하여 정형화하면 사이버 공격이 임무에 미친 피해 영향도를 계산할 수 있다. 본 논문에서는 자산과 과업의 관리 업무를 분리하여 효율적인 관리가 가능하도록 자산과 임무 사이의 의존성에 대한 모델을 적용하였고, 적용한 모델을 바탕으로 벡터 단위의 오퍼레이션을 이용하여 계산의 병렬화나 버퍼를 이용해 연산속도를 향상시키는 등 빠른 시간 안에 계산을 완료할 수 있는 최적화된 시스템을 구현하였다.

MULTI-BLOCK 격자 기법을 이용한 초소형 비행체 주위 공력 특성 해석 (Numerical Investigation of Aerodynamic Characteristics around Micro Aerial Vehicle using Multi-Block Grid)

  • 김영훈;김우례;이정상;김종암;노오현
    • 한국항공우주학회지
    • /
    • 제31권6호
    • /
    • pp.8-16
    • /
    • 2003
  • 3차원 비정상, 비압축성 Navier-Stokes 방정식 해석코드를 이용하여, 초소형 비행체 주위에 형성되는 저 레이놀즈수 유동장의 공력 특성을 연구하였다. 비정상 유동장의 효율적인 계산을 위하여, 개발된 코드는 MPI 프로그래밍 기법을 이용하여 병렬처리 하였으며, single partitioning 방법을 적용하여 3차원 형상에 대한 multi-block 격자계를 효율적으로 해석 하였다. 비교적 형상이 복잡하지 않은 초소형 비행체 주위 날개에 대해 해석한 후 초소형 비행체 전 형상에 대해 받음각을 변화시키며 공력계수 및 정안정성을 살펴보았다. 해석 결과, 서울대학교 미소공기역학실험실에서 수행한 아음속 풍동 실험데이터와 비교하여 보았을 때 대체로 잘 일치하였으며, 개념 설계한 비행체가 공기역학적으로 정안정성을 갖고 있음을 보일 수 있었다.

움직임 추정기의 병렬처리 구조 하드웨어 구현시비유효 데이터의 효율적인처리 방법 (Efficient Processing Technique for Unavailable Data in Hardware Implementation of Motion Estimator with Parallel Processing Architecture)

  • 박종화;강현수
    • 한국콘텐츠학회논문지
    • /
    • 제9권2호
    • /
    • pp.1-9
    • /
    • 2009
  • 본 논문은 H.264/AVC 부호화기의 실시간 동영상 부호화를 위한 하드웨어 구현과정 중 파이프라인 구조의 병렬 처리로 인한 데이터 부재문제의 해결방안을 제시하였다. 참조 소프트웨어(JM)의 움직임 추정 연산은 순차적인 처리가 가능하기 때문에 모든 데이터가 유효하지만, 파이프라인 구조로 하드웨어를 구현시 데이터가 병렬적으로 처리되므로 이전데이터가 유효하지 않은 경우가 발생한다. 본 논문에서는 MVp 연산시의 부재되는 데이터 문제를 해결하였다. 제안된 방법은 유효하지 않은 주변블록의 데이터(MV)로 인한 화질저하를 최소화하기 위하여 유효하지 않은 MV를 대신하여, 정수화소 움직임벡터, MVp(Motion Vector Predictor), MVcol(Motion vector of the Co-located block)을 사용하는 방법이다. BDPSNR로 실험 결과 같은 주제로 이전에 연구된 Huang[7]의 실험결과에 비하여 최대 QCIF영상에서 0.555dB, CIF 영상에서 0.834dB의 성능향상을 나타내고 있다.