• 제목/요약/키워드: 반복 연산

검색결과 500건 처리시간 0.037초

MLFMM(Multi-Level Fast Multipole Method) 방법에 적용된 BiCGstab(l)반복법의 l값에 따른 연산량 분석 및 효율적인 l값 (Computational Complexity of BiCGstab(l) in Multi-Level Fast Multipole Method(MLFMM) and Efficient Choice of l)

  • 이현수;임재원;고일석;서승모
    • 한국전자파학회논문지
    • /
    • 제29권3호
    • /
    • pp.167-170
    • /
    • 2018
  • MoM은 대표적인 적분방정식기반 full-wave simulation 방법이며, 이는 MLFMM 방법을 적용하여 효율적으로 계산될 수 있다. MoM 또는 MLFMM 방법에서 대규모 산란체 표면전류를 계산하는 과정에는 주로 반복법들이 사용된다. 이 가운데 BiCGstab(l)은 l값이 증가할수록 반복횟수는 줄어들지만, 반복당 수행되는 연산횟수가 증가하는 특징이 있다. 본 논문에서는 MLFMM 방법에 적용된 BiCGstab(l) 반복법의 l값에 따른 수렴속도와 연산량을 분석한 후, 효율적인 l값을 제안한다.

반복법을 사용한 단층영상 재구성을 위한 투사기 및 역투사기의 고속 구현 (Fast Implementations of Projector-Backprojector Pairs for Iterative Tomographic Reconstruction)

  • 김수미;이수진;김용호
    • 대한의용생체공학회:의공학회지
    • /
    • 제24권5호
    • /
    • pp.473-480
    • /
    • 2003
  • 반복법을 사용한 영상재구성은 기존의 여과역투사 방법에 비해 윌등한 장점을 가지고 있으므로 방출 전산화단층촬영에 있어 매우 중요한 역할을 해왔다. 그러나, 반복법을 사용한 영상재구성법은 데이터의 투사 및 역투사 계산의 반복으로 이루어져 있으므로 한 영상을 재구성하는데 필요한 계산량은 알고리즘의 구현을 위해 사용된 투사기 및 역투사기의 성능에 크게 좌우된다. 본 연구에서는 투사기 및 역투사기를 구현하기 위한 대표적 방법들의 성능을 정량적으로 비교한다. 각 구현방법에 있어서 투사-역투사 계산에 필요한 연산량을 줄이기 위해 이전에 계산된 결과들을 재사용함으로써 불필요하게 반복되는 연산들을 최소화하도록 하는 방법에 고찰한다. 실험결과에 의하면 선추적법은 연산속도 면에서 다른 방법에 비해 우수할 뿐 아니라, 정확성이 높은 개선된 영상을 제공하는 것으로 나타났다.

HSS기반의 고속 LDPC 복호기 연구 (A Study on High Speed LDPC Decoder Based on HSS)

  • 정지원
    • 한국정보전자통신기술학회논문지
    • /
    • 제5권3호
    • /
    • pp.164-168
    • /
    • 2012
  • 본 논문에서는 DVB-S2 표준안에서 권고되고 있는 irregular LDPC 부호의 고속화 방안에 대한 연구를 하였다. LDPC 복호기에서는 많은 반복횟수와 많은 연산량이 복호 속도 저하의 원인이 되고 있으며, 성능 저하 없이 반복횟수와 연산량을 감소하기 위해서 HSS 기반의 LDPC 복호 구조를 제시하였다. 결과 반복횟수를 성능 저하 없이 절반으로 줄일 수 있으며, 이를 효율적인 설계방안을 제시하였다. 결과 600Mbps급의 throughput을 갖는 LDPC 복호기를 구현 가능케 하였다.

AVX2 명령어 집합을 이용한 고속 HEVC 역-변환 구현 (Implementation of Fast HEVC Inverse Transform using AVX2 Instruction Set)

  • 목정수;마종현;안용조;심동규
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2015년도 하계학술대회
    • /
    • pp.552-554
    • /
    • 2015
  • 본 논문은 AVX2 (Advanced Vector eXtension 2) 명령어 집합을 이용하여 HEVC (High Efficiency Video Coding) 복호화기의 역-변환 모듈을 고속화하는 방법을 제안한다. AVX2 명령어 집합은 256 비트 레지스터를 사용하여 다수의 데이터를 한번의 명령을 통해 병렬적으로 연산할 수 있으며 반복적인 산술 연산 혹은 논리 연산 구조에서 효율적이다. 제안하는 방법은 AVX2 명령어 집합을 이용하여 $8{\times}8{\sim}32{\times}32$ 크기의 TU (Transform Unit) 단위로 수행되는 역-변환 연산을 행렬의 곱 형태로 연산하여 고속화하였다. 실험 결과 AVX2 명령어 집합을 이용한 역-변환 연산은 Chen 알고리즘에 비해 평균 51% 속도 향상을 보였으며 SSE (Streaming SIMD Extension) 명령어 집합을 이용한 연산에 비해 평균 20%의 속도 향상 결과를 얻을 수 있었다.

  • PDF

CUDA의 메모리 복사로 인한 성능 저하 연구 (A Study on a Declines in Performance by Memory Copy in CUDA)

  • 강지훈;이대원;강인성;유헌창
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.135-138
    • /
    • 2013
  • GPGPU(General Purpose Graphics Processing Unit) 병렬처리 시스템인 CUDA(Compute Unified Device Architecture)는 컴퓨터에서의 고속 연산 처리를 위해 많이 사용되어왔다. CUDA에서 연산 처리를 하기 위해서는 CUDA의 특성을 이해해야 한다. CUDA는 CPU(Central Processing Unit)가 처리하는 Host 영역과 GPU(Graphics Processing Unit)가 처리하는 영역인 Device 영역이 존재하며, 이 두 영역간의 데이터 복사를 통해 연산 처리를 진행한다. 이런 구조적인 특성상 메인 메모리에서 GPU 메모리로 입력 데이터를 전달해야 GPU를 이용해 연산을 처리할 수 있는 구조를 가지고 있다. 하지만 이러한 처리 구조로 인해 연산 시간과 별도로 메인 메모리와 GPU 메모리간의 데이터 복사시간이 존재하며, 추가적으로 발생하는 메모리 복사 시간으로 인해 오버헤드가 발생하게 된다. 본 논문에서는 실험을 통해 메모리 복사 시간, 연산의 반복 횟수 그리고 연산의 복잡성이 전체 성능에 어떤 영향을 미치는지 논하고자 한다.

고성능/저전력 3D 기하 연산을 위한 오프라인 CORDIC 벡터회전 알고리즘 (Off-line CORDIC Vector Rotation Algorithm for High-Performance and Low-Power 3D Geometry Operations)

  • 김은옥;이정근;이정아
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권8호
    • /
    • pp.763-767
    • /
    • 2008
  • 본 논문에서는 모바일 환경에서의 3D 그래픽 처리에 효과적인 고성능/저전력의 CORDIC 구조를 구성하기 위하여 각도 기반 검색(ABS)과 스케일링 효과를 고려한 검색(SCS)과 같은 두 가지 오프라인 벡터링 방법을 제안하고 이를 통해 연산의 반복횟수를 줄이는 알고리즘을 개발한다. ABS 알고리즘은 3차원 벡터를 두 각으로 표현하고 이를 검색의 기준으로 삼았고, SCS 알고리즘은 단위 벡터를 기준으로 하여 벡터 회전 시에 최소의 반복 연산만으로도 원하는 회전을 수행할 수 있는 최적의 기본각 회전 시퀀스를 오프라인으로 미리 검색하여 적용한다 본 논문에서 제안하는 ABS, SCS 알고리즘을 통해 지연을 각각 50% 감소시킬 수 있었으며, 이와 함께 voltage scaling 기술을 적용하여 전력 소모를 크게 감소시킬 수 있음을 논의한다.

GPGPU 병렬 프로그래밍을 이용한 H.264/AVC 고속 화면내 예측 모드 결정 (H.264/AVC Fast Intra Mode Decision using GPGPU Parallel Programming)

  • 최성준;한기훈;유영수
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2011년도 추계학술대회
    • /
    • pp.110-112
    • /
    • 2011
  • GPU의 병렬성과 연산능력을 일반적인 공학적 문제 해결에 적용하는 GPGPU 컴퓨팅에 대한 연구가 최근 활발히 진행되고 있다. 비디오 압축과정에는 많은 양의 화소 데이터에 동일하게 반복되는 연산을 수행하는 알고리즘이 많이 적용되므로 GPGPU를 통한 고속 병렬 계산의 응용 분야로 매우 적합하다. H.264/AVC는 비디오를 압축하는 가장 최신의 국제표준으로 여러 제품군과 서비스에 대한 적용되어 시장에서 널리 사용되고 있다. 본 논문에서는 GPGPU의 응용 분야로 주목 받고 있는 비디오 압축 분야에 대한 적용으로 H.264/AVC의 화면내 예측 모드 결정과정에 GPGPU 병렬 프로그래밍을 적용하여 예측 모드 결정 속도를 향상하는 방법을 제안한다. GPU상에서의 데이터 병렬처리를 위해 CUDA C언어를 사용하였으며, CPU상에서의 연산은 C언어를 사용하여 구현되었다. GPU상에서 프레임 전체에 대한 화면내 예측 모드를 병렬적으로 결정함으로써 이에 소요되는 시간을 줄여 줄 수 있었다. 실험결과 GPU상에서 병렬적으로 예측 모드를 결정할 때 Full-HD급 영상에서 약 2.8배 정도의 속도 향상을 확인할 수 있었다. 향후 GPGPU 병렬 프로그래밍을 화면 내 예측뿐만 아니라 반복되는 연산을 수행하는 다른 알고리즘에도 적용하여 부호화기의 계산 부담을 덜어준다면 고속 실시간 비디오 압축 부호기 개발이 더욱 용이해 질것으로 기대된다.

  • PDF

저면적 RSA를 위한 효율적인 Montgomery 곱셈기 하드웨어 설계 (Hardware Design of Efficient Montgomery Multiplier for Low Area RSA)

  • ;류광기
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2017년도 추계학술대회
    • /
    • pp.575-577
    • /
    • 2017
  • 공개 키 암호화에서 RSA 알고리즘은 연산시간이 높은 modular 지수 연산을 사용한다. RSA의 modular 지수 연산은 반복되는 modular 곱셈을 통해 연산한다. 빠른 해독 및 암호화 속도를 가지는 높은 효율의 RSA 알고리즘을 위해 수년간 빠른 modular 곱셈 알고리즘이 연구되었다. 그러나, Montgomery 곱셈은 추가적인 피연산자(반복 루프가 있는 3개의 피연사자)에 의해 캐리 전파 지연이 발생되는 단점이 있다. 본 논문에서는 RSA 암호화 시스템의 가벼운 어플리케이션을 위한 Montgomery 곱셈의 면적을 줄이는 하드웨어 구조를 제안한다. 제안된 하드웨어 구조는 90nm 셀 라이브러리 공정에서 합성한 결과 884.9MHz에서 84k 게이트 수를 가지며, 250MHz에서 56k 게이트수를 가진다.

  • PDF

EPA-SWMM과 지표수 흐름방향 결정 알고리즘을 결합한 도시침수 모형의 개발 (Development of Urban Flooding Model: Coupling to EPA-SWMM Engine and Surface Flow Path Algorithm)

  • 이선민;김종천;윤하늬
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.305-305
    • /
    • 2021
  • XP-SWMM은 EAP-SWMM의 Runoff 기능을 보완하고 2D 해석 기능을 새롭게 추가하여 만든 외산(XP Solutions) 프로그램으로 도시유역 유출량 산정, 우수관거 추적 등과 같은 모의가 가능한 종합 모형이다. 그 중 2차원 분석 기능(2D XP-SWMM)은 연산 결과를 Tu-Flow 모형에 대입한 도시침수 해석모형으로 실무에서 주로 사용되고 있다. 그러나 XP-SWMM은 수량 부분 외에도 수질 부분의 다양한 모형이 통합되어 있어 라이센스 가격이 상당히 높고, 국내 환경에 적합한 모형 수정 등 기술지원을 받기 어렵다는 단점을 갖고 있다. 또한, 실무 활용성이 높은 2차원 분석기능의 경우 모의에 소요되는 시간이 크다는 한계점을 갖고 있다. 2D XP-SWMM 연산의 소요시간이 큰 주요 원인은 계산 시간간격마다 큰 셀수의 행렬 계산을 반복하기 때문이며, 격자를 촘촘하게 설정할수록(행렬의 수가 증가할수록) 수치해석에 소요되는 시간은 기하급수적으로 늘어나게 된다. 2D XP-SWMM 연산은 편미분방정식을 계산하는 모형으로 반복법을 채택하고 있기 때문에 짧은 시간내에 침수해석을 진행해야하는 웹기반 초단기 홍수예경보 시스템 등에 활용하기에는 적합하지 않다. 본 연구에서는 2D XP-SWMM 보다 연산속도를 향상시킨 2차원 도시침수 모형을 개발하였다. 기존 XP-SWMM 중심의 실무 적용성을 유지하고자 XP-SWMM과 동일하게 EPA-SWMM 엔진을 활용하였고 DEM 기반의 지표수 흐름방향 결정 알고리즘을 결합하였다. 본 연구에서 개발한 도시침수 모형 결과를 울산광역시, 청주시 등 도심지에서 발생한 과거 침수피해의 양상과 비교하여 그 타당성을 검증하였다.

  • PDF

파생 상품의 가치 평가를 위한 몬테카를로 알고리즘에 기반한 병렬 스프레드시트 (A Parallel Spreadsheet-based Monte Carlo Algorithm for Financial Derivatives Pricing)

  • 이재근;김진석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (1)
    • /
    • pp.1006-1008
    • /
    • 2005
  • 최근에 계산금융 분야에서 복잡한 수식을 이용한 연산이 증가하고 있다. 그리고 계산금융 분야에서 몬테카를로 시뮬레이션은 대표적인 계산방법 중에 하나이다. 그러나 몬테카를로 시뮬레이션은 많은 반복연산을 수행하므로 연산시간이 오래 걸리는 문제점이 있다. 이러한 문제점을 해결하기 위하여 본 논문에서는 몬테카를로 시뮬레이션과 스프레드시트를 병렬로 처리하였다. 또한 실험을 통하여 병렬 스프레드시트의 계산 노드가 증가함에 따라 파생상품의 계산 시간이 단축되는 것을 보였다.

  • PDF