• 제목/요약/키워드: 연산 효율

검색결과 2,609건 처리시간 0.029초

비균등 메모리 접근 구조에서의 효율적인 그룹화 집단 연산의 처리 (Efficient Processing of Grouped Aggregation on Non-Uniformed Memory Access Architecture)

  • 최성준;민준기
    • 데이타베이스연구회지:데이타베이스연구
    • /
    • 제34권3호
    • /
    • pp.14-27
    • /
    • 2018
  • 최근, 대칭형 다중 처리 (SMP: Symmetric Multiprocessing) 구조에서 발생하는 메모리 병목 현상을 보완하기 위하여 비균등 메모리 접근 구조 (NUMA: Non-Uniform Memory Access) 구조가 제시되었다. 또한, 집단 연산자는 데이터의 특성 및 요약 정보를 제공하는 주요 연산자로써, 집단 연산자의 효율성은 전체 시스템의 성능에 매우 큰 영향을 미친다. 따라서, 본 논문에서는 NUMA 구조에서 효율적으로 집단 연산을 처리할 수 있는 기법을 제안한다. 제안 기법은 분할 단계와 합병 단계로 구성되며, 분할 단계에서 그룹 속성에 따라서 대상 릴레이션을 부분 릴레이션들로 분할한다. 따라서, 각 쓰레드가 독립적으로 부분 릴레이션에 대하여 집단 연산을 수행할 수 있으므로 합병 단계에서 원격 메모리 접속이 발생하지 않도록 하였다. 또한, 합병 단계에서는 각 쓰레드가 지역 해시 테이블을 이용하여 집단 연산을 수행하도록 하고 쓰레드들이 생성한 집단 연산 결과들을 하나로 병합하는데 잠금 경쟁이 발생하지 않도록 하여 처리 성능을 향상하였다.

GPU 연산을 활용한 유사이송 예측모형 개발 (Development of the sediment transport model using GPU arithmetic)

  • 노준수;손상영
    • 한국수자원학회논문집
    • /
    • 제56권7호
    • /
    • pp.431-438
    • /
    • 2023
  • 전 세계적으로 연안침식 문제가 대두됨에 따라 많은 해안선이 지형변화를 겪고 있다. 기후변화 및 해안인구증가로 미루어 볼 때 그 현상은 가속화될 수 있으며, 이에 대응하기 위해 신속하게 지형변화를 모의할 수 있는 유사이송 예측모형 개발의 중요성이 강조된다. 본 연구에서는 GPU (Graphics Processing Unit)를 기반으로 한 유사이송 예측모형을 제안하였으며, GPU 병렬연산을 활용함으로써 기존의 CPU 기반모형 대비 더욱 개선된 속도로 지형변화를 모의할 수 있도록 모형이 개발되었다. 개발된 모형에 대해 수치모형 성능과 GPU 연산효율에 초점을 맞추어 분석을 수행하였다. 모형의 성능검증을 위해 Dam-break 수리실험에 대해 수치모의를 수행하였으며, 모의결과가 관측된 실험데이터와 잘 일치하는 것을 확인하였다. GPU 연산효율은 CPU 기반모형과 수치모의 연산시간을 비교하여 분석하였으며, 개발된 GPU 기반모형이 연산시간의 효율이 상당히 우수한 것으로 확인되었다.

분산 공간 데이터베이스 시스템에서 R+-tree를 이용한 병렬 분산 공간 죠인 기법 (Parallel Distributed Spatial Join Method using R+ -tree In Distributed Spatial Database Systems)

  • 김종현;김재홍;배해영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.67-69
    • /
    • 2002
  • 여러 사이트에서 구축된 공간 데이터를 효율적으로 관리 및 공유하기 위해서는 대용량의 정보를 처리할 수 있는 분산 공간 데이터베이스 시스템의 사용이 필수적이다. 이러한 분산 공간 데이터베이스 시스템상에서의 분산 공간 죠인 질의는 공간 데이터의 대용량성과 그 복잡성으로 인하여 공간 연산의 지펴져 부하와 네트워크상의 전송 부하를 발생시킨다. 이러한 문제를 해결하기 위해 세미죠인 기반의 공간 죠인 기법들이 제안되었으나 공간 죠인 연산을 특정 서버에서만 수행하여 병목현상을 발생시키기 때문에 결국 질의 처리시간이 증가된다. 본 논문은 이러한 분산 공간 데이터베이스 시스템에서 수행 비용이 많이 드는 원격 사이트간의 공간 죠인 연산에 대해 R+-tree 공간 색인을 사용하여 병렬적으로 수행하는 기법을 제안한다. 본 기법은 R+-tree 공간 색인을 이용하여 공간 죠인 연산의 대상이 되는 릴레이션들을 중첩이 없는 두개의 릴레이션들로 분할한 후 질의 수행에 참여하는 두 서버에 죠인 연산을 분배하고 병렬적으로 처리하여 결과들을 병합한 다음 클라이언트에게 전송만다. 본 기법은 릴레이션을 분할하여 각 서버에서 공간 죠인 연산을 병렬적으로 처리하므로 처리 비용을 절반으로 감소시키며. R+-tree의 영역에 해당하는 객체들만 죠인 연산에 참여하게 함으로써 네트워크 전송 비용을 감소시킨다

  • PDF

임베디드 데이터베이스에서의 그림자 페이지 기반 지연 갱신 기법 (Lazy-Update Scheme based on Shadow Paging in Embedded Database)

  • 박재관;박기용;김영기
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.49-52
    • /
    • 2011
  • 모바일 폰에서는 데이터 저장을 위해 낸드 플래시 메모리가 널리 사용하고 있다. 그리고 제한된 리소스 환경임에도 데이터의 효율적인 관리를 위해 임베디드 데이터베이스 시스템을 탑재하는 모델이 점차 늘고 있다. 플래시 메모리의 쓰기 연산은 읽기 연산에 비해 고비용의 연산이며 쓰기 연산이 많을수록 빈 블록을 더 빠르게 소모시켜 고비용의 지우기 연산을 유도하므로 성능 저하를 유발하는 특징이 있다. 본 논문에서는 리소스가 제한적인 모바일 폰에 적용되는 데이터베이스에서의 쓰기 연산 최소화를 위한 지연 갱신 기법을 제안한다. 이 기법은 기존의 그림자 페이지 기법을 모바일 환경에 맞도록 변형하여 플래시 메모리의 쓰기 및 지우기 연산을 감소시켜 데이터베이스의 성능을 향상 시킨다.

AVX2 명령어 집합을 이용한 고속 HEVC 역-변환 구현 (Implementation of Fast HEVC Inverse Transform using AVX2 Instruction Set)

  • 목정수;마종현;안용조;심동규
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2015년도 하계학술대회
    • /
    • pp.552-554
    • /
    • 2015
  • 본 논문은 AVX2 (Advanced Vector eXtension 2) 명령어 집합을 이용하여 HEVC (High Efficiency Video Coding) 복호화기의 역-변환 모듈을 고속화하는 방법을 제안한다. AVX2 명령어 집합은 256 비트 레지스터를 사용하여 다수의 데이터를 한번의 명령을 통해 병렬적으로 연산할 수 있으며 반복적인 산술 연산 혹은 논리 연산 구조에서 효율적이다. 제안하는 방법은 AVX2 명령어 집합을 이용하여 $8{\times}8{\sim}32{\times}32$ 크기의 TU (Transform Unit) 단위로 수행되는 역-변환 연산을 행렬의 곱 형태로 연산하여 고속화하였다. 실험 결과 AVX2 명령어 집합을 이용한 역-변환 연산은 Chen 알고리즘에 비해 평균 51% 속도 향상을 보였으며 SSE (Streaming SIMD Extension) 명령어 집합을 이용한 연산에 비해 평균 20%의 속도 향상 결과를 얻을 수 있었다.

  • PDF

타원 곡선 암호 알고리즘의 네배점 스칼라 연산 (Point Quadruple Operation on Elliptic Curve Cryptography Algorithm)

  • 문상국;허창우;유광열
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2004년도 춘계종합학술대회
    • /
    • pp.784-787
    • /
    • 2004
  • 타원곡선 암호시스템에서의 가장 줄기가 되는 연산은 스칼라 곱셈 연산이다. 본 논문에서는 기존의 두배점-덧셈 (double-and-add) 알고리즘으로 처리하였던 스칼라 곱셈 연산을 개선하여 네배점-덧셈(fund-and-add) 알고리즘을 사용하기 위하여 네배점 (point quadruple) 연산을 유도한다. 유도된 식은 C 프로그램을 사용하여 실제 계산에 응용하여 증명하였다. 네배점 스칼라 연산은 타원곡선 암호시스템의 효율적이고 빠른 연산을 처리하는데 응용될 수 있다.

  • PDF

제내지 침수해석을 위한 병렬연산기법의 비교

  • 박재홍
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.296-296
    • /
    • 2017
  • 본 연구에서는 대규모 유역에서 발생하는 침수 현상을 모의하기 위한 강력하고 정확하며 연산효율이 뛰어난 수치해석 모형을 개발하는 데 있다. 개발된 모형은 확산파 모형을 기본으로 하였고 다수의 코어를 동시적으로 해석하는 병렬연산 기법을 부가하였다. 홍수로 인한 대규모 유역에서의 침수해석은 오랜 시간의 연산 비용을 필요로 한다. 특히 수치화된 지형정보의 이용이나 고정밀 사진 측량 등의 방법을 이용하여 정밀하고 넓은 유역의 디지털 지형자료를 이용한 2 차원 침수해석은 연산 연산의 문제를 더욱 어렵게 할 수 있다. 그러므로 본 연구에서는 제내지나 하류 유역에 발생하는 홍수로 발생된 빠른 침수모의를 위해 병렬화된 침수 해석 모형을 이용하여 병렬 해석 모형의 적용성을 검토하고자 하였다. 연구를 위해 MPI 및 OpenMP 기법을 이용하여 2 차원 침수해석 프로그램의 원시코드를 개선하고 실제 제내지 및 실제 댐 하류유역에 적용하였다. 개발된 모형은 실제 제내지에 적용한 결과를 MPI, OpenMP 병렬해석 기법과 기존의 순차적 모형의 결과를 비교하였다. 모형들의 결과를 제내지의 침수양상, 침수 속도벡터의 방향 및 크기 등의 계산 결과 순차적 모형, MPI 및 OpenMP 모형과의 비교하여 연산 시간은 병렬 해석 모형이 우월함을 보였다.

  • PDF

고성능 HEVC 복호기를 위한 화면내 예측기의 효율적인 하드웨어 설계 (An Efficient Hardware Design of Intra Predictor for High Performance HEVC Decoder)

  • 정홍균;강석민;류광기
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.668-671
    • /
    • 2012
  • 본 논문에서는 차세대 비디오 압축 표준인 HEVC(High Efficiency Video Coding) 복호기의 연산량과 하드웨어 면적을 감소시키기 위하여 화면내 예측 하드웨어 구조를 제안한다. 제안하는 하드웨어 구조는 공통 수식에 대한 연산을 공유하는 공유 연산기를 사용하여 연산량 및 연산기 개수를 감소시키고, $4{\times}4$ PU와 $64{\times}64$ PU의 필터링 수행 여부에 대한 연산을 수행하지 않고 나머지 PU에 대해서는 LUT를 이용하여 연산을 수행하기 때문에 연산량 및 연산 시간을 감소시킨다. 또한 하나의 공통 연산기만을 사용하여 예측 픽셀을 생성하기 때문에 하드웨어 면적이 감소한다. 제안하는 구조를 TSMC 0.18um 공정을 이용하여 합성한 결과 최대 동작 주파수는 100MHz이고, 게이트 수는 140,697이다. $4{\times}4$ PU를 기준으로 제안하는 구조의 처리 사이클 수는 11 사이클로 기존 구조 대비 54% 감소하였고, 16개 참조 픽셀의 필터링 처리를 기준으로 제안하는 구조의 덧셈 연산기 개수는 37개로 표준 draft 6에 비해 22.9% 감소하였다.

전력 분석 공격에 안전한 효율적인 SEED 마스킹 기법 (Efficient Masking Method to Protect SEED Against Power Analysis Attack)

  • 조영인;김희석;최두호;한동국;홍석희;이옥연
    • 정보처리학회논문지C
    • /
    • 제17C권3호
    • /
    • pp.233-242
    • /
    • 2010
  • 전력분석 공격이 소개되면서 다양한 대응법들이 제안되었고 그러한 대응법들 중 블록 암호의 경우, 암/복호화의 연산 도중 중간 값이 전력 측정에 의해 드러나지 않도록 하는 마스킹 기법이 잘 알려져 있다. SEED는 비선형 연산으로 32 비트 덧셈 연산과 S-box 연산을 동시에 사용하고 각 연산에 대한 마스킹 방법이 조화를 이룰 수 있도록 마스킹 형태 변환 과정이 필요하다. 본 논문에서는 SEED의 구조적 특성을 고려하여, 연산 시간이 많이 필요한 마스킹 형태 변환 횟수를 최소화 하도록 새로운 마스킹 S-box 설계법을 제안한다. 또한 마스킹 S-box 테이블을 하나만 생성하고 이것으로 나머지 마스킹 S-box 연산을 대체할 수 있는 연산식을 만들어 기존 마스킹 기법에 비해 마스킹 S-box로 인한 RAM 사용량을 절반으로 줄여 메모리 크기면에서도 효율적이도록 구성하였다.

공간 효율적인 비트-시리얼 제곱/곱셈기 및 AB$^2$-곱셈기 (Area Efficient Bit-serial Squarer/Multiplier and AB$^2$-Multiplier)

  • 이원호;유기영
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제31권1_2호
    • /
    • pp.1-9
    • /
    • 2004
  • 현대 통신 분야에서 많이 응용되고 있는 유한 필드상의 중요한 연산은 지수승과 나눗셈, 역원 둥이 있다. 유한 필드에서 지수 연산은 이진 방법을 이용하여 곱셈과 제곱을 반복함으로서 구현될 수 있고, 나눗셈이나 역원 연산은 A$B^2$ 연산을 반복함으로서 구현될 수 있다. 그래서 이러한 연산들을 위한 빠른 알고리즘과 효율적인 하드웨언 구조 개발이 중요하다. 본 논문에서는 차수가 m인 기약 AOP에 의해 생성되는 $GF(2^m)$상의 제곱과 곱셈을 동시에 할 수 있는 새로운 구조의 비트-시리얼 제곱/곱셈기와 $AB^2$ -곱셈기를 구현하였다. 제안된 연산기들은 지수기와 나눗셈 및 역원기의 핵심 회로로 사용될 수 있으며 기존의 연산기들과 비교하여 보다 작은 하드웨어 복잡도를 가진다. 그리고 제안된 구조는 정규성과 모듈성을 가지기 때문에 VLSI 칩과 같은 하드웨어로 쉽게 구현함으로써 IC 카드에 이용될 수 있다.