• 제목/요약/키워드: Matrix Multiplication

검색결과 167건 처리시간 0.024초

NIST PQC Rainbow의 효율적 유한체 연산 구현 (Efficient Implementation of Finite Field Operations in NIST PQC Rainbow)

  • 김광식;김영식
    • 정보보호학회논문지
    • /
    • 제31권3호
    • /
    • pp.527-532
    • /
    • 2021
  • 본 논문에서는 미국 NIST PQC 표준화 Final List 알고리즘 중 유일한 다변수이차방정식(multivariate quadratic equation) 기반의 전자 서명인 Rainbow 알고리즘에서의 효율적인 유한체 연산 방법을 제안한다. Chou 등은 최근 Rainbow를 Cortex-M4에서 구현하기 위한 새로운 효율적 구현 방법을 제시하였다. 본 논문은 Chou 등이 제안한 방법을 개선하여 기존 대비 XOR 연산의 숫자를 13.7% 이상 감소할 수 있는 새로운 곱셈 방법을 제안한다. 또한, 테이블 룩업(Table Lookup)으로 수행되던 상에서의 역원 연산을 4x4 행렬 역원으로 치환하여 연산하는 방법을 제시한다. 또한, 새로운 구현을 RaspberryPI 3B+상에서 구현하여 성능을 측정하였다.

유한요소 비압축성 유동장 해석을 위한 이중공액구배법의 GPU 기반 연산에 대한 연구 (A Study on GPU Computing of Bi-conjugate Gradient Method for Finite Element Analysis of the Incompressible Navier-Stokes Equations)

  • 윤종선;전병진;정혜동;최형권
    • 대한기계학회논문집B
    • /
    • 제40권9호
    • /
    • pp.597-604
    • /
    • 2016
  • 본 연구에서는 GPU를 이용한 비압축성 유동장의 병렬연산을 위하여, P2P1 유한요소를 이용한 분리 알고리즘 내의 행렬 해법인 이중공액구배법(Bi-Conjugate Gradient)의 CUDA 기반 알고리즘을 개발하였다. 개발된 알고리즘을 이용해 비대칭 협착관 유동을 해석하고, 단일 CPU와의 계산시간을 비교하여 GPU 병렬 연산의 성능 향상을 측정하였다. 또한, 비대칭 협착관 유동 문제와 다른 행렬 패턴을 가지는 유체구조 상호작용 문제에 대하여 이중공액구배법 내의 희소 행렬과 벡터의 곱에 대한 GPU의 병렬성능을 확인하였다. 개발된 코드는 희소 행렬의 1개의 행과 벡터의 내적을 병렬 연산하는 커널(Kernel)로 구성되며, 최적화는 병렬 감소 연산(Parallel Reduction), 메모리 코얼레싱(Coalescing) 효과를 이용하여 구현하였다. 또한, 커널 생성 시 워프(Warp)의 크기에 따른 성능 차이를 확인하였다. 표준예제들에 대한 GPU 병렬연산속도는 CPU 대비 약 7배 이상 향상됨을 확인하였다.

위험 매트릭스(Risk Matrix)를 활용한 조류인플루엔자 인체감염증 위험지역 평가 (High-Risk Area for Human Infection with Avian Influenza Based on Novel Risk Assessment Matrix)

  • 박성대;유대성
    • 한국가금학회지
    • /
    • 제50권1호
    • /
    • pp.41-50
    • /
    • 2023
  • AI인체감염증은 한번 발생하게 되면 막대한 사회경제적 손실이 있으므로, 사전 예방적 관리가 필수적이다. 위험도 평가를 통해 위험요인과 위험지역을 확인하여 방역을 강화하고 사람, 동물, 환경 등 소관 부처 간 분산되어 있는 방역정책 및 관리를 원헬스 차원으로 협업·연계한다면 사회경제적 비용을 최소화할 수 있다. 이번 연구에서는 위험 매트릭스 분석을 통해 가금농장의 고병원성AI와 연계하여 AI인체감염증의 발생 위험지역을 평가하고 위험요인을 분석하였다. AI인체감염증은 가금농장의 고병원성AI와 밀접한 관련이 있고 가금관련 산업 종사자가 가장 감염에 취약한 위험군이기 때문에, 위험 매트릭스는 가금농장의 고병원성AI 평균 발생 건수와 감염에 취약한 가금 관련 축산시설 수를 활용하여 분석하였다. 조류인플루엔자 유행시기에 시·군·구별로 가금농장의 HPAI 평균 발생건수를 예측하기 위해 일반화 선형모형 중 과대산포가 있는 가산자료를 분석하는데 이용되는 음이항 회귀모형을 적용하였다. 시·군·구별 가금농장의 고병원성AI 발생건수와 축산시설 수를 적용한 위험 매트릭스 분석 결과, AI인체감염증의 발생위험이 높아 관리가 필요한 지역은 전남 나주, 전북 정읍, 전북 남원으로 확인되었다. 또한, AI 인체감염증의 발생에 영향을 줄 수 있는 위험요인으로는 가금농장의 저병원성 AI 발생건수, 닭과 오리의 사육 밀도, 축산차량 등록 수로 확인되었다. 가금농장에서 저병원성AI가 1건 발생 시 가금농장의 고병원성AI 발생은 1.687배 증가하고, 닭과 오리의 밀도가 1,000 두/km2 증가할 경우 가금농장의 고병원성AI 발생은 각각 1.618배, 10.252배 증가하며, 축산차량의 경우 100대 증가 시 가금농장의 고병원성AI 발생이 1.134배 증가하는 것으로 나타났다. AI인체감염증의 예방을 위해 HPAI의 발생주기인 2~3년 간격으로 위험평가를 실시하고 환경·동물·사람에 대하여 원 헬스(One Health)적 관점으로 위험요인과 위험지역을 관리한다면, AI인체감염증에 대한 방역정책 수립과 사회·경제적 비용 감소에 도움이 될 수 있을 것으로 판단된다.

가잠의 전염성 연화병 및 농핵병 바이러스 증식에 관한 연구 (Multiplication of Infectious Flacherie and Densonucleosis Viruses in the Silkworm, Bombyx mori)

  • 김근영;강석권
    • 한국잠사곤충학회지
    • /
    • 제25권2호
    • /
    • pp.1-31
    • /
    • 1984
  • 가잠에 있어서 피해가 많은 전염성 연화병(Flacherie Virus; FV)과 농핵병 바이러스(Densonucleosis virus; DNV)의 증식에 관한 연구를 행하기 위하여 서당밀도 구배 초원심분리법에 의한 양바이러스의 정제 및 전자현미경에 의한 관찰, 바이러스 감염잠의 중장과 체액에서의 핵산과 단백질의 변동 및 감염중장 피막세포의 전자현미경에 의한 병리조직학적 관찰 등, 일연의 조사를 통하여 다음과 같은 연구결과를 얻었다. 1. 서당밀도구배에 의한 초원심분리법을 이용하여 FV 및 DNV를 분획한 결과, base line이 낮고 좌우상칭의 단일 peak를 나타내는 전형적인 바이러스 분획을 얻었으며, 또한 이들 바이러스의 negative 염색에 의한 전자현미경 관찰에서 FV는 27nm, DNV는 21nm의 균일한 구형입자임이 확인되었다. 2. 두 바이러스 감염잠의 체중은 바이러스 접종 6일 후부터, 중장중은 바이러스 접종 3일 후부터 건전잠에 비해 뚜렷한 감소를 나타냈다. 3. DNA의 양적 변화는 FV 및 DNV 감염잠에서 공히 중장에서는 전기간을 통해 건전잠에서 보다 높았고, 체액에서는 바이러스 접종 초ㆍ중기에는 큰 변화가 없고 바이러스 접종 7일 이후에는 건전잠에서 보다 훨씬 낮았다. 4. RNA의 양적 변화는 FV 및 DNV 감염잠에서 다같이 바이러스 접종 초기에 중장에서는 건전잠에 비해 높았고, 체액에서는 건전잠에 비해 매우 낮았으나, 바이러스 접종 말기에는 중장 및 체액의 경우 공히 건전잠에서 보다 현저히 낮았으며 그 정도는 DNV 감염잠에서 더 심했다. 5. FV 및 DNV 감염잠에서 중장과 체액의 단백질은 바이러스 접종 중기까지는 건전잠에 비해 큰 변화가 없었으나, 접종 말기에서는 건전잠에서 보다 월등히 낮았다. 6. 바이러스 접종 8일 후의 FV 및 DNV 감염잠 중장 RNA 전기영동상은 건전잠의 중장 RNA인 26S, 17S, 5S 및 4S의 4종 band와 동일했다. 7. FV 및 DNV 감염잠의 중장 단백질 전기영동상은 바이러스 접종 1일과 5일 후에는 건전잠의 것과 큰 차이가 없고, 접종 8일 후에는 건전잠에 존재하는 이동도가 낮은 L band가 양 바이러스 감염잠에서는 공히 소실되는 반면, 건전잠에서 볼 수 없는 이동도가 중간인 M band가 새로이 나타났으며 비교적 이동도가 높은 건전잠의 N band는 양 바이러스 감염잠에서는 2개로 분리되었다. 8. 체액단백질의 전기영동상은 FV 및 DNV감염잠 공히 건전잠의 것과 유사하나, 바이러스 접종 8일 후에는 양적인 감소를 나타내어 건전잠의 약 40%에 지나지 않았다. 9. FV 감염중장조직을 pyronin-methyl green 2종 염색을 하여 광학현미경으로 관찰한 결과, 바이러스 접종 8일 후의 중장원동세포내에서 A형 및 B형 봉입체가 형성되었음을 확인하였다. 10. FV감염 중장조직세포의 전자현미경 관찰에서는 바이러스 접종 5일 후에 배상세포의 'cytoplasmic wall'이 비대해지고 그 내부에 virus-specific vesicle이 형성되었으며, 바이러스 접종 8일 후에는 virus-specific vesicle, 바이러스 입자, linear structure, tubular structure 및 전자밀도가 높은 matrix 등의 바이러스 감염에 대한 특이적인 구조물이 배상세포의 세포질에서 관찰되었으며, microvilli내에서 바이러스 입자의 존재도 확정되었다. 특히 virus-specific vesicle 주위에서는 전자밀도가 높은 구형의 바이러스 입자 유사체가 관찰되었는데, 이것은 virus-specific vesicle 주위에서 바이러스 조립이 일어나는 것을 추정된다. 한편 원통세포 내에서 봉입체 관찰되고, 변형소구화된 배상세포가 중장강으로 탈락되는 것이 관찰되었다. 11. DNV감염 중장조직을 acridine orange 염색을 하여 형광현미경으로 관찰한 결과, DNV접종 5일 후에 본 바이러스 증식 장소인 원동세포핵의 비대가 뚜렷이 관찰되었다. 12. 전자현미경에 의해 DNV감염 중장조직세포를 관찰한 결과, 바이러스 접종 5일 후에 원동세포 핵내의 인이 소형 과립으로 붕괴되어 산재되었고, 접종 8일후에는 전자밀도가 높은 virogenic stroma가 출현하였으며, 감염 말기로 추정되는 핵내의 전자밀도가 전자보다 낮고 더욱 확대되어 핵의 대부분을 차지하는 virogenic stroma도 관찰되었다. 또한 이들 virogenic stroma내에서 바이러스 입자유사체가 관찰되는 것으로 보아 이 virogenic stroma는 바이러스 전구물질의 합성 및 바이러스 조립장소임을 시사하고 있다.

  • PDF

인터넷 기반 클러스터 시스템 환경에서 효율적인 부하공유 기법 (An Efficient Load-Sharing Scheme for Internet-Based Clustering Systems)

  • 최인복;이재동
    • 한국멀티미디어학회논문지
    • /
    • 제7권2호
    • /
    • pp.264-271
    • /
    • 2004
  • 인터넷기반의 클러스터 시스템 환경에서 부하공유 알고리즘은 네트워크의 특성 및 노드의 이질성에 따른 부하 불균형에 효과적으로 대처 할 수 있어야 한다. 본 논문에서 제안하는 효율적인 부하공유기법은 Weighted Factoring 알고리즘을 기반으로 스케줄러를 생성하고 여기에 적응할당정책과 개선된 고정 분할 단위 알고리즘을 적용하여 작업을 분배하는 것이다. 본 논문에서 적용한 적응할당정책은 상대적으로 작업속도가 느린 종노드의 작업을 빠른 종노드가 대신 수행하도록 하는 기법이며, 개선된 고정 분할 단위 알고리즘은 종노드의 계산시간과 데이터전송에 필요한 네트워크 통신시간을 겹치도록 하는 것이다. 제안된 알고리즘의 성능 평가를 위한 시스템 환경에서 멀티미디어 응용에 많이 사용되는 행렬의 곱셈 프로그램을 PVM을 통하여 실험한 결과, 본 논문에서 제안한 알고리즘이 NOW 환경에서 우수한 Send, GSS, Weighted Factoring 알고리즘보다 각각 75%, 79%, 그리고 17% 효율적임을 보였다.

  • PDF

전달 루틴의 병렬화를 통한 SAT 알고리즘의 GPGPU 가속화 (GPGPU Acceleration of SAT Algorithm with Propagation Routine Parallelization)

  • 강형주
    • 한국정보통신학회논문지
    • /
    • 제20권10호
    • /
    • pp.1919-1926
    • /
    • 2016
  • 대량의 데이터를 병렬적으로 처리할 수 있는 General-Purpose Graphics Processing Unit(GPGPU)가 최근 많은 분야에서 적용되고 있으며, 이는 전자 설계 자동화 분야에서도 예외가 아니다. SAT 알고리즘은 다양한 전자 설계 자동화 문제에 적용되는 대표적인 알고리즘 중 하나이다. GPGPU를 이용해서 SAT 알고리즘을 가속화하기 위해 노력이 이루어져 왔으나, SAT 알고리즘 자체의 특성으로 인해 병렬화에 어려움이 있어왔다. 이 논문에서는 SAT 알고리즘의 내부 과정 중 비교적 병렬화가 용이한 전달 루틴을 병렬화함으로써 GPGPU 가속화를 적용하였다. 전달 루틴이 희소 행렬의 곱셈과 유사한 점에 착안하여 데이터 구조를 구성하고 이에 맞추어서 병렬적인 전달 루틴을 작성하였다. 병렬적으로 동작하는 쓰레드들 사이의 데이터 손실을 방지하기 위해 아토믹(atomic) 연산을 이용하였다. 벤치마크 SAT 문제들에 대해 기존의 GPGPU 기반 SAT solver에 비해 성능이 10배 이상 향상되었음을 확인하였다.

인터넷 기반 클러스터 시스템 환경에서 부하공유 및 결함허용 알고리즘 (An Algorithm For Load-Sharing and Fault-Tolerance In Internet-Based Clustering Systems)

  • 최인복;이재동
    • 정보처리학회논문지A
    • /
    • 제10A권3호
    • /
    • pp.215-224
    • /
    • 2003
  • 인터넷 기반의 클러스터 시스템 환경에서 알고리즘의 이식성을 높이기 위해서는 네트워크의 특성 및 노드의 이질성에 따른 부하 불균형, 그리고 네트워크나 노드의 결함과 같은 다양한 수행환경의 변화에도 효과적으로 적응할 수 있어야 한다. 본 논문에서 제안하는 Expanded-WF 알고리즘은 Weighted Factoring 알고리즘을 기반으로 부하공유론 위하여 적응할당정책과 개선된 고정 분할 단위 알고리즘을 적용하고 결함허용을 위하여 작업을 중복 수행하는 기법을 적용한다. 적응할당정책으로는 느린 종노드의 작업을 빠른 종노드가 대신 수행하는 기법을 적용하였고, 개선된 고정 분할 단위 알고리즘은 네트워크의 통신시간과 계산시간을 겹치게 하는 것이다. 두 개의 네트워크 환경으로 구성된 이기종의 클러스터 환경에서 PVM을 이용한 행렬의 곱셈 프로그램으로 실험한 결과, 본 논문에서 제안한 알고리즘이 NOW 환경에서 효율적인 Send, GSS, Weighted Factoring 알고리즘보다 각각 55%, 63%, 그리고 20% 효율적임을 보였으며, 또한 결함허용도 가능함을 보였다.

DCT 영역 영상 크기 조절 방법들에 대한 PSNR 비교 (PSNR Comparison of DCT-domain Image Resizing Methods)

  • 김도년;최윤식
    • 한국통신학회논문지
    • /
    • 제29권10C호
    • /
    • pp.1484-1489
    • /
    • 2004
  • 비디오 프레임의 크기를 축소하거나 확대할 때, 응용에 따라서는 입력 및 출력이 8${\times}$8 블록 DCT 계수들로 구성되도록 할 필요가 있다. 선형 변환이고 유니터리(unitary) 변환의 일종인 DCT에는 행렬 곱셈에 대한 분배 법칙이 성립한다. 이러한 사실을 이용하여 두가드, 묵허지, 박 등은DCT 영역에서 비디오 프레임들의 크기를 축소하는 방법들을 제안하였다. 이러한 방식으로 영상을 축소 후 확대하면 원 영상의 저 주파수 DCT 계수들이 잘 보존된다. 즉, 원 상(축소되기 전의 영상)과 예측된 영상(축소 후 확대된 영상)의 차이를 부호화 해야 되는 경우 부호화 효율이 매우 높아진다. 이러한 것은 스케일러빌러터를 이용한 비디오 부호화에 바람직한 사실이다. 본 논문에서는 이전의 방식들의 연장선 상에서 가로 세로 각각 2:1로 축소하고 다시 2:1로 확대할 때 DCT 블록의 크기를 다양이 하였다. 실험에 의하면 DCT 블록 크기를 크게 할수록 PSNR 값이 커짐을 알 수 있었다. 그러나, 계산상의 복잡도 역시 커질 것으로 예상된다. 본 논문의 실험 결과는 압축 영역 영상 축소 및 확대를 위한 고속 알고리즘 개발에 중요한 데이터가 될 것으로 생각한다.

FPGA 기반 성능 개선을 위한 CIE1931 색역 변환 알고리즘의 최적화된 하드웨어 구현 (Optimized hardware implementation of CIE1931 color gamut control algorithms for FPGA-based performance improvement)

  • 김대운;강봉순
    • 한국정보통신학회논문지
    • /
    • 제25권6호
    • /
    • pp.813-818
    • /
    • 2021
  • 본 논문에서는 기존 CIE1931 색역 변환 알고리즘의 최적화된 하드웨어 구현 방법을 제안한다. 안개제거 알고리즘의 후처리 방법 중 비교적 연산량이 적은 기존 알고리즘은 연산 과정에서 Split multiplier를 사용한 큰 비트의 계산으로 하드웨어 자원 소모량이 크다는 단점이 있다. 제안하는 알고리즘은 기존 알고리즘의 미리 정의된 2번의 행렬 곱셈 연산을 하나로 줄임으로써 연산량 감소, 하드웨어 소형화를 실현하였고, Split multiplier 연산을 최적화시킴으로써 탑재하기에 더욱 효율적인 하드웨어를 구현하였다. 하드웨어는 Verilog HDL 언어로 설계하였고, Xilinx Vivado 프로그램을 이용한 논리합성 결과를 비교하여 4K 표준 환경에서 실시간 처리가 가능한 성능을 확인하였다. 또한, 2가지 FPGA에서의 탑재 결과를 통해 제안하는 하드웨어의 성능을 검증하였다.

LIN/CAN 차량용 인터페이스와 칼만 필터 기능을 통합한 차량용 ECU 설계 (Vehicle ECU Design Incorporating LIN/CAN Vehicle Interface with Kalman Filter Function)

  • 정선우;김용빈;이성수
    • 전기전자학회논문지
    • /
    • 제25권4호
    • /
    • pp.762-765
    • /
    • 2021
  • 본 논문에서는 자동차의 위치 및 자세 추정에 사용되는 칼만 필터 가속기를 내장한 차량용 ECU(electronic control unit)를 설계하고 구현하였다. 프로세서 코어는 RISC-V를 사용하였으며 칼만 필터의 행렬 연산을 수행하는 가속기, 차량 내 통신에 사용되는 CAN(controller area network) 제어기, 센서 연결에 사용되는 LIN(local interconnect network) 제어기를 내장하였다. 칼만 필터 연산은 시간 업데이트와 측정 업데이트의 두 단계로 나뉘며 시간 업데이트 단계에서는 현재 상태변수와 오차 공분산을 예측하고 측정 업데이트 단계에서는 입력값을 받아 칼만 이득을 계산하여 값을 보정한다. 보통 소프트웨어에서는 곱셈에 부동소숫점 연산을 사용하지만 본 논문에서는 하드웨어 면적을 줄이기 위해 정밀도 분석을 고려한 고정소숫점 곱셈기를 사용하였다. 설계된 ECU는 Verilog HDL을 이용하여 검증하였으며 28nm 실리콘 공정으로 구현하였다. 28nm 실리콘 공정으로 구현하였을 때 동작 주파수는 100MHz, 면적은 0.37mm2, 게이트 수는 76만 게이트였다.