• Title/Summary/Keyword: 산술 수행

Search Result 134, Processing Time 0.027 seconds

Kinematic Wave Rainfall-Runoff Model Using CUDA FORTRAN (CUDA FORTRAN을 이용한 운동파 강우유출모형)

  • Kim, Boram;Kim, Dae-Hong
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2018.05a
    • /
    • pp.271-271
    • /
    • 2018
  • 그래픽 처리 장치(GPU: Graphic Processing Units)는 그래픽 처리에 특화된 수많은 산술논리연산자 (ALU: Arithmetic Logic Unit)와 이에 관련된 인스트럭션Instruction)으로 인해 중앙 처리 장치(CPU: Central Processing Units) 보다 훨씬 빠른 계산 처리를 수행할 수 있다. 최근에는 FORTRAN에 의해 구현된 많은 수치모형들이 현실적인 모델링 방법의 발달로 인해 더 많은 계산량과 계산시간을 필요로 한다. 이 연구에서는 GPU 상의 범용 계산GPGPU : General-Purpose computing on Graphics Processing Units) 기반 운동파 강우유출모형(Kinematic Wave Rainfall-Runoff Model)이 CUDA(Compute Unified Device Architecture) FORTRAN을 사용하여 구현되었다. CUDA FORTRAN 운동파 강우유출모형의 계산 결과는 검증된 CPU 기반 운동파 강우유출모형의 계산 결과와 비교하여 검증되었으며, 잘 일치함을 보여 주었다. CUDA FORTRAN 운동파 강우유출모형은 CPU 기반 모형에 비해 약 20 배 더 빠른 계산 시간을 보였다. 또한 계산 영역이 커짐에 따라 CPU 버전에 비해 CUDA FORTRAN 버전의 계산 효율이 향상되었다.

  • PDF

A Study on Parallel I/O Technology in Filesystem for AI (AI를 위한 파일시스템 병렬 I/O 기술 연구)

  • Yoon, Junweon;Hong, Taeyeong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2022.11a
    • /
    • pp.49-51
    • /
    • 2022
  • 대규모 데이터를 처리하기 위해 머신러닝, 딥러닝과 같은 AI 활용 연구가 일반화되면서 시스템 환경 또한 병렬처리 연산에 강화된 가속기 기반의 이기종 아키텍처로 확산되고 있다. CPU 기반의 계산 환경과 달리 상대적으로 성능이 낮은 수천 개의 산술연산장치(ALU)를 활용해 쓰레드 방식으로 연산을 수행하며, I/O의 특성 또한 대규모의 데이터들이 수많은 연산장치에 전달되기 위한 Small I/O, High-throughput 처리 성능이 애플리케이션에 큰 영향을 끼친다. 본 논문에서는 병렬 컴퓨팅 환경에 AI 애플리케이션이 접목되면서 요구되는 스토리지, 파일시스템의 환경을 분석하고 나아가 성능 검증을 통해 I/O 특성을 파악하고자 한다.

A Design and Implementation of Threshold-adjusted Em Codec (Threshold-adjusted EZW Codec의 설계와 구현)

  • Chae, Hui-Jung;Lee, Ho-Seok
    • The KIPS Transactions:PartB
    • /
    • v.9B no.1
    • /
    • pp.57-66
    • /
    • 2002
  • In this paper, we propose a method for the improvement of EZW encoding algorithm. The EZW algorithm encodes wavelet coefficients using 4 symbols such as POS(POsitive), NEG(NEGative), IZ(Isolated Zero), and ZTR(ZeroTreeRoot) which are determined by the significance of wavelet coefficients. In this paper, we applied threshold to wavelet coefficients to improve the EZW algorithm. The coefficients below the threshold are adjusted to zero to generate more ZTR symbols in the encoding process. The overall EZW image compression system is constructed using run-length coding and arithmetic coding. The system shows remarkable results for various images. We finally present experimentation results.

Parallel Modular Multiplication Algorithm to Improve Time and Space Complexity in Residue Number System (RNS상에서 시간 및 공간 복잡도 향상을 위한 병렬 모듈러 곱셈 알고리즘)

  • 박희주;김현성
    • Journal of KIISE:Computer Systems and Theory
    • /
    • v.30 no.9
    • /
    • pp.454-460
    • /
    • 2003
  • In this paper, we present a novel method of parallelization of the modular multiplication algorithm to improve time and space complexity on RNS (Residue Number System). The parallel algorithm executes modular reduction using new table lookup based reduction method. MRS (Mixed Radix number System) is used because algebraic comparison is difficult in RNS which has a non-weighted number representation. Conversion from residue number system to certain MRS is relatively fast in residue computer. Therefore magnitude comparison is easily Performed on MRS. By the analysis of the algorithm, it is known that it requires only 1/2 table size than previous approach. And it requires 0(ι) arithmetic operations using 2ㅣ processors.

Channel Decoding Scheme in Digital Communication Systems (디지털 통신 시스템의 채널 복호 방식)

  • Shim, Yong-Geol
    • The Journal of the Convergence on Culture Technology
    • /
    • v.7 no.3
    • /
    • pp.565-570
    • /
    • 2021
  • A soft-decision decoding scheme of a channel code for correcting an error occurring in a receiver of a digital communication systems is proposed. A method for efficiently decoding by use of the linear and arithmetic structure of linear block codes is presented. In this way, the probability of decoding errors has been reduced. In addition, it is possible to reduce the complexity of decoding as well. Sufficient conditions for achieving optimal decoding has been derived. As a result, the sufficient conditions enable efficient search for candidate codewords. With the proposed decoding scheme, we can effectively perform the decoding while lowering the block error probability.

Development of Diffusive Wave Rainfall-Runoff Model Based on CUDA FORTRAN (CUDA FORTEAN기반 확산파 강우유출모형 개발)

  • Kim, Boram;Kim, Hyeong-Jun;Yoon, Kwang Seok
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2021.06a
    • /
    • pp.287-287
    • /
    • 2021
  • 본 연구에서는 CUDA(Compute Unified Device Architecture) 포트란을 이용하여 확산파 강우 유출모형을 개발하였다. CUDA 포트란은 그래픽 처리 장치(Graphic Processing Unit: GPU)에서 수행하는 병렬 연산 알고리즘을 포트란 언어를 사용하여 작성할 수 있도록 하는 GPU상의 범용계산(General-Purpose Computing on Graphics Processing Units: GPGPU) 기술이다. GPU는 그래픽 처리 작업에 특화된 다수의 산술 논리 장치(Arithmetic Logic Unit: ALU)로 구성되어 있어서 중앙 처리 장치(Central Processing Unit: CPU)보다 한 번에 더 많은 연산 수행이 가능하다. 이에 따라, CUDA 포트란기반 확산파모형은 분포형 강우유출모형의 수치모의 연산시간을 단축시킬 수 있다. 분포형모형의 지배방정식은 확산파모형과 Green-Ampt모형으로 구성되었고, 확산파모형은 유한체적법을 이용하여 이산화 하였다. CUDA 포트란기반 확산파모형의 정확성은 기존 연구된 수리실험 결과 및 CPU기반 강우유출모형과 비교하였으며, 연산소요시간에 대한 효율성은 CPU기반 확산파모형과 비교하였다. 그 결과 CUDA 포트란기반 확산파모형의 결과는 수리실험 결과 및 CPU기반 강우유출모형의 결과와 유사한 결과를 나타냈다. 또한, 연산소요시간은 CPU 기반 확산파모형의 연산소요시간보다 단축되었으며, 본 연구에 사용된 장비를 기준으로 최대 100배 정도 단축되었다.

  • PDF

An Analysis of the Effects of Zero on Children's Arithmetic Performances (영(0)이 초등학생들의 계산 수행에 미치는 영향 분석)

  • Kim, Soo-Mi
    • School Mathematics
    • /
    • v.11 no.4
    • /
    • pp.567-581
    • /
    • 2009
  • Many articles have reported that zero causes children's arithmetic errors. This article was designed to measure the effect of zero on children's arithmetic performances. For this, 222 of 3,4,5,6 graders in elementary school were tested with pencil and paper. The test were categorized into four parts: basic number fact, column subtraction, column multiplication, and column division. These data showed that the negative effect of zero on children's arithmetic was limited to several areas, concretely, multiplication facts with zero, column subtraction with numbers which have two successive zeros, column multiplication with numbers which have zero in a middle position, long division with zeros. But there was no evidence that students could self-control these negative effects of zero as grade went up. It implies that we should keep attention to children's arithmetic performance with zero in some special areas.

  • PDF

Texture Image Database Retrieval Using JPEG-2000 Partial Entropy Decoding (JPEG-2000 부분 엔트로피 복호화에 의향 질감 영상 데이터베이스 검색)

  • Park, Ha-Joong;Jung, Ho-Youl
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.32 no.5C
    • /
    • pp.496-512
    • /
    • 2007
  • In this paper, we propose a novel JPEG-2000 compressed image retrieval system using feature vector extracted through partial entropy decoding. Main idea of the proposed method is to utilize the context information that is generated during entropy encoding/decoding. In the framework of JPEG-2000, the context of a current coefficient is determined depending on the pattern of the significance and/or the sign of its neighbors in three bit-plane coding passes and four coding modes. The contexts provide a model for estimating the probability of each symbol to be coded. And they can efficiently describe texture images which have different pattern because they represent the local property of images. In addition, our system can directly search the images in the JPEG-2000 compressed domain without full decompression. Therefore, our proposed scheme can accelerate the work of retrieving images. We create various distortion and similarity image databases using MIT VisTex texture images for simulation. we evaluate the proposed algorithm comparing with the previous ones. Through simulations, we demonstrate that our method achieves good performance in terms of the retrieval accuracy as well as the computational complexity.

An Architecutre of Low Power MPEG-1/2 Layer-III Decoder Using Dual-core DSP (이중코어 DSP를 이용한 저전력 MPEG-1/2 계층-III 복호화기의 구조)

  • Lee Kyu-Ha;Lee Keun-Sup;Hwang Tae-hoon;Oh Hyun-O;Park Young-Chul;Youn Dae-Hee
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.339-342
    • /
    • 2000
  • 본 논문에서는 DSP와 RISC 마이크로 콘트롤러의 결합으로 구성된 이중 코어 DSP를 이용하여 휴대장치에 적합한 저전력 MPEC-2 계층-III 복호화기의 구조를 제안하고 실시간 시스템을 구현하였다. 제안된 시스템은 디지털 오디오 데이터 처리부와 시스템 제어 정보처리부로 나누어 병렬처리가 가능한 구조이다. 디지털 오디오데이터 처리부에서는 DSP의 강력한 산술연산기능으로 MPEG 복호화 알고리듬을 수행하며 시스템 제어부에서는 마이크로 콘트롤러의 장점인 저가, 저전력의 제어 기능으로 사용자 인터페이스 및 파일 관리, 비트스트림 제어를 담당하도록 구성된다. 입력부에서는 Multi Meadia Card(MMC)를 지원하고, PC와 호환 가능하도록 파일 관리 시스템으로 운용되며 직렬 통신의 데이터 전송과 16비트 해상도 및 최대 48kHz 표본화주파수로 스테레오 출력이 가능하다. 구현된 시스템은 이중 코어를 이용하여 DSP의 연산량 및 동작속도의 감소로 인한 저가, 저전력의 효과로 인해 휴대장치에 적합하다.

  • PDF

Analysis of occurred flow change on dry section in Anyangcheon (소하천 유역에서의 강우 오염부하량 강우-상관관계 분석)

  • Kim, Man-Sik;Lee, Dong-Ryul;Kim, Young-Chul
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2006.05a
    • /
    • pp.963-967
    • /
    • 2006
  • 어떤 강우사상에 대해서 특정유역으로부터의 오염물질 유출특성은 첨두농도, 산술 평균농도, 첨두 오염물질 부하량, 평균 오염물질 부하량 또는 총 유출 부하량 등으로 나타낼 수 있다(이재수 등, 2001). 그러나, 대부분의 경우 강우시 발생하는 총 부하량이 개개의 농도 또는 첨두 부하량보다 더욱 중요하다. 그 이유는 유출사상이 비교적 짧고, 강우 유출수가 유입되는 수체, 특히 저수지나 댐 내에서는 어느 정도의 혼합 현상이 수반되므로 저수지내의 오염물질 농도는 강우로 인한 유출수(저수지로 유입되는)내 개개의 농도변화보다는 결국 총 부하량의 반응이기 때문이다. 특히, 저수지나 호수에서 질소와 인과 같은 영양염류에 대해서 총 부하량은 가장 중요한 수질영향 및 결정 변수일 수밖에 없다. 이와 같은 이유로 강우사상에 대한 평균농도 또는 유량가중 평균농도(EMC, event mean concentration)는 비점원 오염물질의 유출을 평가하는데 가장 적절한 인자로 인식되고 있으며, 가장 널리 이용되고 있다 (EPA, 1983). 본 연구에서 소하천 유역을 대상으로 유량과 수질농도를 실측하여 대상하천에 대한 수문자료를 구축하고, 오염부하모의 모형을 통해 대상유역에서의 강우사상별 오염부하량을 모의하였는데 모형의 보정은 실측된 유량자료를 활용하였으며, 실측된 수질농도자료와 유량자료로 산정한 오염부하량 자료를 통해 검증하였다. 검증된 모형에 대하여 100개의 강우사상에 대한 무작위 모의를 수행하였고, 결과자료를 활용하여 대상하천에 대한 강우-오염부하량의 상관관계식을 도출하였다.

  • PDF