• 제목/요약/키워드: Memory reduction

검색결과 471건 처리시간 0.02초

삼중대각행렬 시스템 풀이의 빠른 GPU 구현 (Fast GPU Implementation for the Solution of Tridiagonal Matrix Systems)

  • 김영희;이성기
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제32권11_12호
    • /
    • pp.692-704
    • /
    • 2005
  • 컴퓨터 하드웨어의 급속한 발전으로 그래픽 프로세서 유닛(Graphics Processor Units : GPUs)은 굉장한 메모리 대역폭과 산술 능역을 보유하게 되어 범용 계산에 많이 활용되고 있으며, 특히 계산 집약적인 물리 기반 시뮬레이션(physics based simulation)의 GPU 구현이 활발하게 연구되고 있다. 물리 기반 시뮬레이션의 기본이 되는 미분방정식 풀이 과정에서 삼중대각행렬(tridiagonal matrix) 시스템은 유한차분(finite-difference) 근사에 의해서 자주 나타나는 선형시스템으로 물리 기반 시뮬레이션 관점에서 삼중대각행렬 시스템의 빠른 풀이는 중요한 연구 분야이다. 본 논문에서는 GPU에서 삼중대각행렬 시스템 풀이를 빠르게 구현할 수 있는 방법을 제안한다. 벡터 프로세서(vector processor) 계산에서 삼중대각행렬 시스템 풀이 방법으로 널리 사용되는 cyclic reduction 또는 odd-even reduction 알고리즘을 GPU에서 구현하였다. 본 논문에서 제안한 방법을 삼중대각행렬 시스템 풀이 방법으로 잘 알려져 있는 Thomas 방법과 GPU를 이용한 선형시스템 풀이에서 좋은 성과를 보이고 있는 conjugate gradient 방법과 비교할 때 상당한 성능 향상을 얻을 수 있었다. 또한, 열전도(heat conduction) 방정식, 이류 확산(advection-diffusion) 방정식, 얕은 물(shallow water) 방정식에 의한 물리 기반 시뮬레이션의 GPU 구현에 본 논문에서 제안한 방법을 사용하여 1024x1024 격자의 계산 영역에서 초당 35프레임 이상의 놀라운 성능을 보여주었다.

지역 버퍼와 주소 압축을 통한 저전력 캐시 설계 (Low-Power Cache Design by using Locality Buffer and Address Compression)

  • 곽종욱
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권9호
    • /
    • pp.11-19
    • /
    • 2013
  • 프로세서와 메모리 시스템 사이의 속도 차이를 완화하기 위하여 오늘날의 컴퓨터 시스템은 대부분 캐시 시스템을 사용하고 있다. 하지만 소비 전력 측면에서 캐시 메모리는 전체 시스템 측면에서 큰 비중을 차지한다. 본 논문에서는 캐시 시스템의 전력을 줄이는 방안 가운데 하나로 지역 버퍼와 주소 압축을 통한 저전력 캐시 설계 기법을 제안한다. 주소 압축을 위해 사용되는 부분태그 캐시는 전력 소모량을 최소화하기 위해서 전체 태그를 쓰기보다는 태그의 작은 부분을 사용함으로써 소비 전력을 줄이도록 하는 기법이다. 본 논문에서는 기존의 여러 주소 압축 캐시 연구에서의 문제점들을 분석하여 그것을 보완할 수 있는 새로운 기법을 제안한다. 제안된 기법은 지역성이 높은 내장형 응용프로그램의 특징을 활용한 것으로, 지역 버퍼와 지역 실패 버퍼를 활용한 새로운 형태의 캐시 주소 압축 기법이다. 모의실험 결과, 제안된 기법은 전체적인 성능의 감소 없이 평균 18%의 에너지 감소를 보였다.

The Downregulation of Somatic A-Type $K^+$ Channels Requires the Activation of Synaptic NMDA Receptors in Young Hippocampal Neurons of Rats

  • Kang, Moon-Seok;Yang, Yoon-Sil;Kim, Seon-Hee;Park, Joo-Min;Eun, Su-Yong;Jung, Sung-Cherl
    • The Korean Journal of Physiology and Pharmacology
    • /
    • 제18권2호
    • /
    • pp.135-141
    • /
    • 2014
  • The downregulation of A-type $K^+$ channels ($I_A$ channels) accompanying enhanced somatic excitability can mediate epileptogenic conditions in mammalian central nervous system. As $I_A$ channels are dominantly targeted by dendritic and postsynaptic processings during synaptic plasticity, it is presumable that they may act as cellular linkers between synaptic responses and somatic processings under various excitable conditions. In the present study, we electrophysiologically tested if the downregulation of somatic $I_A$ channels was sensitive to synaptic activities in young hippocampal neurons. In primarily cultured hippocampal neurons (DIV 6~9), the peak of $I_A$ recorded by a whole-cell patch was significantly reduced by high KCl or exogenous glutamate treatment to enhance synaptic activities. However, the pretreatment of MK801 to block synaptic NMDA receptors abolished the glutamate-induced reduction of the $I_A$ peak, indicating the necessity of synaptic activation for the reduction of somatic $I_A$. This was again confirmed by glycine treatment, showing a significant reduction of the somatic $I_A$ peak. Additionally, the gating property of $I_A$ channels was also sensitive to the activation of synaptic NMDA receptors, showing the hyperpolarizing shift in inactivation kinetics. These results suggest that synaptic LTP possibly potentiates somatic excitability via downregulating $I_A$ channels in expression and gating kinetics. The consequential changes of somatic excitability following the activity-dependent modulation of synaptic responses may be a series of processings for neuronal functions to determine outputs in memory mechanisms or pathogenic conditions.

A personalized exercise recommendation system using dimension reduction algorithms

  • Lee, Ha-Young;Jeong, Ok-Ran
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권6호
    • /
    • pp.19-28
    • /
    • 2021
  • 코로나로 인해 건강관리에 대한 관심이 증가하고 있는 요즘, 여러 사람이 함께 이용하는 헬스장이나 공용시설을 이용하는데 어려움이 늘어남에 따라 홈 트레이닝을 하는 이들이 늘어나고 있다. 이에 본 연구에서는 홈 트레이닝 사용자들에게 좀 더 정확하고 의미 있는 운동 추천을 제공하기 위해 개인 성향 정보를 활용한 개인화된 운동 추천 알고리즘을 제안한다. 이를 위해 식습관 정보, 육체적 조건 등 개인을 나타낼 수 있는 개인 성향 정보를 사용해 k-최근접 이웃 알고리즘으로 데이터를 비만의 기준에 따라 분류하였다. 또한, 운동 데이터 셋을 운동의 레벨에 따라 등급을 구별하였으며 각 데이터 셋의 이웃 정보를 바탕으로 모델 기반 협업 필터링 방법 중 차원 축소모델인 특이값 분해 알고리즘(SVD)을 통해 사용자들에게 개인화된 운동 추천을 제공한다. 따라서 메모리 기반 협업 필터링 추천 기법의 데이터 희소성과 확장성의 문제를 해결할 수 있고, 실험을 통해 본 연구에서 제안하는 알고리즘의 정확도와 성능을 검증한다.

예측 VQ-Pyramid VQ를 이용한 광대역 음성용 LSF 양자학기 설계 (A LSF Quantizer for the Wideband Speech Using the Predictive VQ-Pyramid VQ)

  • 이강은;이인성;강상원
    • 한국음향학회지
    • /
    • 제23권4호
    • /
    • pp.333-339
    • /
    • 2004
  • 본 논문에서는 벡터 양자화기와 피라미드 벡터 양자화기를 직렬로 결합하여 16차 벡터 소스에 대한 vector quantizer-pyramid vector quantizer (VQ-PVQ)를 개발하였으며, 예측 구조와 세이프티-넷 (safety-net) 개념을 결합시켜 광대역 음성 부호화기용 LPC 계수 양자화 기를 설계하였다. 본 양자화기의 성능은 AMR-WB(ITRT-T G.722.2)의 LPC양자화기 성능과 비교하였는데, 스펙트럼 왜곡 및 메모리 요구량에서 상당한 이득을 얻었다.

나노 적층 구조를 응용한 저항성 기반 비휘발성 메모리 소자 특성 제어 (Control of Charge Transports in Nonvolatile Resistive Memory Devices through Embedded Nanoscale Layers)

  • 유일환;황진하
    • 한국세라믹학회지
    • /
    • 제46권3호
    • /
    • pp.336-343
    • /
    • 2009
  • Nickel oxide thin films exhibit the resistive switching as a function of applied voltages. The switching phenomena involve low and high resistance states after electroforming. The electrical features are believed to be associated with the formation and rupture of filaments. The set and reset behaviors are controlled by the oxidation and reduction of filaments. The indirect evidence of filaments is corroborated by the presence of nanocrystalline nickel oxides found in high-resolution transmission electron microscopy. The insertion of insulating layers seems to control the current-voltage characteristics by preventing the continuous formation of conductive filaments, potentially leading to artificial control of resistive behaviors in NiO-based systems.

A Low Power Dual CDS for a Column-Parallel CMOS Image Sensor

  • Cho, Kyuik;Kim, Daeyun;Song, Minkyu
    • JSTS:Journal of Semiconductor Technology and Science
    • /
    • 제12권4호
    • /
    • pp.388-396
    • /
    • 2012
  • In this paper, a $320{\times}240$ pixel, 80 frame/s CMOS image sensor with a low power dual correlated double sampling (CDS) scheme is presented. A novel 8-bit hold-and-go counter in each column is proposed to obtain 10-bit resolution. Furthermore, dual CDS and a configurable counter scheme are also discussed to realize efficient power reduction. With these techniques, the digital counter consumes at least 43% and at most 61% less power compared with the column-counters type, and the frame rate is approximately 40% faster than the double memory type due to a partial pipeline structure without additional memories. The prototype sensor was fabricated in a Samsung $0.13{\mu}m$ 1P4M CMOS process and used a 4T APS with a pixel pitch of $2.25{\mu}m$. The measured column fixed pattern noise (FPN) is 0.10 LSB.

계통분할에 의한 전력계통 상태추정 (Partitioned State Estimation in Electric Power Systems)

  • 박석춘;최상봉;문영현
    • 대한전기학회논문지
    • /
    • 제37권7호
    • /
    • pp.427-433
    • /
    • 1988
  • 본 논문에서는 계통을 분할하여 분할된 지역간의 경계선로에 대학 조류측정을 하여 계통을 축소하는데 근거한 계통분할 알고리즘을 제시한다. 즉 전력계통을 여러개의 종속계통으로 나누면 반그시 경계선로가 파생되는데 이 경계선로 조류를 정확히 추정할 수 있으면 각 종속계통에 대한 상태추정을 개별적으로 행할 수 있으므로 각 종속계통에 대한 경계선로 조류를 추정하는 면밀한 방법을 제시하였다. 까라서, 제시된 알고리즘을 쓰면 종속계통에서 상태추정을 개별적으로 수행할 수 있기 때문에 계산시간과 메모리 용량을 현저히 줄일 수 있다. 제시된 알고리즘을 IEEE 샘플계통에 적용하여 설계통 적용 가능성을 보였다.

전력계통 해석에 유용한 "스파스"행렬법에 관한 연구 (A Study on the Sparse Matrix Method Useful to the Solution of a Large Power System)

  • 한만춘;신명철
    • 전기의세계
    • /
    • 제23권3호
    • /
    • pp.43-52
    • /
    • 1974
  • The matrix inversion is very inefficient for computing direct solutions of the large spare systems of linear equations that arise in many network problems as a large electrical power system. Optimally ordered triangular factorization of sparse matrices is more efficient and offers the other important computational advantages in some applications with this method. The direct solutions are computed from sparse matrix factors instead of a full inverse matrix, thereby gaining a significant advantage is speed and computer memory requirements. In this paper, it is shown that the sparse matrix method is superior to the inverse matrix method to solve the linear equations of large sparse networks. In addition, it is shown that the sparse matrix method is superior to the inverse matrix method to solve the linear equations of large sparse networks. In addition, it is shown that the solutions may be applied directly to sove the load flow in an electrical power system. The result of this study should lead to many aplications including short circuit, transient stability, network reduction, reactive optimization and others.

  • PDF

개선된 부하차단에 관한 전문가 시스템 (Expert System On Advanced load shedding)

  • 김재철;김응상;유미복
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1991년도 하계학술대회 논문집
    • /
    • pp.354-357
    • /
    • 1991
  • In the case of system operation, a line overload cause damage to spread an whole range of power system. Of the theorems on load shedding, this study applied power distribution theorem and load reduction theorem which are local load shedding method, which are not affected by the magnitude of the power system and need not a large memory capacity and computation time. In this paper, we treat the problem of overload when power system occurred to fatal fault. Especially, there is the special case that local load shedding theorem is not always solved. Therefore, we introduce a solved device of the problem and construct the expert system of expanded local load shedding. Because proposed method uses the merits of expert system, in the case of system operation, the system operator don't embarrass to fatal fault and promptly deals with.

  • PDF