• 제목/요약/키워드: Near-Memory Processing

검색결과 38건 처리시간 0.021초

Efficient Hybrid Transactional Memory Scheme using Near-optimal Retry Computation and Sophisticated Memory Management in Multi-core Environment

  • Jang, Yeon-Woo;Kang, Moon-Hwan;Chang, Jae-Woo
    • Journal of Information Processing Systems
    • /
    • 제14권2호
    • /
    • pp.499-509
    • /
    • 2018
  • Recently, hybrid transactional memory (HyTM) has gained much interest from researchers because it combines the advantages of hardware transactional memory (HTM) and software transactional memory (STM). To provide the concurrency control of transactions, the existing HyTM-based studies use a bloom filter. However, they fail to overcome the typical false positive errors of a bloom filter. Though the existing studies use a global lock, the efficiency of global lock-based memory allocation is significantly low in multi-core environment. In this paper, we propose an efficient hybrid transactional memory scheme using near-optimal retry computation and sophisticated memory management in order to efficiently process transactions in multi-core environment. First, we propose a near-optimal retry computation algorithm that provides an efficient HTM configuration using machine learning algorithms, according to the characteristic of a given workload. Second, we provide an efficient concurrency control for transactions in different environments by using a sophisticated bloom filter. Third, we propose a memory management scheme being optimized for the CPU cache line, in order to provide a fast transaction processing. Finally, it is shown from our performance evaluation that our HyTM scheme achieves up to 2.5 times better performance by using the Stanford transactional applications for multi-processing (STAMP) benchmarks than the state-of-the-art algorithms.

목격 여부에 따른 배가쪽 이마앞 영역의 활성화 차이: Functional Near-Infrared Spectroscopy Study 연구 (Increased Ventrolateral Prefrontal Cortex Activation during Accurate Eyewitness Memory Retrieval: An Exploratory Functional Near-Infrared Spectroscopy Study)

  • 함근수;김기평;정호진;유성호
    • The Korean Journal of Legal Medicine
    • /
    • 제42권4호
    • /
    • pp.146-152
    • /
    • 2018
  • We investigated the neural correlates of accurate eyewitness memory retrieval using functional near-infrared spectroscopy. We analyzed oxygenated hemoglobin ($HbO_2$) concentration in the prefrontal cortex during eyewitness memory retrieval task and examined regional $HbO_2$ differences between observed objects (target) and unobserved objects (lure). We found that target objects elicited increased activation in the bilateral ventrolateral prefrontal cortex, which is known for monitoring retrieval processing via bottom-up attentional processing. Our results suggest bottom-up attentional mechanisms could be different during accurate eyewitness memory retrieval. These findings indicate that investigating retrieval mechanisms using functional near-infrared spectroscopy might be useful for establishing an accurate eyewitness recognition model.

Voltage Scaling 기반의 저전력 전류메모리 회로 설계 (Design of Low Power Current Memory Circuit based on Voltage Scaling)

  • 여성대;김종운;조태일;조승일;김성권
    • 한국전자통신학회논문지
    • /
    • 제11권2호
    • /
    • pp.159-164
    • /
    • 2016
  • 무선통신시스템은 한정된 에너지를 갖는 배터리를 사용하기 때문에 저전력 회로로 구현되어야 하며, 이를 위하여 주파수와 상관없이 일정한 전력을 나타내는 전류모드 회로가 연구되어왔다. 본 논문에서는 초저전력 동작이 가능하도록 Dynamic Voltage Scaling 전원을 유도하며, 전류모드 신호처리 중 메모리 동작에서 저장된 에너지가 누설되는 Clock-Feedthrough 문제를 최소화하는 전류메모리 회로를 제안한다. $0.35{\mu}m$ 공정의 BSIM3 모델로 Near-threshold 영역의 전원 전압을 사용한 시뮬레이션을 진행한 결과, 1MHz의 스위칭 동작에서 $2{\mu}m$의 메모리 MOS Width, $0.3{\mu}m$의 스위치 MOS Width, $13{\mu}m$의 Dummy MOS Width로 설계할 때, Clock-Feedthrough의 영향을 최소화시킬 수 있었으며 1.2V의 Near-threshold 전원전압에서 소비전력은 $3.7{\mu}W$가 계산되었다.

CXL 인터커넥트 기술 연구개발 동향 (Trends in Compute Express Link(CXL) Technology)

  • 김선영;안후영;박유미;한우종
    • 전자통신동향분석
    • /
    • 제38권5호
    • /
    • pp.23-33
    • /
    • 2023
  • With the widespread demand from data-intensive tasks such as machine learning and large-scale databases, the amount of data processed in modern computing systems is increasing exponentially. Such data-intensive tasks require large amounts of memory to rapidly process and analyze massive data. However, existing computing system architectures face challenges when building large-scale memory owing to various structural issues such as CPU specifications. Moreover, large-scale memory may cause problems including memory overprovisioning. The Compute Express Link (CXL) allows computing nodes to use large amounts of memory while mitigating related problems. Hence, CXL is attracting great attention in industry and academia. We describe the overarching concepts underlying CXL and explore recent research trends in this technology.

Enhanced Prediction Algorithm for Near-lossless Image Compression with Low Complexity and Low Latency

  • Son, Ji Deok;Song, Byung Cheol
    • IEIE Transactions on Smart Processing and Computing
    • /
    • 제5권2호
    • /
    • pp.143-151
    • /
    • 2016
  • This paper presents new prediction methods to improve compression performance of the so-called near-lossless RGB-domain image coder, which is designed to effectively decrease the memory bandwidth of a system-on-chip (SoC) for image processing. First, variable block size (VBS)-based intra prediction is employed to eliminate spatial redundancy for the green (G) component of an input image on a pixel-line basis. Second, inter-color prediction (ICP) using spectral correlation is performed to predict the R and B components from the previously reconstructed G-component image. Experimental results show that the proposed algorithm improves coding efficiency by up to 30% compared with an existing algorithm for natural images, and improves coding efficiency with low computational cost by about 50% for computer graphics (CG) images.

낮은 복잡도의 준무손실 압축을 위한 향상된 예측 기법 (Enhanced Prediction for Low Complexity Near-lossless Compression)

  • 손지덕;송병철
    • 방송공학회논문지
    • /
    • 제19권2호
    • /
    • pp.227-239
    • /
    • 2014
  • 본 논문은 영상처리용 SoC에서 외부 메모리 대역폭을 효과적으로 낮추기 위한 near-lossless 이미지 코더의 압축 성능을 향상시키는 새로운 예측 기법을 제안한다. 먼저, RGB 간 correlation을 고려하여 이미 복원된 G 성분을 기반으로 R과 B 성분을 효과적으로 예측하는 inter-color prediction을 수행한다. 다음으로 가변 블록 예측을 통해 예측 성능을 향상시킨다. 마지막으로 이전 프레임에서 sampling된 템플릿 dictionary를 이용해 G 성분 예측 시 최소한의 내부 메모리만을 사용하여 시간 축 예측 성능을 개선시키는 방법을 제안한다. 실험 결과를 통해 자연 영상의 경우 기존 기법 대비 평균적으로 약 30%의 코딩 효율 향상을 보이고, CG 영상의 경우에는 평균 60% 정도의 성능 향상을 보임을 알 수 있다.

GB-SAR의 개발 (II) : 영상화 기법 (Development of a GB-SAR (II) : Focusing Algorithms)

  • 이훈열;성낙훈;김정호;조성준
    • 대한원격탐사학회지
    • /
    • 제23권4호
    • /
    • pp.247-256
    • /
    • 2007
  • 이 논문에서는 GB-SAR(Ground-Based Synthetic Aperture Radar) 시스템의 영상화 기법(focusing algorithm)을 소개하고 최적의 영상화 기법을 찾고자 하였다. GB-SAR 영상의 형성 원리, 메모리 및 처리 시간과 관련하여 Deramp-FFT (DF) 기법과 Range-Doppler (RD) 기법의 특징과 장단점을 소개하였다. DF 기법은 처리비용이 적게 들지만 근거리에서는 영상화가 이루어지지 않는 단점이 있으며, RD 기법은 전 영역에서 영상화가 이루어지지만, 합성 구경의 길이가 레일로 제한되어 있는 GB-SAR의 특성상원거리에서는 메모리와 자료처리 시간에 낭비적 요소가 많다. 결과적으로, GB-SAR 영상화를 위하여 원거리에서는 DF 기법을, 근거리에서는 RD 기법을 사용하여 최적화하였다.

철도관제사의 사고유발 요인에 관한 탐색적 구조분석 (An Exploratory Structural Analysis of the Accident Causing Factors in Railway Traffic Controllers)

  • 김경남;신택현
    • 한국시뮬레이션학회논문지
    • /
    • 제27권1호
    • /
    • pp.119-126
    • /
    • 2018
  • 본 연구는 철도관제사의 인적오류를 유발하는 요인이 무엇인지를 AMOS 구조방정식 모형을 활용하여 탐색적으로 검증하려는 목적에서 시도되었다. 관제사와 관련된 문헌연구를 토대로 피로와 스트레스를 외생변인, 정보처리과정에서의 오류(인지, 기억, 저장 및 실행오류)를 내생변인, 그리고 종속변인으로 책임사고와 아차사고를 설정하였다. 여러 기관의 현직관제사 201명의 설문을 분석한 결과, '스트레스 ${\rightarrow}$ 기억오류 ${\rightarrow}$ 저장오류 ${\rightarrow}$ 아차사고 ${\rightarrow}$ 책임사고'의 인과관계 고리가 성립한다는 것을 발견하였다. 이 같은 연구결과는 인적오류와 관련하여 관제사의 사고 저감을 위해서는 그 선행요인인 스트레스를 효과적으로 관리하여 정보처리과정에서의 기억 및 실행오류를 저감시킬 필요가 있다는 것을 시사한다.

부분문제가 같은 블록대각형 선형계획문제의 효율적인 방볍 (An Efficient Algorithm for a Block Angular Linear Program with the Same Blocks)

  • 양병학;박순달
    • 한국경영과학회지
    • /
    • 제12권2호
    • /
    • pp.42-50
    • /
    • 1987
  • This objective of this paper is to develop an efficient method with small memory requirement for a feed-mixing problem on a micro computer. First this method uses the decomposition principle to reduce the memory requirement. Next, the decomposition principle is modified to fit the problem. Further four different variations in solving subproblems are designed in order to improve efficiency of the principle. According to the test with respect to the processing time, the best variation is such that the dual simplex method is used, and the optimal basis of a previous subproblem is used as an initial basis, and the master problem is (M +1) dimensional. In general, the convergence of solution becomes slower near the optimal value. This paper introduces a termination criterion for a sufficiently good solution. According to the test, 5%-tolerence is acceptable with respect to the relation between the processing time and optimal value.

  • PDF

DSM 시스템에서 통신 부하의 가중치를 고려한 경쟁적인 갱신 프로토콜 (Weighted Competitive Update Protocol for DSM Systems)

  • 임성화;백상현;김재훈;김성수
    • 한국정보처리학회논문지
    • /
    • 제6권8호
    • /
    • pp.2245-2252
    • /
    • 1999
  • 분산 공유 메모리(Distributed Shared Memory)시스템은 사용자에게 간단한 공유 메모리 개념을 제공하기 때문에 노드 사이의 데이터 이동에 관여할 필요가 없다. 각 노드는 프로세서, 메모리, 그리고 네트워크 연결장치 등으로 이루어져 있다. 메모리는 페이지 단위로 구분되며 페이지는 여러 노드에 복제본을 소유할 수 있다. 이들간 일치성을 유지하기 위하여 무효화 방식(invalidate protocol)과 갱신 방식(update protocol)이 전통적으로 많이 사용되었다. 이 두 가지 프로토콜의 성능은 시스템 변수 또는 응용 프로그램의 공유 메모리 사용 형태에 따라 좌우된다. 메모리 사용 형태에 적응하기 위하여 경쟁적 갱신(competitive update) 프로토콜은 가까운 장래에 사용되어질 복제본을 갱신시키는 반면, 다른 복제본은 무효화시킨다. 본 논문에서는 노드 사이의 통신비용이 동일하지 않은 구조를 감안한 가중치를 고려한(weighted) 경쟁적 갱신 프로토콜을 제안하였다. 시뮬레이션에 의한 성능 측정 결과 가중치를 고려한 경쟁적 갱신 프로토콜의 성능 향상을 보였다.

  • PDF