• 제목/요약/키워드: Lock-Free

검색결과 62건 처리시간 0.035초

HD-Tree: 고성능 Lock-Free NNS KD-Tree (HD-Tree: High performance Lock-Free Nearest Neighbor Search KD-Tree)

  • 이상기;정내훈
    • 한국게임학회 논문지
    • /
    • 제20권5호
    • /
    • pp.53-64
    • /
    • 2020
  • KD-Tree에서 NNS의 구현은 다차원 데이터를 다루는 응용 프로그램에서 필수적이다. 본 논문에서는 자료구조의 동시 수정, 검색이 일어나는 멀티스레드 상황에서 NNS를 지원하는 고성능 Lock-Free KD-Tree인 HD-Tree를 제안한다. HD-Tree는 동기화에 사용되는 노드 수를 최소화하고, 사용하는 원자 연산자의 수를 감소시켜 성능을 개선하였다. 실험 결과 HD-Tree는 8코어 16스레드의 멀티코어 시스템에서 기존의 NNS보다 성능이 최대 95% 향상되었고, 삽입/삭제연산은 코어보다 스레드가 많은 상황에서 기존 알고리즘보다 최대 15%향상된 성능을 보여준다.

C++11 멀티스레드 프로그래밍을 위한 Lock-Free shared_ptr와 weak_ptr의 구현 (Implementation of Lock-Free shared_ptr and weak_ptr for C++11 multi-thread programming)

  • 구태균;정내훈
    • 한국게임학회 논문지
    • /
    • 제21권1호
    • /
    • pp.55-66
    • /
    • 2021
  • 고성능이 요구되는 게임 프로그래밍에서 멀티스레드 프로그래밍은 필수이다. 하지만 널리 사용되는 C++11의 shared_ptr와 weak_ptr는 멀티스레드 환경에서 오작동 및 성능 문제를 가지고 있다. 본 논문에서는 기존의 오작동 방지 방법보다 높은 성능을 가지는 Lock-Free shared_ptr와 weak_ptr를 제안한다. 제안하는 두 객체는 논블로킹 알고리즘을 이용하여 멀티스레드에서의 데이터 레이스를 방지하였으며, 8스레드 환경에서 실험한 결과 스레드 사이의 경쟁이 낮은 상황에서 기존의 방법보다 최대 7424% 향상되었고, 경쟁이 높은 상황에서 최대 3767% 향상된 성능을 보여준다.

A 500 MHz-to-1.2 GHz Reset Free Delay Locked Loop for Memory Controller with Hysteresis Coarse Lock Detector

  • Chi, Han-Kyu;Hwang, Moon-Sang;Yoo, Byoung-Joo;Choe, Won-Jun;Kim, Tae-Ho;Moon, Yong-Sam;Jeong, Deog-Kyoon
    • JSTS:Journal of Semiconductor Technology and Science
    • /
    • 제11권2호
    • /
    • pp.73-79
    • /
    • 2011
  • This paper describes a reset-free delay-locked loop (DLL) for a memory controller application, with the aid of a hysteresis coarse lock detector. The coarse lock loop in the proposed DLL adjusts the delay between input and output clock within the pull-in range of the main loop phase detector. In addition, it monitors the main loop's lock status by dividing the input clock and counting its multiphase edges. Moreover, by using hysteresis, it controls the coarse lock range, thus reduces jitter. The proposed DLL neither suffers from harmonic lock and stuck problems nor needs an external reset or start-up signal. In a 0.13-${\mu}m$ CMOS process, post-layout simulation demonstrates that, even with a switching supply noise, the peak-to-peak jitter is less than 30 ps over the operating range of 500-1200 MHz. It occupies 0.04 $mm^2$ and dissipates 16.6 mW at 1.2 GHz.

Harmonic Locking을 제거하기 위한 아날로그 Multi- phase DLL 설계 (An Analog Multi-phase DLL for Harmonic Lock Free)

  • 문장원;곽계달
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 하계종합학술대회 논문집(2)
    • /
    • pp.281-284
    • /
    • 2001
  • This paper describes an analog multi-phase delay-locked loop (DLL) to solve the harmonic lock problem using current-starved inverter and shunt-capacitor delay cell. The DLL can be used not only as an internal clock buffer of microprocessors and memory It's but also as a multi-phase clock generator for gigabit serial interfaces. The proposed circuit was simulated in a 0.25${\mu}{\textrm}{m}$ CMOS technology to solve harmonic lock problem and to realize fast lock-on time and low-jitter we verified time interval less than 40 ps as the simulation results.

  • PDF

RM 스케쥴링과 Lock-Free 공유개체에 의한 실시간 시뮬레이션 (The Real-Time Constructive Simulation With the RM scheduling and Lock-free Shared Objects)

  • 박현규
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1998년도 추계종합학술대회 논문집
    • /
    • pp.519-522
    • /
    • 1998
  • The Constructive Battle simulation Model is very important to the recent military training for the substitution of the field training. However, real battlefield systems operate under rea-time conditions, they are inherently distributed, concurrent and dynamic. In order to reflect these properties by the computer-based simulation systems which represent real world processes, we have been developing constructive simulation model for several years. The constructive simulation system is one of the famous real-time system software, nd the one common feature of all real-time systems is defined as the correctness of the system depend not only on the logical result of computation, but also on the time at which the results are produced. Conventionally, scheduling and resource allocation activities which have timing constraints are major problem of real-time computing systems. To overcome these constraints, we elaborated on these issues and developed the simulation system on commercially available hardware and operating system with lock-free resource allocation scheme and rae monotonic scheduling.

  • PDF

연속할당 기법을 이용한 효과적인 lock-free 메모리 할당자 설계 및 구현 (Design and Implementation of Efficient Memory Allocator using Contiguous Allocation Scheme)

  • 김인혁;김태형;엄영익
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(A)
    • /
    • pp.559-561
    • /
    • 2011
  • 멀티코어 환경에서는 공유 데이터에 대한 동기화로 인한 병목 현상이 중요한 문제점 중의 하나이다. 그리고 동적 메모리 할당자는 대량의 메모리를 할당 및 해제하는 프로그램에서 공유 데이터에 대한 동기화 문제로 성능 저하를 유발시키고 있다. 이를 해결하기 위해 다양한 lock-free 메모리 할당 기법들이 소개되었지만 false sharing과 heap blow-up과 같은 여러 가지 문제점들을 가지고 있다. 이에 본 논문에서는 새로운 연속할당 기법을 제안하고, 이를 이용하여 동일 블록 내의 오브젝트 할당/해제에 따른 동기화 문제를 해결함으로써 효과적인 lock-free 메모리 할당 기법을 제안하였다. 그리고 제안 기법을 구현하여 기존의 메모리 할당 기법들과 실험을 통하여 검증하였으며, 대량의 메모리를 사용하는 멀티 스레드 환경에서 특히 좋은 성능을 보이는 것을 확인하였다.

A Digital DLL with 4-Cycle Lock Time and 1/4 NAND-Delay Accuracy

  • Kim, Sung-Yong;Jin, Xuefan;Chun, Jung-Hoon;Kwon, Kee-Won
    • JSTS:Journal of Semiconductor Technology and Science
    • /
    • 제16권4호
    • /
    • pp.387-394
    • /
    • 2016
  • This paper presents a fully digital delay locked loop (DLL) that can acquire lock in four clock cycles with a resolution of a 1/4 NAND-delay. The proposed DLL with a multi-dither-free phase detector acquires the initial lock in four clock cycles with 1/2 NAND-delay. Then, it utilizes a multi-dither-free phase detector, a region accumulator, and phase blenders, to improve the resolution to a 1/4 NAND-delay. The region accumulator which continuously steers the control registers and the phase blender, adaptively controls the tracking bandwidth depending on the amount of jitter, and effectively suppresses the dithering jitter. Fabricated in a 65 nm CMOS process, the proposed DLL occupies $0.0432mm^2$, and consumes 3.7 mW from a 1.2-V supply at 2 GHz.

Event-Driven Real-Time Simulation Based On The RM Scheduling and Lock-free Shared Objects

  • Park, Hyun Kyoo
    • 한국국방경영분석학회지
    • /
    • 제25권1호
    • /
    • pp.199-214
    • /
    • 1999
  • The Constructive Battle Simulation Model is very important to the recent military training for the substitution of the field training. However, real battlefield systems operate under real-time conditions, they are inherently distributed, concurrent and dynamic. In order to reflect these properties by the computer-based simulation systems which represent real world processes, we have been developing constructive simulation model for several years. Conventionally, scheduling and resource allocation activities which have timing constraints, we elaborated on these issues and developed the simulation system on commercially available hardware and operating system with lock-free resource allocation scheme and rate monotonic scheduling.

  • PDF

Re=360에서 교란유동장에 놓인 원형실린더 후류의 유동공진 현상에 대한 직접수치해석 (Direct Numerical Simulation of the Lock-on Phenomena in the Wake behind a Circular Cylinder in a Perturbed Flow at Re=360)

  • 박지용;김수현;배중헌;박노마;유정열
    • 대한기계학회논문집B
    • /
    • 제31권9호
    • /
    • pp.780-789
    • /
    • 2007
  • Lock-on phenomenon in the wake of a circular cylinder is investigated at the Reynolds number of 360 using direct numerical simulation (DNS). To induce lock-on, a streamwise velocity perturbation with a frequency of twice the natural shedding frequency is superimposed on the free stream velocity. The Reynolds stress distributions are investigated to analyze the streamwise force balance acting on the recirculation region and the results are compared with the previous experimental result. When the lock-on occurs, the pressure force on the recirculation region is shown to increase mainly due to the reversal of the Reynolds shear stress distribution, which is consistent with our previous results using PIV measurement. It is also shown that, with the lock-on, the strength of the primary vortices increases whereas that of the secondary vortices decreases significantly. Further, under the lock-on condition the wavelength of the secondary vortices increases by as much as 2.5 times.

논 블록킹 검색연산을 위한 R-tree 기반의 동시성 제어 기법 (A Concurrency Control Method for Non-blocking Search Operation based on R-tree)

  • 김명근;배해영
    • 정보처리학회논문지D
    • /
    • 제11D권4호
    • /
    • pp.809-822
    • /
    • 2004
  • 본 논문에서는 검색 위주의 공간 데이터베이스 시스템을 위한 R-tree 기반의 동시성 제어 기법을 제안한다. 기존의 제안된 기법들은 검색연산이 갱신연산과 동시에 수행되는 것을 막기 위해 노드에 공유 락이나 래치를 획득함으로써 갱신연산으로 인한 검색연산의 블록킹을 막을 수 없다는 문제를 가지고 있으며, 또한 R-tree같은 다차원 색인의 경우 갱신연산의 락 획득은 여러 노드에 걸쳐 일어날 수 있으며, 노드 분할과 같은 경우 오랜 시간동안 락을 획득하고 있을 수도 있기 때문에 검색연산은 장시간 블록킹이 되어야 하는 문제를 갖는다. 따라서 본 논문에서는 이러한 문제를 해결하기 위하여 노드의 엔트리들을 링크드 리스트로 연결하는 방법을 사용하여 노드에 엔트리를 삽입하고 있는 중에도 락이나 래치를 획득하지 않고 검색연산을 할 수 있는 링크드 리스트 기반의 동시성 제어 기법과, 노드 분할이 진행 중에 있는 노드에도 검색연산이 락이나 래치를 획득하지 않고 노드를 탐색할 수 있는 버전 기반의 동시성 제어 기법을 제안한다.