• Title/Summary/Keyword: Memory Mapping

검색결과 215건 처리시간 0.027초

K-Nearest Neighbor Associative Memory with Reconfigurable Word-Parallel Architecture

  • An, Fengwei;Mihara, Keisuke;Yamasaki, Shogo;Chen, Lei;Mattausch, Hans Jurgen
    • JSTS:Journal of Semiconductor Technology and Science
    • /
    • 제16권4호
    • /
    • pp.405-414
    • /
    • 2016
  • IC-implementations provide high performance for solving the high computational cost of pattern matching but have relative low flexibility for satisfying different applications. In this paper, we report an associative memory architecture for k nearest neighbor (KNN) search, which is one of the most basic algorithms in pattern matching. The designed architecture features reconfigurable vector-component parallelism enabled by programmable switching circuits between vector components, and a dedicated majority vote circuit. In addition, the main time-consuming part of KNN is solved by a clock mapping concept based weighted frequency dividers that drastically reduce the in principle exponential increase of the worst-case search-clock number with the bit width of vector components to only a linear increase. A test chip in 180 nm CMOS technology, which has 32 rows, 8 parallel 8-bit vector-components in each row, consumes altogether in peak 61.4 mW and only 11.9 mW for nearest squared Euclidean distance search (at 45.58 MHz and 1.8 V).

임의쓰기 성능향상을 위한 로그블록 기반 FTL의 효율적인 합병연산 (The Efficient Merge Operation in Log Buffer-Based Flash Translation Layer for Enhanced Random Writing)

  • 이준혁;노홍찬;박상현
    • 정보처리학회논문지D
    • /
    • 제19D권2호
    • /
    • pp.161-186
    • /
    • 2012
  • 최근 플래시 메모리의 꾸준한 용량 증가와 가격 하락으로 인해 대용량 SSD(Solid State Drive)가 점차 대중화 되고 있다. 하지만, 플래시 메모리는 하드웨어적인 제약사항이 존재하며, 이러한 제약사항을 보완하기 위해 FTL(Flash Translation Layer)이라는 특별한 미들웨어 계층을 필요로 한다. FTL은 플래시 메모리의 하드웨어적인 제약사항을 효율적으로 운용하기 위해 필요한 계층으로서 파일 시스템으로부터의 논리적 섹터 번호(logical sector number)를 플래시 메모리의 물리적 섹터 번호(physical sector number)로 변환해주는 역할을 한다. 특히, 플래시 메모리의 여러 제약사항 중 "쓰기 전 지우기(erase-before-write)"는 플래시 메모리 성능 저하의 주요한 원인이 되고 있으며, 이와 관련하여 로그블록 기반의 여러 연구들이 활발히 진행되어 왔지만, 대용량의 플래시 메모리를 효율적으로 운용하기 위해서는 몇몇 문제점들이 존재한다. 로그블록 기반의 FAST는 넓은 지역에 임의쓰기(random writing)가 빈번하게 발생하면 데이터 블록 내 사용되지 않은 섹터들로 인해 효율적이지 못한 합병 연산이 발생한다. 즉, 효율적이지 못한 블록 쓰레싱(thrashing)이 빈번하게 발생하고, 플래시 메모리의 성능을 저하시킨다. 로그블록은 덮어쓰기(overwriting) 발생 시 일종의 캐쉬처럼 운영되며, 이러한 기법은 플래시 메모리 성능 향상에 많은 발전을 주었다. 본 연구에서는 임의쓰기에 대한 성능 향상을 위해 로그 블록만을 캐쉬처럼 운영하는 것이 아니라 플래시 메모리 전체를 캐쉬처럼 운용하고, 이를위해 별도의 오프셋이라는 매핑 테이블을 운용하여 플래시 메모리 성능 저하의 주요한 원인이 되는 합병연산과 삭제연산을 줄였다. 새로운 FTL은 XAST(eXtensively-Associative Sector Translation)이라 명명하며, XAST에서는 공간지역성과 시간지역성에 대한 기본적인 이론을 바탕으로 오프셋 매핑 테이블을 효율적으로 운용한다.

NAND 플래시 메모리에서 디지털 포렌식을 위한 파일 복구기법 (A File Recovery Technique for Digital Forensics on NAND Flash Memory)

  • 신명섭;박동주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제37권6호
    • /
    • pp.292-299
    • /
    • 2010
  • 최근 플래시 메모리가 디지털 기기의 저장장치로 널리 사용됨에 따라 플래시 메모리에서 디지털 증거를 분석하기 위한 디지털 포렌식의 필요성이 증가하고 있다. 이를 위해 플래시 메모리에 저장되어 있는 파일을 효율적으로 복구하는 것이 매우 중요하다. 그러나 기존의 하드 디스크 기반 파일 복구 기법을 플래시 메모리에 그대로 적용하기에는 너무나 비효율적이다. 덮어쓰기 불가능과 같이 플래시 메모리는 하드 디스크와 전혀 다른 특성을 가지기 때문이다. 본 논문에서 디지털 포렌식을 지원하기 위한 플래시 메모리를 잘 이해하는 파일 복구 기법을 제안한다. 첫째, 플래시 메모리 저장장치로부터 복구 가능한 모든 파일들을 효과적으로 검색하는 방법을 제안한다. 이것은 플래시 메모리의 쓰기 연산을 담당하는 FTL(Flash Translation Layer)의 메타데이터를 최대한 활용한다. 둘째, 복구 대상 파일들 중에서 특정 파일을 효율적으로 복구할 수 있는 기법을 제안하며, 이를 위해 FTL의 사상 테이블의 위치 정보를 이용한다. 다양한 실험을 통해 본 논문에 제안하는 기법이 기존의 하드 디스크 기반 파일 복구 기법보다 우수함을 보인다.

AFTL: Hot Data 검출기를 이용한 적응형 플래시 전환 계층 (AFTL: An Efficient Adaptive Flash Translation Layer using Hot Data Identifier for NAND Flash Memory)

  • 윤현식;주영도;이동호
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제35권1호
    • /
    • pp.18-29
    • /
    • 2008
  • 최근 NAND 플래시 메모리는 빠른 접근속도, 저 전력 소모, 높은 내구성, 작은 부피, 가벼운 무게 등으로 차세대 대용량 저장 매체로 각광 받고 있다. 그러나 이런 플래시 메모리는 데이타를 기록하기 전에 기존의 데이타 영역이 지워져 있어야 한다는 제약이 있으며, 비대칭적인 읽기, 쓰기, 삭제 연산의 처리속도 각 블록당 최대 소거 횟수 제한과 같은 특징들을 지닌다. 위와 같은 단점을 극복하고 NAND플래시 메모리를 효율적으로 사용하기 위하여. 다양한 플래시 전환 계층 제안되어 왔다. 기러나 기존의 플래시 전환 계층들은 Hot data라 불리는 빈번히 접근되는 데이타에 의해서 잦은 겹쳐쓰기 요구가 발생되며, 이는 급격한 성능 저하를 가져 온다. 본 논문에서는 Hot data 검출기를 이용하여, 매우 적은 양의 데이타인 Hot data를 검출한 후, 검출된 Hot data는 섹터사상 기법을 적용시키고, 나머지 데이타인 Cold data는 로그 기반 블록 사상 기법을 적용시키는 적응형 플래시 전환 계층(AFTL)을 제안한다. AFTL은 불필요한 삭제, 쓰기, 읽기 연산을 최소화시켰으며, 기존의 플래시 전환 계층과의 비교 측정을 통하여 성능의 우수성을 보인다.

멀티프로세서 태스크 할당을 위한 GA과 SA의 비교 (Comparison of Genetic Algorithms and Simulated Annealing for Multiprocessor Task Allocation)

  • 박경모
    • 한국정보처리학회논문지
    • /
    • 제6권9호
    • /
    • pp.2311-2319
    • /
    • 1999
  • 병렬 컴퓨팅에 있어 NP-complete 문제인 태스크 할당문제에 대한 두 가지 휴리스틱 알고리즘을 제시한다. 할당문제는 분산 메모리 멀티컴퓨터의 멀티 프로세싱 노드에 다중통신 태스크들을 최적의 매핑을 찾는 것이다. 태스크들을 목표 시스템 구조의 노드들에 매핑시키는 목적은 해법 품질에 손상 없이 병렬 실행시간을 최소화하기 위함이다. 많은 휴리스틱 기법들이 만족한 매핑을 얻기 위해 채택되어 왔다. 본 논문에서 제시되는 휴리스틱 기법은 유전자 알고리즘(GA)과 시뮬레이티드 어닐링(SA) 기법에 기반을 둔다. 매핑 설정을 위한 총 계산 비용으로 목적함수를 수식화하고 휴리스틱 알고리즘들의 성능을 평가한다. 랜덤, 그리디, 유전자, 어닐링 알고리즘들을 사용하여 얻은 해법의 품질과 시간을 비교한다. 할당 알고리즘 시뮬레이션 연구를 통한 실험적 결과를 보여준다.

  • PDF

모바일 3D 그래픽스를 위한 저전력 텍스쳐 맵핑 기법 (A Low-Power Texture Mapping Technique for Mobile 3D Graphics)

  • 김현희;김지홍
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권2호
    • /
    • pp.45-57
    • /
    • 2009
  • 3차원 그래픽스에서 영상의 현실감을 높이기 위해 자주 사용되는 텍스쳐 맵핑 기법은 많은 연산량과 메모리 접근의 요구로 성능과 전력상의 병목점이 되고 있으며, 이러한 텍스쳐 맵핑 단계에서의 메모리 접근시간을 줄이기 위해 텍스쳐 캐시가 이용되고 있다. 그러나 점차 소형화 되고 있는 휴대용 기기의 특성과 배터리로 동작하기에 갖는 전력상의 제약으로 인해 텍스쳐 캐시가 차지하는 면적과 에너지 소모를 줄이는 노력이 필요하다. 본 논문에서 제안하는 기법은 텍스쳐 캐시의 크기가 줄어듦에 따라 발생하는 미스율의 증가를 보완하기 위해 미리 읽기 기법을 사용한다. 또한 미리 읽기 버퍼에 텍스쳐 캐시에서 교체되는 블록을 임시로 저장해 둠으로써 충돌 미스를 줄이는 기법을 제안한다. 실험 결과, 1K bytes와 2K bytes의 캐시의 사용하면서 16K bytes 또는 8K bytes의 캐시를 사용했을 때와 비슷한 성능을 유지할 수 있음을 확인할 수 있었다. 또한 제안하는 기법의 사용으로 텍스쳐 캐시에서 소모되는 에너지 소모를 $23%{\sim}60%$까지 줄이고 70%정도의 면적을 감소 시킬 수 있음을 보여주었다.

맵리듀스 잡을 사용한 해시 ID 매핑 테이블 기반 대량 RDF 데이터 변환 방법 (Conversion of Large RDF Data using Hash-based ID Mapping Tables with MapReduce Jobs)

  • 김인아;이규철
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 추계학술대회
    • /
    • pp.236-239
    • /
    • 2021
  • AI 기술의 성장과 함께 지식 그래프의 크기는 지속적으로 확장되고 있다. 지식 그래프는 주로 트리플이 연결된 RDF로 표현되며, 많은 RDF 저장소들이 RDF 데이터를 압축된 형태의 ID로 변환한다. 그러나 RDF 데이터의 크기가 특정 기준 이상으로 클 경우, 테이블 탐색으로 인한 높은 처리 시간과 메모리 오버헤드가 발생한다. 본 논문에서는 해시 ID 매핑 테이블 기반 RDF 변환을 분산 병렬 프레임워크인 맵리듀스에서 처리하는 방법을 제안한다. 제안한 방법은 RDF 데이터를 정수 기반 ID로 압축 변환하면서, 처리 시간을 단축하고 메모리 오버헤드를 개선한다. 본 논문의 실험 결과, 약 23GB의 LUBM 데이터에 제시한 방법을 적용했을 때, 크기는 약 3.8배 가량 줄어들었으며 약 106초의 변환 시간이 소모되었다.

  • PDF

$H_2^{15}O$ 양전자단층촬영술을 이용한 뇌기능 지도 작성(II): 작업 기억의 지도 작성 (Functional Brain Mapping Using $H_2^{15}O$ Positron Emission Tomography ( II ): Mapping of Human Working Memory)

  • 이재성;이동수;이상건;남현우;김석기;박광석;정재민;정준기;이명철
    • 대한핵의학회지
    • /
    • 제32권3호
    • /
    • pp.238-249
    • /
    • 1998
  • 목적: PET을 이용하여 특정한 자극에 대한 국소 뇌혈류 변화를 영상화함으로써 비침습적으로 뇌의기능적 구조를 밝혀 낼 수 있다. 이 연구에서는 대조과제와 언어성 및 시각적 작업기억중추에 대한 활성화과제를 수행하면서 뇌혈류 PET을 시행하고 그 차이를 분석하여 작업기억에 관한 뇌기능지도를 구성하였다. 대상 및 방법: 정상인 6명에 대해서 각각 대조과제, 단어기억 언어성 작업기억 활성화과제, 그림기억 언어성 작업기억 활성화과제, 시각적 작업기억 활성화과제를 수행시키면서 뇌혈류 PET을 촬영하였다. 언어성 작업기억과제로서 단어 기억과제에서는 4개의 단어를 순차적으로 보여주고 1초 후 1개의 단어를 보여주어 동일한 단어가 4개의 단어 중에 있었으면 버튼을 누르게 하며 $H_2^{15}O$ PET을 촬영하였다. 두 번 째 언어성 작업기억과제인 그림 기억과제에서는 단어 대신에 특정 단어가 연상되는 사물의 그림을 보여 주었다. 시각적 작업기억과제로는 사람의 얼굴 사진을 보여 주고 같은 실험을 하였다. 의미 없는 기호를 보여 주면서 특정한 기호가 나오면 버튼을 누르게 함으로써 시각적 자극과 손가락운동으로 인한 뇌혈류 분포를 포함하게 하여 대조과제로 삼았다. SPM96소프트웨어를 이용하여 각 영상을 표준 지도 위에 공간적으로 정규화하고 활성화상태에서 뇌혈류가 의미 있게 증가된 영역을 찾아내기 위하여 각 화소의 방사능 계수에 대한 공분산분석을 하여 전체 계수 차이를 제거한 후 국소 계수 차이에 대한 귀무가설을 검증하여 각 화소의 Z 값에 대한 통계적 파라메터 영상(statistical parametric image)으로 뇌기능지도를 작성하였다. 결과: 단어를 이용한 언어성 작업기억에 대한 뇌기능지도에서는 왼쪽 브로카 영역와 전-운동영역, 왼쪽 소뇌, 오른쪽 대상회에서 뇌혈류가 증가하였다. 그림 기억과제 때에는 단어 기억과제에서 활성화된 각 부위에 더하여 왼쪽 위쪽 측두엽, 왼쪽 기저핵과 시상, 왼쪽 전-전두엽 등에서 뇌혈류가 증가하였다. 얼굴기억과제는 오른쪽 아래쪽 전두엽, 브로카 영역, 대상회, 위쪽 두정엽 등 주로 오른쪽 대뇌반구의 뇌혈류가 증가하였다. 세 가지 실험에 공통적으로 활성화된 영역을 찾기 위한 결합분석에는 왼쪽 전-운동영역, 소뇌와 기저핵, 오른쪽 대상회, 브로카 영역, 기저핵에서 뇌혈류가 증가하였다. 결론: 이상의 결과는 언어성 작업기억은 주로 왼쪽 대뇌반구의, 시각적 작업기억은 주로 오른쪽 대뇌반구의 활동에 의해서 주도되며 작업기억에 공통적인 활성화지역이 있다는 가설을 지지하였다. 전두엽이 작업기억에 중요한 역할을 한다고 생각한다.

  • PDF

Hot Data Identification For Flash Based Storage Systems Considering Continuous Write Operation

  • Lee, Seung-Woo;Ryu, Kwan-Woo
    • 한국컴퓨터정보학회논문지
    • /
    • 제22권2호
    • /
    • pp.1-7
    • /
    • 2017
  • Recently, NAND flash memory, which is used as a storage medium, is replacing HDD (Hard Disk Drive) at a high speed due to various advantages such as fast access speed, low power, and easy portability. In order to apply NAND flash memory to a computer system, a Flash Translation Layer (FTL) is indispensably required. FTL provides a number of features such as address mapping, garbage collection, wear leveling, and hot data identification. In particular, hot data identification is an algorithm that identifies specific pages where data updates frequently occur. Hot data identification helps to improve overall performance by identifying and managing hot data separately. MHF (Multi hash framework) technique, known as hot data identification technique, records the number of write operations in memory. The recorded value is evaluated and judged as hot data. However, the method of counting the number of times in a write request is not enough to judge a page as a hot data page. In this paper, we propose hot data identification which considers not only the number of write requests but also the persistence of write requests.

OpenCL을 활용한 이기종 파이프라인 컴퓨팅 기반 Spark 프레임워크 (Spark Framework Based on a Heterogenous Pipeline Computing with OpenCL)

  • 김대희;박능수
    • 전기학회논문지
    • /
    • 제67권2호
    • /
    • pp.270-276
    • /
    • 2018
  • Apache Spark is one of the high performance in-memory computing frameworks for big-data processing. Recently, to improve the performance, general-purpose computing on graphics processing unit(GPGPU) is adapted to Apache Spark framework. Previous Spark-GPGPU frameworks focus on overcoming the difficulty of an implementation resulting from the difference between the computation environment of GPGPU and Spark framework. In this paper, we propose a Spark framework based on a heterogenous pipeline computing with OpenCL to further improve the performance. The proposed framework overlaps the Java-to-Native memory copies of CPU with CPU-GPU communications(DMA) and GPU kernel computations to hide the CPU idle time. Also, CPU-GPU communication buffers are implemented with switching dual buffers, which reduce the mapped memory region resulting in decreasing memory mapping overhead. Experimental results showed that the proposed Spark framework based on a heterogenous pipeline computing with OpenCL had up to 2.13 times faster than the previous Spark framework using OpenCL.