• Title/Summary/Keyword: 메모리효율

Search Result 1,787, Processing Time 0.026 seconds

작업 처리 단위 변화에 따른 GPU 성능과 메모리 접근 시간의 관계 분석 (Analysis of GPU Performance and Memory Efficiency according to Task Processing Units)

  • 손동오;심규연;김철홍
    • 스마트미디어저널
    • /
    • 제4권4호
    • /
    • pp.56-63
    • /
    • 2015
  • 최신 GPU는 프로세서 내부에 포함된 다수의 코어를 활용하여 높은 병렬처리가 가능하다. GPU의 높은 병렬성을 활용하는 기법 중 하나인 GPGPU 구조는 GPU에서 대부분의 CPU의 작업을 처리가 가능하게 해주며, GPU의 높은 병렬성과 하드웨어자원을 효과적으로 활용할 수 있다. 본 논문에서는 다양한 벤치마크 프로그램을 활용하여 CTA(Cooperative Thread Array) 할당 개수 변화에 따른 메모리 효율성과 성능을 분석하고자 한다. 실험결과, CTA 할당 개수 증가에 따라 다수의 벤치마크 프로그램에서 성능이 향상되었지만, 일부 벤치마크 프로그램에서는 CTA 할당 개수 증가에 따른 성능 향상이 발생하지 않았다. 이러한 이유로는 벤치마크 프로그램에서 생성된 CTA 개수가 적거나 동시에 수행할 수 있는 CTA 개수가 정해져 있기 때문으로 판단된다. 또한, 각 벤치마크 프로그램별로 메모리 채널 정체에 따른 메모리 스톨, 내부연결망 정체에 따른 메모리 스톨, 파이프라인의 메모리 단계에서 발생하는 스톨을 분석하여 성능과의 연관성을 파악하였다. 본 연구의 분석결과는 GPGPU 구조의 병렬성 및 메모리 효율성 향상을 위한 연구에 대한 정보로 활용될 것으로 기대된다.

효율적인 채널 정보 메모리 관리를 위한 PCM 엔코더 설계 (Design of Advanced PCM Encoder Architecture for Efficient Channel Information Memory Management)

  • 노윤희;김건희;김동영;김복기;이남식
    • 한국항행학회논문지
    • /
    • 제24권4호
    • /
    • pp.305-313
    • /
    • 2020
  • 원격측정 시스템은 비행체의 상태 정보 데이터를 획득하여 지상 수신소로 전송하는 시스템이다. PCM 엔코더는 획득한 상태 정보 데이터를 이용하여 프레임을 생성하기 위해 채널 정보를 저장할 메모리가 필요하다. 대형 비행체의 경우 각 부위의 센서 및 시스템이 증가함에 따라 많은 데이터를 계측해야 하므로 더 큰 용량의 메모리를 필요로 한다. 그러나 한정된 메모리에서 모든 채널 정보를 저장하기에는 어려움이 있다. 따라서 본 논문에서는 FPGA 내부 ROM의 한정된 메모리에서 중복되는 채널 정보는 메모리에 한번만 할당하고, 마이너 프레임마다 다른 정보를 가지는 서브콤의 채널 정보는 서브콤 배수만큼 메모리에 할당하는 PCM 엔코더 구조를 제시하고 구현하였다. 이는 중복으로 할당되는 채널 정보를 최소화하여 효율적으로 메모리를 관리할 수 있다. 또한 다양한 계측 주기의 채널을 구성한 시뮬레이션을 통해 제시한 PCM 엔코더의 동작을 검증하였다.

플래시 메모리 환경을 위한 이단계 인덱싱 방법 (A Two-level Indexing Method in Flash Memory Environment)

  • 김종대;장지웅;황규정;김상욱
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권7호
    • /
    • pp.713-717
    • /
    • 2008
  • 최근 플래시 메모리 용량이 증가함에 따라 대용량의 데이타를 빠르게 검색하기 위한 효율적인 인덱싱 방법의 필요성이 증가하였다. 플래시 메모리는 기존 저장매체와 다른 여러 가지 하드웨어적인 특성이 있다. 특히, 쓰기 연산과 소거 연산은 비용이 매우 크고, 덮어쓰기 연산이 불가능하다. 본 논문에서는 플래시 메모리에 저장되는 데이타에 대해여 발생하는 잦은 쓰기 연산을 감소시켜 다양한 연산을 효율적으로 처리하는 인덱스 구조를 제안한다. 본 논문에서는 성능 평가를 통해 제안하는 인덱싱 방법의 우수성을 보인다.

반복적 고정분할 평균기법을 이용한 메모리기반 학습기법 (A Memory-based Learning using Repetitive Fixed Partitioning Averaging)

  • 이형일
    • 한국멀티미디어학회논문지
    • /
    • 제10권11호
    • /
    • pp.1516-1522
    • /
    • 2007
  • FPA(Fixed Partition Averaging) 기법은 기억공간의 효율적인 사용과 분류성능의 향상을 위하여 제안되었던 메모리 기반 추론 기법으로 대상 패턴 공간을 분할 한 후 대표 패턴을 추출하여 분류 기준 패턴으로 사용한다. 이 기법은 메모리 사용 효율과 분류 성능 면에서 우수한 결과를 보인다. 그러나 여러 클래스가 혼합된 분할패턴공간의 경우에 원래의 패턴들을 그대로 저장하여 메모리와 분류성능에 부담으로 작용하는 문제점을 가지고 있다. 본 논문에서는 여러 클래스가 혼합된 분할공간에서 패턴비율을 고려하여 고정분할을 반복적으로 실행하여 초월평면을 생성하고 분류하는 반복적 고정분할평균기법을 제안한다. 본 논문에서 제안한 기법은 기존의 k-NN 기법과 비교하여 현저하게 줄어든 대표패턴을 이용하여 유사한 분류 성능을 보여주며, NGE 이론을 구현한 EACH 시스템과 FPA 기법 등과 비교하여 탁월한 분류 성능을 보여준다.

  • PDF

주메모리 접근을 고려한 CPU 주파수 조정 제한 (Limiting CPU Frequency Scaling Considering Main Memory Accesses)

  • 박문주
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제20권9호
    • /
    • pp.483-491
    • /
    • 2014
  • 현대의 컴퓨터 시스템에서는 동적 전압/주파수 조정(DVFS: Dynamic Voltage/Frequency Scaling) 기법을 이용하여 성능과 전력 소모의 균형을 이루도록 한다. DVFS 정책의 유용성은 높아진 주파수에 따른 소모 전력에 대한 성능 향상 정도에 달려있다. 특히 메모리 I/O가 많은 응용의 경우 CPU 주파수 상승에 비례하여 성능이 향상되지 않는 경우가 많다. 본 논문에서는 메모리 접근 빈도에 기반하여 CPU 주파수 조정의 상한을 결정하도록 하였다. 명령어 당 메모리 접근(최종 수준 캐시 미스) 빈도에 따라 CPU 주파수 상향으로 인한 성능 향상이 제한되는 것을 실험으로 확인하고, 성능 향상의 이득이 작아지는 CPU 주파수를 제시하도록 한다. 본 논문의 기법을 적용한 실험 결과는 메모리 접근 빈도가 높은 응용에 대하여 30% 이상의 에너지 효율 상승이 있음을 보인다.

NAND 플래시 메모리 기반 B+트리를 위한 효율적인 고장회복 관리기법 (An Efficient Recovery Management Scheme for NAND Flash Memory-based B+tree)

  • 이현섭;김보경;이동호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.88-91
    • /
    • 2011
  • NAND 플래시 메모리는 저전력과 빠른 접근 속도의 특징 때문에 차세대 저장장치로 주목 받고 있다. 특히 플래시 메모리로 만들어진 SSD(solid state disk)는 인터페이스가 기존의 하드디스크와 동일하고 대용량화 되고 있기 때문에 가까운 미래에 다양한 저장시스템의 저장장치로 사용될 것으로 예상된다. 그러나 NAND 플래시메모리 기반 저장장치는 쓰기 전 소거 구조와 같은 독특한 하드웨어 특징을 가지고 있기 때문에 특정 지역에 반복적인 쓰기 요청을 발생하는 B트리를 구축하는 것은 심각한 성능저하를 야기 할 것이다. 이러한 문제를 해결하기 위해 버퍼를 이용하여 B트리 구축 성능을 개선한 방법들이 제안되었다. 그러나 이러한 기법들은 갑작스러운 전원 차단 시 버퍼에 유지하고 있던 데이터를 모두 유실하기 때문에 고장회복을 위한 추가적인 방법이 필요하다. 따라서 본 논문에서는 버퍼를 이용한 방법 중 IBSF기법을 기반으로 NAND 플래시 메모리 기반 저장장치에서 고성능의B트리 구축 방법뿐만 아니라 전원 차단시 효율적인 고장회복을 할 수 있는 기법을 제안한다. 본 논문에서 제안하는 기법은 B트리 변경시 변경 된 정보를 로그에 저장하여 관리한다. 또한 루트노드가 변경될 때 검사점(checkpoint)을 수행한다. 마지막으로 다양한 실험을 통하여 본 논문의 고장회복 성능을 보여준다.

스냅샷 데이터를 갖는 다중레벨 공간 DBMS 설계 및 구현 (Design and Implementation of Multi-Level Spatial DBMS with Snapshot)

  • 천종현;어상훈;김호석;배해영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.217-219
    • /
    • 2005
  • 최근 들어 무선 인터넷 및 모바일 기술이 급속한 발달을 이루면서 이동 객체의 위치에 기반 한 많은 서비스들이 개발되고 있다. 이 서비스에 사용되는 않은 어플리케이션들은 비교적 용량이 큰 공간 정보를 사용하여 최근에는 기존 디스크 기반 데이터베이스 관리 시스템이 제공할 수 있는 처리 속도보다 더욱 빠른 트랜잭션 처리를 요구하고 있다. 따라서 공간 데이터와 같은 대용량 데이터의 효율적인 처리와 폭주 하는 여러 사용자들에게 빠른 응답시간을 제공하여 주는 공간 DBMS가 요구되고 있다. 기존 디스크 기반의 공간 DBMS는 공간데이터와 같은 대용량의 데이터 관리가 가능하지만, 빠른 응답속도를 요구하는 여러 어플리케이션을 지원하기에는 무리가 있다. 반면에 메인 메모리 기반의 공간 DBMS는 불필요한 디스크 I/O를 없앰으로써 더욱 빠른 트랜잭션 처리를 지원하지만, 메인 메모리의 저장 한계로 대용량 처리에는 한계가 있다. 이러한 이유로 디스크 공간 DBMS의 장점과 메인 메모리 공간 DBMS의 장점으로 이루어진 다중레벨 공간 DBMS를 제안한다. 다중레벨 공간 DBMS는 디스크 기반의 공간 DBMS인 GMS시스템에 메인 메모리 데이터베이스와 그와 관련된 여러 컴포넌트들을 추가하여 개발 하였다. 제안된 시스템은 디스크 데이터베이스 기반의 대용량 데이터의 효율적인 관리와 메모리 데이터베이스 기반의 빠른 트랜잭션 처리를 보장한다.

  • PDF

시각 주목 정보에 기반한 자율 가상 캐릭터의 인지 메모리 설계

  • 차명희
    • 한국게임학회지
    • /
    • 제6권1호
    • /
    • pp.52-54
    • /
    • 2009
  • 프로그램된 정보를 사용하는 자율 가상 캐릭터는 항상 반복된 패턴 행동을 하기 때문에 사용자가 흥미를 잃는 경우가 많고 현실성도 떨어진다. 본 논문에서는 이러한 문제점을 해결하기 위해, 자율 가상캐릭터가 자율적으로 인지한 정보를 저장하고 저장한 정보를 활용하여 상황에 맞는 행동을 수행할 수 있는 메모리 체계를 제안한다. 본 논문은 자율 가상 캐릭터가 시각 주목으로 인지한 정보를 저장하고 관리하는 메모리 체계의 모델을 제시한다. 메모리 용량을 효율적으로 사용할 수 있도록 게임 환경에 적합한 빠른 시각 주목 알고리즘을 연구하여 중요하고 눈에 띄는 정보만 저장한다. 자율 가상 캐릭터의 인지 메모리를 크게 시각 기억와 공간 관계 기억 구조로 구성한다. 시각 기억은 쿼드그래프로 구현된 저장 구조에 인지한 정보를 저장한다. 공간 관계 기억은 공간 관계 그래프 이론을 기반으로 객체들간의 방향과 거리 정보를 저장한다. 본 논문의 제안 방법을 가상 환경에서 실험한 결과, 자율 가상 캐릭터는 시각 주목 기능으로 3차원 가상 환경의 동적 객체까지 감지하여 자율적으로 정보를 주목하여 저장하고 있음을 확인했다. 자율 가상캐릭터는 메모리 정보를 활용하여 목표 객체를 빠르게 탐색하며 길찾기에 필요한 경로 계획을 수립한다. 성능면에서는 주목맵만들기 위한 특징맵으로 가장 주목할 수 있는 특징들로 구성하여 처리속도가 1.6배 이상 향상됨을 확인했다.

  • PDF

이중 포트 메모리를 위한 효과적인 테스트와 진단 알고리듬 (An Efficient Test and Diagnosis Algorithm for Dual Port Memories)

  • 김지혜;김홍식;김상욱;강성호
    • 대한전자공학회논문지SD
    • /
    • 제41권5호
    • /
    • pp.115-131
    • /
    • 2004
  • 이중 포트 메모리의 사용이 증가함에 따라, 이중 포트 메모리의 테스트와 진단이 중요하게 여겨지고 있다. 본 논문에서는 메모리의 테스트 과정에서 고장이 검출되었을 때, 발생한 고장의 종류를 세부적으로 분류할 수 있는 새로운 진단 알고리듬을 제안한다. 본 알고리듬에서는 진단을 위한 패턴뿐만 아니라 테스트 결과를 통하여 얻을 수 있는 정보를 이용하여 진단 과정의 효율성을 증대하였으며, 이중 포트 메모리에서 발생할 수 있는 다양한 고장에 대하여 진단이 가능하다.

가상 메모리 압축을 위한 CAMD 알고리즘 설계 (Design of the Compression Algorithm for in-Memory Data of the Virtual Memory)

  • 장승주
    • 정보처리학회논문지A
    • /
    • 제11A권3호
    • /
    • pp.157-162
    • /
    • 2004
  • 본 논문에서는 가상 메모리 압축 알고리즘으로 CAMD 알고리즘을 제안한다. CAMD 알고리즘은 페이지 폴트가 일어났을 때 이들 페이지들을 스왑 디바이스로 이동시키지 않고 주기억장치 내의 압축된 캐시 영역을 할당하여 압축된 페이지를 저장한다. 이렇게 함으로써 스왑 디바이스로 이동하는 시간과 횟수를 감소시켜서 페이지 폴트 응답시간을 줄이며 주기억장치에 저장되는 페이지들의 공간 활용도를 높일 수 있다. 메모리 내의 데이터는 일반적인 압축 알고리즘에서 다루는 데이터와는 다른 특징들을 가지고 있어서 메모리 내의 주소 값이나 배열 데이터와 값은 요소들을 고려하여 압축될 때의 효율성을 높일 수 있다.