• 제목/요약/키워드: 메모리 계층

검색결과 260건 처리시간 0.026초

모바일 DBMS를 위한 효율적인 압축 데이터 관리 시스템의 개발 (Development of the Efficient Compressed Data Management System for Embedded DBMS)

  • 신영재;황진호;김학수;이승미;손진현
    • 정보처리학회논문지D
    • /
    • 제15D권5호
    • /
    • pp.589-598
    • /
    • 2008
  • 최근 휴대용 정보기기 사용이 보편화되어지고, 정보의 디지털화로 인해 휴대용 정보기기에서 처리되어야 하는 정보가 무수히 많아지고 있다. 이로 인해 휴대용 정보기기에서는 정보들을 효과적으로 관리하기 위해 모바일 DBMS의 사용이 요구되고 있다. 또한 휴대용 정보기기에서 보편적으로 사용되는 저장장치는 NAND형 플래시 메모리로 단위 공간당 비용이 기존의 하드디스크에 비해 수십 배 가량 높아 저장 공간의 효율적인 관리가 요구되고 있다. 따라서 본 논문에서는 플래시메모리를 저장매체로 사용하는 모바일 DBMS에서 압축 기법을 사용한 효율적인 데이터 관리 시스템을 제안한다. 제안되는 압축 기반 시스템은 저장 공간의 절약을 가져오고, 데이터 입출력을 줄인다. 이러한 이점은 플래시 메모리의 수명을 연장시키는 효과 또한 기대할 수 있다.

계층적 결합형 양방향 필터를 이용한 실시간 깊이 영상 보정 방법 (Real-time Depth Image Refinement using Hierarchical Joint Bilateral Filter)

  • 신동원;호요성
    • 방송공학회논문지
    • /
    • 제19권2호
    • /
    • pp.140-147
    • /
    • 2014
  • 본 논문에서는 결합형 양방향 필터를 이용하여 깊이 영상을 실시간으로 보정하는 방법을 제안한다. 제안한 방법은 Kinect 깊이 카메라로부터 얻은 깊이 영상의 화질을 실시간으로 향상시키기 위해 GPU 내의 상수 메모리와 2차원 영상 처리에 적합한 텍스쳐 메모리를 사용한다. 또한, 단일 화소에 대한 결합형 양방향 필터 연산을 각 GPU 쓰레드(thread)에 할당한 다음 병렬로 처리하여 계산량을 현저히 감소시킨다. 그리고 깊이 영상의 품질을 더욱 높이기 위해 CUDA를 이용해 구현한 결합형 양방향 필터를 계층형 구조로 반복적으로 수행하여 폐색 영역이 채워진 깊이 영상을 얻을 수 있다. 실험 결과를 통해, 제안한 실시간 깊이 영상 보정 방법이 깊이 영상의 주관적 화질을 향상시키고, 초당 55 화면의 속도로 동작하는 것을 확인했다.

최적화된 CUDA 소프트웨어 제작을 위한 프로그래밍 기법 분석 (Analysis of Programming Techniques for Creating Optimized CUDA Software)

  • 김성수;김동헌;우상규;임인성
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권7호
    • /
    • pp.775-787
    • /
    • 2010
  • GPU(Graphics Processing Unit)는 범용 CPU와는 달리 다수코어 스트리밍 프로세서(manycore streaming processor) 형태로 특화되어 발전되어 왔으며, 최근 뛰어난 병렬 처리 연산 능력으로 인하여 점차 많은 영역에서 CPU의 역할을 대체하고 있다. 이러한 추세에 따라 최근 NVIDIA 사에서는 GPGPU(General Purpose GPU) 아키텍처인 CUDA(Compute Unified Device Architecture)를 발표하여 보다 유연한 GPU 프로그래밍 환경을 제공하고 있다. 일반적으로 CUDA API를 사용한 프로그래밍 작업시 GPU의 계산구조에 관한 여러 가지 요소들에 대한 특성을 정확히 파악해야 효율적인 병렬 소프트웨어를 개발할 수 있다. 본 논문에서는 다양한 실험과 시행착오를 통하여 획득한 CUDA 프로그래밍에 관한 최적화 기법에 대하여 설명하고, 그러한 방법들이 프로그램 수행의 효율에 어떠한 영향을 미치는지 알아본다. 특히 특정 예제 문제에 대하여 효과적인 계층 구조 메모리의 접근과 코어 활성화 비율(occupancy), 지연 감춤(latency hiding) 등과 같이 성능에 영향을 미치는 몇 가지 규칙을 실험을 통해 분석해봄으로써, 향후 CUDA를 기반으로 하는 효과적인 병렬 프로그래밍에 유용하게 활용할 수 있는 구체적인 방안을 제시한다.

지역적 가중치 파라미터 제거를 적용한 CNN 모델 압축 (Apply Locally Weight Parameter Elimination for CNN Model Compression)

  • 임수창;김도연
    • 한국정보통신학회논문지
    • /
    • 제22권9호
    • /
    • pp.1165-1171
    • /
    • 2018
  • CNN은 객체의 특징을 추출하는 과정에서 많은 계산량과 메모리를 요구하고 있다. 또한 사용자에 의해 네트워크가 고정되어 학습되기 때문에 학습 도중에 네트워크의 형태를 수정할 수 없다는 것과 컴퓨팅 자원이 부족한 모바일 디바이스에서 사용하기 어렵다는 단점이 있다. 이러한 문제점들을 해결하기 위해, 우리는 사전 학습된 가중치 파일에 가지치기 방법을 적용하여 연산량과 메모리 요구량을 줄이고자 한다. 이 방법은 3단계로 이루어져 있다. 먼저, 기존에 학습된 네트워크 파일의 모든 가중치를 각 계층 별로 불러온다. 두 번째로, 각 계층의 가중치에 절댓값을 취한 후 평균을 구한다. 평균을 임계값으로 설정한 뒤, 임계 값 이하 가중치를 제거한다. 마지막으로 가지치기 방법을 적용한 네트워크 파일을 재학습한다. 우리는 LeNet-5와 AlexNet을 대상으로 실험을 하였으며, LeNet-5에서 31x, AlexNet에서 12x의 압축률을 달성 하였다

멀티홈 모바일 호스트상에서 스트라이핑 전송계층 연결을 위한 적응형 버퍼튜닝기법 (An Adaptive Buffer Tuning Mechanism for striped transport layer connection on multi-homed mobile host)

  • 파라즈;허의남
    • 인터넷정보학회논문지
    • /
    • 제10권4호
    • /
    • pp.199-211
    • /
    • 2009
  • 최근 무선네트워크 기술은 이동 응용프로그램을 위해 이종통신망 연결패스 상에서 병렬로 스트라이핑 데이터 기술을 이용해 고속 데이터를 전달을 가능케 한다 [2]. 전통적으로 대역폭지연프로덕트(BDP) 기반에서 고속전송은 송신자 측에서 다중 TCP 소켓의 튜닝을 요구한다. 더욱이, 메모리와 네트워크 요구의 균형을 유지하는 ATBT같은 기술은 유선기반의 단일 소켓상에서 하나의 플로우만 가정하여 설계되었다. 그러므로 본 논문은 여러 무선 패스를 경유하는 이종 무선네트워크 상에서 고속전송을 가능케하는 스트라이핑 전송기술에 적합한 버퍼튜닝 기술을 제안한다. 제안 기술은 이동성, 링크손실, 대역폭변동성 등의 특징을 지닌 무선 멀티홈 모바일 호스트상에서 작동하는 전송계층에서의 자원관리기술이다. 실험을 통하여 유선기반의 ATBT를 본 환경에 적용한 것보다 메모리, 평균 전송량에 있어 제안 기술의 성능이 우수하다.

  • PDF

무선센서네트워크에서 메모리 속성을 이용한 클러스터링 기법 (Clustering Scheme using Memory Restriction for Wireless Sensor Network)

  • 최해원;유기영
    • 한국통신학회논문지
    • /
    • 제34권1B호
    • /
    • pp.10-15
    • /
    • 2009
  • 최근 센서 네트워크에 대한 중요성이 강조 되면서 응용분야도 점차 증가하고 있는 추세이다. 센서 네트워크를 위한 다수의 프로토콜들이 개발되었고 계층구조망을 위한 연구들이 에너지 효율적인 면에서 좋은 평가를 받고 있다. 계층구조망을 위한 라우팅 프로토콜 중 가장 대표적인 프로토콜이 LEACH이다. 하지만 LEACH관련 프로토콜은 메시지 전송 시 네트워크 전체 단위로 통신을 함으로서 발생하는 다양한 문제점을 가지고 있다. 본 논문에서는 LEACH관련 기법들의 문제점을 해결할 수 있는 새로운 클러스터링 기법을 제안한다. 제안하는 기법은 센서노드의 메모리 제약성을 역으로 이용하여 클러스터링을 구성한다. 성능평가 결과 본 논문에서 제안한 클러스터링 기법은 LEACH에 비해 네트워크의 균형 있는 클러스터 분산을 제시할 수 있었고, LEACH보다 약 1.8배 오랜 네트워크 생존기간을 보였다.

커널 기반 가상머신을 이용한 시스템 무결성 모니터링 시스템 (System Integrity Monitoring System using Kernel-based Virtual Machine)

  • 남현우;박능수
    • 정보처리학회논문지C
    • /
    • 제18C권3호
    • /
    • pp.157-166
    • /
    • 2011
  • 가상화 계층은 커널 보다 높은 권한 계층에서 수행되어 운영체제가 사용하고 있는 자원 정보를 모니터링 하는데 적합하다. 하지만 기존 가상화 기반 모니터링 시스템은 CPU나 메모리 사용률과 같은 기초적인 정보만을 제공하고 있다. 본 논문에서 메모리, 레지스터 GDT, IDT 그리고 시스템 콜과 같은 동적인 시스템 커널 객체를 모니터링하기 위하여 전가상화 방식의 모니터링 시스템을 제안한다. 모니터링 시스템을 검증하기 위해 커널의 수정 없이 바로 리눅스 커널에 적용된 전가상화 방식의 KVM을 기반으로 시스템을 구현하였다. 구현된 시스템은 KVM 내부 객체에 접근하기 위한 KvmAccess 모듈, 그리고 가상머신 모니터링 결과를 외부 모듈에서도 사용할 수 있도록 API를 제공하였다. 구현된 모니터링 시스템의 성능을 측정한 결과 1초 주기로 시스템을 모니터링을 하더라도 0.37% 정도의 CPU 점유율을 차지하여 그 성능 부하가 아주 작았다.

계층형 시간적 메모리 네트워크를 기반으로 한 스트림 데이터의 연속 다중 예측 (Continuous Multiple Prediction of Stream Data Based on Hierarchical Temporal Memory Network)

  • 한창영;김성진;강현석
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제1권1호
    • /
    • pp.11-20
    • /
    • 2012
  • 스트림 데이터는 시간에 따라 연속적으로 변화하는 일련의 값들로 나타난다. 이러한 스트림 데이터의 특성상 다양한 시간 간격의 기준에 따라 계속적으로 그 동향이 달라질 수 있다. 이 때문에 스트림 데이터의 추세 예측은 간격이 갱신될 때 마다 연속적인 환경에서 여러 간격들을 기준으로 동시에 이루어지는 연속 다중 예측(Continuous Multiple Prediction, CMP)이 지원되어야 한다. 본 논문은 스트림 데이터의 연속 다중 예측을 효과적으로 지원하기 위하여, 신피질 학습 모델인 계층형 시간적 메모리(Hierarchical Temporal Memory, HTM) 모델을 확장하여 연속통합 HTM(Continuous Integrated HTM, CIHTM) 네트워크를 제안한다. 이를 위해 우리는 HTM 네트워크를 구성하는 기존 노드들 외에 새롭게 이동 벡터 파일 센서, 시공간 분류 노드, 다중 통합 노드를 고안하였다. 그리고 이들을 바탕으로 CIHTM 네트워크의 학습과 추론 알고리즘을 개발하였다.

고성능 플래시 메모리 솔리드 스테이트 디스크 (A High Performance Flash Memory Solid State Disk)

  • 윤진혁;남이현;성윤제;김홍석;민상렬;조유근
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권4호
    • /
    • pp.378-388
    • /
    • 2008
  • 플래시 메모리는 전력 소모가 작고 충격과 진동에 강하며 크기가 작다는 특성 때문에 최근 노트북이나 UMPC(Ultra Mobile PC)와 같은 이동 컴퓨팅 시스템에서 하드디스크를 대체할 대용량 저장 매체로서 주목 받고 있다. 플래시 메모리에 기반한 저장 장치는 일반적으로 랜덤 읽기 성능이나 순차 읽기, 순차 쓰기 성능이 매우 좋은데 비해, 덮어쓰기가 불가능한 플래시 메모리의 물리적인 제약으로 인하여 소량의 랜덤 쓰기 성능은 떨어진다. 본 논문은 이 문제를 해결하기 위한 두 가지 중요한 특징을 갖는 SSD(Solid State Disk) 아키텍처를 제안하였다. 첫 번째로 비휘발성 이면서도 SRAM과 동일한 인터페이스로 덮어쓰기가 가능한 작은 크기의 FRAM(Ferroelectric RAM)을 NAND 플래시 메모리와 함께 사용하여 소량 쓰기 오버헤드를 최소화하였다. 두 번째, 호스트 쓰기 요청들도 소량 랜덤 쓰기와 대량 순차 쓰기로 분류하여 각각에 대해 최적의 쓰기 버퍼 관리 방법을 적용하였다. 평가 보드 상에서 SSD 프로토타입을 구현하고 PC 사용 환경의 워크로드에 기반한 벤치마크를 이용하여 성능을 평가해 본 결과 랜덤 패턴을 보이는 워크로드에서는 하드디스크나 기존의 상용 SSD들에 비해 처리율(throughput) 측면에서 3배 이상의 성능을 보였다.

FlaSim: 리눅스 커널 모듈을 이용한 FTL 에뮬레이터 (FlaSim: A FTL Emulator using Linux Kernel Modules)

  • 최화영;김상현;이승원;박상원
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권11호
    • /
    • pp.836-840
    • /
    • 2009
  • 플래시 메모리의 성능평가 실험 환경 구성은 플래시 메모리가 장착된 제품들이 동작하는 시스템으로 이뤄진다. 이와 같은 방법은 물리적이고 비용적인 제약이 따르게 된다. 또한 실험에 쓰이는 입력 데이터와 FTL 알고리즘의 성능평가를 위한 결과 데이터인 트레이스의 추출 방법이 까다롭고 힘들다. Oracle의 경우 트레이스 추출이 불가능하고, MySQL, SQLite는 트레이스 추출이 가능하더라도 결과의 정확성이 보장되지 않는 문제점이 있다. 따라서 본 논문에서는 디바이스 드라이버를 통해 물리적 제약을 없애고 트레이스 추출을 쉽고 간편하게 하여 정확한 실험 결과 분석이 용이하도록 FTL 에뮬레이터를 설계하고 구현한 내용에 대해 다룬다. 본 논문에서 제안한 FTL 에뮬레이터인 FlaSim은 플래시 메모리의 데이터 저장 메커니즘과 동일한 동작을 하도록 구현하고 리눅스 커널 모듈을 사용하여 필요한 기능을 추가할 수 있다. FlaSim은 모듈 적재 방식을 사용하기 때문에 FTL 알고리즘 및 플래시 메모리에 대한 실험의 확장성을 향상시킨다. 또한 다양한 응용프로그램에 적용이 쉽고, 플래시 메모리에 대한 실험의 제약이 되는 물리적인 비용을 줄일 수 있다. 게다가 트레이스 추출하는 데 쉽고 효율적인 방법을 제공하여 결과 도출 및 분석 시 시간적, 시스템적 제약을 받지 않아 효율성이 큰 장점이 있다. 추후 많은 FTL 알고리즘 및 플래시 메모리에 대한 실험과 연구에 도움이 될 것으로 예상된다.