• Title/Summary/Keyword: 메모리 효율적 알고리즘

Search Result 451, Processing Time 0.023 seconds

Efficient Parallel Bilateral Filter using GPGPU (GPGPU 를 이용한 양 방향성 필터의 병렬 구현 및 성능 평가)

  • Chang, Ki Joon;Ro, Won Woo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2011.11a
    • /
    • pp.369-372
    • /
    • 2011
  • 양 방향성 필터는 이미지표면 평탄화와 잡음제거에 좋은 성능을 보이지만 특유의 연산 복잡도로 인하여 연산 시간이 오래 걸린다는 단점이 존재한다. 따라서 본 논문에서는 고도의 병렬수행을 바탕으로 하는 그래픽연산장치(GPU)에 적합하도록 수정된 효율적인 양 방향성 필터를 NVIDIA 의 CUDA 를 사용하여 GTX 285 GPU 에서 구현하였다. 영상의 전 영역을 참조하는 대신 인접하고 연속된 영역으로의 근사화, 적은 메모리 사용량, 빠른 접근속도를 가지며 충돌이 최소화된 공유메모리 버퍼, Warp 를 고려한 병합된 메모리 접근방법을 바탕으로 병렬화 하였다. 그 결과, 같은 방식의 순차실행 알고리즘 대비 최소 약 34 배에서 최대 약 76 배의 속도 개선과 30dB 내외의 PSNR 을 갖는 양 방향성 필터를 구현할 수 있었다.

Study of Efficient Algorithm for Deduplication of Complex Structure (복잡한 구조의 데이터 중복제거를 위한 효율적인 알고리즘 연구)

  • Lee, Hyeopgeon;Kim, Young-Woon;Kim, Ki-Young
    • The Journal of Korea Institute of Information, Electronics, and Communication Technology
    • /
    • v.14 no.1
    • /
    • pp.29-36
    • /
    • 2021
  • The amount of data generated has been growing exponentially, and the complexity of data has been increasing owing to the advancement of information technology (IT). Big data analysts and engineers have therefore been actively conducting research to minimize the analysis targets for faster processing and analysis of big data. Hadoop, which is widely used as a big data platform, provides various processing and analysis functions, including minimization of analysis targets through Hive, which is a subproject of Hadoop. However, Hive uses a vast amount of memory for data deduplication because it is implemented without considering the complexity of data. Therefore, an efficient algorithm has been proposed for data deduplication of complex structures. The performance evaluation results demonstrated that the proposed algorithm reduces the memory usage and data deduplication time by approximately 79% and 0.677%, respectively, compared to Hive. In the future, performance evaluation based on a large number of data nodes is required for a realistic verification of the proposed algorithm.

OHC Algorithm for RPA Memory Based Reasoning (RPA분류기의 성능 향상을 위한 OHC알고리즘)

  • 이형일
    • Journal of Korea Multimedia Society
    • /
    • v.6 no.5
    • /
    • pp.824-830
    • /
    • 2003
  • RPA (Recursive Partition Averaging) method was proposed in order to improve the storage requirement and classification rate of the Memory Based Reasoning. That algorithm worked well in many areas, however, the major drawbacks of RPA are it's pattern averaging mechanism. We propose an adaptive OHC algorithm which uses the FPD(Feature-based Population Densimeter) to increase the classification rate of RPA. The proposed algorithm required only approximately 40% of memory space that is needed in k-NN classifier, and showed a superior classification performance to the RPA. Also, by reducing the number of stored patterns, it showed a excellent results in terms of classification when we compare it to the k-NN.

  • PDF

An efficient algorithm for hash-join on NUMA architecture (NUMA 구조 기반의 효율적인 해시 조인 알고리즘)

  • Choe, Seongjun;Kim, Hongyeon;Min, Jun-Ki
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2018.05a
    • /
    • pp.300-303
    • /
    • 2018
  • 최근, 불균일 기억 장치 접근 (NUMA) 구조가 부각됨에 따라 NUMA 구조 기반의 관계 연산 기법들이 제안되고 있다. 본 논문에서는 NUMA 구조 기반의 효율적인 해시 조인 기법을 제안한다. NUMA 구조에서 조인 속성 값의 분포가 편중된 릴레이션들 간의 조인은 NUMA 노드들 간의 부하 불균형과 과도한 원격 메모리 접근을 발생시킬 수 있다. 제안 기법에서는 근사 히스토그램을 이용하여 조인 속성 값의 분포를 파악하고, 이를 기반으로 원격 메모리 접근을 줄이는 전달 방안을 제안한다. 실험에서는 입력 릴레이션들에 대해 조인 속성 값의 분포를 변화시키면서 제안 기법에 대한 성능을 평가한다.

Improvement in Performance of ATM Network Interface Card and Performance Evaluation (ATM 망 접속 장치의 성능 향상 방법과 성능 평가)

  • Kim, Cheul-Young;Lee, Seung-Ha;Na, Yun-Joo;Nam, Ji-Seung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2001.10b
    • /
    • pp.1383-1386
    • /
    • 2001
  • Internet 이용자의 급격한 증가와 광대역 통신망(B-ISDN) 구축의 확산에 따라 ATM(Asynchronous Transfer Mode)망 접속장치의 큰 수요가 기대되며, 또한 ATM망 접속장치의 성능 향상도 요구되고 있다. 기존의 연구들은 컴퓨터 프로그램의 메모리에 대한 참조가 지역적이라는 특성을 이용한 가상 메모리의 효율적인 페이지 교체 알고리즘 및 캐쉬 처리 방안들이 진행되어 왔다. 본 논문은 ATM 프로토콜 프로세서를 설계하는데 있어 네트워크 트래픽의 지역성(Locality of Reference)을 고려한 캐쉬 메모리 구조를 적용하여 보다 향상된 ATM 셀 수신이 가능하도록 한다. ATM 셀의 가상 패스 식별자/가상 채널 식별자(VPI/VCI)를 캐쉬 처리함으로써, 패킷을 분해, 재조립(Segmentation and Reassembly)할 때 관련 테이블의 검색 시간을 줄일 수 있다. 캐쉬 메모리 적용으로 인한 성능 향상을 평가하기 위해 ATM NIC 프로세서와 내부 캐시 메모리 그리고, 외부 SRAM 사이에 셀 수신 정보의 Read 와 Write에 드는 시간 비용(System Clock Cycle)을 캐시의 Hit 또는 Miss 등에 따라 구분하고, 이를 기반으로 한 시뮬레이터에 3 종류의 ATM 셀 스트림을 가하여 각각에 대해 평균 셀 처리시간, 데이터 버스의 트래픽 비율 그리고, 히트율의 3가지 평가요소를 측정하고, 비교하였다.

  • PDF

Implementation and Design of AMBA based Contrast Controller for FPD (FPD를 위한 AMBA기반의 콘트라스트 컨트롤러 설계 및 구현)

  • 김석후;홍재인;조화현;최명렬
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.658-660
    • /
    • 2003
  • 본 논문에서는 AMBA 기반의 FPD 시스템에 적용 가능한 콘트라스트 컨트롤러를 설계 및 구현하였다. 제안한 콘트라스트 컨트롤러 내부에는 AMBA의 인터페이스 spec을 준수한 AMBA AHB 컨트롤러와 콘트라스트조정 블록, 메모리 컨트롤러. FPD 컨트롤러가 내장되어있다. 구현한 알고리즘은 실시간 처리가 가능하며 콘트라스트의 범위를 조정하는 가중치를 가진 알고리즘으로 기준되는 값을 이용하여 콘트라스트의 효율적인 조정이 가능하다. 콘트라스트 컨트롤러는 VHDL로 설계하였으며 FPGA를 이용한 H/W를 구현하여 TFT-LCD panel에 디스플레이 하여 검증하였다.

  • PDF

Design and Implementation of Hangul matching System for Pocket PC (Pocket PC용 한글 매칭 시스템 설계 및 구현)

  • 이호현;조범준
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2003.05b
    • /
    • pp.74-79
    • /
    • 2003
  • 한글위주의 스크립트를 전자 잉크 데이터(electronic ink data)형태로 Pocket PC에서 사용하기 위한 한글 매칭 알고리즘을 적용하여 시스템을 구현하였다. 적용된 한글 매칭 알고리즘은 전자잉크데이터(electronic ink data)를 스크립트 형태로 변화한 후 이를 다이나믹 프로그래밍 기법을 사용하여 시스템을 구현한다. Pocket PC의 하드웨적 제약을 고려하여 효율적인 속도를 보장하면서 인식률을 높이기 위해 기본 획을 인식한 후, 획 정보와 획간의 위치관계를 이용하여 자소로 분리된 데이터의 값으로 변환하여 이를 CF메모리상에 있는 통계적 수치 데이터로 저장된 한글 데이터의 값과 비교하여 한글을 인식할 수 있는 시스템 구현에 목적이 있다.

  • PDF

Efficient Maximum Intensity Projection using SIMD Instruction and Streaming Memory Transfer (단일 명령 복수 데이터 연산과 순차적 메모리 참조를 이용한 효율적인 최대 휘소 투영 볼륨 가시화)

  • Kye, Hee-Won
    • Journal of Korea Multimedia Society
    • /
    • v.12 no.4
    • /
    • pp.512-520
    • /
    • 2009
  • Maximum intensity projection (MIP) is a volume rendering method which extracts maximum values along the viewing direction through volume data. It visualizes high-density structures, such as angio-graphic datasets so that it is frequently used in medical imaging systems. We have proposed an efficient two-step MIP acceleration method that uses the recent CPUs. First, we exploited SIMD instructions to reduce conditional branch instructions which take up a considerable part of whole rendering process, so that we improved rendering speed. Second, we proposed a new method, which accesses volume and image data successively by modifying the shear-warp rendering. This method improves memory access patterns so that cache misses are reduced. Using the current CPUs, our method improved the rendering speed by a factor of 7 than that of the shear-warp rendering.

  • PDF

Dynamically Varing Cache Line Size in Merged DRAM/Logic LSIs (런 타임에서의 캐쉬 라인 크기 선택)

  • Jung, Sam-Ki;Lee, In-Hwan
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10a
    • /
    • pp.449-453
    • /
    • 2006
  • DRAM과 고밀도집적회로가 병합된 시스템에서는 메모리와 프로세서간에 넓은 대역폭을 갖을 수 있다. 이런 조건에서 넓은 대역폭을 효율적으로 이용할 수 있는 D-VLS(Dynamically Variable Line Size) 캐쉬가 제안되었다. D-VLS 캐쉬는 프로그램이 실행 되면서 그 프로그램의 특성을 추적하며 적절한 캐쉬 라인 사이즈를 선택함으로써 시스템 성능향상을 목표로 한다. 본 논문에서는 D-VLS 캐쉬에서 캐쉬 라인 사이즈를 결정하는 알고리즘을 개선하고자 한다. 개선된 알고리즘을 적용한 결과 기존의 D-VLS 캐쉬보다 평균 메모리 접근 시간이 3.73% 정도 향상되었다.

  • PDF

An Auxiliary Log Area for In-Page Logging Scheme (In-Page 로깅 기법을 위한 보조 로그 영역)

  • Van, Jae-Kwang;Jin, Rize;Kim, Sungsoo;Chung, Tae-Sun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2014.04a
    • /
    • pp.729-731
    • /
    • 2014
  • 플래시 메모리에서 B-tree 데이터를 저장하고 관리[4, 5]할 때 빈번한 수정과 구조변동으로 인해 발생하는 블록에 대한 쓰기와 지우기 연산의 비용으로 인해 플래시 메모리의 사용 수명을 단축시키는 문제를 해결하기 위해 현재 많이 쓰이고 있는 로그 저장방식을 검토하고 이를 효율적으로 B-tree에 저장하고 관리하도록 동적 블록 그룹핑과 순환 순서 기반의 저장 알고리즘으로 제안 된 GRR (Ground Round Robin) 기법을 보조 로그 블록을 할당하여 머지횟수를 줄일 수 있는 알고리즘을 제안한다.