• 제목/요약/키워드: kernel technique

검색결과 263건 처리시간 0.028초

GCN 아키텍쳐 상에서의 OpenCL을 이용한 GPGPU 성능향상 기법 연구 (A Study on GPGPU Performance Improvement Technique on GCN Architecture Using OpenCL API)

  • 우동희;김윤호
    • 한국전자거래학회지
    • /
    • 제23권1호
    • /
    • pp.37-45
    • /
    • 2018
  • 현재 프로그램이 운용되는 시스템은 기존의 싱글코어 및 멀티코어 환경을 넘어서 매니코어, 부가 프로세스 및 이기종 환경까지 그 영역이 확장되고 있는 중이다. 하지만, 기존 연구의 경우 NVIDIA 벤더에서 나온 아키텍쳐 및 CUDA로의 병렬화가 주로 이루어졌고 AMD에서 나온 범용 GPU 아키텍쳐인 GCN 아키텍쳐에 대한 성능향상에 관한 연구는 제한적으로 이루어졌다. 이런 점을 고려해 본 논문에서는 GCN 아키텍쳐의 GPGPU 환경인 OpenCL 내에서의 성능향상 기법에 대해 연구하고 실질적인 성능향상을 보였다. 구체적으로, 행렬 곱셈과 컨볼루션을 적용한 GPGPU 프로그램을 본 논문에서 제시한 성능향상 기법을 통해 최대 30% 이상의 실행시간을 감소시켰으며, 커널 이용률 또한 40% 이상 높였다.

내장형 시스템을 위한 PMU (Performance Monitoring Unit) 기반 동적 XIP (eXecute In Place) 기법 ((PMU (Performance Monitoring Unit)-Based Dynamic XIP(eXecute In Place) Technique for Embedded Systems))

  • 김도훈;박찬익
    • 대한임베디드공학회논문지
    • /
    • 제3권3호
    • /
    • pp.158-166
    • /
    • 2008
  • These days, mobile embedded systems adopt flash memory capable of XIP feature since they can reduce memory usage, power consumption, and software load time. XIP provides direct access to ROM and flash memory for processors. However, using XIP incurs unnecessary degradation of applications' performance because direct access to ROM and flash memory shows more delay than that to main memory. In this paper, we propose a memory management framework, dynamic XIP, which can resolve the performance degradation of using XIP. Using a constrained RAM cache, dynamic XIP can dynamically change XIP region according to page access pattern to reduce performance degradation in execution time or energy consumption resulting from native XIP problem. The proposed framework consists of a page profiler gathering applications' memory access pattern using PMU and an XIP manager deciding that a page is accessed whether in main memory or in flash memory. The proposed framework is implemented and evaluated in Linux kernel. Our evaluation shows that our framework can reduce execution time at most 25% and energy consumption at most 22% compared with using XIP-only case adopted in general mobile embedded systems. Moreover, the evaluation shows that in execution time and energy consumption, our modified LRU algorithm with code page filters can reduce more than at most 90% and 80% respectively compared with applying just existing LRU algorithm to dynamic XIP.

  • PDF

Scene-based Nonuniformity Correction Algorithm Based on Temporal Median Filter

  • Geng, Lixiang;Chen, Qian;Qian, Weixian;Zhang, Yuzhen
    • Journal of the Optical Society of Korea
    • /
    • 제17권3호
    • /
    • pp.255-261
    • /
    • 2013
  • Scene-based nonuniformity correction techniques for infrared focal-plane arrays have been widely considered as a key technology, and various algorithms have been proposed to compensate for fixed-pattern noise. However, the existed algorithms' capability is always restricted by the problems of convergence speed and ghosting artifacts. In this paper, an effective scene-based nonuniformity correction method is proposed to solve these problems. The algorithm is an improvement over the constant statistics method and a temporal median is utilized with the Gaussian kernel to estimate the nonuniformity parameters. Also theoretical analysis is conducted to demonstrate that effective ghosting artifacts elimination and superior convergence speed can be obtained with the proposed method. Finally, the performance of the proposed technique is tested with infrared image sequences with simulated nonuniformity and with infrared imagery with real nonuniformity. The results show the proposed method is able to estimate each detector's gain and to offset reliably and that it performs better in increasing convergence speed and reducing ghosting artifacts compared with the conventional techniques.

Transient analysis of two dissimilar FGM layers with multiple interface cracks

  • Fallahnejad, Mehrdad;Bagheri, Rasul;Noroozi, Masoud
    • Structural Engineering and Mechanics
    • /
    • 제67권3호
    • /
    • pp.277-281
    • /
    • 2018
  • The analytical solution of two functionally graded layers with Volterra type screw dislocation is investigated under anti-plane shear impact loading. The energy dissipation of FGM layers is modeled by viscous damping and the properties of the materials are assumed to change exponentially along the thickness of the layers. In this study, the rate of gradual change ofshear moduli, mass density and damping constant are assumed to be same. At first, the stress fields in the interface of the FGM layers are derived by using a single dislocation. Then, by determining a distributed dislocation density on the crack surface and by using the Fourier and Laplace integral transforms, the problem are reduce to a system ofsingular integral equations with simple Cauchy kernel. The dynamic stress intensity factors are determined by numerical Laplace inversion and the distributed dislocation technique. Finally, various examples are provided to investigate the effects of the geometrical parameters, material properties, viscous damping and cracks configuration on the dynamic fracture behavior of the interacting cracks.

무슬림 관광객 증대를 위한 머신러닝 기반의 할랄푸드 분류 프레임워크 (A Halal Food Classification Framework Using Machine Learning Method for Enhancing Muslim Tourists)

  • 김선아;김정원;원동연;최예림
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제26권3호
    • /
    • pp.273-293
    • /
    • 2017
  • Purpose The purpose of this study is to introduce a framework that helps Muslims to determine whether a food can be consumed. It can complement existing Halal food classification services having a difficulty of constructing Halal food database. Design/methodology/approach The proposed framework includes two components. First, OCR(Optical Character Recognition) technique is utilized to read the food additive information. Second, machine learning methods were used to trained and predicted to determine whether a food can be consumed using the provided information. Findings Among the compared machine learning methods, SVM(Support Vector Machine), DT(Decision Tree), and NB(Naive Bayes), SVM with linear kernel and DT had excellent performance in the Halal food classification. The framework which adopting the proposed framework will enhance the tourism experiences of Muslim tourists who consider keeping the Islamic law most importantly. Furthermore, it can eventually contribute to the enhancement of smart tourism ecosystem.

SPH에서의 Convex Hull 알고리즘 적용연구 (A Syudy on Applications of Convex Hull Algorithm in the SPH)

  • 이진성;이영신
    • 한국군사과학기술학회지
    • /
    • 제14권2호
    • /
    • pp.313-320
    • /
    • 2011
  • SPH(Smoothed Particle Hydrodynamics) is a gridless Lagrangian technique that is useful as an alternative numerical analysis method used to analyze high deformation problems as well as astrophysical and cosmological problems. In SPH, all points within the support of the kernel are taken as neighbours. The accuracy of the SHP is highly influenced by the method for choosing neighbours from all particle points considered. Typically a linked-list method or tree search method has been used as an effective tool because of its conceptual simplicity, but these methods have some liability in anisotropy situations. In this study, convex hull algorithm is presented as an improved method to eliminate this artifact. A convex hull is the smallest convex set that contains a certain set of points or a polygon. The selected candidate neighbours set are mapped into the new space by an inverse square mapping, and extract a convex hull. The neighbours are selected from the shell of the convex hull. These algorithms are proved by Fortran programs. The programs are expected to use as a searching algorithm in the future SPH program.

듀얼코어 임베디드 리눅스 시스템에서 공유 메모리 성능 개선 방안 및 성능 분석 (Improvement Method and Performance Analysis of Shared Memory in Dual Core Embedded Linux system)

  • 정지성;김창봉
    • 인터넷정보학회논문지
    • /
    • 제11권4호
    • /
    • pp.95-106
    • /
    • 2010
  • 최근 복잡한 프로그래밍 환경에서 다수의 프로세스들은 서로 협력하기 위하여 서로 통신하고 자원과 정보를 공유한다. 커널에서는 이것이 가능한 방법으로 프로세스간 통신이라는 IPC(Inter-Process Communication)를 제공한다. 리눅스에서 사용되는 공유 메모리는 동일한 메모리 영역에 여러개의 프로세스가 접근할 수 있도록 해 주는 기술이다. 본 논문에서는 서로 다른 코어에 서로 다른 운영체제를 갖는 듀얼코어 임베디드 리눅스 시스템에서 공유 메모리 성능 개선 방안을 제시하고, MP2530F(ARM926F+ARM946E)의 임베디드 리눅스 시스템을 구축하여 성능을 측정한다. 공유 메모리를 이용한 프로세스의 동작이 별개의 CPU에서 동작되도록 함으로써 성능 향상을 꾀한다.

중력 모델을 이용한 시공간 데이터의 시각화 (Spatiotemporal Data Visualization using Gravity Model)

  • 김석연;연한별;장윤
    • 정보과학회 논문지
    • /
    • 제43권2호
    • /
    • pp.135-142
    • /
    • 2016
  • 시공간 데이터는 위도와 경도를 비롯한 위치정보를 포함한 데이터를 일컫는 말로 지리학적 시각화의 연구로 시공간 데이터를 분석하고 표현하는 방법에 대한 다양한 연구가 진행되었다. 이 기술은 특정 공간에 시간을 두고 연속적 또는 이산적으로 발생하는 데이터로부터 패턴을 찾고 이를 분석하는 데 목표가 있다. 하지만, 이동 경로에 대한 정보가 없는 이산적인 시공간 데이터에서 데이터의 흐름을 시각화하는 것은 쉽지만은 않은 일이다. 본 논문에서는 커널밀도추정과 중력모델을 이용하여 이산적인 시공간 데이터로부터 벡터를 추출하고 이를 이용하여 사용자로 하여금 시공간 데이터에서 움직임과 경향을 분석할 수 있도록 시각화 하는 것에 목표를 두었다. 이를 뒷받침하기 위하여 트위터 데이터를 이용하여 이산적인 시공간 데이터를 시각화하고 분석하고자 한다.

Dual Core 시스템에서 Shared Memory 기능 구현 (Implementation of the Shared Memory in the Dual Core System)

  • 장승주
    • 한국콘텐츠학회논문지
    • /
    • 제8권9호
    • /
    • pp.27-33
    • /
    • 2008
  • Linux에서 사용되는 Shared Memory는 동일한 메모리 영역에 여러 개의 프로세스가 접근할 수 있도록 해 주는 기술이다. 본 논문은 Linux 운영체제에서 지원해 주는 System V의 IPC 중 하나인 Shared Memory를 Dual Core 시스템 상에서 동작하도록 구현한다. 본 논문에서는 커널 단계에서 처리되는 SVR(System V Release) 형식의 Shared Memory를 다룬다. 기존의 공유메모리 방식은 단일 처리기를 이용한 방식이다. 본 논문에서는 dual core를 이용하여 공유메모리 처리를 할 수 있는 시스템을 제안한다. 본 논문에서 제안하는 Dual Core 시스템에서 공유 메모리 기능 구현은 기존의 단일 처리기 시스템에서보다 성능을 향상시킬 수 있도록 한다. 공유 메모리를 이용한 프로세스의 동작이 별개의 CPU에서 동작되도록 함으로써 성능 향상을 꾀한다.

공정 이상원인의 비선형 통계적 방법을 통한 진단 (Identifying Causes of Industrial Process Faults Using Nonlinear Statistical Approach)

  • 조현우
    • 한국산학기술학회논문지
    • /
    • 제13권8호
    • /
    • pp.3779-3784
    • /
    • 2012
  • 산업체 공정의 실시간 공정 모니터링과 진단은 생산 제품의 품질과 안전을 보장하는데 반드시 필요한 활동들의 하나이다. 그중에서 공정 진단은 공정에 발생된 특정 이상상황의 원인을 밝혀내는 것으로서 조업자들이 이상상황의 근본원인을 보다 효과적으로 도출하는데 도움을 줄 수 있다. 본 논문에서는 비선형 KFDA 기법과 데이터 전처리기법을 이용한 이상원인 진단방법을 적용하고 이의 진단 성능을 기존 선형 기법에 기반한 PCA 진단방법과 비교한다. 실제 공정을 모사한 Tennessee Eastman 공정 시뮬레이터의 공정 데이터를 통한 사례연구를 수행한 결과 기존 선형 진단 방법론 대비 신뢰할 수 있는 진단 결과를 얻을 수 있었다.