• 제목/요약/키워드: unified memory

검색결과 52건 처리시간 0.044초

병렬 응용프로그램 실행 시 GPU 구조에 따른 성능 분석 (Performance Evaluation of the GPU Architecture Executing Parallel Applications)

  • 최홍준;김철홍
    • 한국콘텐츠학회논문지
    • /
    • 제12권5호
    • /
    • pp.10-21
    • /
    • 2012
  • 통합형셰이더 코어 구조 개발 이후 GPU는 그래픽스 전용 연산장치에서 범용 연산장치로 발달하고 있다. 특히, 병렬 응용 프로그램들은 병렬화된 하드웨어 구조를 효과적으로 활용할 수 있기 때문에, GPU를 활용하여 병렬 응용프로그램들을 실행시키는 기법이 주목을 받고 있다. 하지만, 현재의 GPU 구조는 비그래픽스 응용프로그램을 실행하는데 있어서 병렬성을 충분히 확보하지 못하다는 한계를 가지고 있기 때문에, 이를 해결하기 위해 GPU 구조는 빠르게 변화하고 있다. 본 논문에서는 GPU 구조의 개발 방향을 살펴보기 위해, 비그래픽스 병렬 응용프로그램들을 수행하는 경우에 코어 개수 및 동작 주파수 등의 하드웨어구조에 따른 GPU의 성능을 상세히 분석하고자 한다. 실험 결과, 코어 개수가 30에서 192로 늘어나고 동작주파수가 325MHz에서 450MHz로 증가함에 따라 GPU 성능은 28.9%에서 125.8%, 4.4%에서 16.2% 각각 향상되는 반면 성능 향상 효율성은 감소하는 것을 볼 수 있다. 성능 향상 효율성 감소의 주된 원인은 향상된 연산 능력에 맞추어 증가된 데이터 요구를 메모리가 적절하게 처리하지 못하기 때문이다. 결과적으로 GPU의 성능 향상 효율성을 더욱 높이기 위해서는 연산 능력 향상과 더불어 시스템 자원들 또한 GPU 구조에 맞게 변경되어야 함을 구체적인 실험을 통해 알 수 있다.

카드산업에서 휴면 고객 예측 (Prediction of Dormant Customer in the Card Industry)

  • 이동규;신민수
    • 서비스연구
    • /
    • 제13권2호
    • /
    • pp.99-113
    • /
    • 2023
  • 고객 기반의 산업에서 고객 Retention은 기업의 경쟁력이라 할 수 있으며, 고객 Retention을 높이는 것은 기업의 경쟁력을 높이는 것이라 할 수 있다. 따라서, 미래 휴면 고객을 잘 예측하여 관리하는 것은 기업의 경쟁력을 높이는데 무엇보다 중요하다. 왜냐하면, 신규 고객을 유치하는데 필요한 비용이 기존 고객을 Lock-in 시키는데 드는 비용 보다 많은 것으로 알려져 있기 때문이다. 특히, 수 많은 카드사가 존재하는 국내 카드 산업의 휴면 카드를 관리하고자 정부에서 휴면 카드 자동 해지 제도를 도입하고 있으며, 카드 산업에서 휴면 고객을 관리하는 것이 무엇보다 중요한 과제로 떠오르고 있다. 본 연구에서는 카드 산업에서 휴면 고객을 예측하기 위해 Recurrent Neural Network (RNN)방법론을 사용하였으며, RNN방법론 중에서 긴 시간을 효율적으로 학습할 수 있는 Long-Short Term Memory (LSTM)을 활용하였다. 또한, 통합기술수용이론 (UTAUT)을 입각하여 카드 산업에서 휴면 고객을 예측하는데 필요한 변수를 재정의하였다. 그 결과 안정된 모형의 정확도와 F-1 score를 얻을 수 있었으며, Hit-Ratio를 통하여 모형의 안정된 결과를 입증하였다. 기존 연구에서 지적된 통합기술수용이론 (UTAUT)에서 발생 될 수 있는 인구통계학적 정보의 조절 효과도 발생 되지 않은 것을 보였으며, 이로 인해 통합기술수용이론(UTAUT)를 이용한 변수 선정 모형에서 LSTM을 이용한 휴면 고객 예측 모형은 편향되지 않고 안정된 결과를 가져다 줄 수 있다는 것을 입증하였다.

비위론(脾胃論)에 기재된 용어 분류체계에 관한 연구 (A Study of Classification in the Terms of "Biwiron(脾胃論)")

  • 정두영;이병욱;엄동명;김은하
    • 대한한의학원전학회지
    • /
    • 제22권1호
    • /
    • pp.191-205
    • /
    • 2009
  • Objective : Up to the present, theories of medical books is too difficult to understand thoroughly. However, these study methods have some problems in dealing with lots of meaning because the comprehension of theories are dependent upon one's memory. Especially, comparison distinct medical books are more difficult matter. So, we have attempted to solve a problem. Method : We have researched medical terms in the "Piweilun" according to below the procedure. (1) Making a terms list: We have selected constituent of sentence. And we have made term list on the basis of concept of term. (2) Making a synonym list: We have collected identical conception and made a synonym list. So, using an synonym tables of DB, it is possible to search for the non-standard terms of medical theory. (3) Making a classification system: Using UMLS(Unified Medical Language System), MeSH(Medical Subject Headings), IST(International Standard Terminology) ect., we have made a classification system of oriental medicine terms in the "Piwelun". Analysis of relation between terms. Result : In the "Piweilun", there are more than 1,790s concepts. Parts of those are belonged to UMLS-Semantic Type, the other parts of those are not belonged to UMLS-Semantic Type. And those include predicate more than UMLS-Semantic Relations.

  • PDF

인터랙티브 타일드 디스플레이 응용프로그램 개발을 위한 프레임워크 (A Framework for Constructing Interactive Tiled Display Applications)

  • 조용주;김석환
    • 한국정보통신학회논문지
    • /
    • 제13권1호
    • /
    • pp.37-44
    • /
    • 2009
  • 본 논문에서는 인터랙티브 디지털 정보 디스플레이용 응용프로그램 개발을 도와주도록 설계된 iTDF(Interactive Tiled Display Framework)라는 타일드 디스플레이 프레임워크에 대해서 설명한다. 이 프레임워크는 고해상도 타일드 디스플레이 환경에서 여러 개의 3차원 인터랙티브 그래픽 콘텐츠를 동시에 실행시키고 사용자와의 인터랙션이 가능하도록 해준다. 이를 위해, iTDF에서는 네트워크로 묶인 여러 대의 컴퓨터를 활용해서 다수의 인터랙티브 그래픽 프로그램들을 실행시킬 수 있도록 하고, 윈도우의 위치나 크기 조정, 컴퓨터 간의 렌더링 동기화, 분산 공유 메모리, 통합 입력 인터 페이스 등을 분산 시스템에서 지원한다. 본 논문은 먼저 iTDF의 요구사항에 대해서 분석하고, 그 내용을 지원할 수 있는 프레임워크의 설계와 구현에 대해서 설명한다. 그리고 기존의 데스크탑용 응용프로그램들을 iTDF를 활용해서 다시 개발하며, 유용성과 사용성에 대해 고찰한다.

학술자원 공동 활용 기반구축사업 개선 방안 연구 (Implementation Strategy on Sharing Resources to Organizational Change)

  • 김영기;박성호;이수상
    • 한국도서관정보학회지
    • /
    • 제40권2호
    • /
    • pp.287-310
    • /
    • 2009
  • 본 연구는 통합 연구재단의 출범을 앞두고 양 기관에서 운영 중인 학술자원 공동 활용 기반 구축 사업에 대한 개편안을 마련하고, 양 기관에서 현재 운영 중인 사업에 대한 비교 분석 및 장 단점 분석을 통해 향후 통합재단에서의 운영방안을 마련하기 위한 것이다. 이를 위해 한국학술진흥재단과 한국과학재단에서 운영 중인 학술자원 공동 활용 기반구축 사업을 중심으로, 관리 서비스 인프라 측면의 현황 분석을 통해 이슈 및 시사점을 도출하고, 이를 토대로 사업의 성과와 개선과제를 도출하고자 하였다. 본 연구에서는 양 재단에서 추진하고 있는 사업과 정보시스템의 통합은 두 가지 측면으로 나누어 각각의 주요 영역별 방안을 살펴보았는데, 우선 양 재단에서 추진하고 있는 정보서비스 관련 사업의 운영체제의 통합을 통해 새로운 차원의 학술연구 정보서비스를 창출해 내는 조직 방안을 제시하였으며, 다음으로 양 재단 내 단위 시스템으로 분산되어 정보서비스 시스템들의 통합을 통한 연구자들의 단일화된 통합 서비스 제공 방안을 모색하였다.

  • PDF

멀티미디어 통신 환경에서 Push/Pull 버퍼 관리 기법 (A Scheme for Push/Pull Buffer Management in the Multimedia Communication Environments)

  • 정찬균;이승룡
    • 한국정보처리학회논문지
    • /
    • 제7권2S호
    • /
    • pp.721-732
    • /
    • 2000
  • Multimedia communication systems require not only high-performance computer hardwares and high-speed networks, but also a buffer management mechanism to process many data efficiently. Two buffer handling methods, Push and Pull, are commonly used. In the Push method, a server controls the flow of dat to a client, while in the Pull method, a client controls the flow of data from a server. Those buffering schemes can be applied to the data transfer between the packet receiving buffer, which receives media data from a network server, and media playout devices, which play the recived media data. However, the buffer management mechanism in client-sides mainly support either one of the Push or the Pull method. Consequently, they have some limitations to support various media playout devices. Futhermore, even though some of them support both methods, it is difficult to use since they can't provide a unified structure. To resolved these problems, in this paper, we propose an efficient and flexible Push/Pull buffer management mechanism at client-side. The proposed buffer management scheme supports both Push and Pull method to provide various media playout devices and to support buffering function to absorb network jitter. The proposed scheme can support the various media playback devices using a single buffer space which in consequence, saves memory space compared to the case that a client keeps tow types of buffers. Moreover, it facilitates the single buffer as a mechanism for the absorbing network jitter effectively and efficiently. The proposed scheme has been implemented in an existing multimedia communication system, so called ISSA (Integrated Streaming Service Architecture), and it shows a good performance result compared to the conventional buffering methods in multimedia communication environments.

  • PDF

Efficient GPU Framework for Adaptive and Continuous Signed Distance Field Construction, and Its Applications

  • Kim, Jong-Hyun
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권3호
    • /
    • pp.63-69
    • /
    • 2022
  • 본 논문에서는 적응형 및 연속적인 부호 거리장을 빠르게 계산하기 위한 새로운 GPU 기반 프레임워크를 제안하고, 이를 활용한 렌더링/충돌처리 관련 사례를 살펴본다. 삼각형 메쉬로부터 구성된 쿼드트리를 GPU 메모리로 전달하고, 이를 활용하여 삼각형에 대한 유클리디안 거리를 각 스레드 별로 병렬 처리함으로써 적응형 격자 공간에서 불연속 없이 연속적인 최단 거리를 찾는다. 이 과정에서 적응형 부호 거리장의 절단면 보기, 특정 위치에서의 거리 값 조회, 실시간 레이트레이싱 및 충돌처리 작업을 빠르고 효율적으로 수행될 수 있는지를 실험을 통해 보여준다. 제안하는 방법을 사용하면 하이폴리곤 메쉬에서도 1초 내외로 빠르게 적응형 부호 거리장을 계산할 수 있기 때문에 강체뿐만 아니라 변형체에서도 충분히 활용될 수 있는 방법이며, 다양한 모델에서도 정확하게 샘플링하고 거리 값을 나타낼 수 있는지 다양한 실험 결과를 통해 알고리즘의 안정성을 보여준다.

Radix-4 트렐리스 병렬구조 및 역방향 상태천이의 제어에 의한 역추적 비터비 디코더 (Radix-4 Trellis Parallel Architecture and Trace Back Viterbi Decoder with Backward State Transition Control)

  • 정차근
    • 대한전자공학회논문지SP
    • /
    • 제40권5호
    • /
    • pp.397-409
    • /
    • 2003
  • 본 논문에서는 2-step 트렐리스를 하나로 통합한 Radix-4 트렐리스 병렬구조 및 역방향 상태천이의 연속적인 제어에 의한 역추적 비터비 디코더를 구현하고, 이를 초고속 무선 랜에 응용한 결과를 제시한다. Radix-4 트렐리스 병렬구조의 비터비 디코더는 throughput을 개선함과 동시에 구조가 간단하고 지연시간 및 회로의 overhead가 적은 이점이 있다. 이 특성을 기반으로, 본 논문에서는 Radix-4 트렐리스 병렬구조의 구현을 위한 가지 메트릭의 계산과 ACS의 구성, 역방향 상태천이의 연속적인 제어에 의한 역추적 복호 등으로 구성된 새로운 비터비 디코더를 제안한다. 본 제안방법의 적용으로 펑처링의 결과로 인한 가변 부호율의 복호를 통합된 하나의 디코더로 대응할 수 있으며, 부호율의 변화에 따라 별도의 부가회로나 주변제어 회로를 요구하지 않는 특성을 갖는다. 또한, 본 논문에서 제안한 역방향 상태천이의 제어에 의한 역추적 복호는 메모리 제어를 위한 별도의 회로를 추가함이 없이 ACS 사이클 타임에 정확이 동기되어 순서적인 복호를 수행할 수 있게 한다. 제안방법의 유용성을 검증하기 위해, 초고속 무선 랜 규격인 IEEE 802.11a PHY 계층의 채널부호 및 복호에 적용하고, HDL 언어로 구현한 회로의 시뮬레이션 결과를 제시한다.

수면거품과 웨이브거품의 미세한 상호작용을 이용한 대규모 유체 시뮬레이션 (Massive Fluid Simulation Using a Responsive Interaction Between Surface and Wave Foams)

  • 김종현
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제23권2호
    • /
    • pp.29-39
    • /
    • 2017
  • 본 논문에서는 효율적이고 사실적으로 수면거품과 웨이브거품을 표현할 수 있는 통합된 프레임워크를 제안한다. 이 프레임워크는 거품입자가 생성되어야 하는 곳을 결정할 때 발생하는 계산 복잡도를 줄이기 위해 3차원 공간의 물 입자들을 2차원 스크린 공간으로 투영하도록 설계되었다. 거품효과는 빠르고 복잡한 물의 흐름에서 생성되기 때문에, 가속도와 곡률 값을 분석하여 복잡한 유체의 흐름 패턴을 갖는 영역을 2차원에서 찾고 이를 3차공간으로 변환한다. 변환된 3차원 영역에서 거품입자가 방출되고, 각 거품입자는 속도가 따라 분류되며, 그 종류에 따라 다르게 이류됨으로써 웨이브거품의 본질적인 특징을 잘 포착해 낸다. 우리는 거품입자들을 두 가지 유형인 수면 거품과 웨이브거품으로 분류하여 결과적으로 거품의 사실감을 향상시킨다. 웨이브거품은 급류와 같은 부분에서 날카로운 웨이브패턴이 표현되는 특징이 있고, 수면거품은 느린 유속에서 뿌연 거품형태로 표현되는 특징이 있다. 이러한 특징을 표현하기 위해 거품입자의 속도와 위치를 올바르게 가이드해주는 기법을 제안한다. 또한 스크린공간의 밀도를 이용한 커널함수를 제안한다. 이 함수를 이용하여 거품입자의 속도와 위치를 올바르게 조정하여 불필요한 거품입자들을 효율적으로 제거하며, 결과적으로, 거품효과의 시각적인 손실없이 전반적인 메모리 효율성을 향상시켰다. 우리는 신빙성있는 실험결과를 보여주며 제안된 접근법은고품질의 결과를 제공하는 동시에 사용하기 쉽다는 장점이 있다.

방출단층촬영 시스템을 위한 GPU 기반 반복적 기댓값 최대화 재구성 알고리즘 연구 (A Study on GPU-based Iterative ML-EM Reconstruction Algorithm for Emission Computed Tomographic Imaging Systems)

  • 하우석;김수미;박민재;이동수;이재성
    • Nuclear Medicine and Molecular Imaging
    • /
    • 제43권5호
    • /
    • pp.459-467
    • /
    • 2009
  • 목적: ML-EM (The maximum likelihood-expectation maximization) 기법은 방출과 검출 과정에 대한 통계학적 모델에 기반한 재구성 알고리즘이다. ML-EM은 결과 영상의 정확성과 유용성에 있어 많은 이점이 있는 반면 반복적인 계산과 방대한 작업량 때문에 CPU(central processing unit)로 처리할 때 상당한 연산시간이 소요되었다. 본 연구에서는 GPU(graphic processing unit)의 병렬 처리 기술을 ML-EM 알고리즘에 적용하여 영상을 재구성하였다. 대상 및 방법: 엔비디아사(社)의 CUDA 기술을 이용하여 ML-EM 알고리즘의 투사 및 역투사 과정을 병렬화 전략을 구상하였으며 Geforce 9800 GTX+ 그래픽 카드를 이용하여 병렬화 연산을 수행하여 기존의 단일 CPU기반 연산법과 비교하였다. 각 반복횟수마다 투사 및 역투사 과정에 걸리는 총 지연 시간과 퍼센트 오차(percent error)를 측정하였다. 총 지연 시간에는 RAM과 GPU 메모리 간의 데이터 전송 지연 시간도 포함하였다. 결과: 모든 반복횟수에 대해 CPU 기반 ML-EM 알고리즘보다 GPU 기반 알고리즘이 더 빠른 성능을 나타내는 것을 확인하였다. 단일 CPU 및 GPU 기반 ML-EM의 32번 반복연산에 있어 각각 3.83초와 0.26초가 걸렸으며 GPU의 병렬연산의 경우 15배 정도의 개선된 성능을 보였다. 반복횟수가 1024까지 증가하였을 경우, CPU와 GPU 기반 알고리즘은 각각 18분과 8초의 연산시간이 걸렸다. GPU 기반 알고리즘이 약 135배 빠른 처리속도를 보였는데 이는 단일 CPU 계산이 특정 반복횟수 이후 나타나는 시간 지연에 따른 것이다. 결과적으로, GPU 기반 계산이 더 작은 편차와 빠른 속도를 보였다. 결론: ML-EM 알고리즘에 기초한 GPU기반 병렬 계산이 처리 속도와 안정성을 더 증진시킴을 확인하였으며 이를 활용해 다른 영상 재구성 알고리즘에도 적용시킬 수 있을 것으로 기대한다.