• Title/Summary/Keyword: 병렬화 효율

Search Result 382, Processing Time 0.078 seconds

CUDA-based Object Oriented Programming Techniques for Efficient Parallel Visualization of 3D Content (3차원 콘텐츠의 효율적인 병렬 시각화를 위한 CUDA 환경 기반 객체 지향 프로그래밍 기법)

  • Park, Tae-Jung
    • Journal of Digital Contents Society
    • /
    • v.13 no.2
    • /
    • pp.169-176
    • /
    • 2012
  • This paper presents a parallel object-oriented programming (OOP) platform for efficient visualization of three-dimensional content in CUDA environments. For this purpose, this paper discusses the features and limitations in implementing C++ object-oriented codes using CUDA and proposes the solutions. Also, it presents how to implement a 3D parallel visualization platform based on the MVC (Model/View/Controller) design pattern. Also, it provides sample implementations for integral MLS (iMLS) and signed distance fields (SDFs) based on the Marching Cubes and Raytracing. The proposed approach enables GPU parallel processing only by implementing simple interfaces. Based on this, developers can expect general benefits that are common in general OOP techniques including abstractization and inheritance. Though I implemented only two specific samples in this paper, I expect my approach can be widely applied to general computer graphics problems.

Term Clustering and Duplicate Distribution for Efficient Parallel Information Retrieval (효율적인 병렬정보검색을 위한 색인어 군집화 및 분산저장 기법)

  • 강재호;양재완;정성원;류광렬;권혁철;정상화
    • Journal of KIISE:Software and Applications
    • /
    • v.30 no.1_2
    • /
    • pp.129-139
    • /
    • 2003
  • The PC cluster architecture is considered as a cost-effective alternative to the existing supercomputers for realizing a high-performance information retrieval (IR) system. To implement an efficient IR system on a PC cluster, it is essential to achieve maximum parallelism by having the data appropriately distributed to the local hard disks of the PCs in such a way that the disk I/O and the subsequent computation are distributed as evenly as possible to all the PCs. If the terms in the inverted index file can be classified to closely related clusters, the parallelism can be maximized by distributing them to the PCs in an interleaved manner. One of the goals of this research is the development of methods for automatically clustering the terms based on the likelihood of the terms' co-occurrence in the same query. Also, in this paper, we propose a method for duplicate distribution of inverted index records among the PCs to achieve fault-tolerance as well as dynamic load balancing. Experiments with a large corpus revealed the efficiency and effectiveness of our method.

Adaptive variable to variable entropy coding (적응적 V2V 엔트로피 부호화 방법)

  • Ryu, Eun-Kyung;Nam, Jung-Hak;Park, Sea-Nae;Sim, Dong-Gyu
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2011.07a
    • /
    • pp.585-588
    • /
    • 2011
  • 본 논문은 HEVC 표준화 회의 중 빈 단위 병렬화 위해 제안된 V2V 기술을 바탕으로 슬라이스 내에서 적응적으로 발생 확률 예측을 통하여 압축 효율을 높이는 기술을 제안한다. 기존의 V2V 기술은 슬라이스 단위로 확률 양자화 간격과 대표 확률 결정하여 다수개의 빈 코더에 매핑하여 병렬 엔트로피 부호화를 수행하였다. 제안하는 방법은 V2V 기술에서 슬라이스 보다 작은 단위의 확률적 특성을 고려하여 슬라이스 내에서 대표확률의 선택을 적응적으로 결정한다. 대표 확률의 적응적인 선택은 이전의 부호화된 빈의 실제 심볼의 확률을 이용하며, 이로 인해 슬라이스 보다 작은 단위의 국부적 특성을 확률 양자화기에 반영할 수 있다. 실험 결과, 제안하는 방법을 위해 실험된 현재 부호화 빈의 발생확률은 이용하여 최적의 확률을 얻는 실험은 기존의 V2V 기술 대비 0.1%의 부호화 효율을 얻었다.

  • PDF

A Study on High-Frequency of Series-Parallel Resonant Inverter using the IGBT (IGBT를 이용한 직.병렬 공진방식 인버터의 고주파화에 관한 연구)

  • 홍순일;류민섭
    • Proceedings of the KIPE Conference
    • /
    • 1999.07a
    • /
    • pp.110-113
    • /
    • 1999
  • 본 연구에서는 고주파 유도가열을 위한 전원장치에 사용되는 인버터 시스템의 대용량, 고조파화를 실현하기 위한 고주파화 기술을 제안하였다. 부한 공진 인버터는 H형 전-브리지(Full-Bridge)로 구성하고 각 암당 IBGT를 2병렬로 조합하여 구성하고 부하는 직병열 공진회로로 구성한다. 스위칭 동작은 8개의 IGBT중 각 ARM당 2개씩 순차 제어하여 고속 대용량의 고주파 전력을 출력시킨다. 또한 스위칭은 스위치 턴온·오프시에 스위칭 손실을 줄이기 위해 ZVS(Zero-Voltage Switching) 기법을 도입한다. 제어는 고정주파수 PWM(Pulse Width Modulation) 제어를 하여 전력변환 효율을 극대화한다.

  • PDF

Parallel Computation of a Nonlinear Structural Problem using Parallel Multifrontal Solver (다중 프런트 해법을 이용한 비선형 구조문제의 병렬계산)

  • Jeong, Sun Wan;Kim, Seung Jo
    • Journal of the Korean Society for Aeronautical & Space Sciences
    • /
    • v.31 no.2
    • /
    • pp.41-50
    • /
    • 2003
  • In this paper, nonlinear parallel structural analyses are introduced by using the parallel multifrontal solver and damage localization for 2D and 3D crack models is presented as the application of nonlinear parallel computation. The parallel algorithms related with nonliear reduce the amount of memory used is carried out because many variables should be utilized for this highly nonlinear damage analysis. Also, Riks' continuation method is parallelized to search the solution when strain softening occurs due to damage evolution. For damage localization problem, several computational models having up to around 1-million degree of freedoms are used. The parallel performance in this nonlinear parallel algorithm is shown through these examples and the local variation of damage at crack tip is compared among the models with different degree of freedoms.

Horizontal Protocol Processing Architecture for High Performance Parallel Processing (고성능 병렬 처리를 위한 수평적인 프로토콜 처리 구조)

  • Kim, Pyeong-Jung;Park, Chi-Hang
    • The Transactions of the Korea Information Processing Society
    • /
    • v.3 no.6
    • /
    • pp.1386-1396
    • /
    • 1996
  • In the distributed multimedia application, high throughput and low delay is one of the most important QoS(Quality of Service) requirement. Emerging high speed communication offers transmission rate above Gbps, but it can not be utilized efficiently by the performance bottlenecks of communication protocols. To overcom the problem, we propose a horizontal processing architecture that processes data as soon as it arrive from the network. Unfortunately, the OSI protocol stack often imposes ordering constraints that prevent concurrent processing of the protocol layers. By using a fixed packet format, the network layer through the presentation layer are processed in parallel. Our prototype shows that the proposed model has performance improvement up to 61% more advantage than the conventional approach.

  • PDF

Depth Migration for Gas Hydrate Data of the East Sea (동해 가스 하이드레이트 자료 깊이영역 구조보정)

  • Jang, Seong-Hyung;Yoo, Dong-Gun;Suh, Sang-Yong
    • 한국신재생에너지학회:학술대회논문집
    • /
    • 2006.06a
    • /
    • pp.382-385
    • /
    • 2006
  • 한국지질자원연구원은 1997년부터 새로운 에너지 자원으로 활용 가능성을 포함하고 있는 가스 하이드레이트를 조사하기 위해 동해 일원에서 탄성파탐사를 실시하고 있다. 탄성파 반사 자료로부터 가스 하이드레이트 부존여부를 확인하는 방법은 해저면과 평행하면서 위상이 반대로 나타나는 고진폭 반사파 BSR (Bottom Simulating Reflection)과 BSR상부에서의 진폭감소, 하부에서 진폭증가와 구간속도 감소 등을 들 수 있다. 여기에서는 가스 하이드레이트 탐사자료에 대한 일반자료처리와 함께 BSR을 포함하고 있는 탄성파 반사자료에 대해 코드 병렬화된 PSPI를 이용하여 깊이영역 구조보정을 실시하였다. 고용량 탐사자료로 구성된 탄성파 반사자료에 깊이영역 구조보정을 적용하기 위해서는 고성능 컴퓨터와 병렬처리 기술이 필요하다. PSPI(Phase Shift Plus Interpolation)법은 적은 컴퓨터 계산량과 효율성 그리고 주파수 영역에서 구조적으로 병렬화가 용이한 특성을 지니고 있어 구조보정에 많이 이용되고 있다. 여기에서는 MPI(Message Passing Interface)-LAM을 이용하여 병렬코드화된 PSPI를 개발하고 인공합성모델과 동해 가스 하이드레이트 깊이영역 구조보정에 적응하였다.

  • PDF

Development of a Parallel Cell-Based DSMC Method Using Unstructured Meshes (비정렬격자에서 병렬화된 격자중심 직접모사 기법 개발)

  • Kim, Hyeong-Sun;Kim, Min-Gyu;Gwon, O-Jun
    • Journal of the Korean Society for Aeronautical & Space Sciences
    • /
    • v.30 no.2
    • /
    • pp.1-11
    • /
    • 2002
  • In the present study, a parallel DSCM technique based on a cell-based data structure is developed for the efficient simulation of rarefied gas flows especially od PC clusters. Dynamic load balancing is archieved by decomposing the computational domain into several sub-domains and accounting for the number of particles and the number cells of each domain. Mesh adaptation algorithm is also applied to improve the resolution of the solution and to reduce the grid dependency. It was demonstrated that accurate solutions can be obtained after several levels of mesh adapation starting from a coars initial grid. The method was applied to a two-dimensioanal supersonic leading-edge flow and the axi-symmetric Rothe nozzle flow to validate the efficiency of the present method. It was found that the present method is a very effective tool for the efficient simulation of rarefied gas flow on PC-based parallel machines.

Adaptive User and Topic Modeling based Automatic TV Recommender System for Big Data Processing (빅 데이터 처리를 위한 적응적 사용자 및 토픽 모델링 기반 자동 TV 프로그램 추천시스템)

  • Kim, EunHui;Kim, Munchurl
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2015.07a
    • /
    • pp.195-198
    • /
    • 2015
  • 최근 TV 서비스의 가입자 및 TV 프로그램 콘텐츠의 급격한 증가에 따라 빅데이터 처리에 적합한 추천 시스템의 필요성이 증가하고 있다. 본 논문은 사용자들의 간접 평가 데이터 기반의 추천 시스템 디자인 시, 누적된 사용자의 과거 이용내역 데이터를 저장하지 않고 새로 생성된 사용자 이용내역 데이터를 학습하는 효율적인 알고리즘이면서, 시간 흐름에 따라 사용자들의 선호도 변화 및 TV 프로그램 스케줄 변화의 추적이 가능한 토픽 모델링 기반의 알고리즘을 제안한다. 빅데이터 처리를 위해서는 분산처리 형태의 알고리즘을 피할 수 없는데, 기존의 연구들 중 토픽 모델링 기반의 추론 알고리즘의 병렬분산처리 과정 중에 핵심이 되는 부분은 많은 데이터를 여러 대의 기계에 나누어 병렬분산 학습하면서 전역변수 데이터를 동기화하는 부분이다. 그런데, 이러한 전역데이터 동기화 기술에 있어, 여러 대의 컴퓨터를 병렬분산처리하기위한 하둡 기반의 시스템 및 서버-클라이언트간의 중재, 고장 감내 시스템 등을 모두 고려한 알고리즘들이 제안되어 왔으나, 네트워크 대역폭 한계로 인해 데이터 증가에 따른 동기화 시간 지연은 피할 수 없는 부분이다. 이에, 본 논문에서는 빅데이터 처리를 위해 사용자들을 클러스터링하고, 클러스터별 제안 알고리즘으로 전역데이터 동기화를 수행한 것과 지역 데이터를 활용하여 추론 연산한 결과, 클러스터별 지역별 TV프로그램 시청 토큰 별 은닉토픽 할당 테이블을 유지할 때 추천 성능이 더욱 향상되어 나오는 결과를 확인하여, 제안된 구조의 추천 시스템 디자인의 효율성과 합리성을 확인할 수 있었다.

  • PDF

Parallel Rabin Fingerprinting on GPGPU for Efficient Data Deduplication (효율적인 데이터 중복제거를 위한 GPGPU 병렬 라빈 핑거프린팅)

  • Ma, Jeonghyeon;Park, Sejin;Park, Chanik
    • Journal of KIISE
    • /
    • v.41 no.9
    • /
    • pp.611-616
    • /
    • 2014
  • Rabin fingerprinting used for chunking requires the largest amount computation time in data deduplication, In this paper, therefore, we proposed parallel Rabin fingerprinting on GPGPU for efficient data deduplication. In addition, for efficient parallelism in Rabin fingerprinting, four issues are considered. Firstly, when dividing input data stream into data sections, we consider the data located near the boundaries between data sections to calculate Rabin fingerprint continuously. Secondly, we consider exploiting the characteristics of Rabin fingerprinting for efficient operation. Thirdly, we consider the chunk boundaries which can be changed compared to sequential Rabin fingerprinting when adapting parallel Rabin fingerprinting. Finally, we consider optimizing GPGPU memory access. Parallel Rabin fingerprinting on GPGPU shows 16 times and 5.3 times better performance compared to sequential Rabin fingerprinting on CPU and compared to parallel Rabin fingerprinting on CPU, respectively. These throughput improvement of Rabin fingerprinting can lead to total performance improvement of data deduplication.