• 제목/요약/키워드: Data Parallel

검색결과 2,359건 처리시간 0.031초

자료 병렬 언어 프로그램의 병렬 구조 변환을 위한 최적화기 설계 (A Design of An Optimizer For Conversion of Parallel Constructs of Data Parallel Language Programs)

  • 구미순;박명순
    • 한국정보처리학회논문지
    • /
    • 제6권3호
    • /
    • pp.792-803
    • /
    • 1999
  • Most data parallel language compilers are source-to-source translators. Most Compilers of HPF which is recognized as a standard data parallel language convert a parallel program in PHF in a Fortran 77 program inserted message passing primitives. By the way, they currently generate significant amount of ineffective codes in the course of the conversion. Especially, FORALL construct is converted into several DO loops, so loop overhead of these codes is very increased. In this paper, we define and use relation distance vector to keep necessary informations. Then we evaluate and analyze execution time for the codes converted by our method and by PARADIGM method for various array sizes.

  • PDF

분산 병렬 계산환경에 적합한 초대형 유한요소 해석 결과의 효율적 병렬 가시화 (Efficient Parallel Visualization of Large-scale Finite Element Analysis Data in Distributed Parallel Computing Environment)

  • 김창식;송유미;김기욱;조진연
    • 한국항공우주학회지
    • /
    • 제32권10호
    • /
    • pp.38-45
    • /
    • 2004
  • 본 논문에서는 병렬 랜더링 기법의 특정들을 고창하고 이를 토대로 대규모 유한요소 해석결과를 효율적으로 가시화 할 수 있는 병렬 가시화 알고리듬을 제안하였다. 제안된 알고리듬은 요소영역별 계산을 기반으로 하는 병렬 유한요소 해석의 특성에 적합하도록 부분 후 분류방식을 기반으로 설계되었으며, 이미지 조합 과정에 수반되는 네트워크 통신을 효율화하고자 이진 트리구조 통신 패턴을 적용하여 구성되었다. 자체 개발된 소프트웨어를 이용하여 벤치마킹 테스트를 수행하고, 이를 통해 제안된 알고리듬의 병렬 가시화 성능을 측정하였다.

샷 경계 탐지 알고리즘의 병렬 설계와 구현 (Parallel Design and Implementation of Shot Boundary Detection Algorithm)

  • 이준구;김승현;유병문;황두성
    • 전자공학회논문지
    • /
    • 제51권2호
    • /
    • pp.76-84
    • /
    • 2014
  • 최근 고화질 영상의 증가와 더불어 대용량 영상 데이터의 처리는 높은 연산이 요구되어 병렬 처리 설계가 선택되고 있다. 영상 처리에서 나타나는 많은 단순 연산이 병렬처리 가능한 경우, CPU 기반 병렬처리보다는 GPU 기반 병렬처리를 적용하는 것이 계산문제의 시간과 공간 계산 복잡도를 줄일 수 있다. 본 논문은 영상에서 샷 경계 탐지 알고리즘의 병렬 설계와 구현을 연구하였다. 제안하는 샷 경계 탐지 알고리즘은 프레임 간 지역 화소 밝기 비교와 전역 히스토그램 정보를 이용하는데, 이들 데이터의 계산은 대량의 데이터에 대한 높은 병렬성을 갖는다. 이들 연산의 병렬처리를 최대화하기 위해 화소 밝기와 히스토그램의 계산을 NVIDIA GPU에서 병렬 설계 하였다. GPU 기반 샷 탐지 방법은 국가기록원에서 선택된 10개의 비디오 데이터에 대한 성능 테스트를 수행하였다. 테스트에서 GPU 기반 알고리즘의 탐지율은 CPU 기반 알고리즘과 유사하였으나 약 10배의 연산 속도가 개선되었다.

A Parallel Search Algorithm and Its Implementation for Digital k-Winners-Take-All Circuit

  • Yoon, Myungchul
    • JSTS:Journal of Semiconductor Technology and Science
    • /
    • 제15권4호
    • /
    • pp.477-483
    • /
    • 2015
  • The k-Winners-Take-All (kWTA) is an operation to find the largest k (>1) inputs among N inputs. Parallel search algorithm of kWTA for digital inputs is not invented yet, so most of digital kWTA architectures have O(N) time complexity. A parallel search algorithm for digital kWTA operation and the circuits for its VLSI implementation are presented in this paper. The proposed kWTA architecture can compare all inputs simultaneously in parallel. The time complexity of the new architecture is O(logN), so that it is scalable to a large number of digital data. The high-speed kWTA operation and its O(logN) dependency of the new architecture are verified by simulations. It takes 290 ns in searching for 5 winners among 1024 of 32 bit data, which is more than thousands of times faster than existing digital kWTA circuits, as well as existing analog kWTA circuits.

그래픽 사용자 인터페이스로 구현한 병렬 프로그래밍 환경 (A Parallel Programming Environment Implemented with Graphic User Interface)

  • 유정목;이동희;이만호
    • 한국정보처리학회논문지
    • /
    • 제7권8호
    • /
    • pp.2388-2399
    • /
    • 2000
  • 본 논문에서는 사용자의 병렬 프로그램 작성을 도와주는 병렬 프로그래밍 환경에 대해 기술한다. 병렬 프로그래밍 환경은 일반적인 컴파일러의 기능의 전위 부분에 해당하는 어휘분석과 구문분석 기능 수행하고 있으며, 프로그램에서 이용하는 변수들의 데이터 흐름 분석과 데이터 종속성 분석, 그리고, 여러 가지 병렬 프로그램 변환 기법들을 수행한다. 특히 프로그래머가 병렬 프로그램을 용이하게 작성할 수 있도록 그래픽 사용자 인터페이스를 제공한다.

  • PDF

A Controllable Parallel CBC Block Cipher Mode of Operation

  • Ke Yuan;Keke Duanmu;Jian Ge;Bingcai Zhou;Chunfu Jia
    • Journal of Information Processing Systems
    • /
    • 제20권1호
    • /
    • pp.24-37
    • /
    • 2024
  • To address the requirement for high-speed encryption of large amounts of data, this study improves the widely adopted cipher block chaining (CBC) mode and proposes a controllable parallel cipher block chaining (CPCBC) block cipher mode of operation. The mode consists of two phases: extension and parallel encryption. In the extension phase, the degree of parallelism n is determined as needed. In the parallel encryption phase, n cipher blocks generated in the expansion phase are used as the initialization vectors to open n parallel encryption chains for parallel encryption. The security analysis demonstrates that CPCBC mode can enhance the resistance to byte-flipping attacks and padding oracle attacks if parallelism n is kept secret. Security has been improved when compared to the traditional CBC mode. Performance analysis reveals that this scheme has an almost linear acceleration ratio in the case of encrypting a large amount of data. Compared with the conventional CBC mode, the encryption speed is significantly faster.

Petri Net 이론 관점에서 본 소프트웨어 혁신의 확산 (Diffusion of software innovation: a Petri Net theory perspective)

  • 한지연;안종창;이욱
    • 한국산학기술학회논문지
    • /
    • 제14권2호
    • /
    • pp.858-867
    • /
    • 2013
  • 본 연구에서는 MPSOC(Multiprocessor System-on-Chip) 환경의 소프트웨어적인 측면을 주 연구대상으로 하였고 범용 전문 프로그래머들에게 병렬 애플리케이션 프로그래밍을 위한 패턴언어를 제공한다면 병렬처리의 장점을 호소할 수 있을 것으로 보았다. 특히 자체적인 분류에 따른 Data, Tasks, Data flow 모델을 선별하고 그중 CUDA와 HOPES를 경험한 대상으로 Petri Net을 활용, 그들의 숙련도를 확인하는 과정을 포함한다. 각 영역의 숙련 정도, 서로 다른 모델에 대한 이해도를 실험을 통해 검증하였다. 페트리넷은 병렬프로그래밍의 설명에 용이한 모델로 특히 동시성과 병렬성을 설명하는데 탁월한 모형을 제시 할 수 있었다. 실험대상자들에게 페트리넷에 관한 4시간의 선행학습을 시킨 후 56명에게 실험을 실시하여 독립표본 t-검정을 수행했다. 비록 설정된 두 가지 가설이 지지되지 않았지만, 각 영역에서의 숙련자들이 Tasks 중심 혹은 Data 중심의 모형을 얼마나 상호 이해하는가를 판단 할 수 있었다.

A Serial Input/Output Circuit with 8 bit and 16 bit Selection Modes

  • Yang, Yil-Suk;Kim, Jong-Dae;Roh, Tae-Moon;Lee, Dae-Woo;Koo, Jin-Gun;Kim, Sang-Gi;Park, Il-Yong;Yu, Byoung-Gon
    • ETRI Journal
    • /
    • 제24권6호
    • /
    • pp.462-464
    • /
    • 2002
  • This paper presents a serial interface circuit that permits selection of the amount of data converted from serial-to-parallel and parallel-to-serial and overcomes the disadvantages of the conventional serial input/output interface. Based on the selected data length operating mode, 8 bit or 16 bit serial-to-parallel and 8 bit or 16 bit parallel-to-serial conversion takes place in data blocks of the selected data length.

  • PDF

분산형 FP트리를 활용한 병렬 데이터 마이닝 (Parallel Data Mining with Distributed Frequent Pattern Trees)

  • 조두산;김동승
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 V
    • /
    • pp.2561-2564
    • /
    • 2003
  • Data mining is an effective method of the discovery of useful information such as rules and previously unknown patterns existing in large databases. The discovery of association rules is an important data mining problem. We have developed a new parallel mining called Distributed Frequent Pattern Tree (abbreviated by DFPT) algorithm on a distributed shared nothing parallel system to detect association rules. DFPT algorithm is devised for parallel execution of the FP-growth algorithm. It needs only two full disk data scanning of the database by eliminating the need for generating the candidate items. We have achieved good workload balancing throughout the mining process by distributing the work equally to all processors. We implemented the algorithm on a PC cluster system, and observed that the algorithm outperformed the Improved Count Distribution scheme.

  • PDF

PC-Clustering과 병렬가상장치에 의한 수치계산용 슈퍼컴퓨팅 PC 시스템 구축과 성능 테스트 (Construction and Performance Test of a Supercomputing PC System using PC-clustering and Parallel Virtual Machine)

  • 홍우표;김종재;오광식
    • Journal of the Korean Data and Information Science Society
    • /
    • 제10권2호
    • /
    • pp.473-483
    • /
    • 1999
  • Linux 운영체계를 기반으로 한 PC 시스템을 고가의 상용 워크스테이션에 필적하도록 성능을 극대화하고, 각 단위 Linux PC 시스템을 네트워크를 통해 CPU와 memory를 공유하게 하는 병렬가상장치(PVM: Parallel Virtual Machine) 방식의 소프트웨어를 사용하여 군집(clustering)함으로써 슈퍼 컴퓨터급 기능을 발휘하는 분산형 PC 시스템을 시험 구축하였다. 구축된 시스템의 성능을 PVM 방식의 병렬프로그램을 사용하여 벤치마킹 해본 결과, 병렬효율 (parallel efficiency)이 90%급에 접근함을 확인하였다.

  • PDF