• 제목/요약/키워드: parallel communication

검색결과 1,114건 처리시간 0.027초

Efficient Face Recognition using Low-Dimensional PCA: Hierarchical Image & Parallel Processing

  • Song, Young-Jun;Kim, Young-Gil;Kim, Kwan-Dong;Kim, Nam;Ahn, Jae-Hyeong
    • International Journal of Contents
    • /
    • 제3권2호
    • /
    • pp.1-5
    • /
    • 2007
  • This paper proposes a technique for principal component analysis (PCA) to raise the recognition rate of a front face in a low dimension by hierarchical image and parallel processing structure. The conventional PCA shows a recognition rate of less than 50% in a low dimension (dimensions 1 to 6) when used for facial recognition. In this paper, a face is formed as images of 3 fixed-size levels: the 1st being a region around the nose, the 2nd level a region including the eyes, nose, and mouth, and the 3rd level image is the whole face. PCA of the 3-level images is treated by parallel processing structure, and finally their similarities are combined for high recognition rate in a low dimension. The proposed method under went experimental feasibility study with ORL face database for evaluation of the face recognition function. The experimental demonstration has been done by PCA and the proposed method according to each level. The proposed method showed high recognition of over 50% from dimensions 1 to 6.

A Novel Parallel Viterbi Decoding Scheme for NoC-Based Software-Defined Radio System

  • Wang, Jian;Li, Yubai;Li, Huan
    • ETRI Journal
    • /
    • 제35권5호
    • /
    • pp.767-774
    • /
    • 2013
  • In this paper, a novel parallel Viterbi decoding scheme is proposed to decrease the decoding latency and power consumption for the software-defined radio (SDR) system. It implements a divide-and-conquer approach by first dividing a block into a series of subblocks, then performing independent Viterbi decoding for each subsequence, and finally merging the surviving subpaths into the final path. Moreover, a network-on-chip-based SDR platform is used to evaluate the performance of the proposed parallel Viterbi decoding scheme. The experiment results show that our scheme can speed up the Viterbi decoding process without increasing the BER, and it performs better than the current state-of-the-art methods.

분산 병렬 계산환경에 적합한 초대형 유한요소 해석 결과의 효율적 병렬 가시화 (Efficient Parallel Visualization of Large-scale Finite Element Analysis Data in Distributed Parallel Computing Environment)

  • 김창식;송유미;김기욱;조진연
    • 한국항공우주학회지
    • /
    • 제32권10호
    • /
    • pp.38-45
    • /
    • 2004
  • 본 논문에서는 병렬 랜더링 기법의 특정들을 고창하고 이를 토대로 대규모 유한요소 해석결과를 효율적으로 가시화 할 수 있는 병렬 가시화 알고리듬을 제안하였다. 제안된 알고리듬은 요소영역별 계산을 기반으로 하는 병렬 유한요소 해석의 특성에 적합하도록 부분 후 분류방식을 기반으로 설계되었으며, 이미지 조합 과정에 수반되는 네트워크 통신을 효율화하고자 이진 트리구조 통신 패턴을 적용하여 구성되었다. 자체 개발된 소프트웨어를 이용하여 벤치마킹 테스트를 수행하고, 이를 통해 제안된 알고리듬의 병렬 가시화 성능을 측정하였다.

MISIX 기반의 병렬 파일 시스템의 통신 모듈 설계 및 구현 (Design and Implementation of a Communication Module of the Parallel Operating File System based on MISIX)

  • 진성근;조종현;김해진;서대화
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제6권4호
    • /
    • pp.373-382
    • /
    • 2000
  • POFS는 SPAX 컴퓨터에서 운용될 병렬 파일 시스템이다. SPAX는 ETRI에서 개발중인 클러스터 SMP 구조를 가지는 다중 프로세서 컴퓨터이며 SPAX의 운영체제는 Chorus 마이크로커널에 기반한 MISIX이다. 마이크로커널 기반의 운영체제는 마이크로커널의 IPC를 기반으로 구현된 서버의 집합이며, 운영체제의 서브시스템들 혹은 서브시스템들과 사용자 프로그램은 클라이언트/서버 구조를 가지게 된다. 그러므로, 운영체제의 서브시스템을 위한 통신 모듈의 설계 방법은 시스템의 성능에 직접적인 영향을 준다. 본 논문은 MISIX의 병렬 파일 시스템인 POFS 개발함에 있어서 제기된 통신 모듈의 구조와 성능에 관해 기술한다. POFS는 높은 병렬성 및 확장성을 가지며, 단일 시스템 이미지를 제공하는 분산 환경의 파일 시스템이다. POFS의 통신 모듈은 클라이언트/서버 구조인 POFS의 특성을 효과적으로 지원한다.

  • PDF

병렬 이벤트 기반 원격 IT 융합 개발 (Development of Parallel Event-Driven Remote IT Convergence)

  • 김정숙;김성완;김홍섭
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권12호
    • /
    • pp.1-9
    • /
    • 2010
  • 본 논문에서는 첨단 통신 기술을 포함한 IT 기술을 전통산업과 융합한 병렬 이벤트 기반 원격 IT 융합 사례들을 개발하였다. IT 융합 사례들은 다수의 장치와 사용자가 동시에 시스템에서 제공되는 서비스를 이용하거나 이벤트를 발생시킨다. 따라서 다양한 장치들로부터 동시에 발생되는 이벤트를 처리하기 위해 병렬 처리 기법이 필요하다. 이에 본 논문에서는 스레드를 생성하여 병렬 처리가 가능하도록 개발하였으며, 또한 장치와 원격 정보 송수신을 위해 무선 통신 및 전력선 통신과의 연결을 할 수 있는 기술을 개발하였다. 그리고 장치 및 장치와 사용자 포털에서 발생하는 이벤트들을 논리적으로 모델링하기 위해 XML을 이용하여 객체 지향 모델링 기법으로 모델링하였다. 특히 결과들을 효과적으로 보여주기 위해 다양한 시각적인 사용자 인터페이스, 즉 그래프, 테이블 및 그래프와 테이블을 혼합한 방식을 이용하여 실시간으로 볼 수 있도록 개발하였다.

Design of Parallel Processor for Image Processing

  • 노석환;박종원
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2006년도 하계종합학술대회
    • /
    • pp.743-744
    • /
    • 2006
  • This paper presents implementation of parallel processing system for image processing. The parallel processing system proposed consisted of 16 processing elements, and multi-access memory system, and interface modules. The multi-access memory system we introduced is made up of a memory module selection, a data routing module, and an address calculation and routing module.

  • PDF

Pilot Symbol Assisted Hybrid Detection for OFDM-Based Spatial Multiplexing Systems

  • So, Yoon-Jae;Jeon, Hyoung-Goo;You, Young-Hwan;Baek, Myung-Sun;Song, Hyoung-Kyu
    • ETRI Journal
    • /
    • 제26권5호
    • /
    • pp.397-404
    • /
    • 2004
  • In this paper, we provide a new detection scheme for a pilot symbol assisted interference nulling and cancellation operation to reduce unexpected effects owing to parallel transmission in orthogonal frequency division multiplexing (OFDM)-based spatial multiplexing systems. We have shown that the investigated OFDM vertical Bell laboratories layered space time (VBLAST) detection based on hybrid processing performs better than ordinary OFDM-VBLAST detections based on serial processing and parallel processing, respectively.

  • PDF

병렬 VOD 시스템에서 서비스 모델의 성능분석 (Performance Analysis of Service Model in Parallel VOD system)

  • 남정임;남지승
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2005년도 추계종합학술대회
    • /
    • pp.1105-1108
    • /
    • 2005
  • Media service model is divided into 3 models that are Client Pull, Server Push, and IPP(Interleaving Pull & Push) model. In most single VOD(Video On Demand) environment, Client Pull model was sufficient to play the movie Because most media contents has a low bitrate and resolution. But according to an increment of the demand of the high definition media, Client Pull model is not sufficient. Parallel VOD environment is made of several of VOD servers and provides the parallel media stream simultaneously for one client. We compared and analyzed the performance of service models with respect to network delay and data size in buffer in the single and parallel VOD environment and we found that IPP service model keeps the least network delay and stable client buffer state in the parallel VOD environment.

  • PDF

Efficient Parallel Block-layered Nonbinary Quasi-cyclic Low-density Parity-check Decoding on a GPU

  • Thi, Huyen Pham;Lee, Hanho
    • IEIE Transactions on Smart Processing and Computing
    • /
    • 제6권3호
    • /
    • pp.210-219
    • /
    • 2017
  • This paper proposes a modified min-max algorithm (MMMA) for nonbinary quasi-cyclic low-density parity-check (NB-QC-LDPC) codes and an efficient parallel block-layered decoder architecture corresponding to the algorithm on a graphics processing unit (GPU) platform. The algorithm removes multiplications over the Galois field (GF) in the merger step to reduce decoding latency without any performance loss. The decoding implementation on a GPU for NB-QC-LDPC codes achieves improvements in both flexibility and scalability. To perform the decoding on the GPU, data and memory structures suitable for parallel computing are designed. The implementation results for NB-QC-LDPC codes over GF(32) and GF(64) demonstrate that the parallel block-layered decoding on a GPU accelerates the decoding process to provide a faster decoding runtime, and obtains a higher coding gain under a low $10^{-10}$ bit error rate and low $10^{-7}$ frame error rate, compared to existing methods.

A PARALLEL FINITE ELEMENT ALGORITHM FOR SIMULATION OF THE GENERALIZED STOKES PROBLEM

  • Shang, Yueqiang
    • 대한수학회보
    • /
    • 제53권3호
    • /
    • pp.853-874
    • /
    • 2016
  • Based on a particular overlapping domain decomposition technique, a parallel finite element discretization algorithm for the generalized Stokes equations is proposed and investigated. In this algorithm, each processor computes a local approximate solution in its own subdomain by solving a global problem on a mesh that is fine around its own subdomain and coarse elsewhere, and hence avoids communication with other processors in the process of computations. This algorithm has low communication complexity. It only requires the application of an existing sequential solver on the global meshes associated with each subdomain, and hence can reuse existing sequential software. Numerical results are given to demonstrate the effectiveness of the parallel algorithm.