• 제목/요약/키워드: data Parallel

검색결과 2,372건 처리시간 0.035초

PARALLEL DYNAMIC OCTAL COMPACT MAPPING

  • Min, Yong-Sik
    • Journal of applied mathematics & informatics
    • /
    • 제3권1호
    • /
    • pp.35-46
    • /
    • 1996
  • This paper suggests a new coding method for the parallel machine which compresses the data be reducing redundancy. Paral-lel Dynamic octal Compact Mapping (PDOCM) compresses at least 1 byte per word compared with other coding techniques and achieves a 54. 188-fold speedup with 64 processors to transmit 10 million charac-ters.

병렬 VOD 서버의 확장을 위한 스트라이핑 기법 (A Striping Policy for Extension of a Parallel VOD Server)

  • 최숙영;유관종
    • 한국정보과학회논문지:정보통신
    • /
    • 제28권3호
    • /
    • pp.426-434
    • /
    • 2001
  • 병렬 VOD 시스템에서 스트라이핑 정책은 비디오 데이터를 분할 하여 각 노드에 잘 정의된 순서로 분배함으로서 노드간에 부하 균등을 통한 시스템의 성능을 높일 수 있는 중요한 기법이다. 본 논문운 노드를 추가할 경우 노드간의 부하 균등을 고려한 데이터 스트라이핑 기법을 제시한다. 병렬 VOD 서버의 추가된 노드에 새 비디오 파일을 저장할 경우 그 노드에 부하가 집중되어 시스템의 성능이 떨어질수 있기 때문에 적절한 새 노드에 이동시켜 배치시키고 새 비디오 파일을 각 노드에 분배시키는 3 가지 스트라이핑 기법들을 제시한후 실험 분석을 통하여 이 기법들을 비교 평가하였다. 그 결과 FSM 양방향 기법이 가장 좋은 성능을 보였다.

  • PDF

Critical current densities of bicrystalline HTSC film under various magnetic fields

  • Lim S.M.;Jung Y.;Jang K.;Lee S.M.;Jung Y.H.;Youm D.
    • 한국초전도ㆍ저온공학회논문지
    • /
    • 제8권2호
    • /
    • pp.11-16
    • /
    • 2006
  • Critical current densities were measured for a bicrystalline $(Sm_{0.8}Dy_{0.2})Ba_2Cu_3O_7$ film under various magnetic fields $({^{\rightarrow_{H}}}_a)$. The fields were varied from -0.7KOe to +0.7KOe for various orientations with respect to the film surface. The curves of the critical current densities $(J_{cb})\;vs\;{^{\rightarrow_{H}}}_a$ showed the well known butterfly-like hysteretic curves. Our data could be analyzed for the two components of field, which are normal and parallel to the film surface, respectively. We combined the effect of $H_\perp$ deduced from the data for the normal field $(\theta=90^{\circ})$ and the effect of $H_\parallel$ deduced from the data for the almost parallel field $(\theta=2^{\circ})$. Our analyses indicate that $(J_{cb})$ depends on the two components of flux density at the grain boundary. All the experimental data for various ${\theta}s$ fit well to this new formula which was obtained by multiplying the factors deduced from the field dependences of these two components.

임베디드 병렬 프로세서를 위한 칼라미디어 명령어 구현 (Color Media Instructions for Embedded Parallel Processors)

  • 김철홍;김종면
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제35권7호
    • /
    • pp.305-317
    • /
    • 2008
  • 최근 모바일 컴퓨팅 환경의 변화로 멀티미디어 데이타의 고성능, 저전력 처리에 대한 수요가 증가하고, 프로세서에 있어서 멀티미디어 전용 가속기 기능의 중요성이 크게 부각되고 있다. 이에 본 논문은 고성능, 저전력 멀티미디어 처리를 위한 SIMD 병렬 프로세서용 칼라미디어 명령어를 제안한다. 기존의 범용 마이크로프로세서 전용 멀티미디어 명령어 (e.g., MMX, VIS, AltiVec)는 4개의 8 비트 픽셀을 32 비트 레지스터에 저장하고 처리하는 반면에, 제안하는 칼라미디어 명령어는 인간의 시각이 칼라에 덜 민감한 점을 고려하여 32비트 데이타패스 아키텍처에서 두 쌍 (6개의 픽셀)의 압축된 16비트 YCbCr (6비트 Y, 5비트 Cb와 Cr) 데이타를 32비트 레지스터에 저장하고 동시에 처리함으로써 YCbCr 데이타 처리에서 높은 병렬성과 효율성을 보여준다. 또한 칼라미디어 명령어는 데이타 포맷 사이즈를 줄임으로써 전체시스템의 비용을 절감할 뿐만 아니라 데이타 대역폭의 감소로 시스템 디자인을 간소화한다. SIMD 병렬 프로세서 아키텍처에서 모의 실험한 결과, 칼라미디어 명령어 기반 프로그램은 baseline 명령어 프로그램보다 평균 6.3배 성능향상을 보여준다. 반면, Intel의 대표적인 멀티미디어 명령어인 MMX 기반 프로그램은 동일한 SIMD 병렬 프로세서에서 baseline 명령어 프로그램보다 단지 3.7배 성능향상을 나타낸다. 또한, 칼라미디어 명령어는 MMX보다 시스템 면적 효율 (52% 증가 대비 13% 증가)과 시스템 전력 효율 (50% 증가 대비 11% 증가)에서 우수성을 보여준다. 칼라미디어 명령어는 이러한 성능과 효율을 단지 3%의 시스템 면적과 5%의 시스템 전력의 증가로 얻는 반면, MMX는 14%의 시스템 면적과 16%의 시스템 전력증가가 요구된다.

JPEG2000 이산웨이블릿변환의 컨볼루션기반 non-cascaded 아키텍처를 위한 pipelined parallel 최적화 설계 (A Pipelined Parallel Optimized Design for Convolution-based Non-Cascaded Architecture of JPEG2000 DWT)

  • 이승권;공진흥
    • 대한전자공학회논문지SD
    • /
    • 제46권7호
    • /
    • pp.29-38
    • /
    • 2009
  • 본 연구에서는 실시간 이산웨이블릿변환을 위한 컨볼루션기반 non-cascaded 구조를 구현하고자 병렬곱셈기-중간버퍼-병렬누적기의 고성능 병렬파이프라인 연산회로를 설계하였다. 이산웨이블릿변환의 컨볼루션 곱셈연산은 필터계수의 대칭성과 업/다운 샘플링이 고려된 최적화를 통해서 1/4정도로 감소시킬 수 있으며, 화상데이터와 다수 필터계수들 간의 곱셈과정을 LUT기반의 병렬계수 DA 곱셈기 구조로 구현하면 3$\sim$5배 고속연산처리가 가능하게 된다. 또한 컨볼루션의 곱셈결과를 중간버퍼에 저장하여 누적가산 과정에서 재사용하면 전체 곱셈연산량을 1/2로 감소시켜 연산전력을 절약시킬 수 있다. 중간버퍼는 화상데이터와 필터계수들의 곱셈결과값들을 컨볼루션의 누적가산 과정을 위해 정렬시켜 저장하게 되는데, 이때 병렬누적가산기의 고속 순차검색을 위해 정렬된 병렬저장이 이루어지도록 버퍼관리 구조를 설계한다. 컨볼루션의 병렬곱셈기와 병렬누적가산기는 중간버퍼를 이용한 파이프라인을 구성하게 되는데, 파이프라인 연산처리 효율을 높이기 위해 병렬곱셈기의 연산처리 성능에 맞추어 누적가산기 및 중간버퍼의 병렬화 구조가 결정된다. 설계된 고성능 이산웨이블릿변환기의 성능을 검증하기 위해서 0.18um 라이브러리를 이용한 후반부 설계를 하였으며, 90MHz에서 SVGA(800$\sim$600)영상을 30fps로 실시간 처리함을 확인하였다.

Feasibility Study of a Distributed and Parallel Environment for Implementing the Standard Version of AAM Model

  • Naoui, Moulkheir;Mahmoudi, Said;Belalem, Ghalem
    • Journal of Information Processing Systems
    • /
    • 제12권1호
    • /
    • pp.149-168
    • /
    • 2016
  • The Active Appearance Model (AAM) is a class of deformable models, which, in the segmentation process, integrates the priori knowledge on the shape and the texture and deformation of the structures studied. This model in its sequential form is computationally intensive and operates on large data sets. This paper presents another framework to implement the standard version of the AAM model. We suggest a distributed and parallel approach justified by the characteristics of the model and their potentialities. We introduce a schema for the representation of the overall model and we study of operations that can be parallelized. This approach is intended to exploit the benefits build in the area of advanced image processing.

직병렬 주사방식 일정장비의 신호처리기 설계 연구 (Electronic Processor Design for Thermal Imager with Serial/Parallel Scan type)

  • 송인섭;유위경;윤은석;홍영철;홍석민
    • 전자공학회논문지B
    • /
    • 제31B권1호
    • /
    • pp.49-56
    • /
    • 1994
  • This paper describes the design principles and methods of electronic processor for thermal imager with the SPRITE detector, operating in the 8-12 micron band. The thermal imager consists of a optical scanner containing the detector and an electrical signal processor. The optical scanner utilizing rotating polygon and oscillating mirror, is 2-dimensional serial/parallel scan type using 5 elements of the detector. And the electronic processor has pre-processing of 5 chnanel's thermal signal from the detector, and performs digital scan conversion to reform the parallel data stream into serial analog data compatible with conventional RS-170 video. Through the designed electronic processor, we have acquired a satisfactory thermal image. And the MRTD (Minimum Resolvable Temperature Difference) is 0.5$^{\circ}$K at 7.5 cycles/mm.

  • PDF

Parallel damage detection through finite frequency changes on multicore processors

  • Messina, Arcangelo;Cafaro, Massimo
    • Structural Engineering and Mechanics
    • /
    • 제63권4호
    • /
    • pp.457-469
    • /
    • 2017
  • This manuscript deals with a novel approach aimed at identifying multiple damaged sites in structural components through finite frequency changes. Natural frequencies, meant as a privileged set of modal data, are adopted along with a numerical model of the system. The adoption of finite changes efficiently allows challenging characteristic problems encountered in damage detection techniques such as unexpected comparison of possible shifted modes and the significance of modal data changes very often affected by experimental/environmental noise. The new procedure extends MDLAC and exploits parallel computing on modern multicore processors. Smart filters, aimed at reducing the potential damaged sites, are implemented in order to reduce the computational effort. Several use cases are presented in order to illustrate the potentiality of the new damage detection procedure.

병렬 구조에 의한 가변 논리제어장치의 기능적 설계 (A Functional Design of Programmable Logic Controller Based on Parallel Architecture)

  • 이정훈;신현식
    • 대한전기학회논문지
    • /
    • 제40권8호
    • /
    • pp.836-844
    • /
    • 1991
  • PLC(programmable logic controller) system is widely used for the control of factory. PLC system receives ladder diagram which is drawn by the user to implement hardware logic, converts the ladder diagram into sequence program which is executable in the PLC system, and executes the sequence program indefinitely unless user breaks. The sequence program processes the data of on/off signal, and endures 1 scan delay and missing of pulse-type signal shorter than a scan time. So, data dependency doesn't exist. By applying theis characteristics to multiprocessor architecture, we design parellel PLC functionally and evaluate performance upgrade. Parallel PLC consists of central processing module, N general processing unit, and a shared memory by master-slave type. Each module executes allocated sequence program by the control of central processing module. We can expect performance upgrade by parallel processing, and reliability by relocation of sequence program when error occurs in processing module.

  • PDF

H/V-버스 병렬컴퓨터의 설계 및 성능 분석 (Design and Performance Analysis of the H/V-bus Parallel Computer)

  • 김종현
    • 한국시뮬레이션학회논문지
    • /
    • 제3권1호
    • /
    • pp.29-42
    • /
    • 1994
  • The architecture of a MIMD-type parallel computer system is specified: a simulator is developed to support design and evaluation of systems based on the architecture: and conducted with the simulator to evaluate system performance. The horizontal/vertical-bus(H/V-bus) system architecture provides an NxN array of processing elements which communicate with each other through a network of N horizontal buses and N vertical buses. The simulator, written in SLAM II and FORTRAN, is designed to provide high-resolution in simulating the IPC mechanism. Parameters provide the user with independent control of system size, PE speed and IPC mechanism speed. Results generated by the simulator include execution times, PE utilizations, queue lengths, and other data. The simulator is used to study system performance when a partial differential equation is solved by parallel Gauss-Seidel method. For comparisons, the benchmark is also executed on a single-bus system simulator that is derived from the H/V-bus system simulator. The benchmark is also solved on a single PE to obtain data for computing speedups. An extensive analysis of results is presented.

  • PDF