• Title/Summary/Keyword: m-병렬

Search Result 787, Processing Time 0.04 seconds

Serialization Dispatcher Worker Model (직렬화 디스패쳐 워커모델 기법)

  • Lim, Sang-woo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2014.11a
    • /
    • pp.573-575
    • /
    • 2014
  • 클럭 경쟁에서 코어 경쟁으로 전환된 요즘. 병렬 프로그래밍은 중요 하다. 동기화 개체를 사용하면 병목 현상이 발생하며, 1:1 Thread 모델은 자원의 낭비와 문맥전환 비용이 발생한다. Thread 풀 모델은 직렬화에 약점을 가지는게 되는데, 본 논문에서는 다중 개체 대응에 적합한 병렬 프로그래밍 모델을 제시한다.

A Interpolation Hardware Architecture for HEVC Inter-Prediction Decoder Using Parallel Process (병렬처리를 이용한 HEVC 디코더의 화면간 예측 보간 필터 하드웨어 구조)

  • Choi, Seung-Hwan;Bae, Jong-Woo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.04a
    • /
    • pp.950-953
    • /
    • 2015
  • 본 논문에서는 HEVC 디코더에서 화면간 예측의 보간 필터에 대한 하드웨어 구조를 제시하고, 설계 및 분석결과를 통해 연구 결론을 도출하는 것이 목적이다. 제안하는 하드웨어 구조는 보간 필터의 각 필터 간의 유사성을 확인하고 빠르게 데이터를 처리하기 위한 병렬처리 방법을 제시한다. 또한 레지스터를 통한 데이터를 재사용하는 방식을 이용하여 외부 메모리와의 불필요한 연결을 줄여 성능을 향상시켰다.

Frequency Sub-bands Parallel Neural Network Classification of Infrasonic Signals Associated with Volcanic Eruptions (주파수 부대역별 병렬 신경망 분석에 의한 화산 분출 초저음파의 식별기법 연구)

  • Lee, Jin-Koo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2014.04a
    • /
    • pp.785-787
    • /
    • 2014
  • 본 논문에서는 화산 분출 초저음파의 식별을 위해서 FSPNNC(Frequency Sub-bands Parallel Neural NetworkClassification)을 선택한다. FSPNNC 는 각기 다른 주파수 영역에서 독립적으로 추출한 특징벡터를 병렬 구조의 신경망에 학습하는 구조를 가지며 하나의 신경망은 하나의 분류 및 하나의 주파수 부대역만을 학습하고 다른 신경망들은 해당 특징벡터를 분류하지 않도록 학습된다. 실험은 단일 신경망 및 PNNCB(Parallel Neural Network Classifier Bank)와의 비교실험을 통하여 식별 성능을 제시한다.

A Study on comparison of calculation between CPU-intensive and GPU-intensive and finding proper model for specific program (GPU기반의 계산속도와 CPU기반의 계산속도 비교 및 특정 프로그램에 따른 적합한 모델 찾기에 대한 연구)

  • Shin, Hyun-Soo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.05a
    • /
    • pp.48-51
    • /
    • 2019
  • 최근 기술이 발달함으로 인해 더 짧은시간에 더 많은 계산량이 필요해진 시대가 왔다. 본 연구에서는 CPU와 GPU의 구조를 파악하고 계산속도를 비교한다. 직렬 방식의 알고리즘에서의 병렬 방식의 알고리즘 및 현재 GPU 병렬처리 적용 사례 및 추후 적합한 모델 찾기에 대해 연구한다.

A Log-based Analysis on the Characteristics and Structure of MPI-IO (MPI-IO를 위한 로그 기반 특성 및 구조 분석)

  • Cha, Kwangho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.05a
    • /
    • pp.114-116
    • /
    • 2013
  • 메시지 전달 방식의 병렬 프로그래밍에서 사용되는 MPI는 프로그램의 확장성 보장에 적합한 MPI-IO라는 파일 I/O 방법을 제공하고 있다. MPI-IO는 동시적인 병렬 I/O 수행으로 인한 성능 저하를 최소화하기 위하여 내부적으로 데이터 재정렬 후 I/O를 수행한다. 본 연구에서는 이와 같은 MPI-IO의 내부 처리과정을 기록하기 위한 방안을 강구하여 실행 시간 로그를 기록하였고 이를 바탕으로 MPI-IO의 특성을 살펴보았다.

Survey of various parallel job scheduling techniques on clusters (병렬 작업 스케줄링에 대한 조사 연구)

  • Yoon, Ji Hyun;Yeom, Heon Y.
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2007.11a
    • /
    • pp.630-633
    • /
    • 2007
  • 클러스터를 이용하여 다수의 작업을 실행시키는 경우에 효율적으로 사용자들이 자원을 사용하기 위해서는 작업 스케줄링이 매우 중요하다. 다양한 스케줄링 방법들이 제안되었으며 그 중 효율적으로 병렬 작업을 스케쥴링하기 위해 제안된 방법으로는 backfilling, co-scheduling, gang scheduling을 들 수 있다. 이러한 연구에서는 이론적인 논의가 많았고, 실제로 구현을 했다고 하더라고 multiprocessor 를 대상으로 backfilling 을 다룬 내용이 대부분이었다. 이 논문은 클러스터상에서의 parallel job scheduling 에 대해 조사하였다.

A Zero-latency Cycle Detection Scheme for Enhanced Parallelism in Multiprocessing Systems (다중처리 시스템의 병렬성 증대를 위한 사이클의 비 지연 발견 기법)

  • Kim Ju Gyun
    • Journal of KIISE:Computer Systems and Theory
    • /
    • v.32 no.2
    • /
    • pp.49-54
    • /
    • 2005
  • This Paper Presents a non-blocking deadlock detection scheme with immediate cycle detection in multiprocessing systems. We assume an expedient state and a special case where each type of resource has one unit and each request is limited to one resource unit at a time. Unlike the previous deadlock detection schemes, this new method takes O(1) time for detecting a cycle and O(n+m) time for blocking or handling resource release where n and m are the number of processes and that of resources in the system. The deadlock detection latency is thus minimized and is constant regardless of n and m. However, in a multiprocessing system, the operating system can handle the blocking or release on-the-fly running on a separate processor, thus not interfering with user process execution. To some applications where deadlock is concerned, a predictable and zero-latency deadlock detection scheme could be very useful.

Fabrication of polymeric optical waveguides for parallel optical interconnection using hot embossing technique (Hot Embossing기술을 이용한 병렬 광접속용 고분자 광도파로 제작)

  • 최춘기;김병철;한상필;안승호;정명영
    • Korean Journal of Optics and Photonics
    • /
    • v.13 no.3
    • /
    • pp.223-227
    • /
    • 2002
  • Polymeric multi-mode optical waveguides were fabricated for parallel optical interconnection. Waveguide structures were molded by a Ni mold master using a hot embossing technique. The Ni mold master was manufactured by LIGA process. Multimode optical waveguides with a 48$\times$47 ${\mu}{\textrm}{m}$$^2$cross-section were produced by a simple two-step process. The propagation losses of the multimode waveguide measured at 0.85 ${\mu}{\textrm}{m}$ and 1.3 ${\mu}{\textrm}{m}$ wavelengths were 0.38 dB/cm and 0.66 dB/cm, respectively.

Parallel M-band DWT-LMS Algorithm to Improve Convergence Speed of Nonlinear Volterra Equalizer in MQAM System with Nonlinear HPA (비선형 HPA를 가진 M-QAM 시스템에서 비선형 Volterra 등화기의 수렴 속도 향상을 위한 병렬 M-band DWT-LMS 알고리즘)

  • Choi, Yun-Seok;Park, Hyung-Kun
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.32 no.7C
    • /
    • pp.627-634
    • /
    • 2007
  • When a higher-order modulation scheme (16QAM or 64QAM) is applied to the communications system using the nonlinear high power amplifier (HPA), the performance can be degraded by the nonlinear distortion of the HPA. The nonlinear distortion can be compensated by the adaptive nonlinear Volterra equalizer using the low-complexity LMS algorithm at the receiver. However, the LMS algorithm shows very slow convergence performance. So, in this paper, the parallel M-band discrete wavelet transformed LMS algorithm is proposed in order to improve the convergence speed. Throughout the computer simulations, it is shown that the convergence performance of the proposed method is superior to that of the conventional time-domain and transform-domain LMS algorithms.

mOBCP Overlay Multicast Mechanism based on PMSS(Parallel Media Streaming Server) System (병렬 미디어 스트리밍 서버 시스템에서의 mOBCP 오버레이 멀티캐스트 기법 적용 방안)

  • Yang, Hyun-Jong;Lee, Hyung-Ok;Nam, Ji-Seung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2009.04a
    • /
    • pp.1144-1147
    • /
    • 2009
  • 멀티미디어의 방송 서비스 제공하기 위해서 IP 멀티캐스트의 대안으로써 현재의 인터넷 환경에서도 동시 접속자 수의 제한과 자원 낭비 문제를 효과적으로 해결할 수 있는 다양한 오버레이 멀티캐스트 기법이 제시되고 있다. 본 논문에서는 멀티미디어의 방송 서비스 제공을 위한 병렬 미디어 스트리밍 서버(PMSS : Parallel Media Streaming Server)시스템에 대해 알아보고 오버레이 멀티캐스트 트리 구성 방안으로 분산형 Tree-First 기반의 Spanning tree 구조의 하나인 TBCP기법에 대해 설명하고, TBCP기법의 한계점을 극복하기 위한 오버레이 멀티캐스트 기반의 알고리즘 적용한 효율적이고 향상된 성능을 제공하는 miniOverlay Broadcasting Control Protocol (mOBCP)에 대해 알아본다. 또 제안한 mOBCP 멀티캐스트 기법을 기반으로 PMSS를 이용하여 오버레이 방송 서비스를 제공하는 방안에 제시한다. 성능 비교는 Single 서버와 PMSS로 멀티미디어 방송 서비스를 제공했을 때의 지연시간(Latency)를 비교해 보고 mOBCP기법과 TBCP기법을 PMSS 시스템에서 적용하여 사용자 요구량에 따른 서비스 받는대 걸리는 지연시간을 비교함으로써 제안된 기법의 효율성을 보여주고 있다.