• 제목/요약/키워드: Parallel Machine

검색결과 508건 처리시간 0.025초

순차 Shear-Warp 알고리즘을 이용한 병렬볼륨렌더링의 구현 (Implementation of Parallel Volume Rendering Using the Sequential Shear-Warp Algorithm)

  • 김응곤
    • 한국정보처리학회논문지
    • /
    • 제5권6호
    • /
    • pp.1620-1632
    • /
    • 1998
  • 본 논문에서는 볼륨렌더링을 위한 빠른 병렬 알고리즘을 제안하고, 이를 4,096개의 프로세서를 가진 MasPar MP-2범용병렬 컴퓨터에서 C 언어와 MPL(MasPar Programming Language)언어를 이용하여 구현하였다. 본 알고리즘은 현재 가장 빠른 순차 볼륨 렌더링 알고리즘으로 알려진 Lacroute의 Shear-Warp 알고리즘을 병렬화한 것이다. 본 병렬 알고리즘은 밀림변환 공간 분할 기법과 이전의 렌더링 단계에서 얻은 부하정보를 이용하여 다음 렌더링시 부하를 균형화하는 부하균형화 기법을 이용함으로써 통신 오버헤드를 줄이며, 연속길이부호화 기법에 의한 볼륨 데이터 구조를 이용함으로써 처리할 복셀의 수를 크게 줄인다. MasPar MP-23에서 $128\times128\times128$복셀로 구성된 인체 두뇌 볼륨 데이터세트에 대하여 실험한 결과 초당 3~4프레임의 속도로 렌더링하였으며 본 알고리즘의 확장성에 의하여 16,384개의 프로세서를 가진 MasPar MP-2 시스템에서는 초당 12~16프레임의 렌더링이 가능할 것으로 기대된다. 또한 더 큰 볼륨에 대해서도 최근의 SIMD 또는 MIMD 머신상에서는 초당 30~60프레임의 렌더링이 가능할 것으로 기대된다.

  • PDF

Surface Texturing한 평행 슬라이더 베어링의 열유체윤활 해석: 딤플 깊이의 영향 (Thermohydrodynamic Lubrication Analysis of Surface-Textured Parallel Slider Bearing: Effect of Dimple Depth)

  • 박태조;김민규
    • Tribology and Lubricants
    • /
    • 제33권6호
    • /
    • pp.288-295
    • /
    • 2017
  • In order to improve the efficiency and reliability of the machine, the friction should be minimized. The most widely used method to minimize friction is to maintain the fluid lubrication state. However, we can reduce friction only up to a certain limit because of viscosity. As a result of several recent studies, surface texturing has significantly reduced the friction in highly sliding machine elements, such as mechanical seals and thrust bearings. Thus far, theoretical studies have mainly focused on isothermal/iso-viscous conditions and have not taken into account the heat generation, caused by high viscous shear, and the temperature conditions on the bearing surface. In this study, we investigate the effect of dimple depth and film-temperature boundary conditions on the thermohydrodynamic (THD) lubrication of textured parallel slider bearings. We analyzed the continuity equation, the Navier-Stokes equation, the energy equation, and the temperature-viscosity and temperature-density relations using a computational fluid dynamics (CFD) code, FLUENT. We compare the temperature and pressure distributions at various dimple depths. The increase in oil temperature caused by viscous shear was higher in the dimple than in the bearing outlet because of the action of the strong vortex generated in the dimple. The lubrication characteristics significantly change with variations in the dimple depths and film-temperature boundary conditions. We can use the current results as basic data for optimum surface texturing; however, further studies are required for various temperature boundary conditions.

병렬 컴퓨팅 시스템에서 LLVM 응용 연구 (Study on LLVM application in Parallel Computing System)

  • 조중석;조두산;김용연
    • 문화기술의 융합
    • /
    • 제5권1호
    • /
    • pp.395-399
    • /
    • 2019
  • 다양한 병렬 컴퓨팅 시스템을 지원하기 위해서는 LLVM IR을 벡터/행렬을 보다 효과적으로 지원할 수 있도록 확장하는 것과 LLVM IR을 machine code로 바꾸어 주는 부분을 새로운 알고리즘으로 설계하여 구현하면 된다. IR 예제에서 보았듯이 기본적으로 RISC 명령어로 구성되어 있기 때문에 RISC 명령어 생성은 자연스럽게 생성되며, 벡터 또한 현재 지원가능한데 행렬 명령어는 지원되지 못하고 있다. 벡터/행렬을 보다 강력하게 지원하기 위한 새로운 IR 구조, 명령어 생성 알고리즘 및 관련 부분의 확장이 필요하다. 이를 위해 LLVM IR의 각 명령어를 (벡터/행렬을 위한) target architecture의 적당한 명령어로 mapping을 해주는 부분 (instruction selection 알고리즘)이 중요하다. LLVM IR 명령어의 의미를 파악하고, target architecture의 각 명령어 의미와 syntax를 비교하여, 패턴이 일치하는 명령어를 선택하여 mapping을 효율적으로 해줘야 한다.

조선소 병렬 기계 공정에서의 납기 지연 및 셋업 변경 최소화를 위한 강화학습 기반의 생산라인 투입순서 결정 (Reinforcement Learning for Minimizing Tardiness and Set-Up Change in Parallel Machine Scheduling Problems for Profile Shops in Shipyard)

  • 남소현;조영인;우종훈
    • 대한조선학회논문집
    • /
    • 제60권3호
    • /
    • pp.202-211
    • /
    • 2023
  • The profile shops in shipyards produce section steels required for block production of ships. Due to the limitations of shipyard's production capacity, a considerable amount of work is already outsourced. In addition, the need to improve the productivity of the profile shops is growing because the production volume is expected to increase due to the recent boom in the shipbuilding industry. In this study, a scheduling optimization was conducted for a parallel welding line of the profile process, with the aim of minimizing tardiness and the number of set-up changes as objective functions to achieve productivity improvements. In particular, this study applied a dynamic scheduling method to determine the job sequence considering variability of processing time. A Markov decision process model was proposed for the job sequence problem, considering the trade-off relationship between two objective functions. Deep reinforcement learning was also used to learn the optimal scheduling policy. The developed algorithm was evaluated by comparing its performance with priority rules (SSPT, ATCS, MDD, COVERT rule) in test scenarios constructed by the sampling data. As a result, the proposed scheduling algorithms outperformed than the priority rules in terms of set-up ratio, tardiness, and makespan.

고온초전도 더블 팬케이크 코일들 사이의 접합 방법 (A Joining Method between HTS Double Pancake Coils)

  • 손명환;심기덕;김석호;김해종;배준한;이언용;민치현;성기철
    • 대한전기학회논문지:전기기기및에너지변환시스템부문B
    • /
    • 제55권12호
    • /
    • pp.633-639
    • /
    • 2006
  • High temperature superconductor (HTS) winding coil is one of the key component in superconducting device fabrication. Double-pancake style coils are widely used for such application. High resistance between pancake coils greatly affects the machine design, operating condition and thus the stability. In order to reduce such resistance, experimentalists are looking for efficient and damage free coil connecting methods. In this respect, here we proposed parallel joining method to connect the coils. This is to do crossly joining with HTS tapes on two parallel HTS tapes. Joint samples between two parallel HTS tapes were prepared by using HTS tapes and current-voltage (I-V) characteristic curves were investigated at liquid nitrogen temperature i.e., 77.3 K. A 20 cm length joint connected between two parallel HTS tapes shows $32.5n{\Omega}$, for currents up to 250 A. A small HTS magnet, having two double pancake sub-coils connected together through new parallel joint method was fabricated and their current-voltage (I-V) characteristic curve was investigated. At 77.3K, critical current(Ic) of 97 A and resistance of $55n{\Omega}$ for currents upto 130 A were measured. At operating current 86 A lower than Ic, Joule heats generated in whole magnet and at joint region between sub-coils were 226 mW and 0.4 mW, respectively. Low Joule heat generation suggests that this joining method may be used to fabricate HTS magnet or windings.

오디세우스 대용량 검색 엔진을 위한 병렬 웹 크롤러의 구현 (Implementation of a Parallel Web Crawler for the Odysseus Large-Scale Search Engine)

  • 신은정;김이른;허준석;황규영
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권6호
    • /
    • pp.567-581
    • /
    • 2008
  • 웹의 크기가 폭발적으로 증가함에 따라 인터넷에서 정보를 얻는 수단으로서 검색 엔진의 중요성이 부각되고 있다. 검색 엔진은 사용자에게 최신의 정보를 검색 결과로서 제공하기 위해 웹 페이지를 주기적으로 수집하고 이를 데이타베이스에 저장한다. 웹 크롤러는 이러한 목적으로 웹 페이지를 수집하는 프로그램이다. 대부분의 검색 엔진은 제한된 시간 내에 많은 수의 웹 페이지를 수집하기 위해 다수의 머신을 사용하는 병렬 웹 크롤러를 이용한다. 그러나, 병렬 웹 크롤러의 아키텍처와 세부 구현 방법이 잘 알려져 있지 않기 때문에 실제로 병렬 웹 크롤러를 구현하는 데에 어려움이 많다. 본 논문에서는 병렬 웹 크롤러(parallel web crawler)의 아키텍처와 세부 구현 방법을 제시한다. 병렬 웹 크롤러는 다수의 머신에서 웹 페이지를 병렬적으로 수집하기 위해 조정자(coordinator) 대리자(agent) 구조의 2-티어(tier) 모델을 사용한다. 조정자/대리자 모델은 각 머신에서 웹 페이지를 수집하기 위한 다수의 대리자들과 이 대리자들을 관리하기 위한 하나의 조정자로 구성된다. 병렬 웹 크롤러는 웹 페이지를 수집하기 위한 크롤링(crawling) 모듈, 수집한 웹 페이지를 데이타베이스 로딩 포맷으로 변환하기 위한 컨버팅(converting) 모듈, 수집된 웹 페이지의 중요도를 계산하기 위한 랭킹(ranking) 모듈로 구성된다. 본 논문에서는 병렬 웹 크롤러의 각 모듈들을 설명하고, 세부 구현 방법을 설명한다. 마지막으로, 실험을 통해 병렬 웹 크롤러의 성능을 평가하였다. 실험 결과, 제안된 병렬, 웹 크롤러가 수집해야할 웹 페이지 개수와 머신 개수에 따라 확장 가능함을 보였다.

초정밀 기상측정용 다이아프램 타입 접촉식 프로브의 개발 (Development of Diaphragm-type Stylus Probe for Ultra-precision On-machine Measurement Application)

  • 이정훈;이찬희;최준명;김호상
    • 한국정밀공학회지
    • /
    • 제29권8호
    • /
    • pp.845-852
    • /
    • 2012
  • The diaphragm-type stylus probe was developed for ultra-precision on-machine measurement (OMM) application. This probe is equipped with two diaphragms which are parallel and one capacitive sensor is used for detecting the vertical motion of end tip in the stylus when it is contacted to the optical freeform surface. For better performance of proposed probes, several design parameters such as axial stiffness and the lateral deformations were investigated with finite element analysis techniques. To verify the feasibility, the profiles of the master sphere ball were measured on the ultra-precision milling machine. The measurement results show that the proposed probe can calculate the radius of the circle within the accuracy of 0.1 ${\mu}m$ for the ultraprecision optical surface.

Minimization of a Cogging Torque for an Interior Permanent Magnet Synchronous Machine using a Novel Hybrid Optimization Algorithm

  • Kim, Il-Woo;Woo, Dong-Kyun;Lim, Dong-Kuk;Jung, Sang-Yong;Lee, Cheol-Gyun;Ro, Jong-Suk;Jung, Hyun-Kyo
    • Journal of Electrical Engineering and Technology
    • /
    • 제9권3호
    • /
    • pp.859-865
    • /
    • 2014
  • Optimization of an electric machine is mainly a nonlinear multi-modal problem. For the optimization of the multi-modal problem, many function calls are required with much consumption of time. To address this problem, this paper proposes a novel hybrid algorithm in which function calls are less than conventional methods. Specifically, the proposed method uses the kriging metamodel and the fill-blank technique to find an approximated solution in a whole problem region. To increase the convergence speed in local peaks, a parallel gradient assisted simplex method is proposed and combined with the kriging meta-model. The correctness and usefulness of the proposed hybrid algorithm is verified through a mathematical test function and applied into the practical optimization as the cogging torque minimization for an interior permanent magnet synchronous machine.

30kW 고주파 용접 전원용 Full-Bridge 컨버터의 분산설계에 관한 연구 (Research for Distributed Design for 30kW Full-Bridge Converter for in High Frequency Welding Machine)

  • 김민우;최승원;이일운;이준영;정계수;이토 에이지
    • 전력전자학회논문지
    • /
    • 제25권6호
    • /
    • pp.469-476
    • /
    • 2020
  • This study presents the results of the research on power supplies for welding machine using MOSFET switches in high frequency switching for ease of design and use a 100 kHz switching frequency for high power density. The topology of the proposed power supplies for welding machine is ZVS-PWM full-bridge converter. The proposed converter is designed on a distributed transformer for ease of design and be used in a 100 kHz switching frequency for high power density. The problem of power imbalance of transformers occurring in parallel operation of transformers can be improved by applying common mode coupled inductor and the corresponding contents are experimented and verified in this paper to present conclusions.

인공신경망 기계번역에서 디코딩 전략에 대한 연구 (Study on Decoding Strategies in Neural Machine Translation)

  • 서재형;박찬준;어수경;문현석;임희석
    • 한국융합학회논문지
    • /
    • 제12권11호
    • /
    • pp.69-80
    • /
    • 2021
  • 딥러닝 모델을 활용한 인공신경망 기계번역 (Neural machine translation)이 주류 분야로 떠오르면서 최고의 성능을 위해 모델과 데이터 언어 쌍에 대한 많은 투자와 연구가 활발하게 진행되고 있다. 그러나, 최근 대부분의 인공신경망 기계번역 연구들은 번역 문장의 품질을 극대화하는 자연어 생성을 위한 디코딩 전략 (Decoding strategy)에 대해서는 미래 연구 과제로 남겨둔 채 다양한 실험과 구체적인 분석이 부족한 상황이다. 기계번역에서 디코딩 전략은 번역 문장을 생성하는 과정에서 탐색 경로를 최적화 하고, 모델 변경 및 데이터 확장 없이도 성능 개선이 가능하다. 본 논문은 시퀀스 투 시퀀스 (Sequence to Sequence) 모델을 활용한 신경망 기반의 기계번역에서 고전적인 그리디 디코딩 (Greedy decoding)부터 최신의 방법론인 Dynamic Beam Allocation (DBA)까지 비교 분석하여 디코딩 전략의 효과와 그 의의를 밝힌다.