• Title/Summary/Keyword: 다중 코어

Search Result 160, Processing Time 0.036 seconds

Parallel Cell-Connectivity Information Extraction Algorithm for Ray-casting on Unstructured Grid Data (비정렬 격자에 대한 광선 투사를 위한 셀 사이 연결정보 추출 병렬처리 알고리즘)

  • Lee, Jihun;Kim, Duksu
    • Journal of the Korea Computer Graphics Society
    • /
    • v.26 no.1
    • /
    • pp.17-25
    • /
    • 2020
  • We present a novel multi-core CPU based parallel algorithm for the cell-connectivity information extraction algorithm, which is one of the preprocessing steps for volume rendering of unstructured grid data. We first check the synchronization issues when parallelizing the prior serial algorithm naively. Then, we propose a 3-step parallel algorithm that achieves high parallelization efficiency by removing synchronization in each step. Also, our 3-step algorithm improves the cache utilization efficiency by increasing the spatial locality for the duplicated triangle test process, which is the core operation of building cell-connectivity information. We further improve the efficiency of our parallel algorithm by employing a memory pool for each thread. To check the benefit of our approach, we implemented our method on a system consisting of two octa-core CPUs and measured the performance. As a result, our method shows continuous performance improvement as we add threads. Also, it achieves up to 82.9 times higher performance compared with the prior serial algorithm when we use thirty-two threads (sixteen physical cores). These results demonstrate the high parallelization efficiency and high cache utilization efficiency of our method. Also, it validates the suitability of our algorithm for large-scale unstructured data.

Implementation of Adaptive Multi Rate (AMR) Vocoder for the Asynchronous IMT-2000 Mobile ASIC (IMT-2000 비동기식 단말기용 ASIC을 위한 적응형 다중 비트율 (AMR) 보코더의 구현)

  • 변경진;최민석;한민수;김경수
    • The Journal of the Acoustical Society of Korea
    • /
    • v.20 no.1
    • /
    • pp.56-61
    • /
    • 2001
  • This paper presents the real-time implementation of an AMR (Adaptive Multi Rate) vocoder which is included in the asynchronous International Mobile Telecommunication (IMT)-2000 mobile ASIC. The implemented AMR vocoder is a multi-rate coder with 8 modes operating at bit rates from 12.2kbps down to 4.75kbps. Not only the encoder and the decoder as basic functions of the vocoder are implemented, but VAD (Voice Activity Detection), SCR (Source Controlled Rate) operation and frame structuring blocks for the system interface are also implemented in this vocoder. The DSP for AMR vocoder implementation is a 16bit fixed-point DSP which is based on the TeakLite core and consists of memory block, serial interface block, register files for the parallel interface with CPU, and interrupt control logic. Through the implementation, we reduce the maximum operating complexity to 24MIPS by efficiently managing the memory structure. The AMR vocoder is verified throughout all the test vectors provided by 3GPP, and stable operation in the real-time testing board is also proved.

  • PDF

Processing Speed Improvement of Software for Automatic Corner Radius Analysis of Laminate Composite using CUDA (CUDA를 이용한 적층 복합재 구조물 코너 부의 자동 구조 해석 소프트웨어의 처리 속도 향상)

  • Hyeon, Ju-Ha;Kang, Moon-Hyae;Moon, Yong-Ho;Ha, Seok-Wun
    • Journal of Convergence for Information Technology
    • /
    • v.9 no.7
    • /
    • pp.33-40
    • /
    • 2019
  • As aerospace industry has been activated recently, it is required to commercialize composite analysis software. Until now, commercial software has been mainly used for analyzing composites, but it has been difficult to use due to high price and limited functions. In order to solve this problem, automatic analysis software for both in-plane and corner radius strength, which are all made on-line and generalized, has recently been developed. However, these have the disadvantage that they can not be analyzed simultaneously with multiple failure criteria. In this paper, we propose a method to greatly improve the processing speed while simultaneously handling the analysis of multiple failure criteria using a parallel processing platform that only works with a GPU equipped with a CUDA core. We have obtained satisfactory results when the analysis speed is experimented on the vast structure data.

Multi-Document Summarization Method of Reviews Using Word Embedding Clustering (워드 임베딩 클러스터링을 활용한 리뷰 다중문서 요약기법)

  • Lee, Pil Won;Hwang, Yun Young;Choi, Jong Seok;Shin, Young Tae
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.10 no.11
    • /
    • pp.535-540
    • /
    • 2021
  • Multi-document refers to a document consisting of various topics, not a single topic, and a typical example is online reviews. There have been several attempts to summarize online reviews because of their vast amounts of information. However, collective summarization of reviews through existing summary models creates a problem of losing the various topics that make up the reviews. Therefore, in this paper, we present method to summarize the review with minimal loss of the topic. The proposed method classify reviews through processes such as preprocessing, importance evaluation, embedding substitution using BERT, and embedding clustering. Furthermore, the classified sentences generate the final summary using the trained Transformer summary model. The performance evaluation of the proposed model was compared by evaluating the existing summary model, seq2seq model, and the cosine similarity with the ROUGE score, and performed a high performance summary compared to the existing summary model.

Heterogeneous Operating Systems Integrated Trace Method for Real-Time Virtualization Environment (다중 코어 기반의 실시간 가상화 시스템을 위한 이종 운영체제 통합 성능 분석 방법에 관한 연구)

  • Kyong, Joohyun;Han, In-Kyu;Lim, Sung-Soo
    • IEMEK Journal of Embedded Systems and Applications
    • /
    • v.10 no.4
    • /
    • pp.233-239
    • /
    • 2015
  • This paper describes a method that is integrated trace for real-time virtualization environment. This method has solved the problem that the performance trace may not be able to analyze integrated method between heterogeneous operating systems which is consists of real-time operating systems and general-purpose operating system. In order to solve this problem, we have attempted to reuse the performance analysis function in general-purpose operating system, thereby real-time operating systems can be analyzed along with general-operating system. Furthermore, we have implemented a prototype based on ARM Cortex-A15 dual-core processor. By using this integrated trace method, real-time system developers can be improved productivity and reliability of results on real-time virtualization environment.

Technique Development of Realtime Movement, Reaction and Photorealistic Rendering of Virtual Objects (ITRC 4th workshop 제 2-1 세부과제 -가상 물체의 실시간 거동 및 반응 시뮬레이션과 시각적 실사렌더링 기술 개발-)

  • Ji, Joong-Hyun;Yun, Dong-Ho;Ko, Kwang-Hee
    • 한국HCI학회:학술대회논문집
    • /
    • 2009.02a
    • /
    • pp.2066-2067
    • /
    • 2009
  • 1차년도에는 햅틱 시나리오의 비주얼 쓰레드로서의 환경을 구축하여 햅틱 렌더링과 그래픽 렌더링의 연동을 위한 연구를 수행하였고 햅틱 장비로부터 오는 다양한 데이터 처리를 위한 데이터 로딩 기법을 연구하고 이를 멀티 코어 CPU를 이용하여 단일 조명상에서 광선 추적하는 알고리즘을 개발하였다. 당해연도에는 1Khz 의 속도를 가진 햅틱 렌더링과의 불연속성을 해결하기 위하여 GPU를 이용한 보다 빠른 고품질의 광선 추적 알고리즘을 개발하고자 한다. 이를 위하여 NVIDIA의 범용 솔루션인 CUDA를 통해 병렬 처리를 통해 실시간으로 다중 광원을 가진 Dynamic한 장면을 갱신할 수 있도록 한다. 또한 심장, 폐, 간과 같은 반투명한 재질을 가진 신체 장기 표현을 위해 각 재질에 맞는 양방향의 표면 내부 산란 분포함수를 간략화하여 차후 년도의 연구에 반영한다.

  • PDF

Line Share Device Design by CWDM (CWDM 기반 선로 공유 장치 설계)

  • Jung, Byung-Chan;Cho, Tae-Kyoung
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.9 no.1
    • /
    • pp.87-92
    • /
    • 2008
  • This study presents the design methods that will enable high speed communication companies to establish high efficiency optical communication network at a low cost. This study compares and analyzes CWDM and DWDM technology that transmit multiple optical signals through an optic core, and describes compensation of deteriorated optical signal, which occurs in long distance data transmission, through the stabilization of TX/RX terminal to enable long distance data transmission. CWDM based line access multiplexer increases concentration efficiency by eight times by providing 4:1 concentration subscriber network.

Study on operation for VC merging equipment (VC merging 장치의 운용 방법에 관한 연구)

  • Yun, Bin-Yeong;Jeong, Youn-Kwae;Kim, Whan-Woo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2000.10b
    • /
    • pp.1537-1540
    • /
    • 2000
  • MPLS 는 ATM 과 같은 기존의 레이어 2 계층의 스위칭 기술을 사용하여 IP와 같은 레이어 3 계층기능을 효과적으로 제공하기 위해서 제안되었다. 이러한 MPLS가 코어라우터에 적용될 때 확장성을 제공하기 위한 필수적인 방안으로 VC merging 기능이 요구된다. VC merging 기능은 수신된 ATM 셀들을 VCC 별로 AAL5 프레임 단위로 다중화하고 동일한 목적지를 갖는 ATM 셀에 대해서 동일한 VPI/VCI 값을 갖도록 ATM 셀을 생성한다. 본 논문에서는 최대 1Gbps 데이터를 처리하는 SAR 소자를 사용하여 VC merging 장치를 구현하였다. 그리고 이를 MPLS 망에 적용시키기 위해서 VCC 연결 설정에 제한성을 갖는 SAR 소자에도 적용 가능한 연결 설정 및 해제 절차를 제공하였다.

  • PDF

Selective Conflict Resolution for Transactional Memory System to Improve Performance (트랜잭셔널 메모리 시스템의 성능향상을 위한 선택적 트랜잭셔널 메모리 충돌해결정책)

  • Jeon, Won;Ro, Won Woo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2014.04a
    • /
    • pp.115-118
    • /
    • 2014
  • 트랜잭셔널 메모리는 다중 코어 시스템에서 lock 을 대체할 메모리 동기화 기법으로 소개되었다. 트랜잭셔널 메모리를 사용하는 시스템에서 같은 주소의 메모리에 동시에 접근하여 충돌이 일어난 트랜잭션은 충돌해결정책에 의해 유효화 될지 버려질지 선택된다. 기존의 트랜잭셔널 메모리는 고정된 충돌해결정책을 사용하여, 상황에 따라 가장 유리한 트랜잭션을 선택 해주지 못하는 한계가 있었다. 본 논문에서는 상황에 따라 여러 정책 중 유리한 충돌해결정책을 판단하여 적용시키는 방법을 제안한다. STAMP 벤치마크를 통한 시뮬레이션 결과, 제안하는 방법은 기존에 사용되는 Timestamp, Karma 충돌해결정책 대비 평균 22% 높은 성능 향상을 보였다.

SMPS Design for high voltage input (고출력 SMPS 설계)

  • Song, Gwang-Cheol;Park, Sung-Min;Song, Kwang-Seok
    • Proceedings of the KIPE Conference
    • /
    • 2015.11a
    • /
    • pp.169-170
    • /
    • 2015
  • 본 논문은 Forward Converter방식의 DC/DC 컨버터 회로를 기반으로, 1000[V]급에 해당하는 고전압 입력으로부터 절연된 저전압을 출력하는 고압SMPS에 관한 것이다. 제안된 토폴로지는 고전압을 분배하는 커패시터와 MCU 전용의 커패시터를 직렬로 구성하고, 각 커패시터에 분배된 전압을 입력으로 다중여자 방식의 컨버터 구조로 되어있다. 직렬 커패시터 구조는 고압환경에서 각 소자들의 절연 및 전압스트레스를 저감할 수 있으며, 제어기 전용의 커패시터는 시스템의 초기구동을 위한 자가충전 (Self-Power) 및 Black-Start의 시스템 안정화 구조이다. 또한 각 모듈에 연결된 모든 DC/DC컨버터 출력이 하나의 변압기에 연결되는 구조를 취하고 있어 Passive방식의 단일 코어를 갖는고주파 변압기를 통하여 자속을 공유함으로 밸런싱이 가능하다. 따라서 본 논문에서 제안된 공진회로는 PISM을 이용한 시뮬레이션과 실험을 통해 제안된 알고리즘의 타당성과 우수성을 검증하였다.

  • PDF