• 제목/요약/키워드: Kernel Memory

검색결과 179건 처리시간 0.029초

Temperature effect on seismic performance of CBFs equipped with SMA braces

  • Qiu, Canxing;Zhao, Xingnan
    • Smart Structures and Systems
    • /
    • 제22권5호
    • /
    • pp.495-508
    • /
    • 2018
  • Shape memory alloys (SMAs) exhibit superelasticity given the ambient temperature is above the austenite finish temperature threshold, the magnitude of which significantly depends on the metal ingredients though. For the monocrystalline CuAlBe SMAs, their superelasticity was found being maintained even when the ambient temperature is down to $-40^{\circ}C$. Thus this makes such SMAs particularly favorable for outdoor seismic applications, such as the framed structures located in cold regions with substantial temperature oscillation. Due to the thermo-mechanical coupling mechanism, the hysteretic properties of SMAs vary with temperature change, primarily including altered material strength and different damping. Thus, this study adopted the monocrystalline CuAlBe SMAs as the kernel component of the SMA braces. To quantify the seismic response characteristics at various temperatures, a wide temperature range from -40 to $40^{\circ}C$ are considered. The middle temperature, $0^{\circ}C$, is artificially selected to be the reference temperature in the performance comparisons, as well the corresponding material properties are used in the seismic design procedure. Both single-degree-of-freedom systems and a six-story braced frame were numerically analyzed by subjecting them to a suite of earthquake ground motions corresponding to the design basis hazard level. To the frame structures, the analytical results show that temperature variation generates minor influence on deformation and energy demands, whereas low temperatures help to reduce acceleration demands. Further, attributed to the excellent superelasticity of the monocrystalline CuAlBe SMAs, the frames successfully maintain recentering capability without leaving residual deformation upon considered earthquakes, even when the temperature is down to $-40^{\circ}C$.

CUDA를 이용한 효과적인 GPU 광선추적 가속 알고리즘 (An efficient acceleration algorithm of GPU ray tracing using CUDA)

  • 지중현;윤동호;고광희
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.469-474
    • /
    • 2009
  • 본 논문은 CUDA를 이용하여 GPU에서의 최적화된 kd-tree 탐색구조 환경과 광선/삼각형의 교차검사 알고리즘을 통한 실시간의 광선추적 시스템을 제안한다. 기존의 GPU 기반 kd-tree 탐색 알고리즘은 대부분 스택이 없는 GPU 하드웨어의 특성상 임의의 단말노드에서 기하요소의 교차검사가 실패할 경우 상위노드로 상향식 탐색을 진행하기 때문에 노드에 대한 중복 방문이 반드시 필요하거나 혹은 불필요한 메모리의 적재가 필요하기 때문에 큰 장면에 대한 광선추적은 어렵게 된다. 본 논문에서 제안하는 알고리즘은 CPU 방식의 kd-tree 탐색과 비슷하게 동작하도록 stack을 CUDA 프레임워크를 이용하여 GPU의 지역메모리로 구현하였기 때문에 기존의 방법 등에서의 문제점을 해결하였다. 또한 탐색구조를 통해서 찾은 말단 삼각형들의 처리를 위해서 최신의 CPU 기반의 교차검사 알고리즘인 Plucker 좌표계 검사를 CUDA로 구현하여 병렬 가속시켰다. Plucker 검사는 기존의 무게중심 좌표 대신에 광선과 삼각형 edge의 관계를 이용하는 간단한 연산만을 이용하는 장점이 있다. 전체 시스템은 단일 커널로 구성되어 있으며 병렬처리를 위한 복잡한 동기화나 광선패킷의 도입 없이 간단하게 구현되었다. 결과적으로 본 논문의 실험은 기존 알고리즘 대비 제안하는 알고리즘이 약 2배의 성능 향상이 있음을 보여 준다.

  • PDF

Internet망을 이용한 VOD Client에 관한 연구 (Research about VOD Client that use Internal net)

  • 서승범;홍철호;신동욱;김선주;이무재
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2003년도 학술회의 논문집 정보 및 제어부문 A
    • /
    • pp.211-214
    • /
    • 2003
  • 현재 VOD 의 구현 방식은 PC기반을 이용하여 구현되고 있는데 이 VOD를 PC기반이 아닌 Embedded System으로 구현하는 연구를 수행하였다. 이 시스템의 OS는 WindowsCE.net을 이용하였으며, x86코어를 내장한 Sc1200(National사의 Geode제품군)을 CPU로 사용하였고, 메모리는 128 MByte SDRAM을 사용하였다. 그 외에 영상 데이터의 처리를 위하여 Mpeg Decoder를 사용하였고, Internet 망을 이용하기 위한 Ethernet Controller를 이용하였다. 그리고 소프트웨어를 저장하기 위한 저장메모리가 3가지 가 있는데, BIOS를 위한 Boot ROM과 WindowsCE Kernel을 저장하고 있는 Flash Memory, 그리고 나머지 기타 환경을 저장하기위한 Disk On Chip이 3가지가 저장메모리이다. 이 시스템의 영상출력부는 컴포지트(Composite), 컴포넌트(Com ponent), S-Video가 있으며 이들 중 1가지를 선택하여 TV에 연결하여 동작 되도록 하였다. 실제 구현은 시스템 개발에 필요한 BIOS, WinodwsCE.net Porting, DeviceDriver와 동작 확인에 필요한 간단한 Application 제작하였으며, 영상 Play는 WindowsCE.net에 포함되어있는 Window Media Player를 이용하였다. 따라서, 본 논문은 현재 PC에서 구현되고 있는 VOD 서비스의 단점들인 불필요한 마우스와 키보드 조작, PC와 TV의 연결 시 해상도 호환 문제등 을 보완하고자 Embedded System의 형태로 바꾸어 손쉽게 TV와 연결하여 사용할 수 있도록 구현하는데 의의가 있다고 할 수 있다.

  • PDF

가상화 환경에서 임베디드 시스템을 위한 모니터링 프레임워크와 디버깅 시스템 (Dynamic Monitoring Framework and Debugging System for Embedded Virtualization System)

  • 한인규;임성수
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권12호
    • /
    • pp.792-797
    • /
    • 2015
  • 효과적인 모니터링은 시스템을 진단하여 안정성을 향상시킨다. 하지만 타겟 시스템이 고장나거나 모니터링 시스템이 악의적인 공격을 당하면 신뢰성 있는 모니터링을 할 수 없다. 본 논문에서는 가상화를 이용하여 타겟 시스템이 고장나도 지속적인 모니터링이 가능한 시스템을 구현하고 해당 프레임워크를 제안한다. 제안한 프레임워크는 동적 바이너리 계측을 이용하였고, 하이퍼바이저 계층에서 해당 작업을 수행하기 때문에 상위에 있는 운영체제 종류에 상관없이 사용가능한 유연성과 격리성으로 시스템의 안정성을 보장한다. 또한 특별한 디버깅 장비가 필요 없기 때문에 모니터링 비용 면에서 이점을 가져올 수 있다. 본 프레임워크의 소개와 함께 이를 사용한 디버깅 기능을 소개한다. 모니터링 시스템으로 인한 오버헤드를 알기 위해 연산 성능, 메모리 성능, 메모리 대역폭을 측정하였으며 메모리 성능에서 추가 오버헤드가 2% 발생했다.

SPAX를 위한 OSF/1 AD3 기반의 마이크로 커널 초기화 설계 및 구현 (The Design and Implementation of OSF/1 AD3 Based-Microkernel Initialization for SPAX)

  • 김정녀;조일연;이재경;김해진
    • 한국정보처리학회논문지
    • /
    • 제5권5호
    • /
    • pp.1333-1344
    • /
    • 1998
  • 마이크로 커널 기반 운영체제는 종래의 통합커널에 비해 비교적 속도가 늦지만 운영체제 모듈성, 이식성 측면에서 장점이 있어 다중컴퓨터 시스템에 적합하다. 다중컴퓨터 시스템용 운영체제가 시스템의 기능을 원활하게 수행할 수 있도록 하기 위해서는 부트 시의 정보를 이용하여 처리기의 각 장치 및 메모리를 시스템에 알맞게 초기화하여야 할 것이다. 본 논문에서는 OSF/1 AD3를 기반으로 한 운영체제인 고속병렬컴퓨터의 OSF/1 AD3 MISIX 마이크로 커널 초기화에 대해 기술한다. 클러스터링 기반 고속병렬처리 시스템인 고속병렬컴퓨터의 초기화를 부트, 하드웨어 관련 초기화, 메모리 주소공간 구축 등의 관점에서 기능을 소개하고, 이를 시험한 내용을 시험 환경을 바탕으로 기술한다. 구현된 마이크로 커널은 운영체제 이식 작업의 일부로 4개의 처리기를 갖는 단일노드 시스템에서 시험이 이루어졌다.

  • PDF

멀티코어 CPU를 갖는 공유 메모리 구조의 대규모 병렬 유한요소 코드에 대한 설계 고려 사항 (Design Considerations on Large-scale Parallel Finite Element Code in Shared Memory Architecture with Multi-Core CPU)

  • 조정래;조근희
    • 한국전산구조공학회논문집
    • /
    • 제30권2호
    • /
    • pp.127-135
    • /
    • 2017
  • 멀티코어 CPU와 BLAS, LAPACK을 구현한 최적 수치라이브러리, 직접 희소 솔버의 대중화 등 PC나 워크스테이션 수준에서도 대규모 유한요소 모델을 해석할 수 있도록 컴퓨팅 환경이 급속도로 변화되었다. 이 논문에서는 멀티코어 CPU를 갖는 공유 메모리 구조에 대한 병렬 유한요소 프로그램 설계시 고려사항으로 (1) 최적화된 수치라이브러리의 사용, (2) 최신 직접 희소 솔버의 사용, (3) OpenMP를 이용한 병렬 요소 강성 행렬의 계산, (4) 희소행렬 저장방식의 일종인 triplet을 이용한 어셈블 기법 등을 제시하였다. 또한 대규모 수치모델을 통해 많은 시간이 소요되는 작업을 기준으로 병렬화 효과를 검토하였다.

다중 GPU기반 홀로그램 생성을 위한 병렬처리 성능 최적화 기법 (An Optimization Method for Hologram Generation on Multiple GPU-based Parallel Processing)

  • 국중진
    • 스마트미디어저널
    • /
    • 제8권2호
    • /
    • pp.9-15
    • /
    • 2019
  • 홀로그램의 생성을 위한 연산은 포인트 클라우드의 규모에 따라 연산량이 기하급수적으로 증가하기 때문에 최근에는 다중의 GPU를 기반으로 CUDA 또는 OpenCL 라이브러리를 활용한 병렬처리가 이루어지고 있다. GPU기반의 병렬처리를 위한 CUDA 커널은 GPU의 코어 개수와 메모리 크기를 고려하여 쓰레드(thread), 블록(block), 그리드(grid)를 구성해야 하며, 다중 GPU 환경인 경우 GPU의 개수에 따른 그리드, 블록, 또는 쓰레드 단위의 분산처리가 필요하다. 본 논문에서는 CGH 생성에 대한 성능평가를 위해 포인트 클라우드의 포인트 개수를 10~1,000,000개 범위에서 점진적으로 증가시키면서 CPU, 단일 GPU, 다중 GPU 환경에서 연산 속도를 비교해 보았으며, 다중 GPU 환경에서 CGH(Computer Generated Hologram) 생성 연산을 가속화하기 위한 CUDA 기반의 병렬처리 과정에서 요구되는 메모리 구조 설계와 연산 방법을 제안한다.

GPU 컨테이너 동시 실행에 따른 응용의 간섭 측정 프레임워크 설계 (A design of GPU container co-execution framework measuring interference among applications)

  • 김세진;김윤희
    • KNOM Review
    • /
    • 제23권1호
    • /
    • pp.43-50
    • /
    • 2020
  • 범용 그래픽 처리 장치(General Purpose Graphics Processing Unit, GPGPU)는 최근 고성능 컴퓨팅에서 중요한 역할을 함으로써, 여러 클라우드 서비스 공급업체들은 GPU 서비스를 제공하기 시작했다. 컨테이너를 사용하는 클라우드 환경에서 대부분의 클러스터 오케스트레이션 플랫폼은 정수 개의 GPU를 작업에 할당하고 다른 작업과 이를 공유하는 것을 허용하지 않는다. 이 경우 작업이 GPU에서 코어 및 메모리 등 자원이 집중적으로 필요하지 않다면 GPU 노드의 리소스 사용률이 저하될 수 있다. GPU 가상화는 응용의 동시 수행을 가능하게 하며 자원을 공유할 수 있는 기회를 제공한다. 하지만 응용의 동시 수행 성능은 동시 수행되는 응용의 특성과 노드 안에서 자원 경쟁으로 인한 간섭에 따라 달라질 수 있다. 본 논문은 컨테이너 오케스트레이션 플랫폼인 쿠버네티스(Kubernetes)를 기반으로 다중 서버 생성 및 실행을 통하여 GPU를 공유함으로써 발생할 수 있는 간섭을 측정하기 위한 프레임워크를 제안한다. 본 프레임워크를 통해 다양한 스케줄링 방법으로 GPU에서 여러 작업을 실행함으로써 이에 따른 성능 변화를 조사하였으며, 이를 통해 GPU 메모리 사용량 및 컴퓨팅 리소스만 고려해서는 최적의 스케줄링을 할 수 없음을 보인다. 마지막으로 해당 프레임워크를 사용하여 응용들의 동시 실행에 따라 발생한 간섭을 측정한다.

UbiFOS: A Small Real-Time Operating System for Embedded Systems

  • Ahn, Hee-Joong;Cho, Moon-Haeng;Jung, Myoung-Jo;Kim, Yong-Hee;Kim, Joo-Man;Lee, Cheol-Hoon
    • ETRI Journal
    • /
    • 제29권3호
    • /
    • pp.259-269
    • /
    • 2007
  • The ubiquitous flexible operating system (UbiFOS) is a real-time operating system designed for cost-conscious, low-power, small to medium-sized embedded systems such as cellular phones, MP3 players, and wearable computers. It offers efficient real-time operating system services like multi-task scheduling, memory management, inter-task communication and synchronization, and timers while keeping the kernel size to just a few to tens of kilobytes. For flexibility, UbiFOS uses various task scheduling policies such as cyclic time-slice (round-robin), priority-based preemption with round-robin, priority-based preemptive, and bitmap. When there are less than 64 tasks, bitmap scheduling is the best policy. The scheduling overhead is under 9 ${\mu}s$ on the ARM926EJ processor. UbiFOS also provides the flexibility for user to select from several inter-task communication techniques according to their applications. We ported UbiFOS on the ARM9-based DVD player (20 kB), the Calm16-based MP3 player (under 7 kB), and the ATmega128-based ubiquitous sensor node (under 6 kB). Also, we adopted the dynamic power management (DPM) scheme. Comparative experimental results show that UbiFOS could save energy up to 30% using DPM.

  • PDF

콤바인 원격 모니터링을 위한 게이트웨이 설계 및 개발 (Design and Implementation of the Gateway for Remote Monitoring a Combine)

  • 문용균;송유환;신기영;이상식;최창현;문정환
    • Journal of Biosystems Engineering
    • /
    • 제32권3호
    • /
    • pp.197-205
    • /
    • 2007
  • The objective of this study was to design and implement a gateway for remote monitoring a combine. Many researchers have designed and implemented trouble-shooting system of agricultural machine. but the system didn't have network system or used wired network system. But monitoring machine have been operated in the out of door. In such an environment, each machine have to be operated under on a guarantee of mobility and stability. Thus, we have developed a gateway with an embedded system including the XScale PXA255 processor and wireless network device. We have also built an embedded Linux kernel and several devices. We developed an embedded application for monitoring a combine and this application is also capable of receiving signals from other clients and sending them to a server via Wireless LAN. Finally, results of performance evaluation which measured CPU share and memory sizes have shown that it is possible to provide monitoring service stably.