• 제목/요약/키워드: Many-core architecture

검색결과 136건 처리시간 0.022초

최적화된 CUDA 소프트웨어 제작을 위한 프로그래밍 기법 분석 (Analysis of Programming Techniques for Creating Optimized CUDA Software)

  • 김성수;김동헌;우상규;임인성
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권7호
    • /
    • pp.775-787
    • /
    • 2010
  • GPU(Graphics Processing Unit)는 범용 CPU와는 달리 다수코어 스트리밍 프로세서(manycore streaming processor) 형태로 특화되어 발전되어 왔으며, 최근 뛰어난 병렬 처리 연산 능력으로 인하여 점차 많은 영역에서 CPU의 역할을 대체하고 있다. 이러한 추세에 따라 최근 NVIDIA 사에서는 GPGPU(General Purpose GPU) 아키텍처인 CUDA(Compute Unified Device Architecture)를 발표하여 보다 유연한 GPU 프로그래밍 환경을 제공하고 있다. 일반적으로 CUDA API를 사용한 프로그래밍 작업시 GPU의 계산구조에 관한 여러 가지 요소들에 대한 특성을 정확히 파악해야 효율적인 병렬 소프트웨어를 개발할 수 있다. 본 논문에서는 다양한 실험과 시행착오를 통하여 획득한 CUDA 프로그래밍에 관한 최적화 기법에 대하여 설명하고, 그러한 방법들이 프로그램 수행의 효율에 어떠한 영향을 미치는지 알아본다. 특히 특정 예제 문제에 대하여 효과적인 계층 구조 메모리의 접근과 코어 활성화 비율(occupancy), 지연 감춤(latency hiding) 등과 같이 성능에 영향을 미치는 몇 가지 규칙을 실험을 통해 분석해봄으로써, 향후 CUDA를 기반으로 하는 효과적인 병렬 프로그래밍에 유용하게 활용할 수 있는 구체적인 방안을 제시한다.

정신분석학에 의한 루이스 칸의 건축철학과 카발라와의 비교 연구 (A Comparative Study on Louis L Kahn's Architectural Philosophy and Kabbalah based on Psychoanalysis)

  • 최효식
    • 건축역사연구
    • /
    • 제18권2호
    • /
    • pp.85-105
    • /
    • 2009
  • This study set out to compare and analyze the influences Kabbalah, which was Louis I. Kahn's faith as a Jew, on his architecture based on Freud's psychoanalysis that had many exchanges with modernism and contemporary architecture and theories. The specific goals of the study were to shed light to Kahn's presence in contemporary architecture anew and establish the methodology of using psychoanalysis in building new theories of architectural planning. When the theories of psychoanalysis were introduced for comparison and analysis purposes, Kahn tried to differentiate his buildings by placing a function or symbolic central space at the heart of a building even though he did adopt a characteristic of modernism architecture, which was placing a core at the centre of plan, for a while. Such a tendency of his was based on Jung's opinions rather than Freud's and affected by Ecole des Beaux-Art. The analysis results also indicate that he conceived "Served Space & Servant Space," "architecture of connection" and "silence and light" that made up the essence of his architectural theory from the relationships between Ayin-Sof, Kabbalah's absolute god, and Sefiroth. It's also very likely that his often use of triangles and circles in his architecture was affected by the Tree of Sefiroth diagram of Kabbalah. His tendency is well reflected in Salk Institute and Philips Exeter Academy Library, where he placed a laboratory or courtyard at the center where a core was supposed to be, created a corridor or courtyard space between those central spaces and the core, and connected them one another with to perceive the being of Ayin-Sof into an architectural space, which is well proven with Mikveh Israel Synagogue where he directly applied the Tree of Sefiroth diagram. The synagogue also contained a hollow column that served as an important concept in his late architecture. The hollow column was also the result of him applying the concept of Sefiroth of the place where Ayin-Sof Was reduced in Kabbalah.

  • PDF

중심코어를 가지는 저층 철근콘크리트 필로티 건물의 내진성능 (Seismic Performance of Low-rise Piloti RC Buildings with Concentric Core)

  • 윤태호
    • 한국산업융합학회 논문집
    • /
    • 제25권4_2호
    • /
    • pp.611-619
    • /
    • 2022
  • In this study, the seismic performance of low - rise piloti buildings with concentric core (shear wall) position is analysed and reviewed based on KDS 41. The prototype is selected among the constructed low - rise piloti buildings with concentric core designed based on KBC 2005 which was used for many low - rise piloti buildings construction. The seismic performance of the building shows plastic behavior in X-direction and elastic behavior in Y-direction. The inter-story drift is lager than that of concentric core case and is under the maximum allowed drift ratio. The displacement ratio of first story is much lager the that of upper stories, and the frame structure in the first story is evaluated as vulnerable to lateral force. Therefore, low - rise piloti buildings with concentric core need the diminishment of lateral displacement and reinforcement of lateral resistance capacity in seismic design and seismic retrofit.

GCN 아키텍쳐 상에서의 OpenCL을 이용한 GPGPU 성능향상 기법 연구 (A Study on GPGPU Performance Improvement Technique on GCN Architecture Using OpenCL API)

  • 우동희;김윤호
    • 한국전자거래학회지
    • /
    • 제23권1호
    • /
    • pp.37-45
    • /
    • 2018
  • 현재 프로그램이 운용되는 시스템은 기존의 싱글코어 및 멀티코어 환경을 넘어서 매니코어, 부가 프로세스 및 이기종 환경까지 그 영역이 확장되고 있는 중이다. 하지만, 기존 연구의 경우 NVIDIA 벤더에서 나온 아키텍쳐 및 CUDA로의 병렬화가 주로 이루어졌고 AMD에서 나온 범용 GPU 아키텍쳐인 GCN 아키텍쳐에 대한 성능향상에 관한 연구는 제한적으로 이루어졌다. 이런 점을 고려해 본 논문에서는 GCN 아키텍쳐의 GPGPU 환경인 OpenCL 내에서의 성능향상 기법에 대해 연구하고 실질적인 성능향상을 보였다. 구체적으로, 행렬 곱셈과 컨볼루션을 적용한 GPGPU 프로그램을 본 논문에서 제시한 성능향상 기법을 통해 최대 30% 이상의 실행시간을 감소시켰으며, 커널 이용률 또한 40% 이상 높였다.

광주도심지역의 지속가능한 개발을 위한 공공건축 설계프로젝트 (Design Proposals of Public Architecture for Sustainable Development in Kwangju Old City)

  • 손승광
    • 한국주거학회:학술대회논문집
    • /
    • 한국주거학회 2002년도 추계학술발표대회
    • /
    • pp.79-84
    • /
    • 2002
  • Many people think, in common that An expansion toward outer city is a development, and it can be a general trends in a new development in a growing city. But We can see many case which moving of a public building are considerate as a core element to promote the new development towards outer city, and that is a negative element of slum in central area and community making. There are many aspects to pursue sustainable urban structure of in a city, and public building is a very important element to manage deteriorate central area from social slum in a old town. In this presentation, three project, Local Authority office of Chonnam province, Kwangju Station, and Hyper Urbanity, and it shows sustainable concept of the public building as a core in a city development. The effect of the projects are expected sustainable development and community in terms of social, cultural and historical aspects.

  • PDF

Electrospray technique for preparation of core-shell materials : A mini-review

  • Tran, Vinh Van;Lee, Young-Chul
    • 한국입자에어로졸학회지
    • /
    • 제14권3호
    • /
    • pp.49-63
    • /
    • 2018
  • During the last decade, electrospray (ES) techniques have been used as potential methods for preparing of core-shell materials. Depending on the architecture of nozzle and design of devices, the ES techniques includes monoaxial, coaxial, multiple coaxial nozzle ES and microfluidic ES devices. ES operates based on a basic principle, in which a spray of monodisperse droplets is formed by dispensing an electrically conductive liquid through a capillary charged to a sufficiently high potential. In review of many recent research papers, we take a closer look at ES techniques and their applications for fabrication of core-shell materials. Several advantages of ES technique compared with other methods were emphasized and it may be regarded as a potential tool for fabrication of core-shell materials current and near future.

Research on prefabricated concrete beam-column joint with high strength bolt-end plate

  • Shufeng, Li;Di, Zhao;Qingning, Li;Huajing, Zhao;Jiaolei, Zhang;Dawei, Yuan
    • Structural Engineering and Mechanics
    • /
    • 제74권3호
    • /
    • pp.395-406
    • /
    • 2020
  • Many prefabricated concrete frame joints have been proposed, and most of them showed good seismic performance. However, there are still some limitations in the proposed fabricated joints. For example, for prefabricated prestressed concrete joints, prefabricated beams and prefabricated columns are assembled as a whole by the pre-stressed steel bar and steel strand in the beams, which brings some troubles to the construction, and the reinforcement in the core area of the joints is complex, and the mechanical mechanism is not clear. Based on the current research results, a new type of fabricated joint of prestressed concrete beams and confined concrete columns is proposed. To study the seismic performance of the joint, the quasi-static test is carried out. The test results show that the nodes exhibit good ductility and energy dissipation. According to the experimental fitting method and the "fixed point pointing" law, the resilience model of this kind of nodes is established, and compared with the experimental results, the two agree well, which can provides a certain reference for elasto-plastic seismic response analysis of this type of structure. Besides, based on the analysis of the factors affecting the shear capacity of the node core area, the formula of shear capacity of the core area of the node is proposed, and the theoretical values of the formula are consistent with the experimental value.

ARMv7 Thumb Architecture 취약성 분석 (Vulnerability analysis on the ARMv7 Thumb Architecture)

  • 김시완;성기택
    • 한국정보통신학회논문지
    • /
    • 제21권5호
    • /
    • pp.1003-1008
    • /
    • 2017
  • 최근 몇 년간 사물인터넷은 중요한 연구적 관심을 끌어왔다. 새로운 IoT 기술이 널리 이용되기 위해서는 정보의 신뢰성과 보호가 전적으로 요구된다. IoT 시스템은 그 특성상 직접적인 접근이 쉬우므로 이로 인한 물리적인 보안에 매우 취약하다. SoC 기술의 발달과 함께 운영체제에 대한 기술도 많이 이루어졌으며 많은 새로운 운영체제가 소개되고 있다. 본 연구에서는 ARMv7 Thumb Architecture 하드웨어 플랫폼에서 동작하는 운영체제에 대한 취약성분석 결과에 대하여 기술하였다. 최근에 소개된 "Windows 10 IoT Core" 운영체제에 대하여, 연구를 통하여 개발된 침투코드를 특정 IoT 시스템에 이식시켜 Zero-Day Attack을 구현하였다. 결과의 침투코드에 대한 바이러스 검출 여부를 "virustotal" 사이트에 의뢰하여 유효성을 입증하였다.

휴대용 초음파 영상처리를 위한 멀티미디어 확장 명령어 및 최적의 매니코어 프로세서 구조 탐색 (Multimedia Extension Instructions and Optimal Many-core Processor Architecture Exploration for Portable Ultrasonic Image Processing)

  • 강성모;김종면
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권8호
    • /
    • pp.1-10
    • /
    • 2012
  • 본 논문에서는 휴대용 초음파 영상의 고성능 및 저전력 처리를 위해 멀티미디어 전용 명령어를 내장한 매니코어의 디자인 공간 탐색 방법론을 제안한다. 이를 위해서 멀티미디어 확장 명령어로 인한 서브워드 병렬처리 방식을 적용한 프로그램과 적용하지 않은 프로그램의 성능을 비교하여 에너지 효율 및 면적효율을 측정하였다. 모의실험 결과, MMX 형태 명령어를 사용한 프로그램은 베이스라인 프로그램 보다 $256{\times}256$ 해상도에서 실행시간은 평균 3.16배, 에너지 효율은 평균 8.13배, 면적 효율은 평균 3.16배의 향상을 보였다. $240{\times}320$ 해상도와 $240{\times}400$ 해상도에서는 각각 실행시간 평균 2.16배, 2.25배, 에너지 효율은 4.04배 4.34배, 면적 효율은 2.16배, 2.25배 향상되었다. 더불어 이러한 MMX 형태 명령어를 포함한 매니코어의 프로세싱 엘리먼트 (Processing Element: PE) 개수 및 메모리 사이즈를 변화시키면서 각 초음파 영상의 해상도별로 최적의 시스템 면적 및 에너지 효율을 보이는 PE 구조를 탐색하였다.

고속의 클러스터 추정을 위한 매니코어 프로세서의 디자인 공간 탐색 (Design Space Exploration of Many-Core Processor for High-Speed Cluster Estimation)

  • 서준상;김철홍;김종면
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권10호
    • /
    • pp.1-12
    • /
    • 2014
  • 본 논문에서는 단일 명령어, 다중 데이터 처리 기반의 매니코어 프로세서를 이용하여 높은 계산량이 요구되는 차감 클러스터링 알고리즘을 병렬 구현하고 성능을 향상시킨다. 또한 차감 클러스터링 알고리즘을 위한 최적의 매니코어 프로서서 구조를 선택하기 위해 다섯 가지의 프로세싱 엘리먼트 (processing element, PE) 구조 (PEs=16, 64, 256, 1,024, 4,096)를 모델링하고, 각 PE구조에 대해 실행시간 및 에너지 효율을 측정한다. 두 가지 의료 영상 및 각 영상의 세 가지 해상도(($128{\times}128$, $256{\times}256$, $512{\times}512$)를 이용하여 모의 실험한 결과, 모든 경우에 대해 PEs=4,096구조에서 최고의 성능 및 에너지 효율을 보였다.