• 제목/요약/키워드: Single allocation

검색결과 297건 처리시간 0.034초

Empirical Performance Evaluation of Communication Libraries for Multi-GPU based Distributed Deep Learning in a Container Environment

  • Choi, HyeonSeong;Kim, Youngrang;Lee, Jaehwan;Kim, Yoonhee
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권3호
    • /
    • pp.911-931
    • /
    • 2021
  • Recently, most cloud services use Docker container environment to provide their services. However, there are no researches to evaluate the performance of communication libraries for multi-GPU based distributed deep learning in a Docker container environment. In this paper, we propose an efficient communication architecture for multi-GPU based deep learning in a Docker container environment by evaluating the performances of various communication libraries. We compare the performances of the parameter server architecture and the All-reduce architecture, which are typical distributed deep learning architectures. Further, we analyze the performances of two separate multi-GPU resource allocation policies - allocating a single GPU to each Docker container and allocating multiple GPUs to each Docker container. We also experiment with the scalability of collective communication by increasing the number of GPUs from one to four. Through experiments, we compare OpenMPI and MPICH, which are representative open source MPI libraries, and NCCL, which is NVIDIA's collective communication library for the multi-GPU setting. In the parameter server architecture, we show that using CUDA-aware OpenMPI with multi-GPU per Docker container environment reduces communication latency by up to 75%. Also, we show that using NCCL in All-reduce architecture reduces communication latency by up to 93% compared to other libraries.

Development of an Alignment Method for Retarders in isoSTED Microscopy

  • Ilkyu Park;Dong-Ryoung Lee
    • Current Optics and Photonics
    • /
    • 제8권4호
    • /
    • pp.421-426
    • /
    • 2024
  • The use of stimulated emission depletion (STED) microscopy has significantly improved resolution beyond the limits imposed by diffraction; Furthermore, STED microscopy adopts a 4Pi-geometry to achieve an isotropic improvement in resolution. In isoSTED microscopy, a polarizing beam splitter and retarders are used in a 4Pi cavity to split beams of identical power, generating constructive and destructive interference for lateral and axial resolution improvements, respectively. The precise alignment of the retarders is crucial for optimizing the performance of isoSTED microscopy, because this orientation affects the quality of the depletion focus, necessitating zero intensity at the center. Incomplete destructive interference can lead to unwanted fluorescence inhibition, resulting in degraded resolution and contrast. However, measuring the intensity and polarization state in each optical path of the 4Pi cavity is complex and requires additional devices such as a power meter. Here, we propose a simple and accurate alignment method for the 4Pi cavity in isoSTED microscopy. Our approach demonstrates the equal allocation of power between upper and lower beam paths and achieves complete destructive interference using a polarizing beam displacer and a single CCD camera positioned outside the 4Pi cavity.

농촌지역 보건지료원의 업무활동 분석 (A Survey on Activities of Community Health Practitioners in Rural Area)

  • 강복수
    • Journal of Yeungnam Medical Science
    • /
    • 제4권2호
    • /
    • pp.139-148
    • /
    • 1987
  • 농촌의 일차보건의료사업의 중심적인 역할을 수행하고 있는 보건진료원의 업무활동을 분석함으로 활동내용의 개선방향과 그들의 관리에 필요한 자료를 제공하기 위하여 경상북도내의 26명의 보건진료원을 대상으로 1987년 11월 16일부터 12월 5일사이의 통상적인 활동기간을 택하여 월요일에서 토요일까지 6일간 출근에서 퇴근까지의 활동상황을 자가기록방법(work diary method)에 의해 조사한 성적을 요약하면 다음과 같다. 주당 평균 활동시간은 2,918분이었다. 연령과 보건진료원 경력이 많을수록 더 많은 시간을 활동하는 것으로 나타났고 미혼자보다는 기혼자가 더 많은 시간을 활동하였다. 총 활동시간 중 보건진료소내 근무가 79.8%였고 보건진료소외가 20.2%를 차지하였다. 보건진료소외 근무에 있어서 연령과 경력이 적을수록 그리고 미혼자가 기혼자보다 더 많이 활동한 것으로 나타났다. 활동영역별 시간 배분은 기술업무수행이 46.3%로 제일 많았고 행정업무는 18.7%를 차지하였다. 기술 업무에 있어 미혼자가 기혼자보다 연령과 경력이 적을수록 더 많이 활동하였다. slack time은 연령과 경력이 많을수록 그리고 기혼자가 미혼자보다 더 길었다. 기술업무는 보건진료소내 근무중 45.3%를 차지하였고 보건진료소외 근무중 50.2%를 차지하였다. 기타업무에 소요된 시간과 slack time은 보건진료소내 근무에서보다 보건진료소외 근무에서 현저히 적었다. 기술업무 중 환자치료활동은 63.1%이었고, 기타 서비스는 36.9%을 차지하였다. 기혼자가 미혼자보다 그리고 경력이 많을수록 환자치료활동에 소비한 시간이 많았고 지역사회 주민의 건강증진을 위한 공중보건활동에 소비한 시간이 적었다. 행정업무 중 각종 기록 및 대장정리에 61.6%를 소비하였고 마을건강원회의에 소비된 시간은 4.2%에 불과하였다. 마을건강원회의에 소요된 시간은 연령과 경력이 많을수록 기혼자가 미혼자보다 더 많았다. 총 근무시간을 활동내용별로 분석하면 환자치료활동이 29.2%로 제일 많았고, 기타활동, 각종기록 및 대장정리의 순이었다. 보건진료소내 활동은 환자치료활동이 33.9%, 공중보건활동이 11.4% 이었고, 보건진료소외 활동은 각각 10.9% 및 39.1%이었다. 보건진료원의 직무영역별 활동상황을 분석하면 통상질환관리에 소요된 시간이 49.7%로 제일 많았고 지역사회접근은 2.4%로 제일 적었다. 이상을 종합하면 보건진료원은 보건진료소내에서 주로 활동하며 예방보건활동보다는 진료활동에 더 치중하고 있다. 농촌의 일차보건의료사업의 정착을 위해서는 보건진료원 보수교육을 통하여 그리고 도, 군단위의 기술지도체계의 확립과 운영으로 건강증진업무의 강화와 지역사회개발사업에 관련된 활동에 적극 참여토록 유도해야겠다고 생각한다.

  • PDF

멀티모드 멀티태스크 임베디드 어플리케이션을 위한 HW/SW 분할 기법 (HW/SW Partitioning Techniques for Multi-Mode Multi-Task Embedded Applications)

  • 김영준;김태환
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제34권8호
    • /
    • pp.337-347
    • /
    • 2007
  • 시스템의 기능을 바꾸어 가면서 여러 개의 어플리케이션을 작동시키는 임베디드 시스템을 멀티모드(multi-mode) 임베디드 시스템이라 부른다. 더 나아가서 하나의 모드가 여러 개의 태스크로 구성된 임베디드 시스템을 멀티모드 멀티태스크(multi-task) 임베디드 시스템이라 부른다. 본 논문에서는 시간제한 조건을 가지고 있는 멀티모드 멀티태스크 임베디드 어플리케이션을 대상으로 하는 HW/SW 분할 방법에 대한 연구이다. 시간제한 조건을 만족하는 스케줄과 함께 태스크의 기능모듈(functional module)을 동작시킬 효율적인 처리 자원(processing resource)을 할당/매핑하여 시스템의 비용(가격)을 최대한 낮추는 것이 목적이다. 이 문제를 잘 풀기 위해 중요한 것은 모듈사이의 병렬성을 최대한 이용하여 실행시키는 것이다. 그러나 이전의 HW/SW 분할 방법은 모듈의 병렬 실행 가능성을 최대한 이용하지 않았는데, 병렬성 이용을 위한 탐색 계산이 복잡할 뿐 아니라 스케줄 가능성(schedulability) 검사를 단순하게 하려고 하였기 때문이다. 기존 방법의 한계를 극복하기 위해서 우리는 다음의 세 개의 세부문제를 동시에 고려하는 HW/SW 분할 기법을 제안한다: (1) 처리 자원의 할당 (2) 태스크 모듈에 대한 처리 자원 매핑 (3) 모듈실행 스케줄의 결정. 특별히 모듈의 병렬 실행과 실행 가능성을 간결하게 측정하는데 바탕을 둔 단순모드(single-mode) 멀티태스크 어플리케이션에 대한 반복 개선 방식을 갖는 분할 기법을 만들었다. 다시 이 기법을 확장하여 멀티모드 멀티태스크 어플리케이션의 분할 기법을 만들었다. 실제 사용되는 어플리케이션을 대상으로 한 실험에서 제안된 우리의 기법이 기존의 방법에 비해서 단순모드와 멀티모드 멀티태스크 어플리케이션에 대해서 각각 17.0%와 19.0%의 가격을 낮추는 것이 확인되었다.기존의 단량체인 Bis-GMA의 대체재로 고려될 수 있다. 혈중 cholestrol의 증가는 비만, 동맥경화, 고혈압 등의 심혈관 질환과 당뇨병 지방 대사 장해 등을 일으킨다. 함량의 경우 정상군에 비해 대조군은 1.74배 증가하였다. 그에 비해 RCM 투여군의 경우 대조군에 비해 57.4%의 예방효과를 측정할 수 있었다. HDL-콜레스테롤은 항 동맥경화의 지표로서 콜레스테롤을 말초혈관에서 간으로 수송하여 동맥경화를 진행시키지 않는 방향으로 콜레스테롤을 운반하여 지질대사 장해에 대한 방어 작용을 지니고 있다고 볼 수 있다. 정상군에 비해 대조군은 2.62배 감소하였다. 그에 비해 RCM 투여군은 대조군보다 81.6% 증대되는 효과를 볼 수 있었다. 과산화 지질 (Malondialdehyde)의 경우 지질조직의 손상정도를 나타내는 중요한 효소로 인정되고 있으며, 조직의 손상, 발암, 염증, 성인병 및 노화 등과 같은 여러 가지 유해 작용을 일으킨다. 정상군에 비해 대조군은 1.74배 수치가 증가되었으며, RCM투여군의 대조군과 비교 시 57.4% 감소되는 효과를 볼 수 있었다. 본 연구는 LPS로부터 유도된 산화적 스트레스에 대한 복분자의 선투여 후 예방효과를 알아보았다. 생약재의 일종인 복분자의 경우 LPS로 유도된 산화적 스트레스 억제 및 지질대사로부터의 개선 효과가 있는 것으로 판단되며 지질과산화에 대해서 강한 억제 활성을 나타내는 것을 알 수 있었다. 이러한 결과로 복분자는 생활 습관병의 예방과 개선에 유효한 것으로 사료되었으며, 지질대사와 과산화지표의 검증을 통해 기능성 식품소재로 활용될 수 있음을 보여주었다.로서 역시 CTV 치료계획에서 적게 조사되었다(p=0.005). 기존의 ICRU 치료계획은 잔류종양의 크기가 작은 경우 불필요하게 정상조직에 많은 선량이 투여되기 때문에 CT를 이용한 CTV 치료계획을 적용하여 정상조직에 대한 피폭을

임베디드 멀티미디어 재생기에서 속도기반 미리읽기를 이용한 사용자기능 지원 파일시스템 (A File System for User Special Functions using Speed-based Prefetch in Embedded Multimedia Systems)

  • 최태영;윤현주
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권7호
    • /
    • pp.625-635
    • /
    • 2008
  • 휴대용 멀티미디어 재생기는 기존의 멀티미디어 파일 서버와는 다른 성질들을 가지고 있다. 개인 사용자 전용, 비교적 낮은 하드웨어 성능, 사용자 기능으로 인한 순간적인 높은 부하, 그리고 짧은 개발주기 등이 이러한 성질들이다. 다양한 멀티미디어 파일 시스템은 여러 사용자의 요구는 처리하기에는 적합하지만 단일 사용자의 특수 기능을 지원하기에는 적합하지 않다. 팁과 같은 추가 정의를 응용프로그램과 과일시스템이 주고받는 방식들도 제안되었지만 프로그램의 개발주기를 증가시킬 수 있다. 본 논문에서는 파일블록배치, 버퍼-캐시, 그리고 미리 읽기를 사용하여 휴대용 재생기에서 사용자 기능을 효과적으로 지원하는 파일 시스템을 디자인하고 그 성능을 평가하였다. 힌트를 사용하는 기존의 미리읽기들과는 달리 제안된 미리읽기인 SPRA (Speed-based PRefetch Algorithm)는 힌트를 사용하지 않고 입출력 요구의 패턴을 통해서 미리 읽을 블록을 예측한다. 이는 응용프로그램이 수정되고 재컴파일 되는 과정을 제거함으로써 프로그램 개발기간을 단축시킨다. 실험결과 SPRA의 평균 반환시간은 리눅스의 추가읽기와 비교해서 $4.29%{\sim}52.63%$이며, 고속 재생 시 리눅스 추가읽기의 $1.01{\sim}3.09$배의 대역폭을 가진다.

이동체 데이터베이스를 위한 디클러스터링 정책 (Declustering Method for Moving Object Database)

  • 서영덕;홍은석;홍봉희
    • 정보처리학회논문지D
    • /
    • 제11D권7호
    • /
    • pp.1399-1408
    • /
    • 2004
  • 이동체 데이터베이스에서 이동체 궤적의 양은 엄청나게 많아서 기존의 단일 디스크 기반에서는 특정 영역의 질의에 대한 빠른 응답과 처리율의 향상을 볼 수 없다. 따라서 고성능 질의 처리를 위한 시스템의 성능 향상을 위해서는 병렬 처리 기법의 도입이 필요하다. 기존의 디클러스터링 방법에서는 시간이 지남에 따라 연속적으로 보고되는 이동체 특성을 고려하지 않고 있다. 그러므로 대용량 이동체 데이터에 대하여 고성능 질의 처리를 위한 새로운 디클러스터링 방법이 필요하다. 이 논문에서는 대용량 이동체 데이테베이스에 대한 고성능 질의 처리를 위한 새로운 디클러스터링 정책을 제시하였다. 이동체 데이터의 MBB(Minimum Bounding Box) 중 공간 좌표에 대한 근접성만을 고려하여 하나의 SD(SemiAllocation Disk)값을 설정하고 그 값과 시간 도메인을 다시 고려하여 근접성을 계산함으로써 디클러스터링을 한다. 또한 디스크 별 부하 균등하를 고려하여 보다 정확한 디클러스터링 효과를 가지도록 하였다. 이와 같이 이동체의 시공간 특성을 고려한 새로운 디클러스터링 정책으로 시스템의 성능을 향상 시킬 수 있다. 성능평가를 통해서 기존의 Round-Robin 방법보다는 $5\%,\;10\$ 영역 질의에서 평균 $15\%$ 정도의 성능향상을 보였으며 Spatial Proximity 방법보다는 평균 $5\%$의 성능향상을 보였다.

이기종 네트워크에서 클러스터 코디네이터 노드 기반의 셀간 간섭 관리 방법 (Cluster Coordinator Node Based Inter-Cell Interference Management Methods in Heterogeneous Networks)

  • 양모찬;오선애;신오순;신요안
    • 한국통신학회논문지
    • /
    • 제38A권3호
    • /
    • pp.277-288
    • /
    • 2013
  • 차세대 이동통신 시스템 규격으로서 3GPP LTE-Advanced (Third Generation Partnership Project Long Term Evolution-Advanced)는 급격하게 증가하는 무선 데이터 트래픽 요구를 해결하기 위해 펨토 셀 혹은 피코 셀과 같은 소형 기지국 및 단말과 단말 사이에 근거리 통신을 수행하는 D2D (Device-to-Device) 통신 방식을 도입하였다. 대형 기지국인 매크로 셀과 소형 기지국인 펨토 셀과 피코 셀 그리고 D2D 통신이 한 개의 셀 내에 혼재하면서 생기는 다양한 간섭 상황이 정리되었으며, 이를 해결하기 위해서 다양한 주제 범위에서 연구가 되었다. 따라서 본 논문에서는 이러한 HetNet (Heterogeneous Network)에서 매크로 셀과 타 기종 네트워크 사이의 간섭을 관리하고 주파수 효율성을 높일 수 있는 간섭회피 방법을 제시한다. 본 논문에서 고려하는 CCN (Cluster Coordinator Node)의 도움을 받는 셀간 간섭회피 방법은 하나의 MeNB (Macro enhanced Node-B)와 다수 소형 셀들이 공존하는 HetNet 환경에서 다수 소형 셀들을 하나의 CCN이 관리하는 구조를 고려한다. HetNet에서 셀간 간섭관리를 위한 구체적인 방법으로 본 논문에서는 CCN 영역 내에 사용자들의 간섭회피를 위한 자원할당 방법을 제안하고, 이들 성능을 시스템 레벨 모의시험을 통해 검증하였다.

집중의 신경해부와 정신생리 (The Neuroanatomy and Psychophysiology of Attention)

  • 이성훈;박윤조
    • 수면정신생리
    • /
    • 제5권2호
    • /
    • pp.119-133
    • /
    • 1998
  • Attentional processes facilitate cognitive and behavioral performance in several ways. Attention serves to reduce the amount of information to receive. Attention enables humans to direct themselves to appropriate aspects of external environmental events and internal operations. Attention facilitates the selection of salient information and the allocation of cognitive processing appropriate to that information. Attention is not a unitary process that can be localized to a single neuroanatomical region. Before the cortical registration of sensory information, activation of important subcortical structures occurs, which is called as an orienting response. Once sensory information reaches the sensory cortex, a large number of perceptual processes occur, which provide various levels of perceptual resolution of the critical features of the stimuli. After this preattentional processing, information is integrated within higher cortical(heteromodal) systems in inferior parietal and temporal lobes. At this stage, the processing characteristics can be modified, and the biases of the system have a direct impact on attentional selection. Information flow has been traced through sensory analysis to a processing stage that enables the new information to be focused and modified in relation to preexisting biases. The limbic and paralimbic system play significant roles in modulating attentional response. It is labeled with affective salience and is integrated according to ongoing pressures from the motivational drive system of the hypothalamus. The salience of information greatly influences the allocation of attention. The frontal lobe operate response selection system with a reciprocal interaction with both the attention system of the parietal lobe and the limbic system. In this attentional process, the search with the spatial field is organized and a sequence of attentional responses is generated. Affective, motivational and appectitive impulses from limbic system and hypothalamus trigger response intention, preparation, planning, initiation and control of frontal lobe on this process. The reticular system, which produces ascending activation, catalyzes the overall system and increases attentional capacity. Also additional energetic pressures are created by the hypothalamus. As psychophysiological measurement, skin conductance, pupil diameter, muscle tension, heart rate, alpha wave of EEG can be used. Event related potentials also provide physiological evidence of attention during information process. NI component appears to be an electrophysiological index of selective attention. P3 response is developed during the attention related to stimulus discrimination, evaluation and response.

  • PDF

TDM 수신 방식의 멀티 대역 OFDM 통신 시스템에서 STO 특성 분석 및 보상 (Analysis and Compensation of STO Effects in the Multi-band OFDM Communication System of TDM Reception Method)

  • 이희규;유흥균
    • 한국통신학회논문지
    • /
    • 제36권5A호
    • /
    • pp.432-440
    • /
    • 2011
  • 4세대 이동통신에서 LTE-Advanced 시스템은 최대 1Gbps의 전송 속도를 구현하기 위해 최대 l00MHz의 넓은 주파수 대역을 필요로 한다. 그러나 현재의 상태에서는 이러한 넓은 대역의 주파수를 얻기가 힘들어 대안으로 여러개의 조각난 대역을 합쳐서 사용하는 Carrier Aggregation기법이 제안되었다. 기본적으로 Carrier Aggregation과 같이 다중 대역을 통해 수신되는 신호는 대역별 여러 개의 수신기를 이용해 각각의 대역별로 병렬 수신 처리하는 Multi-Chain방식이 사용되는데 이는 효과적인 방법이 아니다. 그러므로 본 논문에서는, Time division Multiplexing(TDM)방법을 이용하여 단일 수신기로 수신할 수 있는 방법을 연구한다. TDM 방식은 수신된 여러 대역의 신호를 시간적으로 나누어 수신하고 하나의 DSP를 통해 처리할 수 있는 방식이다. 그런데, 이러한 TDM 방식 기반에서는 Sampling Timing Offset (STO)에 의하여 심각하게 성능 왜곡이 발생하게 된다. 그러므로 본 연구에서는 TDM 방식 기반에서 발생하는 샘플링 타이밍 오프셋의 영향을 분석한다. 그리고 그 분석을 통해 구한 STO 추정 값을 이용하여 보상하는 방법을 제안한다. 마지막으로 시뮬레이션을 통해 BER 성능을 확인하고 제안된 시스템이 OFDM 기반의 시스템에서 다중 대역을 단일 수신기로 수신하는 방법에 적합함을 보인다.

KOINONIA 고속 WPAN의 멀티미디어 전송을 위한 채널 타임 할당 및 CAC 알고리즘 (KOINONIA High-Rate WPAN Channel Time Allocation and CAC Algorithm for Multimedia Transmission)

  • 박종호;이태진;전선도;연규정;원윤재;조진웅
    • 한국통신학회논문지
    • /
    • 제30권5A
    • /
    • pp.417-425
    • /
    • 2005
  • KOINONIA는 고속 무선개인네트워크(Wireless Personal Area Network: WPAN) 기술로 개인 영역에서 고속의 데이터 전송과 멀티미디어 트래픽 전송을 지원하기 위해 개발되었다. 마스터와 슬레이브가 스타 토폴로지 형태로 피코넷을 구성한다. 멀티미디어 트래픽의 QoS를 위해 마스터가 슬레이브의 요청을 받아 채널을 할당해주는 TDMA방식의 매체 접근 방법을 사용하는데, 이때 마스터가 각 할당요청에 대해 스케줄링을 하는 방법이 네크워크 전체의 성능에 크게 영향을 끼치게 된다. 따라서 채널을 효율적으로 사용하고 멀티미디어 트래픽의 QoS를 효과적으로 보장하기 위해서는 효율적인 채널 할당 스케줄링 알고리즘이 필요하다. 본 논문에서는 슈퍼프레임의 길이와 관계없이 일정 간격으로 채널 타임을 할당할 수 있는 스케줄링 및 CAC(Connection Admission Control) 알고리즘을 제안하고 시뮬레이션을 통해 채널 사용과 QoS 측면에서 효과적임을 보였다. 또한 제안한 알고리즘은 기본적인 스케줄링 기법인 WRR(Weighted Round-Robin)에 비해 데이터 특성에 맞게 채널 타임을 할당하므로 채널타임 절약과 더불어 전력소비도 절약할 수 있다.