• 제목/요약/키워드: Parallel computer architecture

검색결과 233건 처리시간 0.026초

프로세스 결함 검출을 위한 OGSA 기반 그리드 서비스의 설계 및 구현 (A Grid Service based on OGSA for Process Fault Detection)

  • 강윤희
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2004년도 추계 종합학술대회 논문집
    • /
    • pp.314-317
    • /
    • 2004
  • 네트워크 및 소프트웨어 하부구조의 진보에 의해 이형의 컴퓨팅 자원 집합으로 구성된 환경에서 그리드 컴퓨팅 기술은 확산되고 있다. 그리드 컴퓨팅은 광대역으로 연결되어진 분산 컴퓨터들의 조정에 의한 사용을 요구한다. 그리드 컴퓨팅을 위한 다양한 시스템과 그리드 응용 서비스의 증가에 따라 그리드 운영환경은 네트워크 분리 및 노드 결함 등에 의해 높은 결함율을 가질 수 있다. 결함 검출은 그리드 응용 시스템의 강건성을 위해 시스템 설계 및 구현시의 필수적인 요소이다. 본 논문에서는 낮은 네트워크 트래픽 환경에서 높은 신뢰성 정공을 위한 OGSA(Open Grid Service Architecture) 기반의 자원 결함 검출 서비스를 제안한다.

  • PDF

구 집합에 대한 컨벡스헐 근사 (Approximating the Convex Hull for a Set of Spheres)

  • 김병주;김구진;김영준
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제3권1호
    • /
    • pp.1-6
    • /
    • 2014
  • 현재까지 컨벡스헐 (convex hull) 의 계산 알고리즘들은 주로 점 집합 (point set) 에 대해 연구가 수행되어 왔다. 본 논문에서는 이산 공간에서 다양한 반경을 갖는 구 집합에 대한 컨벡스헐을 근사하는 방법을 제시한다. 구 집합에 대한 컨벡스헐 계산은, 특히 단백질 분자의 구조적인 특성을 연구하는 여러 응용분야에서 계산 효율성을 증대시키기 위한 기반 기술이라 할 수 있다. 분자에 대응하는 구의 집합에 대해 복셀 맵 (voxel map) 자료구조를 적용하고 이를 이용하여 컨벡스헐을 계산하는 알고리즘을 제시한다. 제안된 방법은 GPU를 활용한 병렬처리를 수행하여 평균적으로 6,400개 이하의 구가 포함된 집합에 대해 40ms 이내에 컨벡스헐을 계산하는 성능을 보인다.

FPGA-Based Hardware Accelerator for Feature Extraction in Automatic Speech Recognition

  • Choo, Chang;Chang, Young-Uk;Moon, Il-Young
    • Journal of information and communication convergence engineering
    • /
    • 제13권3호
    • /
    • pp.145-151
    • /
    • 2015
  • We describe in this paper a hardware-based improvement scheme of a real-time automatic speech recognition (ASR) system with respect to speed by designing a parallel feature extraction algorithm on a Field-Programmable Gate Array (FPGA). A computationally intensive block in the algorithm is identified implemented in hardware logic on the FPGA. One such block is mel-frequency cepstrum coefficient (MFCC) algorithm used for feature extraction process. We demonstrate that the FPGA platform may perform efficient feature extraction computation in the speech recognition system as compared to the generalpurpose CPU including the ARM processor. The Xilinx Zynq-7000 System on Chip (SoC) platform is used for the MFCC implementation. From this implementation described in this paper, we confirmed that the FPGA platform is approximately 500× faster than a sequential CPU implementation and 60× faster than a sequential ARM implementation. We thus verified that a parallelized and optimized MFCC architecture on the FPGA platform may significantly improve the execution time of an ASR system, compared to the CPU and ARM platforms.

Challenges for Nanoscale MOSFETs and Emerging Nanoelectronics

  • Kim, Yong-Bin
    • Transactions on Electrical and Electronic Materials
    • /
    • 제11권3호
    • /
    • pp.93-105
    • /
    • 2010
  • Complementary metal-oxide-semiconductor (CMOS) technology scaling has been a main key for continuous progress in silicon-based semiconductor industry over the past three decades. However, as the technology scaling enters nanometer regime, CMOS devices are facing many serious problems such as increased leakage currents, difficulty on increase of on-current, large parameter variations, low reliability and yield, increase in manufacturing cost, and etc. To sustain the historical improvements, various innovations in CMOS materials and device structures have been researched and introduced. In parallel with those researches, various new nanoelectronic devices, so called "Beyond CMOS Devices," are actively being investigated and researched to supplement or possibly replace ultimately scaled conventional CMOS devices. While those nanoelectronic devices offer ultra-high density system integration, they are still in a premature stage having many critical issues such as high variations and deteriorated reliability. The practical realization of those promising technologies requires extensive researches from device to system architecture level. In this paper, the current researches and challenges on nanoelectronics are reviewed and critical tasks are summarized from device level to circuit design/CAD domain to better prepare for the forthcoming technologies.

Digitalization of Seafarer's Book for Authentication and e-Navigation

  • Huh, Jun-Ho;Seo, Kyungryong
    • Journal of Information Processing Systems
    • /
    • 제15권1호
    • /
    • pp.217-232
    • /
    • 2019
  • Currently, the crew working on a ship is required to carry a seafarer's book in most countries around the world, including the Republic of Korea (ROK). Yet, many fishermen working in the international waters of the ROK do not abide by this rule as the procedure of obtaining it is rather inconvenient or they do not understand the necessity or the benefits of having it. Also, as the regulation of carrying the certificate has been strengthened, it is important for them to avoid making a criminal record unintentionally. This study discusses the digitalization of the seafarer's book based on several security measures in addition to BLE Beacon-based positioning technology, which can be useful for the e-Navigation. Normally, seamen's certificates are recorded by the captain, medical institution, or issuing authority and then kept in an onboard safe or a certificate cabinet. The material of the certificates is a cloth that can withstand salinity as the certificate could be contaminated by mold. In the past, the captains and their crews were uncooperative when the ROK's maritime police tried to inspect several ships simultaneously because of the time and cost involved. Thus, a system with which the maritime police will be able to conveniently manage the crews is proposed.

Black Ice Detection Platform and Its Evaluation using Jetson Nano Devices based on Convolutional Neural Network (CNN)

  • Sun-Kyoung KANG;Yeonwoo LEE
    • 한국인공지능학회지
    • /
    • 제11권4호
    • /
    • pp.1-8
    • /
    • 2023
  • In this paper, we propose a black ice detection platform framework using Convolutional Neural Networks (CNNs). To overcome black ice problem, we introduce a real-time based early warning platform using CNN-based architecture, and furthermore, in order to enhance the accuracy of black ice detection, we apply a multi-scale dilation convolution feature fusion (MsDC-FF) technique. Then, we establish a specialized experimental platform by using a comprehensive dataset of thermal road black ice images for a training and evaluation purpose. Experimental results of a real-time black ice detection platform show the better performance of our proposed network model compared to conventional image segmentation models. Our proposed platform have achieved real-time segmentation of road black ice areas by deploying a road black ice area segmentation network on the edge device Jetson Nano devices. This approach in parallel using multi-scale dilated convolutions with different dilation rates had faster segmentation speeds due to its smaller model parameters. The proposed MsCD-FF Net(2) model had the fastest segmentation speed at 5.53 frame per second (FPS). Thereby encouraging safe driving for motorists and providing decision support for road surface management in the road traffic monitoring department.

시그내쳐 기반의 네트워크 침입 방지에서 고속의 패킷 필터링을 위한 시스템 구조 (A High-speed Packet Filtering System Architecture in Signature-based Network Intrusion Prevention)

  • 김대영;김선일;이준용
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제34권2호
    • /
    • pp.73-83
    • /
    • 2007
  • 네트워크 침입 방지에서 공격 패킷은 시그내쳐에 기반을 둔 방법에 의해 발견되어 제거된다. 패턴 매칭(Pattem Matching)은 공격 시그내쳐를 발견하기 위해 광범위하게 사용되고 있고, 또한 네트워크 침입방지 시스템에서 시간적으로 가장 많이 수행되는 부분이다. 네트워크 침입방지 시스템에 사용되는 패턴 매칭은 주로 하드웨어를 사용하여 가속화되며 회선 속도로 수행되어야 한다. 그러나 이것만으로는 충분치 않고 다음과 같은 조건들이 더 요구된다. 첫째, 패턴 매칭 하드웨어는 패턴 인덱스 번호와 패턴 발견위치를 포함한 충분한 패턴 매칭 정보를 회선 속도에 맞게 제공해야 한다. 둘째, 불필요한 패턴 매칭을 줄이기 위한 패턴 그룹을 지원할 수 있어야 한다. 셋째, 패턴의 개수가 증가하더라도 최저 성능을 보장 할 수 있어야 한다. 마지막으로, 수행 중단 없이 몇분 또는 몇초 이내에 패턴 업데이트가 가능해야 한다. 본 논문에서는 위의 요구사항을 만족하는 시스템 구조를 제안한다. 이 시스템은 여러 개의 패턴 문자를 동시에 처리하고 파이프라인 구조를 사용하여 고속의 처리를 가능케 한다. Xilinx FPGA 시뮬레이션을 통해 제안된 시스템이 10Gbps 이상의 속도에서 동작하며 위의 모든 요구사항을 만족시킴을 보였다.

패턴인식용 VLSI 펄스형 디지탈 다계층 신경망의 구조및 동작 특성 (A VLSI Pulse-mode Digital Multilayer Neural Network for Pattern Classification : Architecture and Computational Behaviors)

  • 김영철;이귀상
    • 전자공학회논문지B
    • /
    • 제33B권1호
    • /
    • pp.144-152
    • /
    • 1996
  • 대규모 병렬처리가 가능하고 칩당 뉴론 집적도가 높은 펄스형 디지털 다계층 신경망 구조를 제안하였다. 제안된 신경망에서는 대수적인 신경망연산이 의사-랜덤 펄스 시퀀스(pseudo-random pulse sequences)와 단순 디지털 논리 게이트를 이용하여 확률적 프로세스로 대치되었다. 확률적 프로세스의 결과로 나타나는 신경망 연산의 통계적 모델을 제시하였으며 이를 바탕으로 랜덤잡음의 영향과 연산의 정확도를 분석하였다. 이진인식 문제를 적용하여 제안된 신경망의 성능을 평가하고 제시한 통계적 분석결과의 정당성을 검증하였다. Gate 레벨과 register transfer 레벨로 기술된 신경망의 VHDL 모델의 시뮬레이션 결과는 개발된 통계적모델로 예측된 인식추정치와 실제 인식률이 거의 일치함을 보였으며, 또한 숫자인식률에 있어서도 일반 Back-Propagation 신경망의 인식률과 거의 차이가 없음을 보였다.

  • PDF

분산 공유 메모리 시스템에서 메모리 접근지연을 줄이기 위한 이중 슬롯링 구조 (A Dual Slotted Ring Organization for Reducing Memory Access Latency in Distributed Shared Memory System)

  • 민준식;장태무
    • 정보처리학회논문지A
    • /
    • 제8A권4호
    • /
    • pp.419-428
    • /
    • 2001
  • 집적회로 기술의 발달은 처리기의 속도를 계속적으로 증가시켜 왔다. 처리기 응용분야의 주요한 도전은 공유 메모리 다중 처리기 시스템에서 고성능 처리기들을 효과적으로 사용하고자 하는 것이다. 우리는 상호 연결망 문제가 소규모의 공유 메모리 다중처리기 시스템에서 조차 완전히 해결되었다고 생각하지 않는다. 그 이유는 공유버스의 속도는 새로운 강력한 처리기들의 대역폭 요구를 수용할 수 없기 때문이다. 지난 수년간 점대점 단방향 연결은 매우 가능성 있는 상호 연결망 기술로서 대두되었다. 단일 슬롯링은 점대점 상호 연결망의 가장 간단한 형태이다. 단일 슬롯링 구조의 단점은 링에서 처리기의 수가 증가함에 따라 메모리 접근지연 시간이 선형적으로 증가한다는 것이다. 이런 이유로 우리는 캐쉬 기반의 다중처리기 시스템에서 단일 슬롯링을 대체할 수 있는 이중 슬롯링 구조를 제안한다. 또한 본 논문에서 새로운 스누핑 프로토콜을 사용하는 이중 슬롯링 구조를 분석하고 분석적모델과 모의 실험을 통하여 기존의 단일 슬롯링과 성능을 비교한다.

  • PDF

Activity and Safety Recognition using Smart Work Shoes for Construction Worksite

  • Wang, Changwon;Kim, Young;Lee, Seung Hyun;Sung, Nak-Jun;Min, Se Dong;Choi, Min-Hyung
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권2호
    • /
    • pp.654-670
    • /
    • 2020
  • Workers at construction sites are easily exposed to many dangers and accidents involving falls, tripping, and missteps on stairs. However, researches on construction site monitoring system to prevent work-related injuries are still insufficient. The purpose of this study was to develop a wearable textile pressure insole sensor and examine its effectiveness in managing the real-time safety of construction workers. The sensor was designed based on the principles of parallel capacitance measurement using conductive textile and the monitoring system was developed by C# language. Three separate experiments were carried out for performance evaluation of the proposed sensor: (1) varying the distance between two capacitance plates to examine changes in capacitance charges, (2) repeatedly applying 1 N of pressure for 5,000 times to evaluate consistency, and (3) gradually increasing force by 1 N (from 1 N to 46 N) to test the linearity of the sensor value. Five subjects participated in our pilot test, which examined whether ascending and descending the stairs can be distinguished by our sensor and by weka assessment tool using k-NN algorithm. The 10-fold cross-validation method was used for analysis and the results of accuracy in identifying stair ascending and descending were 87.2% and 90.9%, respectively. By applying our sensor, the type of activity, weight-shifting patterns for balance control, and plantar pressure distribution for postural changes of the construction workers can be detected. The results of this study can be the basis for future sensor-based monitoring device development studies and fall prediction researches for construction workers.