DOI QR코드

DOI QR Code

Implementation of AWS-based deep learning platform using streaming server and performance comparison experiment

스트리밍 서버를 이용한 AWS 기반의 딥러닝 플랫폼 구현과 성능 비교 실험

  • Received : 2019.10.07
  • Accepted : 2019.11.01
  • Published : 2019.12.31

Abstract

In this paper, we implemented a deep learning operation structure with less influence of local PC performance. In general, the deep learning model has a large amount of computation and is heavily influenced by the performance of the processing PC. In this paper, we implemented deep learning operation using AWS and streaming server to reduce this limitation. First, deep learning operations were performed on AWS so that deep learning operation would work even if the performance of the local PC decreased. However, with AWS, the output is less real-time relative to the input when computed. Second, we use streaming server to increase the real-time of deep learning model. If the streaming server is not used, the real-time performance is poor because the images must be processed one by one or by stacking the images. We used the YOLO v3 model as a deep learning model for performance comparison experiments, and compared the performance of local PCs with instances of AWS and GTX1080, a high-performance GPU. The simulation results show that the test time per image is 0.023444 seconds when using the p3 instance of AWS, which is similar to the test time per image of 0.027099 seconds on a local PC with the high-performance GPU GTX1080.

본 논문에서는 로컬 PC의 성능이 주는 영향이 적은 딥러닝 동작 구조를 구현하였다. 일반적으로, 딥러닝 모델은 많은 연산량을 가지고 있어 처리하는 PC의 성능에 영향을 많이 받는다. 본 논문에서는 이와 같은 제약 사항을 줄이기 위하여 AWS와 스트리밍 서버를 이용하여 딥러닝 동작을 구현하였다. 첫 번째, AWS에서 딥러닝 연산을 하여 로컬 PC의 성능이 떨어지더라도 딥러닝 동작이 정상적으로 작동할 수 있도록 하였다. 하지만 AWS를 통해 연산 시 입력에 대해 출력의 실시간성이 떨어진다. 두 번째, 스트리밍 서버를 이용하여 딥러닝 모델의 실시간성을 증가시킨다. 스트리밍 서버를 사용하지 않았을 경우 한 이미지씩 처리하거나 이미지를 쌓아서 동영상으로 만들어 처리하여야 하기 때문에 실시간성이 떨어진다. 성능 비교 실험을 위한 딥러닝 모델로는 YOLO v3모델을 사용하였고, AWS의 인스턴스들 및 고성능 GPU인 GTX1080을 탑재한 로컬 PC의 성능을 비교하였다. 시뮬레이션 결과 AWS의 인스턴스인 p3 인스턴스를 사용하였을 때 한 이미지 당 테스트 시간이 0.023444초로써 고성능 GPU인 GTX1080을 탑재한 로컬 PC의 한 이미지 당 테스트 시간인 0.027099초와 유사하다는 결과를 얻었다.

Keywords

References

  1. Junho Na, "The future of AI and employment", 14-17(4 pages), FUTURE HORIZON, 2016.5
  2. Amazon Web Services https://en.wikipedia.org/wiki/Amazon_Web_Services
  3. Amazon EC2 Instance Types http//aws.amazon.com/ec2/instance-types/
  4. Brian Hayes, "Cloud computing" Communication of the ACM, 7, 9-11, 2008 DOI: 10.1145/1364782.1364786
  5. Cloud Computing, https://en.wikipedia.org/wiki/Cloud_computing
  6. Internet protocol suite https://en.wikipedia.org/wiki/Internet_protocol_suite
  7. 3-Way handshake https://en.wikipedia.org/wiki/Handshaking
  8. 4-Wa handshake https://en.wikipedia.org/wiki/IEEE_802.11i-2004#Four-way_handshake
  9. Joseph Redmon, Ali Farhadi, "YOLO v3: An Incremental Improvement.", Apr, 2018, ArXiv:1804.02767v1
  10. Amazon EC2 pricing https://aws.amazon.com/ec2/pricing/

Cited by

  1. 청정환기장치 최적제어를 위한 IoT 기반 실시간 공기질 모니터링 플랫폼 구현 vol.21, pp.6, 2019, https://doi.org/10.7472/jksii.2020.21.6.95