DOI QR코드

DOI QR Code

도로 주행환경 분석을 위한 빅데이터 플랫폼 구축 정보기술 인프라 개발

Development of Information Technology Infrastructures through Construction of Big Data Platform for Road Driving Environment Analysis

  • 정인택 (한국건설기술연구원 ICT융합연구소) ;
  • 정규수 (한국건설기술연구원 ICT융합연구소)
  • Jung, In-taek (ICT Convergence and Integration Research Institute, Korea Institute of Civil Engineering and Building Technology) ;
  • Chong, Kyu-soo (ICT Convergence and Integration Research Institute, Korea Institute of Civil Engineering and Building Technology)
  • 투고 : 2018.01.05
  • 심사 : 2018.03.09
  • 발행 : 2018.03.31

초록

본 연구는 차량센싱데이터, 공공데이터 등 다종의 빅데이터를 활용하여 주행환경 분석 플랫폼 구축을 위한 정보기술 인프라를 개발하였다. 정보기술 인프라는 H/W 기술과 S/W 기술로 구분할 수 있다. 먼저, H/W 기술은 빅데이터 분산 처리를 위한 병렬처리 구조의 소형 플랫폼 서버를 개발하였다. 해당 서버는 1대의 마스터 노드와 9대의 슬래이브 노드로 구성하였으며, H/W 결함에 따른 데이터 유실을 막기 위하여 클러스터 기반 H/W 구성으로 설계하였다. 다음으로 S/W 기술은 빅데이터 수집 및 저장, 가공 및 분석, 정보시각화를 위한 각각의 프로그램을 개발하였다. 수집 S/W의 경우, 실시간 데이터는 카프카와 플럼으로 비실시간 데이터는 스쿱을 이용하여 수집 인터페이스를 개발하였다. 저장 S/W는 데이터의 활용 용도에 따라 하둡 분산파일시스템과 카산드라 DB로 구분하여 저장하는 인터페이스를 개발하였다. 가공 S/W는 그리드 인덱스 기법을 적용하여 수집데이터의 공간 단위 매칭과 시간간격 보간 및 집계를 위한 프로그램을 개발하였다. 분석 S/W는 개발 알고리즘의 탐재 및 평가, 장래 주행환경 예측모형 개발을 위하여 제플린 노트북 기반의 분석 도구를 개발하였다. 마지막으로 정보시각화 S/W는 다양한 주행환경 정보제공 및 시각화를 위하여 지오서버 기반의 웹 GIS 엔진 프로그램을 개발하였다. 성능평가는 개발서버의 메모리 용량과 코어개수에 따른 연산 테스트를 수행하였으며, 타 기관의 클라우드 컴퓨팅과도 연산성능을 비교하였다. 그 결과, 개발 서버에 대한 최적의 익스큐터 개수, 메모리 용량과 코어 개수를 도출하였으며, 개발 서버는 타 시스템 보다 연산성능이 우수한 것으로 나타났다.

This study developed information technology infrastructures for building a driving environment analysis platform using various big data, such as vehicle sensing data, public data, etc. First, a small platform server with a parallel structure for big data distribution processing was developed with H/W technology. Next, programs for big data collection/storage, processing/analysis, and information visualization were developed with S/W technology. The collection S/W was developed as a collection interface using Kafka, Flume, and Sqoop. The storage S/W was developed to be divided into a Hadoop distributed file system and Cassandra DB according to the utilization of data. Processing S/W was developed for spatial unit matching and time interval interpolation/aggregation of the collected data by applying the grid index method. An analysis S/W was developed as an analytical tool based on the Zeppelin notebook for the application and evaluation of a development algorithm. Finally, Information Visualization S/W was developed as a Web GIS engine program for providing various driving environment information and visualization. As a result of the performance evaluation, the number of executors, the optimal memory capacity, and number of cores for the development server were derived, and the computation performance was superior to that of the other cloud computing.

키워드

참고문헌

  1. J. Gantz, D. Reinsel, THE DIGITAL UNIVERSE IN 2020: Big Data, Bigger Digital Shadows, and Biggest Growth in the Far East, p. 1-3, International Data Corporation Analyze the Future, 2012.
  2. National Information Society Agency, Open Data Portal, Available From: https://www.data.go.kr/.
  3. I. Jung, K. Chong, "Development of Platform for Driving Environment Analysis using Vehicle Sensing and Public Big Data", Transportation Technology and policy, vol. 14, no. 4, pp. 10-19, 2017.
  4. M. Son, Analysis of the domestic/foreign technology development and market outlook of promising industry related to artificial intelligence/big data, pp. 241-271, Knowledge Industry Information Institute, 2016.
  5. J. Lee, "Big Data Technology Trend", Hallym ICT Policy Journal, vol. 2, pp. 14-19, 2015.
  6. J. Kim, "Big data Utilization and related Technique and Technology Analysis", Korea Contents Association Journal, vol. 10, no. 1, pp. 34-40, 2012. DOI: https://doi.org/10.5392/JKCA.2012.12.03.034
  7. K. Shvachko, H. Kuang, S. Radia, R. Chansler, "The Hadoop Distributed File System," Proceedings of the 2010 IEEE 26th Symposium on Mass Storage Systems and Technologies(MSST), pp. 1-10, 2010. DOI: https://doi.org/10.1109/MSST.2010.5496972
  8. A. Lakshman, P. Malik, "Cassandra: a Decentralized Structured Storage System", ACM SIGOPS Operating Systems Review, vol. 44, no. 2, pp. 35-40, 2010. DOI: https://doi.org/10.1145/1773912.1773922
  9. R. Padhy, M. Patra, S. Satapathy, "RDBMS to NoSQL: Reviewing Some Next-Generation Non-Relational Database's", International Journal of Advanced Engineering Science and Technologies, vol. 11, no. 1, pp. 15-30, 2011.
  10. Y. Seo, W. Kim, "Information Visualization Process for Spatial Big Data", Journal of Korea Spatial Information Society, vol. 23, no. 6, pp. 109-116, 2015. DOI: https://doi.org/10.12672/ksis.2015.23.6.109
  11. H. Singh, S. Bawa, "A Survey of Traditional and MapReduce Based Spatial Query Processing Approaches", ACM SIGMOD Record, vol. 46, no. 2, pp. 18-29, 2017. DOI: https://doi.org/10.1145/3137586.3137590
  12. S. Shim, K. Choi, S. Lee, S. Namkoong, "An Expressway Path Travel Time Estimation Using Hi-pass DSRC Off-Line Travel Data", Journal of Korean Society of Transportation, vol. 31, no. 3, pp. 45-54, 2013. DOI: http://doi.org/10.7470/jkst.2013.31.3.045
  13. I. Jung, "AADT Estimation of Unobserved Road Segments Using GPS Vehicle Trip Data", Seoul National University Ph. D thesis, 2016.