DOI QR코드

DOI QR Code

Data Preprocessing Technique and Service Operation Architecture for Demand Forecasting of Electric Vehicle Charging Station

전기자동차 충전소 수요 예측 데이터 전처리 기법 및 서비스 운영 아키텍처

  • 홍준기 (전북대학교 소프트웨어공학과) ;
  • 김순태 (전북대학교 소프트웨어공학과) ;
  • 김정아 (가톨릭관동대 컴퓨터교육과)
  • Received : 2023.03.13
  • Accepted : 2023.04.07
  • Published : 2023.04.30

Abstract

Globally, the eco-friendly industry is developing due to the climate crisis. Electric vehicles are an eco-friendly industry that is attracting attention as it is expected to reduce carbon emissions by 30~70% or more compared to internal combustion engine vehicles. As electric vehicles become more popular, charging stations have become an important factor for purchasing electric vehicles. Recent research is using artificial intelligence to identify local demand for charging stations and select locations that can maximize economic impact. In this study, in order to contribute to the improvement of the performance of the electric vehicle charging station demand prediction model, nationwide data that can be used in the artificial intelligence model was defined and a pre-processing technique was proposed. In addition, a preprocessor, artificial intelligence model, and service web were implemented for real charging station demand prediction, and the value of data as a location selection factor was verified.

세계적으로 기후 위기로 인해 친환경 산업이 발전하고 있다. 전기자동차는 내연기관 자동차에 비해 탄소 배출량을 30~70% 이상 절감할 수 있을 것으로 전망되어 주목받고 있는 친환경 산업이다. 전기자동차가 대중화됨에 따라 충전소는 전기자동차 구매를 위한 중요한 요소로 자리 잡았다. 최근 연구에서는 지역의 충전소 수요를 파악하고 경제적인 효과를 최대화할 수 있는 위치를 선정하기 위해 인공지능을 활용하고 있다. 본 연구에서는 전기자동차 충전소 수요 예측 모델의 성능향상에 이바지하고자 인공지능 모델에 활용할 수 있는 전국 단위의 데이터를 정의하고 전처리 기법을 제안하였다. 또한 실제 충전소 수요 예측을 위한 전처리기와 인공지능 모델, 서비스 웹을 구현하고 데이터의 입지선정 요인으로의 가치를 검증하였다.

Keywords

Ⅰ. 서론

세계적으로 기후 위기를 해결하기 위해 전기자동차 산업은 빠르게 발전하고 있으며, 다양한 정책적 지원과 제도의 마련으로 대중화되고 있다[1]. 전기자동차의 수요가 증가함에 따라 충전소는 소비자에게 전기자동차 구매의 중요한 요소가 되었다[2]. 더불어 전기자동차 충전소 공급업체도 경제적으로 최대의 이익을 얻을 수 있는 지역을 선정하여 보급하고자 한다. 우리나라에서는 전기자동차 충전소의 수요 예측을 위해 인공지능 방법을 활용한 다양한 연구들이 진행되고 있다. 이병현, 하헌식, 김병식[3]은 환경부와 함께 전국을 대상으로 CILI라는 새로운 지표를 만들어 급속충전소 수요를 예측했다. Mehmet Erbaş et al[4]은 GIS 기반의 Fuzzy를 활용하여 다중 기준 결정 분석으로 최적의 충전소 입지를 선정했다. Caiyun Bian et al[5]은 MILP 방법을 활용하여 투자관점을 반영한 GIS를 기반의 최적 입지 선정 방안을 연구했다.

이와 함께 다양한 분야에서 지리공간 데이터 분석을 위해 GIS[6]를 활용하고 있다. 권태정, 이재령, 박재표[7]는 해양 예측 모델 데이터를 활용하면서 사용자의 편의성을 위해 웹 기반의 GIS를 활용하였다. Wang, S., Zhong, Y., & Wang, E[8]은 시공간 데이터의 종합적인 처리를 위한 GIS 아키텍처를 설계하였다. 충전소 입지선정 도메인에서도 GIS를 통한 분석과 의사결정을 진행하고 있지만, 다양한 업무 관계자들이 GIS를 다루는데 익숙지 않아 어려움을 겪는 문제가 있다. 우리는 이런 문제를 해결하기 위해 입지선정 도메인에 적합한 서비스의 아키텍처를 설계하고 구현하였다.

본 연구에서는 전기자동차 충전소 수요 예측 모델의 성능향상에 이바지하고자 인공지능 모델에 활용할 수 있는 전국 단위의 데이터를 정의하고 전처리 기법을 제안하였다. 또한 실제 충전소 수요 예측을 위한 전처리기와 인공지능 모델, 서비스 웹을 구현하고 데이터의 입지선정 요인으로의 가치를 검증하였다.

Ⅱ. 전처리 및 인공지능 모델

1. 데이터 수집

본 연구에서는 정확한 입지선정과 지속성을 고려하여 4가지의 기준으로 전기자동차 충전소 수요 예측을 위한 데이터를 수집한다. 전국 단위의 지리정보 기반 데이터를 처리하기 위해 기준을 선정한다.

✓ 전국 데이터 존재 여부

✓ 데이터의 표현 범위가 읍면동보다 상세한 단위

✓ 데이터가 공개되어 있어 쉬운 접근 가능 여부

✓ 지리정보를 가지고 있거나 지리 데이터와 병합 가능 여부

표 1은 위 기준을 충족하여 수집한 데이터를 정리한 자료이다. 지점은 점 형태의 지리정보이고, 지역은 선 또는 다각형 형태의 지리정보이다. 기본정보는 자체적으로 지리정보는 없지만, 지점 또는 지역 데이터와 병합할 수 있는 공통된 컬럼을 담은 데이터이다.

표 1. 분류별 수집 데이터 정리표

Table 1. Table of data collection by classification

OTNBBE_2023_v23n2_131_t0001.png 이미지

2. 전기자동차 충전소 수요 예측 데이터 전처리

격자를 기반으로 하여 인공지능에 활용하기 위해 격자 단위 피처(Feature)의 정의와 값이 필요하다. 따라서 점, 선, 면으로 되어 있는 원천 데이터를 격자 형태로 변환한다. 전처리과정은 그림 1과 같이 데이터 로드 및 다듬기, 병합, 지리 데이터 생성 및 좌표계 설정, 선정 대상 지역 반경 집계, 충전소 설치 불가 지역 데이터 생성, 완성 데이터 저장 및 전달의 6단계를 거친다.

OTNBBE_2023_v23n2_131_f0001.png 이미지

그림 1. 전기자동차 충전소 수요 예측 데이터 전처리 과정

Fig. 1. Electric vehicle charging station demand forecast data preprocessing

가. 데이터 로드 및 다듬기

첫 번째 단계에서는 파일로 저장되어 있던 데이터를 메모리상으로 옮기고 바로 데이터 정제 작업을 진행한다. 데이터 정제는 아래의 내용을 진행한다.

■ 결측값 보완: 결측값을 제거 또는 대체

■ 불필요한 행렬 제거: 비어 있거나 사용하지 않는 행렬 제거

■ 컬럼명 통일 및 재설정: 병합을 위한 컬럼명 변경

■ 데이터 일치화: 병합 컬럼 데이터의 표현 일치화

■ 중복 제거: 중복되는 값을 제거하거나 항목의 합계를 내어 중복 최소화

■ Geocoding: 지번 또는 도로명주소는 Map API를 활용해 위·경도 좌표로 변환

나. 병합

수집한 데이터 간 병합을 진행한다. 인공지능 입력 데이터를 생성할 때 격자 지리정보를 기반으로 격자의 중심점으로부터 일정 반경의 데이터를 집계하게 되는데 이를 위해서 반드시 지리 데이터가 필요하다. 하지만 기본정보의 경우 지리정보가 포함되어 있지 않기 때문에 지점 또는 지역 데이터와 같은 컬럼으로 병합하여 사용한다.

다. 지리 데이터 생성 및 좌표계 설정

이번 단계에서는 Excel 또는 CSV 데이터는 표기된 좌푯값을 활용하여 지리 데이터로 만들어주고 모든 데이터를 대상으로 좌표계가 미터법에 적합하도록 좌표계를 통일시킨다.

라. 지리 데이터 생성 및 좌표계 설정

선정 지역은 시, 도 단위의 격자를 활용한다. 예를 들어 경기도의 모든 지역의 격자를 집계 대상으로 한다. 그림 2와 같이 격자 데이터 중심점으로부터 일정 반경 데이터를 집계한다. 가~다 과정으로 준비된 데이터는 격자의 중심점과 거리를 측정하여 집계하는데, 단순하게 데이터의 개수를 세기도 하고, 면적과 인구수, 충전량 같은 값의 합계도 집계한다. MAP API는 POI(Point of Interest) 데이터 조회 결과로 집계된 데이터를 반환하기에 검색 요청을 하여 반환된 합계 값을 사용한다.

OTNBBE_2023_v23n2_131_f0002.png 이미지

그림 2. 격자 중심점의 1km 반경 데이터 집계 예시

Fig. 2. Example of data aggregation of 1km radius of grid center point

격자 데이터는 100m, 250m, 500m, 1000m으로 구분된다. 100m로 갈수록 지역을 세밀하게 나누어 데이터를 활용할 수 있는 장점이 있지만, 데이터의 양이 기하급수적으로 커져 자원 요구사항이 높아진다. 1000m 크기의 격자는 데이터양이 급격히 줄어들지만, 지역이 세밀하게 나눠지지 않는 단점이 있다.

마. 충전소 설치 불가 지역 데이터 생성

전기자동차 충전소 설치는 법과 제도에 의해 제한될 수 있으며, 지목에 따라 설치 가능 여부가 갈린다. 따라서 충전소 수요 지역을 선정할 때 설치 불가능 지역은 제외하기 위해 그림 3과 같이 제외 지역 지리 데이터를 생성한다.

OTNBBE_2023_v23n2_131_f0003.png 이미지

그림 3. 충전소 설치 가능 지역 예시

Fig. 3. Examples of areas where charging stations can be installed

바. 완성 데이터 저장 및 전달

최종적으로 전처리기를 통해 시, 도를 경계로 집계된 격자 지리정보 파일과 충전소 설치 불가 지역을 담고 있는 2개의 파일을 생성하고 Geojson 또는 Shape 파일 형태로 저장한다. 저장된 데이터는 인공지능 모델 학습 데이터로 활용한다.

3. 인공지능 모델 학습 및 예측

인공지능 모델의 경우 10여 개를 학습시킨 후 최고의 결과를 나타내는 모델을 선정하여 예측한다. 인공지능모델로 회기분석을 위한 모델을 사용하고, XGBoost, SVR, Random Forest[9-11] 등등이 있다.

선정된 모델로 격자의 충전량을 예측하고, 해당 결과를 기반으로 하여 MCLP(Maximum Coverage Location Problem)[12] 방법으로 입지를 추천한다. 격자의 개수를 기반으로 하여 입지의 수를 조정하여 순위별 결과를 제공한다.

Ⅲ. 입지선정 결과

본 연구에서는 전기자동차 보급률이 가장 높은 제주도와 전기자동차 등록 대수가 가장 많은 경기도를 대상으로 데이터 검증을 위해 회귀 분석을 적용하여 피처 임포턴스(Feature Importance)를 분석하였다.

1. 제주도 완/급속 충전소 피처 임포턴스

제주도의 완속충전소, 그림 4의 경우 거주민들과 연관성이 높은 곳도 나오지만, 숙박과 같은 관광지가 3번째로 높게 나와 관광객의 영향을 많이 받았을 것으로 판단된다.

OTNBBE_2023_v23n2_131_f0004.png 이미지

그림 4. 제주도 완속충전소 피처 임포턴스

Fig. 4. Jeju Island Slow Charging Station Feature Importance

제주도의 급속충전소, 그림 5에서는 완속충전소와 확연히 다른 결과를 볼 수 있으며, 교통과 관련된 피처들이 많이 반영되는 것을 확인할 수 있다. 특히 관광객의 많은 이동량과 연관되는 것이라 추측된다.

OTNBBE_2023_v23n2_131_f0005.png 이미지

그림 5. 제주도 급속충전소 피처 임포턴스

Fig. 5. Jeju Island Fast Charging Station Feature Importance

최종적으로 완/급속 피처 임포턴스를 보고 제주도의 경우 섬이라는 특성과 관광지라는 특성이 반영된 결과를 볼 수 있다고 판단하였다.

2. 경기도 완/급속 충전소 피처 임포턴스

경기도는 제주도와는 다르게 완속충전소, 그림 6에서 볼 수 있듯이 인구수와 아파트단지가 높아 주거지역의 특징이 나타난다. 내륙지방이며 특히 거주인구가 많고 출퇴근 유동 인구가 많은 지역이라는 점이 반영된 결과라고 분석하였다.

OTNBBE_2023_v23n2_131_f0006.png 이미지

그림 6. 경기도 완속충전소 피처 임포턴스

Fig. 6. Gyeonggido Slow Charging Station Feature Importance

반면에 급속충전소, 그림 7는 도시공원이 압도적으로 높게 나타난다는 특징을 볼 수 있다. 따라서 우리는 경기도의 경우 휴식 공간이 함께 있거나 교통량에 영향을 받는다는 특징이 반영된 결과를 확인할 수 있었다.

OTNBBE_2023_v23n2_131_f0007.png 이미지

그림 7. 경기도 급속충전소 피처 임포턴스

Fig. 7. Gyeonggido Fast Charging Station Feature Importance

3. 제주도와 경기도의 최적 입지

제주도와 경기도의 최적 입지를 선정한 일부를 그림 8-9에서 확인할 수 있다. 오픈소스인 QGIS를 활용하여 데이터를 표현하였으며 빨간 점은 급속충전소, 초록 점은 완속충전소를 의미한다.

OTNBBE_2023_v23n2_131_f0008.png 이미지

그림 8. 제주도 인근 충전소 최적입지 예시

Fig. 8. Example of optimal location for charging stations near Jeju Island

OTNBBE_2023_v23n2_131_f0009.png 이미지

그림 9. 경기도 성남 인근 충전소 최적입지 예시

Fig. 9. Example of optimal location for charging stations near Seongnam, Gyeonggi-do

제주도와 경기도 지역의 완/급속 입지 분포는 다르게 나타나는 것을 확인할 수 있었고, 크게는 거주지역과 도시의 중심지로 구분할 수 있다. 특히 제주도의 경우 관광지 주변은 급속충전소가 많이 분포하고 제주시 인근의 주거지역에는 완속충전소가 많이 분포한다. 반면에 경기도는 확연히 나뉘지는 않지만 약간의 분포 차이가 나고 도시중심지 위주인 것을 확인할 수 있었다.

Ⅳ. 구현

3장의 입지선정 결과를 분석 및 활용하기 위해 지리공간 정보를 다루기 위한 GIS를 활용할 수 있지만, 충전소 공급업체의 경우 다양한 관계자들이 지리공간 데이터를 다루는 데 모두가 익숙하지 않다는 문제가 있다. 웹 형태로 입지선정 도메인에 맞고 손쉽게 사용할 수 있는 GIS 서비스가 필요하여 입시선정을 위한 Web GIS를 구상하고 구현하였다.

1. 요구사항

먼저 아키텍처를 설계하기 위해 우리는 요구사항을 분석하고 설계하였다. 요구사항은 아래의 업무 관계자를 기준으로 하여 작성되었으며, 표 2에 정리되어있다.

표 2. 소프트웨어 요구사항

Table 2. Software Requirements

OTNBBE_2023_v23n2_131_t0002.png 이미지

• 입지선정 담당자: 최적의 충전소 입지선정을 위해 데이터를 분석하고 논의, 실제 위치를 방문하여 설치 가능 여부 확인

• 의사결정자: 입지선정 담당자의 데이터를 기반으로 하여 최종적으로 허가 결정

• 데이터 관리자: 데이터 최신화 및 관리

• 서비스 관리자: 입지선정 서비스 유지관리

2. 아키텍처

요구사항을 기반으로 하여 아키텍처를 분석 및 설계하였으며, 그림 10-12와 같이 SEI[13]의 Module, C&C, Allocation View로 아키텍처를 작성하였다.

OTNBBE_2023_v23n2_131_f0010.png 이미지

그림 10. 입지선정 서비스 모듈 아키텍처

Fig. 10. Location selection service module architecture

OTNBBE_2023_v23n2_131_f0011.png 이미지

그림 11. 입지선정 서비스 C&C 아키텍처

Fig. 11. Location selection service C&C architecture

OTNBBE_2023_v23n2_131_f0012.png 이미지

그림 12. 입지선정 서비스 배포 아키텍처

Fig. 12. Location selection service deployment architecture

모듈 아키텍처에서는 모듈을 구분하고 모듈 간의 처리 흐름을 파악할 수 있다. 사용자는 Web 또는 GIS를 통해 요청할 수 있으며, Web의 GIS를 사용하지 않고 결과를 내려받아 QGIS와 같은 외부 프로그램으로 마이그레이션 가능하도록 설계한다.

C&C 아키텍처에서는 충전소 입지선정 시스템과 GIS, 데이터 수집기 간에 연결을 확인할 수 있으며, 사용하는 원천 데이터가 파일의 형태로 활용되는 것을 확인할 수 있다.

배포 아키텍처에서는 Client/Server 구조로 구성된 것을 확인할 수 있고 QGIS와 같은 외부 프로그램으로 데이터를 마이그레이션하여 사용할 수 있도록 구성한다. 서버에서는 서비스를 제공하는 입지선정 시스템이 동작하고 독립적으로 데이터 수집기가 동작하여 주기적으로 데이터를 업데이트한다.

3. 입지선정 Web GIS 구현

전기자동차 충전소 입지선정을 위한 Web GIS는 그림 13과 같이 구현되었다. 그림 14에서는 SW 구성도를 확인할 수 있는데 파이썬 언어를 사용하고 Flask 프레임워크를 사용하여 Web을 구성하였다. 데이터 처리는 pandas, 인공지능은 scikit-learn을 활용하였다.

OTNBBE_2023_v23n2_131_f0013.png 이미지

그림 13. 전기자동차 충전소 입지선정 서비스 웹페이지

Fig. 13. Electric vehicle charging station location selection service web page

OTNBBE_2023_v23n2_131_f0014.png 이미지

그림 14. 충전소 입지선정 서비스 SW 구성도

Fig. 14. SW configuration diagram of charging station location selection service

해당 Web에서는 지역 선정 후 입지선정 요청을 통해 인공지능을 활용한 최적 입지선정 예측을 처리할 수 있고, 해당 결과를 확인할 수 있는 GIS 화면을 제공한다. 그림 13은 제주도의 결과를 조회한 화면이고 해당 화면에서는 GIS 화면과 함께 연동된 지역의 피처 임포턴스를 초록 그래프로 표현하고, 격자 또는 최적 입지의 원본 데이터를 표의 형태로 확인할 수 있다. 마지막으로 우리는 주간/야간, 평일/주말을 세부적으로 나누어 충전량이 얼마나 예측되는지도 파란 그래프로 표현하였다.

Ⅴ. 결론

본 연구에서는 전국 단위 전기자동차 충전소 수요 예측을 위해 인공지능 모델에 활용할 수 있는 데이터를 정의하고 데이터 전처리 기법을 제안하였다. 인공지능 모델을 활용하여 경기도와 제주도의 완/급속 피처 임포턴스를 비교 분석하였고, 영향을 주는 요인이 달라지는 것을 확인할 수 있었다.

또한 충전소 입지선정을 위한 Web GIS 서비스 아키텍처를 설계하고 구현하였다. 입지선정을 위해 다양한 업무 관계자와 협업이 필요한데 인공지능의 결과를 분석하고 의사결정을 위한 지원을 할 수 있을 것이라 기대한다.

향후 연구로는 전기자동차 충전소 수요 예측에 사용될수 있는 추가적인 데이터를 조사해보고, 방대한 양의 데이터 처리를 분산처리와 같은 아키텍처를 활용하여 효율을 높이는 방법을 연구하고자 한다.

References

  1. Yuntak Lee, & Choong-Han Yoon. "Positive Feedback Network Effects of Electric Vehicles and EV-Charging Stations". Journal of the Korea Academia-Industrial cooperation Society, Vol. 23, No. 8 pp. 483-488, 2022 DOI: 10.5762/KAIS.2022.23.8.483
  2. Jaewan Hwang, Hankyu Lim, and Eunju Park, (2023). "Infrastructure Construction using the Correlation between Electric Vehicle Charging Infrastructure and Electric Vehicle Registratio". Journal of KII, 21(3), 1-9. DOI: 10.14801/jkiit.2023.21.3.1
  3. Lee, BH., Jung, SJ., Sung, JH. et al. Selection of charging sites for electric vehicles in the Republic of Korea based on fuzzy analytic hierarchy process. J. Korean Phys. Soc. 79, 217-229 (2021) DOI: 10.1007/s40042-021-00128-9
  4. Erbas, Mehmet, et al. "Optimal siting of electric vehicle charging stations: A GIS-based fuzzy Multi-Criteria Decision Analysis." Energy 163 (2018): 1017-1031. DOI: 10.1016/j.energy.2018.08.140.
  5. Caiyun Bian, Hailong Li, Fredrik Wallin, Anders Avelin, Lu Lin, Zhixin Yu, Finding the optimal location for public charging stations - a GIS-based MILP approach, Energy Procedia, Vol 158, pp. 6582-6588, 2019, DOI: 10.1016/j.egypro.2019.01.071.
  6. Chang, K. T. (2014). Introduction to geographic information systems. Mc Graw Hill Higher Education. DOI: 10.1002/9781118786352.wbieg0152
  7. Taejung Kwon, Jea-Ryung Lee, Jae Pyo Park, "A Visualization Method for the Ocean Forecast Data using WMS System". The Journal of The Institute of Internet, Broadcasting and Communication, Vol. 18, No. 6, pp. 11-19. 2018. DOI: 10.7236/JIIBC.2018.18.6.11
  8. Wang, S., Zhong, Y., & Wang, E. "An integrated GIS platform architecture for spatiotemporal big data". Future Generation Computer Systems, Volume 94, pp. 160-172. 2019 DOI: 10.1016/j.future.2018.10.034
  9. Chen, Tianqi, and Carlos Guestrin. "Xgboost: A scalable tree boosting system." Proceedings of the 22nd acm sigkdd international conference on knowledge discovery and data mining. 2016. DOI: 10.1145/2939672.2939785
  10. Smola, Alex J., and Bernhard Scholkopf. "A tutorial on support vector regression." Statistics and computing 14.3 (2004): 199-222. DOI: 10.1023/B:STCO.0000035301.49549.88
  11. Biau, Gerard, and Erwan Scornet. "A random forest guided tour." Test 25.2 (2016): 197-227. DOI: 10.1007/s11749-016-0481-7
  12. Megiddo, Nimrod, Eitan Zemel, and S. Louis Hakimi. "The maximum coverage location problem." SIAM Journal on Algebraic Discrete Methods 4.2 (1983): 253-261. DOI: 10.1137/0604028
  13. Bass, Len, Paul Clements, and Rick Kazman. Software architecture in practice. Addison-Wesley Professional, 2003.