DOI QR코드

DOI QR Code

Hot Place Detection Based on ConvLSTM AutoEncoder Using Foot Traffic Data

유동인구를 활용한 ConvLSTM AutoEncoder 기반 핫플레이스 탐지

  • Ju-Young Lee ;
  • Heon-Jin Park
  • 이주영 (인하대학교 통계학과) ;
  • 박헌진 (인하대학교 통계학과)
  • Received : 2023.11.21
  • Accepted : 2023.12.14
  • Published : 2023.12.31

Abstract

Small business owners are relatively likely to be alienated from various benefits caused by the change to a big data/AI-based society. To support them, we would like to detect a hot place based on the floating population to support small business owners' decision-making in the start-up area. Through various studies, it is known that the population size of the region has an important effect on the sales of small business owners. In this study, inland regions were extracted from the Incheon floating population data from January 2019 to June 2022. the Data is consisted of a grid of 50m intervals, central coordinates and the population for each grid are presented, made image structure through imputation to maintain spatial information. Spatial outliers were removed and imputated using LOF and GAM, and temporal outliers were removed and imputated through LOESS. We used ConvLSTM which can take both temporal and spatial characteristics into account as a predictive model, and used AutoEncoder structure, which performs outliers detection based on reconstruction error to define an area with high MAPE as a hot place.

빅데이터/AI 기반 사회로의 변화에 따른 여러 혜택에서 소상공인은 상대적으로 소외될 가능성이 높다. 이를 지원하기 위해 유동인구를 기반으로 핫플레이스를 정의하여 소상공인의 창업 지역 의사 결정을 지원하고자 한다. 다양한 연구를 통해 해당 지역의 인구 규모가 소상공인의 매출에 중요한 영향을 미친다는 사실이 알려져 있다. 본 연구에서는 인천 유동인구 데이터 중 내륙 지방을 추출하여 연구를 진행하였다. 50m 간격의 격자 형태로 이루어진 데이터로 보간을 통해 일 단위로 이미지화 하였다. LOF와 GAM을 이용하여 공간적 이상치 제거 및 보간을 수행하였고, LOESS를 통해 시간적 이상치를 제거 및 보간하였다. 시간적, 공간적 특성을 모두 고려할 수 있는 ConvLSTM을 예측 모델로 사용하였으며, reconstruction error를 기반으로 이상치 탐지를 수행하는 AutoEncoder 구조를 통해 MAPE가 높은 격자가 밀집해 있는 지역을 핫플레이스로 정의하고자 한다.

Keywords

Acknowledgement

본 연구는 과학기술정보통신부의 재원으로 한국연구재단의 지원을 받아 수행되었습니다.(NRF-2022R1A5A7033499)

References

  1. 이임동, 이찬호, 강상목, "편의점 매출에 영향을 미치는 입지요인에 대한 실증 연구", 부동산학연구 16(4), pp. 53-77, 2010.
  2. 이연수, 박현신, 유승환, 강준모, "캠퍼스 상권 매출액에 영향을 미치는 입지요인 분석", 서울도시연구 15(1), pp. 17-34, 2014.
  3. 허찬, 임희석, "기계 학습 기반 유동인구 예측 모델 설계", 대한 산업공학회 추계학술대회 논문집, pp. 2437-2439, 2018.
  4. 박상윤, 김수현, 허준, "LSTM 기반의 sequence to sequence learning을 이용한 지역 유동 인구수의 예측 모형", 대한공간정보학회 학술대회, pp. 119-121, 2020.
  5. 김성아, 김흥순, "시멘틱 네트워크 분석을 활용한 '핫플레이스' 의미 분석에 관한 연구", 국토지리학회지 55(1), pp. 1-13, 2021.
  6. 김태경, 정천용, 정지이, "핫플레이스의 생성조건 및 쇠퇴⋅이동에 관한 연구", 경기연구원 기본연구, pp. 1-149, 2018.
  7. M. M. Breunig, H.-P. Kriegel, R. T. Ng, and J. Sander, "Lof: identifying density-based local outliers", in Proceedings of the 2000 ACM SIGMOD International Conference on Management of Data, pp. 93-104, 2000.
  8. T. J. Hastie, "Generalized additive models", in Statistical models in S. Routledge, pp. 249-307, 2017.
  9. T. Hastie, R. Tibshirani, J. H. Friedman, and J. H. Friedman, "The elements of statistical learning: data mining, inference, and prediction", Springer, 2, 2009.
  10. D. Tikunov and T. Nishimura, "Traffic prediction for mobile network using holt-winter's exponential smoothing", in 2007 15th international conference on software, telecommunications and computer networks. IEEE, pp. 1-5, 2007.
  11. H. W. Kim, J. H. Lee, Y. H. Choi, Y. U. Chung, and H. Lee, "Dynamic bandwidth provisioning using ARIMA-based traffic forecasting for Mobile WiMAX", Comput. Commun. 34(1), pp. 99-106, 2011.
  12. S. Siami-Namini, N. Tavakoli, and A. S. Namin, "A comparison of ARIMA and LSTM in forecasting time series", in 2018 17th IEEE international conference on machine learning and applications (ICMLA). IEEE, pp. 1394-1401, 2018.
  13. J. Oliver-Muncharaz, "Comparing classic time series models and the lstm recurrent neural network: An application to S&P 500 stocks", Finance, Markets and Valuation 6(2), pp. 137-148, 2020.
  14. S. Hochreiter and J. Schmidhuber, "Long shortterm memory", Neural Computation 9(8), pp. 1735-1780, 1997.
  15. D. E. Rumelhart, G. E. Hinton, and R. J. Williams, "Learning representations by back-propagating errors", Nature, 323(6088), pp. 533-536, 1986.
  16. X. Shi, Z. Chen, H. Wang, D. Y. Yeung, W. K. Wong, and W. C. Woo, "Convolutional lstm network: A machine learning approach for precipitation nowcasting", Advances in neural information processing systems, 28, 2015.