The Comparison Among Prediction Methods of Water Demand And Analysis of Data on Water Services Using Data Mining Techniques

데이터마이닝 기법을 활용한 상수 이용현황 분석 및 단기 물 수요예측 방법 비교

  • Received : 2015.12.21
  • Accepted : 2015.12.28
  • Published : 2016.02.29

Abstract

This study identifies major features in water supply and introduces important factors in water services based on the information from data mining analysis of water quantity and water pressure measured from sensors. It also suggests more accurate methods using multiple regression analysis and neural network in predicting short term prediction of water demand in water service. A small block of a county is selected for the data collection and tests. There isa water demand on business such as public offices and hospitalstoo in this area. Real stream data from sensors in this area is collected. Among 2,728 data sets collected, 2,632 sets are used for modelling and 96 sets are used for testing. The shows that neural network is better than multiple regression analysis in their prediction performance.

본 연구에서는 상수관망에 설치된 유량, 압력 센서를 통해 취득한 빅데이터에 대해 데이터마이닝 기법을 활용하여 해당 공급권역의 특성을 파악하고 그 정보에 기반하여 상수 공급에 있어서 유의할 점 등을 도출해보고자 하였다. 또한, 상수 사용에 대한 단기 수요예측을 수행하는데 있어서도 통계적 방법인 다중회귀분석과 데이터마이닝의 인공신경망 기법을 비교하여 좀 더 정확한 수요예측을 할 수 있는 모델을 제시해보고자 하였다. 데이터 수집과 테스트를 위하여 지자체 한 군의 소블록 지역을 대상으로 선정하였다. 해당 지역은 가정용 수요 외에도 관공서, 병원 등의 대형 업무용 수요도 일부 존재하고 있는 지역이다. 해당 지역의 센서를 통해 취득되는 연속 발생 데이터를 수집하였다. 이런 방식을 통해 취득된 데이터는 총 2,728건이며 이 중 2,632건은 예측모델을 생성하는데 96건은 예측모델의 예측력을 테스트 하는 데에 활용하였다. 이러한 테스트를 수행한 결과 상수 수요예측에 있어서 인공신경망이 다중회귀분석에 비교하여 더 좋은 예측율을 보였다.

Keywords

References

  1. 삼성경제연구소, "효과적 수요 예측 방법과 사례", SERI 이슈 페이퍼, 2012.
  2. 송수섭, 이의훈, "인공신경망을 이용한 소비자 선택 예측에 관한 연구", 한국경영과학회, 제26권, 제4호, pp.55-70, 2001.
  3. 주충남, 구자용, 유명진, "인공신경망을 이용한 단기 물수요 예측", 대한환경공학회, 추계학술연구발표회 논문집(I), 1999.
  4. 최국렬, 데이터마이닝 이론과 실습 : 보건의료데이터 중심, 청구문화사, 2001.
  5. 최기선, 유철, 진력민, 유성근, 전명근, "AR모델과 MLP를 이용한 단기 물 수요 예측 알고리즘 개발", 한국지능시스템학회논문지, 제19권, 제5호, pp.713-719, 2009. https://doi.org/10.5391/JKIIS.2009.19.5.713
  6. 최세일, "의주식시장 기술적 지표 분석", 진리탐구, 1999.
  7. 추휘석, 민지경, 이인호, "다수의 인공신경망 모형을 통한 기업데이터의 분류 및 부도예측에 관한 연구", 연세경영연구, 제41권, 제2호, pp.513-539, 2004.
  8. 한상만, 박승배, 정남호, "인공신경망과 로짓모형을 이용한 내구재의 구매의도 예측에 관한 비교연구", 아시아마케팅저널, 제15권, 제3호, pp.71-92, 2000.
  9. 허명회, 이용구, 데이터마이닝 모델링과 사례, 한나래, 2008.
  10. 허 준, 최병주, 정성원, "클레멘타인을 이용한 데이터마이닝", 1판, SPSS아카데미, 2001.
  11. Berry, M. and Linoff, G., Data Mining Techniques, Wiley, New York, 1997.
  12. Domingos, P. and G. Hulten, Mining High-Speed Data Streams, KDD, Boston, MA, USA ACM Press, 2000.
  13. Han, J. and M. Kamber, Data Mining-Concepts and Techniques, Morgan Kaufmann, 2001.
  14. Han, J., J. Pei, and Y. Yin, "Mining frequent patterns without candidate generation", In Proceedings of 2000 ACM-SIGMOD International Conference of Management of Data, 2000.
  15. Hulten, G., L. Spencer, and P. Domingos, Mining Time-Changing Data Streams, KDD 01 San Francisco, C.A. USA, 2001.
  16. Pendharkar, P.C., "A Threshold-varying Artificial Neural Network approach for Classification and its Application to Bankruptcy Prediction Problem", Computers and Operations Research, Vol.32, No.10, pp.2561-2582, 2005. https://doi.org/10.1016/j.cor.2004.06.023
  17. West, D., "Neural Network Credit Scoring Models", Computers and Operations Research, Vol.27, No.11, pp.1131-1152, 2000. https://doi.org/10.1016/S0305-0548(99)00149-5