DOI QR코드

DOI QR Code

Analysis and Utilization of Housing Information based on Open API and Web Scraping

오픈API와 웹스크래핑에 기반한 주택정보 분석 및 활용방안

  • Shin-Hyeong Choi (Division of Electrical, Control & Instrumentation Engineering, Kangwon National University)
  • Received : 2024.09.23
  • Accepted : 2024.10.14
  • Published : 2024.10.29

Abstract

In an era of low interest rates around the world, interest in real estate has increased. We can collect real estate information using the Internet, but it takes a lot of time to find. In this paper, real estate information from January 2015 to April 2024 is collected from three places to help users more easily collect real estate information of interest and use it for sales. First, by analyzing HTML documents using web scraping techniques, information on real estate of interest is automatically extracted from the website of the platform company. Second, the actual transaction price of the real estate is additionally collected through the open API provided by the Ministry of Land, Infrastructure and Transport. Third, real estate-related news is provided so that users can learn about the future value and prospects of real estate. The simulation results for the data collected in this study show that the lowest price predicted by the ARIMA model is expected to be in May 2024 among the next eight months. Therefore, by following this procedure, real estate buyers can make more efficient home sales by referring to related information including the predicted transaction price.

전 세계적으로 저금리 시대에 부동산에 대한 관심이 증가했으며, 인터넷을 사용하여 부동산 정보를 수집할 수 있지만 찾는 데 많은 시간이 소요된다. 본 논문에서는 2015년 1월부터 2024년 4월까지의 부동산 정보를 수집하여 사용자에게 제공함으로써 관심 있는 부동산 정보를 이용하여 매매에 사용할 수 있도록 돕는다. 첫째, 웹 스크래핑 기법을 사용하여 HTML 문서를 분석하여 플랫폼 기업의 웹사이트에서 관심 부동산 정보를 자동으로 추출하고, 둘째, 국토교통부에서 제공하는 오픈 API를 통해 해당 부동산의 실제 거래 가격을 추가 수집한다. 셋째, 부동산 관련 뉴스를 제공하여 사용자가 부동산의 미래 가치와 전망을 알 수 있도록 한다. 본 연구에서 수집한 데이터에 대해 시뮬레이션한 결과 ARIMA 모델로 예측한 매매가격에 의하면 향후 8개월 중에서는 2024년 5월이 가장 낮은 가격임을 예상할 수 있다. 따라서 이와 같은 절차에 따르면 부동산 매수자는 예측된 거래 가격을 포함한 관련 정보를 참고하여 보다 효율적인 주택 매매를 할 수 있다.

Keywords

References

  1. TheStreet Technology [Website]. (2024. Feb 29) Retrieved from https://www.thestreet.com/technology/copyright-lawsuits-against-openai-microsoft-chatgpt
  2. V. Singrodia, A. Mitra, S. Paul, "A Review on Web Scrapping and its Applications", 2019 International Conference on Computer Communication and Informatics, pp.1-6, Jan, 2019.
  3. P. Matta, N. Sharma, D. Sharma, B. Pant, "Web Scraping: Applications and Scraping Tools", International Journal of Advanced Trends in Computer Science and Engineering, 9(5), pp.8202-06, Oct, 2020.
  4. C. Lotfi, S. Srinivasan, M. Ertz, I. Latrous, "Web Scraping Techniques and Applications: A Literature Review", SCRS Conference Proceedings on Intelligent Systems, pp.381-394, Apr, 2022.
  5. Wikipedia [Website]. (2024 March 5) Retrieved from https://en.wikipedia.org/wiki/Open_API
  6. TechTarget [Website]. (2021 October). Retrieved from https://www.techtarget.com/searchapparchitecture/definition/open-API-public-API
  7. M. Soheila, R. Mohammad. "A Brief Survey on Event Prediction Methods in Time Series". Advances in Intelligent Systems and Computing. pp. 235-246, Jan, 2015.
  8. M. Soheila, R. Mohammad. "Time series forecasting using improved ARIMA". 2016 Artificial Intelligence and Robotics. pp. 92-97, Apr, 2016.
  9. L. Yizhuo, S. Weijia. "ARIMA Time Series Modeling and Forecasting of Enterprise Electric Energy Consumption". International Conference on Frontiers of Electronics, Information a nd Computation Technologies. pp. 497-500, May, 2023.
  10. N. Khin, Y. Yi. "Time Series Data Forecasting System for Stock using TA and ARIMA Model". 2023 IEEE Conference on Computer Applications. pp. 72-76, Feb, 2023.