DOI QR코드

DOI QR Code

그래프 데이터베이스 모델을 이용한 효율적인 부동산 빅데이터 관리 방안에 관한 연구

A Study on Effective Real Estate Big Data Management Method Using Graph Database Model

  • 김주영 (서울대학교 건설환경공학부) ;
  • 김현정 (한동대학교 창의융합교육원) ;
  • 유기윤 (서울대학교 건설환경공학부)
  • Ju-Young, KIM (Department of Civil and Environmental Engineering, Seoul National University) ;
  • Hyun-Jung, KIM (School of Creative Convergence Education, Handong Global University) ;
  • Ki-Yun, YU (Department of Civil and Environmental Engineering, Seoul National University)
  • 투고 : 2022.11.15
  • 심사 : 2022.12.12
  • 발행 : 2022.12.31

초록

부동산 데이터는 경제, 법률, 군중심리 등 다양한 분야와 상호작용하고 복잡한 레이어의 데이터로 구성되어 있으며, 그 양 또한 방대하고 빠르게 변화하여 빅데이터로 볼 수 있다. 부동산 빅데이터를 관리하기 위한 기존의 관계형데이터베이스는 스키마가 고정되어 있고 수직적 확장성을 가지며 다양한 관계를 처리하기 어려운 한계가 있다. 이러한 한계를 극복하기 위하여 본 연구에서는 부동산 데이터를 그래프데이터베이스에 구축함으로써 그 유용성을 검증하였다. 연구방법은 가장 널리 사용되는 데이터베이스 중 하나인 관계형데이터베이스 방식인 MySQL과 그래프데이터베이스 방식인 Neo4j에 다양한 부동산 데이터를 모델링하고 실생활에서 사용되는 부동산 질문들을 수집하여 9개의 질문들에 대해 그래프데이터베이스와 관계형데이터베이스의 쿼리시간을 비교하였다. 실험결과로 Neo4j는 다양한 관계를 추론하는 다중 JOIN 문이 있는 쿼리에도 일정한 성능을 보였지만 MySQL은 JOIN문이 많아질수록 쿼리시간이 급격하게 증가하는 경향을 보였다. 이러한 결과를 통해 다양한 관계를 가진 부동산 빅데이터에 Neo4j 같은 그래프데이터베이스가 효율적일 수 있음을 알 수 있으며 부동산가격 요인예측, 부동산에 대한 AI스피커 질의 등의 분야에서 활용을 기대할 수 있다.

Real estate data can be big data. Because the amount of real estate data is growing rapidly and real estate data interacts with various fields such as the economy, law, and crowd psychology, yet is structured with complex data layers. The existing Relational Database tends to show difficulty in handling various relationships for managing real estate big data, because it has a fixed schema and is only vertically extendable. In order to improve such limitations, this study constructs the real estate data in a Graph Database and verifies its usefulness. For the research method, we modeled various real estate data on MySQL, one of the most widely used Relational Databases, and Neo4j, one of the most widely used Graph Databases. Then, we collected real estate questions used in real life and selected 9 different questions to compare the query times on each Database. As a result, Neo4j showed constant performance even in queries with multiple JOIN statements with inferences to various relationships, whereas MySQL showed a rapid increase in its performance. According to this result, we have found out that a Graph Database such as Neo4j is more efficient for real estate big data with various relationships. We expect to use the real estate Graph Database in predicting real estate price factors and inquiring AI speakers for real estate.

키워드

과제정보

본 연구는 국토교통부/국토교통과학기술진흥원의 지원으로 수행되었음(과제번호 RS-2022-00143336)

참고문헌

  1. Baek, C.Y., and Park, S.H. 2021. A Study on Maps Update for Highly Automated Driving using a Graph Database. Journal of the Korean Society of Cadastre 37(1):135-149
  2. Cheng, Y., Ding, P., Wang, T., Lu, W., and Du, X. 2019. Which category is better: benchmarking relational and graph database management systems. Data Science and Engineering 4(4):309-322.
  3. Kim, S.W., and Chung, K.S. 2010. Comparative Study of the Fitness between Traditional OLS Models and Spatial Econometrics Models Using the Real Transaction Housing Price in the Busan. Journal of KREAA 16(3):41-55
  4. Lee, J.Y., Oh, K.J., and Ahn, J.J. 2021. Study on the Development Direction of Domestic Proptech Company: Focusing on the Real Estate Platform Information Provision Function. Knowledge Management Research 22(2):55-76
  5. Oh, B.R. 2014. A Study on Travel Characteristics and the Establishment of Criterion for the Size of the Neighborhood Unit by Using the Data of Household Travel Diary Survey in Seoul. Seoul Studies 15(3):1-18 https://doi.org/10.23129/SEOULS.15.3.201409.1
  6. Park, W.S., and Rhim, B.J. 2010. A Study on the Factors Affection Apartment Price by Using Hedonic Price Model. JOURNAL OF THE KOREA REAL ESTATE SOCIETY 28(2):245-271
  7. Rashidy, R. A. H. E., Hughes, P., Figueres-Esteban, M., Harrison, C., and Van Gulijk, C. 2018. A big data modeling approach with graph databases for SPAD risk. Safety science 110:75-79.
  8. Seo, W.S. 2019. Comparing the Housing Implicit Prices of Restricted and Unrestricted Hedonic Price Models. Journal of Korea Planning Association 54(6):80-88 https://doi.org/10.17208/jkpa.2019.11.54.6.80
  9. Sun, Y. 2013. Real estate management information system. Proceedings of the International Conference on Information Engineering and Applications(IEA). London. pp.623-629.
  10. Trofimov, S., Szumilo, N., and Wiegelmann, T. 2016. Optimal database design for the storage of financial information relating to real estate investments. Journal of Property Investment & Finance 34(5):535-546.
  11. Xiao, F., Guo, W., Liu, W., and Zeng, J. 2021. A Spatio-temporal Big Data Decision Support System of Real Estate. International Conference on Information Technology and Biomedical Engineering (ICITBE) IEEE.. December. pp.30-34.
  12. Yoon, B.H., Kim, S.K., and Kim, S.Y. 2017. Use of graph database for the integration of heterogeneous biological data. Genomics & informatics 15(1):19-27. https://doi.org/10.5808/GI.2017.15.1.19