DOI QR코드

DOI QR Code

주거환경에 대한 거주민의 만족도와 영향요인 분석 - 직방 아파트 리뷰 빅데이터와 딥러닝 기반 BERT 모형을 활용하여 -

Analysis of Resident's Satisfaction and Its Determining Factors on Residential Environment: Using Zigbang's Apartment Review Bigdata and Deeplearning-based BERT Model

  • 권준현 (한양대학교 도시공학과) ;
  • 이수기 (한양대학교 도시공학과)
  • 투고 : 2023.03.21
  • 심사 : 2023.06.16
  • 발행 : 2023.06.30

초록

주거환경에 대한 만족도는 주거지 선택 및 이주 등에 영향을 미치는 주요인으로, 도시에서의 삶의 질과 직접적으로 연결된다. 최근 온라인 부동산 서비스의 증가로 주거환경에 대한 사람들의 만족도를 쉽게 확인할 수 있으며, 사람들이 평가하는 내용을 바탕으로 주거환경 만족 요인에 대한 분석이 가능하다. 이는 기존에 활용되던 설문조사 등의 방식보다 더 많은 양의 평가를 효율적으로 활용할 수 있음을 의미한다. 본 연구는 서울특별시를 대상으로 온라인 부동산 서비스인 '직방'에서 수집된 약 3만여 건의 아파트 리뷰를 분석에 활용하였다. 리뷰에 포함된 추천 평점을 토대로, 아파트 리뷰를 긍정적, 부정적으로 분류하고, 딥 러닝 기반 자연어 처리 모델인 BERT(Bidirectional Encoder Representations from Transformers)를 사용하여 리뷰를 자동으로 분류하는 모델을 개발하였다. 이후 SHAP(SHAPley Additive exPlanation)를 이용하여 분류에 중요한 역할을 하는 단어 토큰을 도출함으로 주거환경 만족도의 영향요인을 도출하였다. 더 나아가 Word2Vec을 이용하여 관련 키워드를 분석함으로써 주거환경에 대한 만족도 개선을 위한 우선 고려사항을 제시하였다. 본 연구는 거주자의 정성평가 자료인 아파트 리뷰 빅데이터와 딥러닝을 활용하여 주거환경에 대한 만족도를 긍정적, 부정적으로 자동 분류하는 모형을 제안하여 그 영향요인을 도출하는데 의의가 있다. 분석결과는 주거환경 만족도 향상을 위한 기초자료로 활용될 수 있으며 향후 아파트 단지 인근 주거환경 평가, 신규 단지 및 기반시설의 설계 및 평가 등에 활용될 수 있다.

Satisfaction on the residential environment is a major factor influencing the choice of residence and migration, and is directly related to the quality of life in the city. As online services of real estate increases, people's evaluation on the residential environment can be easily checked and it is possible to analyze their satisfaction and its determining factors based on their evaluation. This means that a larger amount of evaluation can be used more efficiently than previously used methods such as surveys. This study analyzed the residential environment reviews of about 30,000 apartment residents collected from 'Zigbang', an online real estate service in Seoul. The apartment review of Zigbang consists of an evaluation grade on a 5-point scale and the evaluation content directly described by the dweller. At first, this study labeled apartment reviews as positive and negative based on the scores of recommended reviews that include comprehensive evaluation about apartment. Next, to classify them automatically, developed a model by using Bidirectional Encoder Representations from Transformers(BERT), a deep learning-based natural language processing model. After that, by using SHapley Additive exPlanation(SHAP), extract word tokens that play an important role in the classification of reviews, to derive determining factors of the evaluation of the residential environment. Furthermore, by analyzing related keywords using Word2Vec, priority considerations for improving satisfaction on the residential environment were suggested. This study is meaningful that suggested a model that automatically classifies satisfaction on the residential environment into positive and negative by using apartment review big data and deep learning, which are qualitative evaluation data of residents, so that it's determining factors were derived. The result of analysis can be used as elementary data for improving the satisfaction on the residential environment, and can be used in the future evaluation of the residential environment near the apartment complex, and the design and evaluation of new complexes and infrastructure.

키워드

과제정보

이 논문은 한국연구재단의 지원(NRF-2018R1A5A7059549)을 받아 수행된 연구임.

참고문헌

  1. 김보찬.김유현.김민정.이종석, 2018, 데이터마이닝을 활용한 서울 주요 대학가 주거용 부동산 임대료 모형 수립에 관한 연구, 「대한산업공학회지」, 44(4): 259-271. https://doi.org/10.7232/JKIIE.2018.44.4.259
  2. 김선재.이수기, 2020, 수도권 2 기 신도시 주거환경만족도 요인 분석: 웹크롤링과 텍스트 마이닝을 활용하여.「국토계획」, 55(7), 5-20. https://doi.org/10.17208/jkpa.2020.12.55.7.5
  3. 서울특별시, 2014, 2030 서울도시기본계획.
  4. 신은진.남진, 2012, 서울시 아파트 단지의 주거환경 유형별 주거만족도 결정요인에 관한 연구, 「국토계획」, 47(5): 139-154.
  5. 안용진, 2016, 거주지 교통사고 공간적 집중이 주거환경 만족도에 미친 영향: 다수준 분석을 활용한 서울시 25개 자치구 실증연구, 「도시설계」, 17(2): 5-18.
  6. 오규만.이명훈, 2019, 대도시 고가아파트 주거만족과 추천의도에 대한 영향 분석-서울과 부산을 중심으로, 「주거환경」, 17(4): 219-234.
  7. 이유재.문선희, 2016, 아파트 주거만족도 평가 모형의 개발과 적용: KARSI (Korea Apartment Resident Satisfaction Index) 모형을 중심으로, 「소비자학연구」, 27(2): 25-55.
  8. 장은아.최회련.이홍철, 2020, BERT를 활용한 뉴스 감성분석과 거시경제지표 조합을 이용한 주가지수 예측, 「한국컴퓨터정보학회논문지」, 25(5): 47-56. https://doi.org/10.9708/JKSCI.2020.25.05.047
  9. 장한두, 2008, "주거만족 영향요인과 주거환경평가: 서울시 중소규모 아파트의 거주자 특성별 분석을 중심으로, 「대한건축학회」, 24(5): 11-21.
  10. 아사미 야스시(淺見泰司), 2003, 「住居環境 : 평가방법과 이론」, 강부성.강인호.박인석.이규인. 최정민 역, 시공문화사.
  11. 황상흠.김도현, 2020, 한국어 기술문서 분석을 위한 BERT 기반의 분류모델, 「한국전자거래학회지」, 25(1):203-214. https://doi.org/10.7838/JSEBS.2020.25.1.203
  12. Araque, O., Zhu, G., and Iglesias, C. A., 2019, A semantic similarity-based perspective of affect lexicons for sentiment analysis, Knowledge-Based Systems, 165: 346-359. https://doi.org/10.1016/j.knosys.2018.12.005
  13. Catelli, R., Pelosi, S., and Esposito, M., 2022, Lexicon-based vs. Bert-based sentiment analysis: A comparative study in Italian, Electronics, 11(3): 374.
  14. Chen, W., Wu, X., and Miao, J., 2019. Housing and subjective class identification in urban China, Chinese Sociological Review, 51(3): 221-250. https://doi.org/10.1080/21620555.2019.1601012
  15. Devlin, J., Chang, M. W., and Lee, K. T., 2018, BERT: Pre-training of deep bidirectional transformers for language understanding, arXiv: 1810.04805.
  16. Hu, Y., Deng, C., and Zhou, Z., 2019, A semantic and sentiment analysis on online neighborhood reviews for understanding the perceptions of people toward their living environments, Annals of the American Association of Geographers, 109(4): 1052-1073. https://doi.org/10.1080/24694452.2018.1535886
  17. Hu, L., He, S., and Su, S, 2022, A novel approach to examining urban housing market segmentation: Comparing the dynamics between sales submarkets and rental submarkets, Computers, Environment and Urban Systems, 94: 101775.
  18. Kokalj, E., Skrlj, B., Lavrac, N., Pollak, S., and Robnik-Sikonja, M., 2021, BERT meets shapley: Extending SHAP explanations to transformer-based classifiers, In Proceedings of the EACL Hackashop on News Media Content Analysis and Automated Report Generation, 16-21.
  19. Lundberg, S. M., and Lee, S. I., 2017, A unified approach to interpreting model predictions, Advances in neural information processing systems, 30.
  20. Luo, Z., Huang, S., and Zhu, K. Q., 2019, Knowledge empowered prominent aspect extraction from product reviews, Information Processing and Management, 56(3): 408-423. https://doi.org/10.1016/j.ipm.2018.11.006
  21. Meng, G., and Hall, G. B., 2006, Assessing housing quality in metropolitan Lima, Peru, Journal of Housing and the Built Environment, 21: 413-439. https://doi.org/10.1007/s10901-006-9058-1
  22. Mikolov, T., Chen, K., Corrado, G., and Dean, J., 2013, Efficient estimation of word representations in vector space, arXiv preprint, arXiv: 1301-3781.
  23. Mustafa, R. U., Ashraf, N., Ahmed, F. S., Ferzund, J., Shahzad, B., and Gelbukh, A., 2020, A multiclass depression detection in social media based on sentiment analysis, In 17th International Conference on Information Technology-New Generations, 659-662.
  24. Sailunaz, K., and Alhajj, R., 2019, Emotion and sentiment analysis from Twitter text, Journal of Computational Science, 36: 101003.
  25. Su, S., He, S., Sun, C., Zhang, H., Hu, L., and Kang, M., 2021, Do landscape amenities impact private housing rental prices? A hierarchical hedonic modeling approach based on semantic and sentimental analysis of online housing advertisements across five Chinese megacities, Urban Forestry and Urban Greening, 58: 126-968. https://doi.org/10.1016/j.ufug.2020.126968
  26. United Nations, 1989, Handbook of social indicators, studies in methods series F no. 49, New York: United Nations.
  27. Vuong, T., Saastamoinen, M., Jacucci, G., and Ruotsalo, T., 2019, Understanding user behavior in naturalistic information search tasks, Journal of the Association for Information Science and Technology, 70(11): 1248-1261. https://doi.org/10.1002/asi.24201
  28. Wang, L., He, S., Su, S., Li, Y., Hu, L., and Li, G., 2022, Urban neighborhood socioeconomic status (SES) inference: A machine learning approach based on semantic and sentimental analysis of online housing advertisements, Habitat International, 124: 102572
  29. Zhang, B., Xu, X., Li, X., Chen, X., Ye, Y., and Wang, Z., 2019, "Sentiment analysis through critic learning for optimizing convolutional neural networks with rules", Neurocomputing, 356: 21-30. https://doi.org/10.1016/j.neucom.2019.04.038
  30. 서울 열린데이터 광장, "서울시 재정비촉진지구 개발 추진 현황 자료", 2022.09.20 읽음. http://data.seoul.go.kr/dataList/OA-2747/S/1/datasetView.do