DOI QR코드

DOI QR Code

건설신기술에 대한 토픽 모델링 및 토픽 변화추이 분석

Topic modeling and topic change trend analysis for advanced construction technologies

  • 정성윤 (한국건설기술연구원 미래스마트건설연구본부) ;
  • 김남곤 (한국건설기술연구원 미래스마트건설연구본부)
  • 투고 : 2021.11.24
  • 심사 : 2021.12.29
  • 발행 : 2021.12.31

초록

현재 국내 건설기술의 발전을 도모하기 위해 건설신기술 지정 제도를 운영하고 있다. 이 제도를 통해 지정된 건설신기술과 관련하여 중요도가 높은 출현 어휘와 어휘들 간의 관계를 분석함으로써 건설신기술에 내재된 암묵적인 의미를 살펴보고자 하였다. 이를 위해 918건의 건설신기술정보를 수집하였다. 수집된 건설신기술의 고시연도와 요약 내용을 기초로 하여 건설신기술별로 출현어휘의 중요도를 측정하였다. LDA 모형을 기반으로 한 4개의 토픽별로 연관된 어휘들 간의 영향정도를 평가하였다. 기술적용분야에 따른 토픽을 분석하였다. 1990년부터 2021년까지의 토픽별로 영향력이 높은 어휘들의 변화 추이를 유추하였다. 향후 환경·기계·설비 토픽과 구조물의 보수 보강 토픽의 영향정도 변화와 이에 관련한 적용기술 분야를 예측하였다. 토픽의 개발방향을 예측하였다.

Currently, the advanced construction technology endorsement system is being operated to promote the development of domestic construction technology. We tried to examine the implicit meanings inherent in advanced construction technologies by analyzing the relationship between emerging vocabularies with high importance in relation to the advanced construction technologies endorsed through this system. For this purpose, 918 cases of advanced construction technology information were collected. Based on the endorsed year and summary of the advanced construction technologies, the importance of the emerging vocabularies was measured for each advanced construction technology. And, based on the LDA model, the degree of influence between related vocabularies was evaluated for each of the four topic areas. Topics according to the technical application fields were analyzed. From 1990 to 2021, the trend of changes in highly influential vocabularies by each topic was inferred. In the future, changes in the degree of influence of the topics of environment, machinery, facilities, and maintenance and reinforcement of structures and related technology fields were predicted.

키워드

과제정보

이 논문은 2021년도 정부(교육과학기술부)의 재원으로 한국건설기술연구원의 주요사업의 지원을 받아 "(21주요-대2-목적)미래 건설산업 견인 및 신시장 창출을 위한 스마트 건설기술 연구"로 수행된 연구임

참고문헌

  1. 국토교통과학기술진흥원의 건설신기술 소개 http://www.kaia.re.kr/portal/contents.do?menuNo=200136 (accessed Nov., 05, 2021).
  2. Sajid, A., Jan, S, and Shah, I. A., "Automatic Topic Modeling for Single Document Short Texts" 2017 International Conference on Frontiers of Information Technology, pp. 70-75, 2017.
  3. KoNLPy: 파이썬 한국어 NLP(2021). https://www.konlpy.org/ko/latest/(accessed Nov., 05, 2021).
  4. 이종화, 이문봉, 김종원, "TF-IDF를 활용한 한글 자연어 처리 연구", 정보시스템연구, vol. 28, no. 3, pp. 105-121, 2019년 9월
  5. Salton G. and McGill, M. J., Introduction to modern information retrieval, McGraw-Hill, ISBN 0-07-054484-0, 1983.
  6. Blei, D. M., Ng, A. Y., and Jordan, M. I., "Latent dirichlet allocation", Journal of Machine Learning Research, Vol. 3, pp. 993-1022, 2003.
  7. 황서이, 황동열, "토픽모델링과 의미연결망분석을 통한 예술경영 연구동향 분석", 예술경영연구, vol. 47, no. 2, pp. 5-29, 2018.
  8. Sabidussi G., The centrality index of a graph. Psychometrika, vol. 31, no. 4, pp. 581-603, 1966. https://doi.org/10.1007/BF02289527
  9. 정철우, 김재준, "텍스트마이닝을 활용한 건설분야 트랜드 분석", 한국디지털 건축.인테리어학회 논문집, vol. 12, no. 2, pp. 53-60, 2016년 6월
  10. 박준용, "텍스트 마이닝을 활용한 토목분야 연구토픽 분석", 서울기술연구, Vol. 11, pp. 50-52, 2021년
  11. 정다운, 유지송, 이미숙, 신동빈, "텍스트 마이닝에 기반한 U-City 서비스 이슈 및 동향분석", 한국공간정보학회논문지, vol. 23, no. 3, pp. 34-44, 2015년 6월
  12. 박건철, 이치형, "토픽 모델링을 활용한 스마트시티 연구동향 분석", 한국인터넷정보학회논문지, vol. 20, no. 3, pp. 119-128, 2019년 6월
  13. 최솔샘, "텍스트 마이닝을 활용한 항공산업 트렌드 및 예측 모델 분석 연구", 한국항공대학교 석사학위 논문, 2021년 2월