비정형 데이터를 이용한 화학물질 사고 대응 체계 정보속성 비교 분석 : 화학사고 예방, 대비 및 대응을 위한 OECD 지침서를 중심으로

Comparative analysis of informationattributes inchemical accident response systems through Unstructured Data: Spotlighting on the OECD Guidelines for Chemical Accident Prevention, Preparedness, and Response

  • 김용진 (한국화학연구원 연구기획실) ;
  • 도충현 (한국화학연구원 연구기획실)
  • YongJin Kim (Office of R&D Planning, Korea Research Institute of Chemical Technology) ;
  • Chunghyun Do (Office of R&D Planning, Korea Research Institute of Chemical Technology)
  • 투고 : 2023.09.05
  • 심사 : 2023.11.28
  • 발행 : 2023.12.31


화학물질 사고는 신속한 대응 및 복구가 어렵고, 환경오염과 인명피해가 동반된다는 점에서 매뉴얼의 중요성이 점차 주목받고 있으며, OECD에서는 화학사고 예방, 대비 및 대응을 위한 OECD 지침서(이하 OECD 지침서)를 2023년 6월 개정하였다. 또한, 기존 연구에서는 화학사고에 대한 인식 제고를 통해 법규, 규정, 매뉴얼 등 시스템적 대응이 필요하다는 점을 강조하고 있으나. 매뉴얼에 대한 정보속성 비교연구는 찾아보기 힘들었다. 이에, 본 연구는 기존 OECD 지침서(2판)와 개정된 OECD 지침서(3판)을 비교분석하여 OECD 지침서별 정보속성을 파악하고 시사점을 발굴하는 것을 목표로 하였다. 세부적으로는 어떤 단어가 중요해졌는지 파악하기 위해 TF-IDF(Term Frequency-Inverse Document Frequency) 분석을 적용하였으며, 유사하게 사용한 단어와 차별성있게 사용한 단어를 파악하기 위해 Word2Vec을 적용하였다. 최종적으로는 2X2 매트릭스를 제안하고, 각 사분면에 어떤 단어들이 있는지를 도출하여 OECD 지침서별 정보속성을 심층적으로 비교하였다. 본 연구는 연구자들이 정보속성을 파악하는데 도움이 되는 프레임워크를 제공하고자 하였으며, 실무적으로는 국내 화학관련 정부부처 및 기업의 표준메뉴얼 개정에 참고할 수 있을 것으로 보인다.

The importance of manuals is emphasized because chemical accidents require swift response and recovery, and often result in environmental pollution and casualties. In this regard, the OECD revised OECD Guidelines for the Prevention, Preparedness, and Response to Chemical Accidents (referred to as the OECD Guidelines), in June 2023. Moreover, while existing research primarily raises awareness about chemical accidents, highlighting the need for a system-wide response including laws, regulations, and manuals, it was difficult to find comparative research on the attributes of manuals. So, this paper aims to compare and analyze the second and third editions of the OECD Guidelines, in order to uncover the information attributes and implications of the revised version. Specifically, TF-IDF (Term Frequency-Inverse Document Frequency) was applied to understand which keywords have become more important, and Word2Vec was applied to identify keywords that were used similarly and those that were differentiated. Lastly, a 2×2 matrix was proposed, identifying the topics within each quadrant to provide a deeper comparison of the information attributes of the OECD Guidelines. This study offers a framework to help researchers understand information attributes. From a practical perspective, it appears valuable for the revision of standard manuals by domestic government agencies and corporations related to chemistry.



  1. 국립국어원, (n.d.). 국립국어원 표준국어대사전. 국립국어원. Retrieved January 30, 2023, from 
  2. 김대환. (2010). OECD DAC 가입과 KOICA 의 환경 및 기후변화 ODA 추진전략. Journal of International Development Cooperation, 5(2), 10-31. 
  3. 김민구, 김용우, 정태현, 김영민. (2022). Organic Light-Emitting Diodes 디스플레이 기술의 특허동향과 기술적 가치에 관한 탐색적 연구. 지능정보연구, 28(4), 135-155.
  4. 김용진, 정주미, 최호철. (2022). 한국의 화학무기용 특정화학물질 관리체계 개선방안 연구: 한중.일 3 국간 비교를 중심으로. 한국정책과학학회보, 26(2), 65-86. 
  5. 김진솔, 신동훈, 김희웅. (2021). 비정형 빅데이터를 이용한 COVID-19 주요 이슈 분석. 지식경영연구, 22(2), 145-165.
  6. 박종서, 정성봉, 안찬기, 김연응. (2012). 위험물 표준화를 통한 운송 사고대응메뉴얼 개발. 한국산업인력공단, 서울. 
  7. 박호연, 김경재. (2019). CNN-LSTM 조합모델을 이용한 영화리뷰 감성분석. 지능정보연구, 25(4), 141-154.
  8. 소방신문. (2023), 소방청, 2022년 국내 화학사고 218건...소방청, 희귀 화학물질 사고대응 능력 높인다. 소방신문. Retrieved January 30, 2023, from 
  9. 유은순, 최건희,김승훈. (2015). TF-IDF 와 소설 텍스트의 구조를 이용한 주제어 추출 연구. 한국컴퓨터정보학회논문지, 20(2), 121-129.
  10. 유지선, 정영진. (2014). 유해화학물질 유출의 사례 분석. 한국화재소방학회 논문지, 28(6), 90-98. 
  11. 윤여일, 고은정, 김남규. (2019). 주제 균형 지능형 텍스트 요약 기법. 지능정보연구, 25(2), 141-166.
  12. 이동훈, & 김관호. (2018). Word2Vec 기반의 의미적 유사도를 고려한 웹사이트 키워드 선택기법. 한국전자거래학회지, 23(2), 83-96.
  13. 이성직, 김한준. (2009). TF-IDF 의 변형을 이용한 전자뉴스에서의 키워드 추출 기법. 한국전자거래학회지, 14(4), 59-73. 
  14. 이재석, 최돈묵. (2015). 국가재난관리체제 관점의 화학사고 대응체계 개선방안에 관한 연구. 한국화재소방학회 논문지, 29(5), 73-78. 
  15. 전병국, 안현철. (2015). 사용자 리뷰 마이닝을 결합한 협업 필터링 시스템: 스마트폰 앱 추천에의 응용. 지능정보연구, 21(2), 1-18.
  16. 정예림, 김지희, 유형선. (2020). Word2Vec 을 활용한 제품군별 시장규모 추정 방법에 관한 연구. 지능정보연구, 26(1), 1-21.
  17. 한국학술지인용색인. (n.d.). KCI 통합검색. 한국학술지인용색인. Retrieved January 31, 2023, from 
  18. 화학물질안전원, (n.d.). 화학물질종합정보시스템. Retrieved January 31, 2023, 화학물질안전원. from 
  19. 환경부 화학물질과/화학물질안전 TF. (2013, September 25). 구미 불화수소 누출사고, 화학안전의 교훈. 환경부. Retrieved January 31, 2023, from 
  20. 환경부 물관리정책실 수질관리과. (2022, March 24). 미규제 미량오염물질 촘촘한 조사, 먹는물 안전관리 강화. 환경부. Retrieved January 31, 2023, from 
  21. Bird, S. (2006, July). NLTK: the natural language toolkit. In Proceedings of the COLING/ACL 2006 Interactive Presentation Sessions (pp. 69-72). 
  22. CEFIC. (2023, February 27). Facts and Figures 2023. CEFIC. Retrieved August 31, 2023, from
  23. Jang, B., Kim, I., & Kim, J. W. (2019). Word2vec convolutional neural networks for classification of news articles and tweets. PloS one, 14(8), e0220976. 
  24. Kim, Y. J., & Lee, D. H. (2020). Technology convergence networks for flexible display application: A comparative analysis of latecomers and leaders. Japan and the World Economy, 55, 101025. 
  25. Levy, O., Goldberg, Y., & Dagan, I. (2015). Improving distributional similarity with lessons learned from word embeddings. Transactions of the association for computational linguistics, 3, 211-225.
  26. Loper, E., & Bird, S. (2002). Nltk: The natural language toolkit. arXiv preprint cs/0205028. 
  27. Mikolov, T., Chen, K., Corrado, G., & Dean, J. (2013). Efficient estimation of word representations in vector space. arXiv preprint arXiv:1301.3781. 
  28. Nawangsari, R. P., Kusumaningrum, R., & Wibowo, A. (2019). Word2vec for Indonesian sentiment analysis towards hotel reviews: An evaluation study. Procedia Computer Science, 157, 360-366.
  29. OECD. (2003) OECD Guiding Principles for Chemical Accident Prevention, Preparedness and Response - Second Edition. Paris: OECD Publishing. 
  30. OECD. (2023) OECD Guiding Principles for Chemical Accident Prevention, Preparedness and Response - Third Edition. Paris: OECD Publishing. 
  31. Rehurek, R., & Sojka, P. (2011). Gensim-statistical semantics in python. Retrieved from 
  32. Sparck Jones, K. (1972). A statistical interpretation of term specificity and its application in retrieval. Journal of documentation, 28(1), 11-21.