Abstract
The autoignition temperature is one of the most important physical properties used to determine the flammability characteristics of chemical substances. Despite the needs of the experimental autoignition temperature data for the design of chemical plants, it is not easy to get the data. This study have built and compared partial least squares (PLS) and support vector machine (SVM) models to predict the autoignition temperatures of 503 organic compounds out of DIPPR 801. As the independent variables of the models, 59 functional groups were chosen based on the group contribution method. The prediction errors calculated from cross-validation were employed to determine the optimal parameters of two models. And, particle swarm optimization was used to get three parameters of SVM model. The PLS and SVM results of the average absolute errors for the whole data range from 58.59K and 29.11K, respectively, indicating that the predictive ability of the SVM is much superior than PLS.
화학물질의 화재위험을 나타내는 가장 중요한 물성의 하나인 자연발화점의 실험 데이터는 그 필요에도 불구하고 데이터를 얻는 것이 어려운 경우가 많다. 이 연구에서는 DIPPR 801에서 얻은 503개 유기물의 자연발화점 실험데이터로부터 자연발화점을 예측하는 부분최소자승법(PLS) 및 support vector machine(SVM) 모델을 만들고 비교하였다. 그룹기여법을 이용하여 59개 작용기가 이 예측모델의 독립변수가 되었다. 두 모델에서 결정해야 할 매개변수는 교차검증으로 계산된 오차를 이용하여 결정되었고, SVM모델은 그 매개변수가 많아 particle swarm optimization을 이용한 최적화를 이용하였다. 전체 데이터에 대해 계산된 평균절대오차는 PLS가 58.59K였고, SVM이 29.11K여서 SVM이 PLS에 비해 매우 우수한 예측성능을 보였다.