Abstract
Retention relative times(RRTs) of PAH molecules and their derivatives in gas chromatography are trained and predicted in testing sets using a multiple linear regression(MLR) and an artificial neural network(ANN). The main descriptors of PAHs and their derivatives in QSRR are the square root of molecular weight(sqmw), molecular connectivity($^1{\chi}_v$), molecular dipole moment(D) and length-to-breadth ratios(L/B). The results of MLR shows that a heavy molecule has a propensity for long retention time. L/B closely related with slot model is a good descriptor in MLR. On the other hand, ANN which is not effected by the linear dependencies among the descriptors were exclusively based on molecular weight and molecular dipole moment. The variances which shows the accuracy of prediction for retention times in testing sets are 1.860, 0.206 for MLR and ANN, respectively. It was shown that ANN can exceed the MLR in prediction accuracy.
기체 크로마토그래피에서 PAH와 그것의 유도체들의 상대적 용리시간을 인공신경망분석과 다변량 선형 회귀분석을 사용하여 학습한 후, 시험세트들의 상대적 용리시간을 예측하였다. QSRR에서 PAH와 그것의 유도체의 주요한 설명인자는 분자량의 제곱근, 분자의 연결지수($^1{\chi}_v$), 분자 쌍극자모멘트 및 분자의 길이와 폭의 비율(L/B)이었다. 다변량선형회귀분석에 의하면 큰 분자일수록 용리시간은 길어지며 또한 L/B의 값이 커지면 용리시간이 증가하는 것으로 보아 슬롯이론을 따르고 있음을 알 수 있었다. 반면에 설명인자 사이의 선형 독립성에 영향을 받지 않는 인공신경망 분석결과에 의하면 분자량과 분자 쌍극자 모멘트가 주요한 인자로 작용하고 있었다. 시험세트의 예측 정확도를 나타내는 분산은 선형회귀분석에서는 1.860, 인공신경망분석법에서 0.206으로서 인공신경망 분석법이 다변량회귀분석보다 더 좋은 예측방법임을 알 수 있었다.