Molecular Property Prediction with Deep-learning and Pretraining Strategy

사전학습 전략과 딥러닝을 활용한 분자의 특성 예측

  • Lee, Seungbeom (Graduate School of Artificial Intelligence, POSTECH) ;
  • Kim, Jiye (Graduate School of Artificial Intelligence, POSTECH) ;
  • Kim, Dongwoo (Graduate School of Artificial Intelligence, POSTECH) ;
  • Park, Jaesik (Graduate School of Artificial Intelligence, POSTECH) ;
  • Ahn, Sungsoo (Graduate School of Artificial Intelligence, POSTECH)
  • 이승범 (포항공과대학교 인공지능 대학원) ;
  • 김지예 (포항공과대학교 인공지능 대학원) ;
  • 김동우 (포항공과대학교 인공지능 대학원) ;
  • 박재식 (포항공과대학교 인공지능 대학원) ;
  • 안성수 (포항공과대학교 인공지능 대학원)
  • Published : 2022.07.13

Abstract

본 논문에서는 분자의 특성을 정확하게 예측하기 위해 효과적인 사전학습(pretraining) 전략과 트랜스포머(Transformer) 모델을 활용한 방법을 제시한다. 딥러닝을 활용한 분자의 성능을 예측하는 연구는 그동안 레이블이 부족한 분자데이터의 특성에 의해 학습 때 사용된 데이터이외의 분자데이터에 대해 일반화 능력이 떨어지는 어려움을 겪었다. 이 논문에서 제시한 모델은 사전학습(pretraining)을 수행할 때 자기지도학습(self-supervised training)을 사용하여 부족한 레이블에 의한 문제점을 피할 수 있다. 대규모 분자 데이터셋으로부터 학습된 이 모델은 4가지 다운스트림 데이터셋에 대해 모두 우수한 성능을 보여주어 일반화 성능이 뛰어나며 효과적인 분자표현을 얻을 수 있음을 보인다.

Keywords