한국컴퓨터정보학회:학술대회논문집 (Proceedings of the Korean Society of Computer Information Conference)
- 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
- /
- Pages.63-66
- /
- 2022
사전학습 전략과 딥러닝을 활용한 분자의 특성 예측
Molecular Property Prediction with Deep-learning and Pretraining Strategy
- 이승범 (포항공과대학교 인공지능 대학원) ;
- 김지예 (포항공과대학교 인공지능 대학원) ;
- 김동우 (포항공과대학교 인공지능 대학원) ;
- 박재식 (포항공과대학교 인공지능 대학원) ;
- 안성수 (포항공과대학교 인공지능 대학원)
- Lee, Seungbeom (Graduate School of Artificial Intelligence, POSTECH) ;
- Kim, Jiye (Graduate School of Artificial Intelligence, POSTECH) ;
- Kim, Dongwoo (Graduate School of Artificial Intelligence, POSTECH) ;
- Park, Jaesik (Graduate School of Artificial Intelligence, POSTECH) ;
- Ahn, Sungsoo (Graduate School of Artificial Intelligence, POSTECH)
- 발행 : 2022.07.13
초록
본 논문에서는 분자의 특성을 정확하게 예측하기 위해 효과적인 사전학습(pretraining) 전략과 트랜스포머(Transformer) 모델을 활용한 방법을 제시한다. 딥러닝을 활용한 분자의 성능을 예측하는 연구는 그동안 레이블이 부족한 분자데이터의 특성에 의해 학습 때 사용된 데이터이외의 분자데이터에 대해 일반화 능력이 떨어지는 어려움을 겪었다. 이 논문에서 제시한 모델은 사전학습(pretraining)을 수행할 때 자기지도학습(self-supervised training)을 사용하여 부족한 레이블에 의한 문제점을 피할 수 있다. 대규모 분자 데이터셋으로부터 학습된 이 모델은 4가지 다운스트림 데이터셋에 대해 모두 우수한 성능을 보여주어 일반화 성능이 뛰어나며 효과적인 분자표현을 얻을 수 있음을 보인다.