Proceedings of the Korea Information Processing Society Conference (한국정보처리학회:학술대회논문집)
- 2022.05a
- /
- Pages.424-427
- /
- 2022
- /
- 2005-0011(pISSN)
- /
- 2671-7298(eISSN)
DOI QR Code
HR-evaluation sentence multi-classification and Analysis post-training effect using unlabeled data
HR-평가 문장 Multi-classification 및 Unlabeled data 를 활용한 Post-training 효과 분석
- Choi, Cheol (Graduate School of Computer & Information Technology, Korea University) ;
- Lim, HeuiSeok (Graduate School of Computer & Information Technology, Korea University)
- Published : 2022.05.17
Abstract
본 연구는 도메인 특성이 강한 HR 평가문장을 BERT PLM 모델을통해 4 가지 class 로 구분하는 문제를 다룬다. 다양한 PLM 모델 적용과 training data 수에 따른 모델 성능 비교를 통해 특정 도메인에 언어모델을 적용하기 위해서 필요한 기준을 확인하였다. 또한 Unlabeled 된 HR 분야 corpus 를 활용하여 BERT 모델을 post-training 한 HR-BERT 가 PLM 분석모델 정확도 향상에 미치는 결과를 탐구한다. 위와 같은 연구를 통해 HR 이 가지고 있는 가장 큰 text data 에 대한 활용 기반을 마련하고, 특수한 도메인 분야에 PLM 을 적용하기 위한 가이드를 제시하고자 한다
Keywords