DOI QR코드

DOI QR Code

HR-평가 문장 Multi-classification 및 Unlabeled data 를 활용한 Post-training 효과 분석

HR-evaluation sentence multi-classification and Analysis post-training effect using unlabeled data

  • 최철 (고려대학교 컴퓨터정보통신대학원) ;
  • 임희석 (고려대학교 컴퓨터정보통신대학원)
  • Choi, Cheol (Graduate School of Computer & Information Technology, Korea University) ;
  • Lim, HeuiSeok (Graduate School of Computer & Information Technology, Korea University)
  • 발행 : 2022.05.17

초록

본 연구는 도메인 특성이 강한 HR 평가문장을 BERT PLM 모델을통해 4 가지 class 로 구분하는 문제를 다룬다. 다양한 PLM 모델 적용과 training data 수에 따른 모델 성능 비교를 통해 특정 도메인에 언어모델을 적용하기 위해서 필요한 기준을 확인하였다. 또한 Unlabeled 된 HR 분야 corpus 를 활용하여 BERT 모델을 post-training 한 HR-BERT 가 PLM 분석모델 정확도 향상에 미치는 결과를 탐구한다. 위와 같은 연구를 통해 HR 이 가지고 있는 가장 큰 text data 에 대한 활용 기반을 마련하고, 특수한 도메인 분야에 PLM 을 적용하기 위한 가이드를 제시하고자 한다

키워드