Korean Dependency Parsing Using Various Ensemble Models

Jo, Gyeong-Cheol;Kim, Ju-Wan;Kim, Gyun-Yeop;Park, Seong-Jin;Gang, Sang-U;

한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리) (Annual Conference on Human and Language Technology)

한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
/
Pages.543-545
/
2019
/
2005-3053(pISSN)

한국정보과학회 언어공학연구회 (Human and Language Technology)

다양한 앙상블 알고리즘을 이용한 한국어 의존 구문 분석

Korean Dependency Parsing Using Various Ensemble Models

조경철 (가천대학교, 소프트웨어학과) ;
김주완 (가천대학교, 소프트웨어학과) ;
김균엽 (가천대학교, 소프트웨어학과) ;
박성진 (가천대학교, 소프트웨어학과) ;
강상우 (가천대학교, 소프트웨어학과)

Jo, Gyeong-Cheol (Department of Software, Gachon University) ;
Kim, Ju-Wan (Department of Software, Gachon University) ;
Kim, Gyun-Yeop (Department of Software, Gachon University) ;
Park, Seong-Jin (Department of Software, Gachon University) ;
Gang, Sang-U (Department of Software, Gachon University)

발행 : 2019.10.10

PDF

PDF 다운로드

⟨ 이전 논문 다음 논문 ⟩

초록

본 논문은 최신 한국어 의존 구문 분석 모델(Korean dependency parsing model)들과 다양한 앙상블 모델(ensemble model)들을 결합하여 그 성능을 분석한다. 단어 표현은 미리 학습된 워드 임베딩 모델(word embedding model)과 ELMo(Embedding from Language Model), Bert(Bidirectional Encoder Representations from Transformer) 그리고 다양한 추가 자질들을 사용한다. 또한 사용된 의존 구문 분석 모델로는 Stack Pointer Network Model, Deep Biaffine Attention Parser와 Left to Right Pointer Parser를 이용한다. 최종적으로 각 모델의 분석 결과를 앙상블 모델인 Bagging 기법과 XGBoost(Extreme Gradient Boosting) 이용하여 최적의 모델을 제안한다.

키워드

과제정보

이 연구는 2019년도 정부(과학기술정보통신부)의 재원으로 한국연구재단의 지원을 받아 수행된 기초연구사업임(No. NRF-2019R1C1C1006299)

한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리) (Annual Conference on Human and Language Technology)

다양한 앙상블 알고리즘을 이용한 한국어 의존 구문 분석

Korean Dependency Parsing Using Various Ensemble Models

초록

키워드

과제정보

자세히 찾기