한국어정보학회:학술대회논문집
- 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
- /
- Pages.321-323
- /
- 2017
Bidirectional LSTM CRFs를 이용한 한국어 개체명 인식
Named-entity Recognition Using Bidirectional LSTM CRFs
- Song, Chi-Yun (Department of Software Engineering, Gachon University) ;
- Yang, Sung-Min (Department of Software Engineering, Gachon University) ;
- Kang, Sangwoo (Department of Software Engineering, Gachon University)
- 발행 : 2017.10.13
초록
개체명 인식은 문서 내에서 고유한 의미를 갖는 인명, 기관명, 지명, 시간, 날짜 등을 추출하여 그 종류를 결정하는 것을 의미한다. Bidirectional LSTM CRFs 모델은 연속성을 갖는 데이터에 가장 적합한 RNN기반의 심층 학습모델로서 개체명 인식 연구에 가장 우수한 성능을 보여준다. 본 논문에서는 한국어 개체명 인식을 위하여 Bidirectional LSTM CRFs 모델을 사용하고, 입력 자질로 단어뿐만 아니라 품사 임베딩 모델과, 개체명 사전을 활용하여 입력 자질을 구성한다. 또한 입력 자질에 대한 벡터의 크기를 최적화 하여 기본 모델보다 성능이 향상되었음을 증명하였다.