Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))
- 2018.10a
- /
- Pages.181-184
- /
- 2018
- /
- 2005-3053(pISSN)
Concept and Application of Deep learning-based Automatic Spacing
문장 정보를 고려한 딥 러닝 기반 자동 띄어쓰기의 개념 및 활용
- Cho, Won Ik (Seoul National University, Department of Electrical and Computer Engineering and INMC) ;
- Cheon, Sung Jun (Seoul National University, Department of Electrical and Computer Engineering and INMC) ;
- Kim, Ji Won (Seoul National University, Department of Linguistics) ;
- Kim, Nam Soo (Seoul National University, Department of Electrical and Computer Engineering and INMC)
- 조원익 (서울대학교, 전기정보공학부 뉴미디어통신공동연구소) ;
- 천성준 (서울대학교, 전기정보공학부 뉴미디어통신공동연구소) ;
- 김지원 (서울대학교 언어학과) ;
- 김남수 (서울대학교, 전기정보공학부 뉴미디어통신공동연구소)
- Published : 2018.10.12
Abstract
본 논문에서는, 한국어 활용에 있어 중의성을 해소해 주고 심미적 효과를 줄 수 있는 개념인 띄어쓰기를, 교정이 아닌 입력 보조의 관점에서 접근한다. 사람들에게 자판을 통한 텍스트 입력이 언어활동의 보편적인 수단이 되면서 가독성을 포기하고서라도 편의를 택하는 경우가 증가하게 되었는데, 본 연구에서는 그러한 문장들의 전달력을 높여 줄 수 있는 자동 띄어쓰기 및 그 활용 방안을 제시한다. 전체 시스템은 dense word embedding과 딥 러닝 아키텍쳐를 활용하여 훈련되었으며, 사용된 코퍼스는 비표준어 및 비정형을 포함하는 대화체 문장으로 구성되어 user-generate된 대화형 문장 입력의 처리에 적합하다.