KorCAT: Cohesion Analysis Tool for Korean Text

한국어 텍스트 결속성 측정 도구: KorCAT

  • Dong-Hyun Kim (Department of Computer Science and Engineering, Inha University) ;
  • Hyun-Jung Kim (Department of Korean Language Education, Inha University) ;
  • Chul-hui Kim (Department of Korean Language Education, Inha University) ;
  • Young-Duk Seo (Department of Computer Science and Engineering, Inha University)
  • 김동현 (인하대학교 컴퓨터공학과) ;
  • 김현정 (인하대학교 국어교육과) ;
  • 김철희 (인하대학교 국어교육과) ;
  • 서영덕 (인하대학교 컴퓨터공학과)
  • Published : 2022.10.18

Abstract

결속성은 텍스트의 의미 관계 분석에서 주요하게 고려되는 요인 중 하나이다. 결속성이 높을 수록 텍스트 내 언어적 의미 관계가 긴밀한 것으로 볼 수 있기 때문이다. 사람에 의한 텍스트 결속성 분석은 주관이 개입되는 문제를 배제할 수 없는데, 영어에는 TAACO라고 불리는 결속성 자동 측정 도구가 있어 다양한 지표들로 텍스트의 결속성을 측정하고 있다. 그러나 한국어에는 이와 같은 텍스트 결속성 자동 측정 도구가 거의 없으며, 관련 연구도 상당히 부족한 실정이다. 따라서 본 논문에서는 한국어 텍스트의 의미 관계 분석을 위한 결속성 지표를 정의하고, 한국어의 특성에 맞는 결속성 측정 도구인 KorCAT을 제안한다.

Keywords

Acknowledgement

이 논문은 2022년도 정부(과학기술정보통신부)의 재원으로 정보통신기획평가원의 지원(No.2022-0-00448, 인간처럼 회상이 가능한 인공 신경망 지속학습 플랫폼 개발, No.RS-2022-00155915, 인공지능융합혁신인재양성(인하대학교))과 한국연구재단의 지원을 받아 수행된 연구임 (NRF-2022R1C1C1012408, 우수신진연구).