Ko-ATOMIC 2.0: Constructing Commonsense Knowledge Graph in Korean

Ko-ATOMIC 2.0: 한국어 상식 지식 그래프 구축

  • Jaewook Lee (Department of Computer Science and Engineering, Korea University) ;
  • Jaehyung Seo (Department of Computer Science and Engineering, Korea University) ;
  • Dahyun Jung (Department of Computer Science and Engineering, Korea University) ;
  • Chanjun Park (Upstage) ;
  • Imatitikua Aiyanyo (Human-inspired AI Research) ;
  • Heuiseok Lim (Department of Computer Science and Engineering, Korea University)
  • Published : 2023.10.12

Abstract

일반 상식 기반의 지식 그래프는 대규모 코퍼스에 포함되어 있는 일반 상식을 수집하고 구조화하는 지식의 표현 방법이다. 일반 상식 기반의 지식 그래프는 코퍼스 내에 포함되어 있는 다양한 일반 상식의 형태와 관계를 모델링하며, 주로 질의응답 시스템, 상식 추론 등의 자연어처리 하위 작업에 활용할 수 있다. 가장 잘 알려진 일반 상식 기반의 지식 그래프로는 ConceptNet [1], ATOMIC [2]이 있다. 하지만 한국어 기반의 일반 상식 기반의 지식 그래프에 대한 연구가 존재했지만, 자연어처리 태스크에 활용하기에는 충분하지 않다. 본 연구에서는 대규모 언어 모델과 프롬프트의 활용을 통해 한국어 일반 상식 기반의 지식 그래프를 효과적으로 구축하는 방법론을 제시한다. 또한, 제안하는 방법론으로 구축한 지식 그래프와 기존의 한국어 상식 그래프의 품질을 양적, 질적으로 검증한다.

Keywords