Methodologies for Constructing KorLex 1.5 (a Korean WordNet) and its Semantic Structure

한국어 어휘의미망 KorLex 1.5의 구축방법론과 정보구조

  • Yoon, Aesun (Dept. of French, Pusan National University) ;
  • Kwon, Hyuk-Chul (Dept of Computer Science, Pusan National University) ;
  • Lee, Eun-Ryoung (Interdisciplinary Program for Cognitive Science, Humanities Institute, Pusan National University) ;
  • Hwang, Soon-Hee (Interdisciplinary Program for Cognitive Science, Humanities Institute, Pusan National University)
  • 윤애선 (부산대학교 불어불문학과) ;
  • 권혁철 (부산대학교 정보컴퓨터 공학부) ;
  • 이은령 (부산대학교 인지과학협동과정, 인문학연구소) ;
  • 황순희 (부산대학교 인지과학협동과정, 인문학연구소)
  • Published : 2008.10.10

Abstract

1980년대 중반부터 지난 20여 년간 구축해 온 영어 워드넷(PWN)은 인간의 심상어휘집을 재현하려는 목적으로 개발되기 시작하였으나, 그 활용 가능성에 주목한 것은 자연언어처리와 지식공학 분야다. 컴퓨터 매개 의사소통(CMC), 인간-컴퓨터 상호작용(HCI)에서 인간 언어를 자연스럽게 사용하여 필요한 정보를 획득하기 위해서는 의미와 지식의 처리가 필수적인데, 그 해결의 실마리를 어휘라는 실체를 가진 언어단위에서 찾을 수 있기 때문이다. 이후 전 세계적으로 약 50개 언어의 어휘의미망이 PWN을 참조모델로 구축되어 다국어처리의 기반을 제공할 뿐 아니라, 시맨틱 웹 이후 더욱 주목 받고 다양한 방식으로 활용되고 있다. 본고는 PWN을 참조 모델로 2004년부터 2007년까지 구축한 한국어 어휘의미망 KorLex 1.5를 소개하는 데 있다. 현재 KorLex은 명사, 동사, 형용사, 부사 및 분류사로 구성되며, 약 13만 개의 신셋과 약 15만 개의 어의를 포함하고 있다.

Keywords