Dealing with Compouds in the Construction of a POS Tagged Korean Corpus

형태 분석 말뭉치 구축을 위한 합성어의 처리 방법 - 띄어쓰기를 고려하여 -

  • 조진현 (고려대학교 민족문화연구원 전자텍스트연구소) ;
  • 김일환 (고려대학교 민족문화연구원 전자텍스트연구소) ;
  • 이현희 (고려대학교 민족문화연구원 전자텍스트연구소) ;
  • 이영제 (고려대학교 민족문화연구원 전자텍스트연구소) ;
  • 강범모 (고려대학교 민족문화연구원 전자텍스트연구소)
  • Published : 2002.10.11

Abstract

이 연구는 형태 분석 정보가 부착된 말뭉치를 구축할 때 합성어를 처리하기 위한 방법론을 제시하고, 그 타당성을 검증해 보는 데 있다. 그동안 합성어 처리를 위해서 합성어 선정 기준을 이용하거나 목록을 이용하는 방법이 이용되었는데, 본고에서는 ${\ulcorner}$표준국어대사전${\lrcorner}$의 합성어 목록을 참조하는 것이 적절한 방법이 될 수 있음을 보이고자 한다. 또한 이 방법을 실제 말뭉치 구축에 활용할 경우, 원문의 띄어쓰기 정보가 합성어 처리에서 중요한 요인이 될 수 있다는 점을 지적하고, 이러한 처리가 가지는 한계와 의의에 대해서도 논의하고자 한다.

Keywords