단어들을 위한 새로운 메트릭 공간 : 코퍼스그람

A New Metric Space for Words : Corpusgram

  • 이호석 (뉴미디어학과 공과대학 호서대학교) ;
  • 김영택 (컴퓨터신기술연구소 서울대학교)
  • 발행 : 2007.06.25

초록

본 논문은 코퍼스로부터 추출된 단어들을 빈도수에 따라서 적절하게 표시하고 거리를 계산할 수 있는 새로운 메트릭 공간(metric space)에 대하여 논의한다. 일반적인 Cartesian 좌표 평면은 단어와 빈도수를 표시하는데 불편한 점이 있다고 할 수 있다. 본 논문에서는 빈도수에 기반 한 새로운 좌표 평면과 정보 이론에 기반 한 새로운 거리 계산 방법을 제시하여, 코퍼스 기반 언어 처리에 필요한 계산을 더욱 적합하게 할 수 있도록 하였다.

키워드