DOI QR코드

DOI QR Code

Special Word Analysis Algorithm Considering Punctuations

문장부호를 고려한 특수어절 분석 알고리즘

  • 김현주 ((주)데이터스트림즈 기술연구소) ;
  • 이영민 ((주)데이터스트림즈 기술연구소) ;
  • 이영상 ((주)데이터스트림즈 기술연구소) ;
  • 천승태 ((주)데이터스트림즈 기술연구소)
  • Published : 2015.10.28

Abstract

자연언어 분석에 있어서 형태소 분석은 핵심적인 기술로 요구되고 있다. 한글 형태소 분석기는 한글을 분석하기 위한 알고리즘을 활용하여 형태소 단위로 분석한다. 하지만 한글과 문장부호가 혼용된 특수어절은 한글을 분석하는 알고리즘을 통하여 정확한 결과를 도출할 수가 없으므로 별도의 알고리즘이 필요하다. 본 논문에서는 이러한 문제점을 특수어절에 공백을 삽입하여 다시 어절로 분리해 내는 알고리즘을 적용하여 해결하고자 한다.

Keywords