한국정보과학회:학술대회논문집 (Proceedings of the Korean Information Science Society Conference)
- 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
- /
- Pages.490-492
- /
- 2003
- /
- 1598-5164(pISSN)
중국어 정보검색을 위한 확장된 바이그램 분할기법
An Extended Bigram Segmentation Method for Chinese Information Retrieval
- Jin, Yun (Dept. of Computer Science, Chungnam National University) ;
- Kang, Ji-Hoon (Dept. of Computer Science, Chungnam National University) ;
- Myaeng, Sung-Hyon (School of Engineering, Information and Communications University)
- 발행 : 2003.10.01
초록
중국어 문장은 영어와 한국어와 달리 단어에 대한 명확한 한계가 없기 때문에 중국어 정보검색 시스템에서는 중국어 문장에 대한 색인 작업을 각각의 글자를 기본단위로 자르는 방법을 사용하거나 또는 단어의 한계에 관한 정보가 이미 제공된 단어 사전을 이용하여 색인하는 방법을 사용하고 있다. 하지만 이 두 가지 방법은 모두 장단점이 있다. 본 논문에서는 이 두 가지 방법의 장점을 취하고 단점을 보안하는 방법으로 확장한 바이그램 분할기법을 제안하려 한다. 이 방법은 실용성이 있으며, 검색성능 향상을 도모하였다.
키워드