Annual Conference of KIPS (한국정보처리학회:학술대회논문집)
- 2015.10a
- /
- Pages.1230-1232
- /
- 2015
- /
- 2005-0011(pISSN)
- /
- 2671-7298(eISSN)
DOI QR Code
A update-efficient disk-based inverted index structure
효율적인 갱신이 가능한 디스크 기반 역색인 구조
- Park, Eun Ju (Dept. of Computer Science, Sookmyung Women's University) ;
- Lee, Ki Yong (Dept. of Computer Science, Sookmyung Women's University)
- Published : 2015.10.28
Abstract
소셜 네트워크 서비스(SNS)로 인해 스트리밍 환경에서 발생되는 데이터들이 급격하게 증가하고 있다. 이러한 많은 데이터 사이에서 특정 키워드를 담고 있는 문서를 찾고자 한다. 문서를 찾는 대표적인 색인인 역색인을 사용한다. 그러나 데이터가 증가하게 되면 데이터를 참조하는 색인의 크기 또한 증가한다. 결국 데이터뿐만 아니라 색인 또한 디스크에 저장되어야 한다. 본 논문에서는 역색인을 지수적으로 증가시키면서 관리하는 방법을 다룬다. 새로운 문서는 가장 작은 역색인에 저장이 되고, 후에 더 큰 역색인으로 옮겨지게 된다. 매번 전체 역색인을 읽지 않고 작은 역색인을 갱신함으로서 갱신부하를 줄이게 된다.
Keywords