DOI QR코드

DOI QR Code

Efficient Approximate String Searches with Inverted Lists through Search Range Reduction

효율적인 유사문자열 검색을 위한 역리스트 탐색 기법

  • Lee, Eun-Seok (Div. of Electronics & Information Engineering, Chonbuk National University) ;
  • Kim, Jong-Ik (Div. of Computer Science & Engineering, Chonbuk National University)
  • 이은석 (전북대학교 전자정보공학부) ;
  • 김종익 (전북대학교 컴퓨터공학부)
  • Published : 2011.04.30

Abstract

유사문자열 검색이란 문자열 집합에서 주어진 문자열과 유사한 문자열들을 검색하는 것으로 정보검색, 데이터 클리닝 등의 분야에서 활용되고 있다. 효율적인 유사문자열 검색을 위해 사전에 문자열 집합에 대한 역리스트를 구성하고 문자열이 주어졌을 때, 주어진 문자열에 관련된 역리스트를 병합하여 유사도 기준을 만족하는 문자열을 찾는다. 이때 비용을 줄이기 위해 일부의 역리스트만 병합하고 나머지 역리스트에 대해서는 이진탐색을 하는 방법이 있다. 본 논문에서는 역리스트를 이진탐색할 때, 불필요한 탐색구간을 제거하여 역리스트 탐색 비용을 줄이는 방법을 제안한다.

Keywords