Abstract
Previous researches on mining sequential patterns mainly focused on discovering patterns from the point-based event. Interval events with a time interval occur in the real world that have the start and end point. Existing interval pattern mining methods that discover relationships among interval events based on the Allen operators have some problems. These are that interval patterns having three or more interval events can be interpreted as several meanings. In this paper, we propose the I_TPrefixSpan algorithm, which is an efficient sequence pattern mining technique for removing ambiguity in the Interval Patterns Mining. The proposed algorithm generates event sequences that have no ambiguity. Therefore, the size of generated candidate set can be minimized by searching sequential pattern mining entries that exist only in the event sequence. The performance evaluation shows that the proposed method is more efficient than existing methods.
기존의 순차 패턴 마이닝 기법은 주로 시점 기반 이벤트를 중심으로 연구되었다. 그러나 실생활에는 시작 시점과 종료 시점과 같은 시간 간격을 갖는 인터벌 이벤트가 많이 발생한다. Allen 연산자를 기반으로 두 인터벌 이벤트 사이의 인터벌 패턴을 탐사하는 기존의 기법은 세 개 이상의 인터벌 이벤트 사이에서 인터벌 패턴이 여러 의미로 해석될 수 있는 문제점을 가지고 있다. 이 논문은 인터벌 패턴 탐사에서 모호성 제거를 위한 효율적인 순차 탐색 마이닝 기법인 I_TPrefixSpan 알고리즘을 제안한다. 제안하는 기법은 인터벌 이벤트에 대한 이벤트 시퀀스를 생성함으로써 모호성을 제거하고 이벤트 시퀀스에 존재하는 항목만을 대상으로 순차 탐색함으로써 후보 집합 생성을 최소화 할 수 있다. 성능 평가를 통하여 제안하는 방법이 기존의 방법에 비하여 보다 효율적임을 보인다.