Annual Conference of KIPS (한국정보처리학회:학술대회논문집)
- 2004.05a
- /
- Pages.97-100
- /
- 2004
- /
- 2005-0011(pISSN)
- /
- 2671-7298(eISSN)
Text Assocation Pattern Extraction using NFP-tree Algorithm
NFP-Algorithm 알고리즘을 기반한 텍스트 연관 패턴 추출
- Yu, Soo-Kung (Dept of Multimedia, Sookmyung Women's University) ;
- Kim, Kio-chung (Dept of Multimedia, Sookmyung Women's University)
- Published : 2004.05.14
Abstract
인터넷상에서 존재하는 많은 데이터베이스들 중 현실적으로 유용한 정보를 가지고 있는 것은 텍스트 데이타베이스이다. 텍스트 마이닝 기법에서 비구조적인 특징을 가진 텍스트 데이타로부터 유용한 정보를 분석하고 추출하여 연관된 패턴을 탐색하는 과정은 중요한 연구과제이다. 이에 본 논문은 인터넷에서 저장된 텍스트 데이터를 가지고 기존 텍스트 마이닝 기법 중 연관탐색 기법을 적용하여 사용자 중심의 연관된 패턴을 찾아서 의미있는 정보를 얻고자 한다. 탐색하기 위해 먼저 전처리 작업으로 용어의 객체를 추출하고. 추출된 각 객체들은 대용량 데이터에서 시간적, 공간적면에서 효율적인 연관탐색 기법인 NFP-Algorithm(N-most interesting k-itemsets Using FP-tree and FP-Growth)을 적용시켜서 의미있는 정보를 추출했다. 또한 Apriori계 Algorithm, FP-Algorithm, NFP-Algorithm을 비교하여 NFP-Algorithm이 시간적면에서 효율적임을 보여주었다.
Keywords