Abstract
Most of any existing classification algorithm in data mining area have focused on goals improving efficiency, which is to generate decision tree more rapidly by utilizing just less computing resources. In this paper, we focused on the efficiency as well as effectiveness that is able to generate more meaningful classification rules in application area, which might consist of the ontology automatic generation, business environment and so on. For this, we proposed not only novel function with the weight of support and confidence degree but also analyzed the characteristics of the weighted function in theoretical viewpoint. Furthermore, we proposed novel classification algorithm based on the weighted function and the characteristics. In the result of evaluating the proposed algorithm, we could perceive that the novel algorithm generates more classification rules with significance more rapidly.
데이터마이닝 분야에서 기존의 분류알고리즘들은 보다 적은 컴퓨팅 자원을 이용하여 보다 빨리 분류모형을 생성하고자 하는 효율성 중심의 연구가 주를 이루었다. 본 논문에서는 분류알고리즘의 효율성을 추구할 뿐 아니라 온톨로지 자동생성이나 비즈니스 환경 등 각 응용분야에 적합한 유효한 분류규칙을 보다 많이 생성 할 수 있는 효과성도 동시 에 추구하였다. 이를 위하여 지지도와 신뢰도의 가중치가 적용된 가중치 적용함수를 제안하였고 이 함수의 성질들을 이론적으로 규명하였다. 가중치 적용함수를 사용하면서 새로운 분리 기준 설정 방법을 제안하였고 또한 새로운 분류알고리즘을 제안하였다. 제안한 알고리즘의 성능평가 결과 기존의 우수한 알고리즘보다 보다 많은 유효한 분류규칙들을 보다 신속하게 생성함을 알 수 있었다.