• 제목/요약/키워드: intervening association rule

검색결과 4건 처리시간 0.019초

연관성규칙에서 의미 없는 규칙의 발견에 관한 연구 (A study on insignificant rules discovery in association rule mining)

  • 조광현;박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권1호
    • /
    • pp.81-88
    • /
    • 2011
  • 연관성규칙은 대용량 데이터베이스에서 각 항목들 간의 관련성을 찾아내는 기법으로 둘 또는 그 이상의 품목들 사이의 지지도, 신뢰도, 향상도를 바탕으로 관련성 여부를 측정한다. 연관성규칙에서는 일반적으로 사용하는 연관성규칙 이외에 연관성규칙의 효율성을 개선하기 위하여 여러 가지 제약기반 연관성규칙의 연구가 활발하게 진행되고 있다. 연관성규칙 생성 시, 종종 많은 규칙들을 발견할 수 있다. 이는 변수들 간에 우연히 관련성이 높게 나타나는 경우가 존재할 수 있고 매개변수에 의하여 직접적인 관련성이 없는 규칙을 발견할 수도 있다. 이에 본 논문에서는 연관성규칙에서 매개변수에 의한 의미 없는 규칙의 발견에 관하여 연구하고자 한다. 본 연구 결과는 연관성 규칙에서 생성된 규칙에 대한 관련성을 보다 정확하게 이해할 수 있도록 함으로써 결과의 해석을 보다 명확하게 할 수 있다.

주변 조건부 변수에 의한 연관성 규칙 생성에 관한 연구 (A study on association rule creation by marginally conditional variables)

  • 조광현;박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권1호
    • /
    • pp.121-129
    • /
    • 2012
  • 연관성규칙은 대용량 데이터베이스에서 각 항목들 간의 관련성을 찾아내는 기법이다. 현재 연관성규칙의 효율성을 개선하기 위하여 많은 연구자들에 의하여 제약 기반 연관성규칙의 연구가 활발하게 진행되고 있다. 연관성규칙 생성 시, 종종 많은 규칙들을 발견할 수 있다. 이들 규칙 중에서 변수들 간에 우연히 관련성이 높게 나타나는 경우가 존재할 수 있고 주변 조건부 변수 (매개변수, 외적변수)에 의하여 직접적인 관련성이 없는 규칙을 발견할 수도 있으며, 그 규칙은 간접적 해석만 가능하므로 의미가 없는 것으로 판단 할 수 있다. 이에 본 연구에서는 연관성 규칙에서 주변 조건부 변수를 고려한 연관성 규칙 생성에 관하여 연구하고자 하며, 이를 실례를 통하여 고찰하였다. 본 연구의 결과를 적용함으로써 연관성 규칙에서 의미 없는 규칙을 찾을 수 있으며, 변수들 간의 관련성을 보다 정확하고 명확하게 이해할 수 있을 것이다.

매개 변수를 이용한 의사결정나무 생성에 관한 연구 (A study on decision tree creation using intervening variable)

  • 조광현;박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권4호
    • /
    • pp.671-678
    • /
    • 2011
  • 데이터마이닝은 방대한 양의 데이터 속에서 쉽게 드러나지 않는 유용한 정보를 찾아내는 기법으로서 의사결정나무, 연관 규칙, 군집분석, 신경망 분석 등의 기법이 있으며, 이중 의사결정나무 알고리즘은 의사결정 규칙을 도표화하여 관심대상이 되는 집단을 몇 개의 소집단으로 분류하거나 예측을 수행하는 방법으로서 고객세분화, 고객 분류, 문제 예측 등의 여러 분야에서 유용하게 활용되고 있다. 일반적으로 의사결정나무의 모형 생성 시, 모형 생성의 기준 및 입력 변수의 수에 따라 복잡한 모형이 생성되기도 하며 특히 입력 변수의 수가 많을 경우 종종 모형 생성 및 해석에 있어 어려움을 격기도 한다. 이에 본 논문에서는 의사결정나무 생성 시, 입력 변수에 대한 매개 관계를 파악하여 나무 생성에 불필요한 입력 변수를 제거하는 방법을 제시하고 그 효율성을 파악하기 위하여 실제 자료에 적용하고자 한다.

사회지표조사에서의 3단계 복합 데이터마이닝의 적용 방안 (A study on 3-step complex data mining in society indicator survey)

  • 조광현;박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권5호
    • /
    • pp.983-992
    • /
    • 2012
  • 사회지표조사는 주민들이 생각하는 사회 상태를 총체적으로 파악할 수 있는 조사로서 다양한 시책 개발에 있어 지역의 여론을 반영할 수 있는 장점이 있다. 사회지표조사는 사회 변화를 알 수 있는 중요한 척도라고 할 수 있으며, 많은 지자체 (서울시, 인천시, 부산시, 울산시, 경상남도 등)에서 많은 예산과 시간을 들여 조사를 실시하고 있다. 그러나 조사에 대한 분석 결과가 기초통계분석 위주로 되어 있어 실제 사회지표조사 자료를 제대로 활용하고 있지 못하고 있는 실정이므로 데이터마이닝 등의 다양한 방법의 적용이 필요하다. 이에 본 논문에서는 사회지표조사의 효율적인 분석을 위하여 새로운 데이터마이닝 방법론을 제시하고자 한다. 본 논문에서는 매개연관성규칙, k-평균 군집분석, 의사결정나무를 순차적으로 적용하는 3단계 복합 데이터마이닝의 적용 방법을 제안하며, 이를 2010년에 조사된 경상남도 사회지표조사 자료에 적용하고자 한다.