• 제목/요약/키워드: 데이터마이닝 의사결정나무 분석

검색결과 109건 처리시간 0.023초

연속형 반응변수를 위한 데이터마이닝 방법 성능 향상 연구 (A study for improving data mining methods for continuous response variables)

  • 최진수;이석형;조형준
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권5호
    • /
    • pp.917-926
    • /
    • 2010
  • 배깅과 부스팅의 기법은 예측력을 향상 시킨다고 알려져 있다. 이는 비교 실험을 통하여 성능이 검증 되었는데, 목표변수가 범주형인 경우에 특정 의사결정나무 알고리즘인 회귀분류나무만 주로 고려되었다. 본 논문에서는 의사결정나무 외에도 다른 데이터마이닝 방법도 고려하여 목표변수가 연속형인 경우에 배깅과 부스팅 기법의 성능 검증을 위한 비교 실험을 실시하였다. 구체적으로, 데이터마이닝 알고리즘 기법인 선형회귀, 의사결정나무, 신경망에 배깅 및 부스팅 앙상블 기법을 결합하여 8개의 데이터를 비교 분석하였다. 실험 결과로 연속형 자료에 대한 여러 데이터마이닝 알고리즘에도 배깅과 부스팅의 기법이 성능 향상에 도움이 되는 것으로 확인되었다.

의사결정나무 기법을 활용한 백화점의 고객세분화 사례연구 (A Case Study on segmentation of Department Store using Decision Tree Analysis)

  • 채경희;김상철
    • 유통과학연구
    • /
    • 제8권1호
    • /
    • pp.13-19
    • /
    • 2010
  • 기업에서는 마케팅 비용대비 효과를 극대화하기 위하여, 고객을 세분한 후, 목표고객을 선별하여 해당 고객에 적절한 캠페인을 실시하고 있다. 특히 고객세분화 방법으로 통계 모형을 비롯하여 데이터마이닝 방법 등 다양한 방법들이 활용되고 있다. 그 중에서도 데이터마이닝은 1990년대 초에 도입되어 다양한 경영 문제를 해결하고 있다. 본 논문에서는 이와 같은 고객세분화에 활용되고 있는 데이터마이닝 방법에 대해 살펴본 후, 실제 백화점 사례를 기반으로 고객세분화에 주로 활용되고 있는 의사결정나무 분석 방법의 효과 및 장단점에 대해 논의해보고자 한다.

  • PDF

의사결정나무를 이용한 개인휴대통신 해지자 분석

  • 최종후;서두성
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회 1998년도 추계학술대회 논문집
    • /
    • pp.377-380
    • /
    • 1998
  • 본 논문에서는 최근 데이터마이닝의 도구로 활발하게 소개되고 있는 의사결정나무 분석을 이용하여 개인휴대통신의 해지자 분석을 실시한다. 또한 로지스틱 회귀모형을 이용하여 가입고객의 해지 가능성에 대한 점수화를 시도한다.

  • PDF

주변조건부 변수를 이용한 의사결정나무모형 생성에 관한 연구 (A study on decision tree creation using marginally conditional variables)

  • 조광현;박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권2호
    • /
    • pp.299-307
    • /
    • 2012
  • 데이터마이닝은 주어진 데이터베이스에서 항목간의 흥미로운 관계를 찾아내는 기법으로서 의사결정나무는 데이터마이닝의 대표적인 알고리즘이라고 할 수 있다. 의사결정나무는 관심대상이 되는 집단을 몇 개의 소집단으로 분류하거나 예측을 수행하는 방법이다. 일반적으로 연구자가 의사결정나무 모형을 생성 할 때 모형 생성의 기준 및 입력 변수의 수에 따라 복잡한 모형이 생성되기도 한다. 특히 의사결정나무 모형에서 입력 변수의 수가 많을 경우 생성된 모형은 복잡한 형태가 될 수 있고, 모형 분석이 어려울 수도 있다. 만일 입력변수에서 주변조건부 변수 (매개변수, 외적변수)가 존재한다면 이 입력변수는 직접적인 관련성이 없는 것으로 판단한다. 이에 본 논문에서는 주변조건부 변수를 고려하여 의사결정나무모형을 생성하는 방법을 제시하고 그 효율성을 파악하기 위하여 실제 자료에 적용하고자 한다.

공공 DB 데이터마이닝 기법을 활용한 국내 청소년 삶의 만족도 분석에 관한 실증연구: 의사결정나무 기법을 중심으로 (Analysis of Korean Adolescents' Life Satisfaction based on Public Database and Data Mining Techniques: Emphasis on Decision Tree)

  • 조현진;고건우;이건창
    • 디지털융복합연구
    • /
    • 제18권6호
    • /
    • pp.297-309
    • /
    • 2020
  • 본 연구는 국내 공공 DB에 데이터마이닝 기법인 로지스틱 회귀분석과 의사결정나무 분석을 적용하여 국내 청소년의 삶의 만족도 증진에 관한 의미 있는 의사결정 규칙을 추출하는 과정을 분석한다. 분석을 위하여 한국아동·청소년패널조사(KYCPS) 중에서 중1 패널데이터의 4~6차연도 자료인 고등학생 학년별 자료를 활용하였다. 로지스틱 회귀분석으로 추출된 영향요인은 1학년은 전체 성적 만족도, 주의집중 문제, 우울, 자아 탄력성, 애정, 과잉간섭, 학습활동, 교사관계, 2학년은 가정의 경제 수준, 건강상태, 전체 성적 만족도, 신뢰, 소외, 학습활동, 학교규칙, 교우관계, 교사 관계, 3학년은 가정의 경제 수준, 전체 성적 만족도, 우울, 자아 탄력성, 애정, 학대, 학교규칙, 교사 관계로 나타났다. 의사결정나무 기법을 적용한 결과 국내 고등학생의 삶의 만족도는 개인의 정서 문제, 학교성적, 가정의 경제적 환경, 학교적응 등에 의하여 복합적으로 영향을 받는 것으로 파악되었다.

데이터마이닝을 이용한 국민연금 부정수급 예측모형 개발 - 손해배상금 불성실 신고를 대상으로 - (An Application of Data-Mining Tool in Fraud Pension Payment Prediction)

  • 차경엽
    • Communications for Statistical Applications and Methods
    • /
    • 제17권1호
    • /
    • pp.1-8
    • /
    • 2010
  • 최근 사회복지분야에서 부정수급, 횡령 등이 빈번히 발생함에 따라 비리를 방지하기 위한 체계적인 관리 방안이 요구되고 있다. 데이터마이닝은 다수의 이해관계자와 많은 예산이 투입되는 사업을 관리하는데 효과적인 방법이다. 본 연구는 국민연금의 부정 수급자 관리방안으로 데이터마이닝을 이용한 예측모형을 개발하였다. 분석결과, 수급자의 급여, 연금 가입, 사고내역 정보가 부정수급의 특성 요인으로 나타났으며 이를 의사결정나무 모형, 로지스틱 회귀모형, 인공신경망 모형에 적용한 결과 의사결정나무 모형의 예측력이 가장 우수한 것으로 분석되었다.

말콤볼드리지 모델에 근거한 경영진의 의사결정 패턴 분석

  • 신완선;유진성
    • 한국품질경영학회:학술대회논문집
    • /
    • 한국품질경영학회 2006년도 추계 학술대회
    • /
    • pp.119-123
    • /
    • 2006
  • 본 연구는 말콤볼드리지(ME) 모델에 근거하여 경영진의 의사결정을 분석하는 것이다. 경영진의 회의록 분석을 통해서 경영방향을 분석하는 방법과 결과 활용을 논한다. 데이터마이닝의 기법인 의사결정나무를 이용하여 의사결정의 패턴을 찾는 방법도 소개한다.

  • PDF

매개 변수를 이용한 의사결정나무 생성에 관한 연구 (A study on decision tree creation using intervening variable)

  • 조광현;박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권4호
    • /
    • pp.671-678
    • /
    • 2011
  • 데이터마이닝은 방대한 양의 데이터 속에서 쉽게 드러나지 않는 유용한 정보를 찾아내는 기법으로서 의사결정나무, 연관 규칙, 군집분석, 신경망 분석 등의 기법이 있으며, 이중 의사결정나무 알고리즘은 의사결정 규칙을 도표화하여 관심대상이 되는 집단을 몇 개의 소집단으로 분류하거나 예측을 수행하는 방법으로서 고객세분화, 고객 분류, 문제 예측 등의 여러 분야에서 유용하게 활용되고 있다. 일반적으로 의사결정나무의 모형 생성 시, 모형 생성의 기준 및 입력 변수의 수에 따라 복잡한 모형이 생성되기도 하며 특히 입력 변수의 수가 많을 경우 종종 모형 생성 및 해석에 있어 어려움을 격기도 한다. 이에 본 논문에서는 의사결정나무 생성 시, 입력 변수에 대한 매개 관계를 파악하여 나무 생성에 불필요한 입력 변수를 제거하는 방법을 제시하고 그 효율성을 파악하기 위하여 실제 자료에 적용하고자 한다.

데이터마이닝을 활용한 이탈고객 스코어링 모델 개발

  • 한상태;이성건;강현철;유동균
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2001년도 추계학술발표회 논문집
    • /
    • pp.155-161
    • /
    • 2001
  • 최근의 많은 기업에서는 방대한 고객 데이터베이스를 활용하여 자사의 경쟁력을 갖추는 방안으로써 데이터마이닝을 선택하고 있다. 본 연구에서는 데이터마이닝을 활용해 손해보험사의 데이터베이스를 분석하여 자동차보험 고객의 이탈을 방지하는 이탈고객 스코어링 모델을 개발하였다. 분석방법론으로는 의사결정나무와 로지스틱 회귀분석을 사용하였으며 기업에서의 데이터마이닝을 위한 일련의 과정을 상세히 기술하고 기업의 데이터베이스가 가지고 있는 문제점을 지적하였다.

  • PDF

데이터마이닝 기법을 활용한 고혈압 관리를 위한 의사결정지원시스템의 개발 (development of Decision Support System for the Management of hypertension using Datamining Technology)

  • 호승희;채영문;조승연;최동훈;송용욱;박충식;조경원;송지원
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2000년도 춘계정기학술대회 e-Business를 위한 지능형 정보기술 / 한국지능정보시스템학회
    • /
    • pp.271-282
    • /
    • 2000
  • 본 연구의 목적은 데이터마이닝 기법을 임상적으로 중요한 위치를 차지하고 있는 고혈압 환자의 특성과 치료에 따른 예후를 예측할 수 있는 지식을 발굴하고 이의 임상적용의 타당성을 검증하여 의사결정지원시스템을 개발하고 이의 유용성을 평가하는데 있다. 이에 연세대학교 의과대학 부속 세브란스 병원의 환자를 대상으로 로지스틱 회귀분석을 이용하여 혈압조절상의 위험요인의 규명하고, 의사결정나무분석을 통해 치료약제별 혈압조절군과 비조절군의 특성을 도출하고 각 대상군을 결정짓는 규칙을 생성하였으며, 이를 활용한 의사결정지원시스템의 개발 및c 평가를 시행하였다. 그 결과 기존 임상이론만을 활용한 시스템의 처방에 의한 혈압조절군보다 데이터마이닝 기법을 활용한 시스템의 처방에 의한 혈압조절군의 비율이 전체적으로 더 높게 나타남을 알 수 있었다. 본 연구의 결과는 우리나라 현실에 부합되는 고혈압 진료지침을 개발하고 적용, 평가하는데 기여할 수 있을 것으로 판단되며, 이와 같은 의사결정지원 시스템을 운영을 통해 실제 임상 진료에 적용해 봄으로써 그 효과와 실증적 가치를 창출할 수 있을 것이다.

  • PDF