• Title/Summary/Keyword: 의사결정나무추론

Search Result 19, Processing Time 0.029 seconds

실시간 CRM을 위한 분류 기법과 연관성 규칙의 통합적 활용;신용카드 고객 이탈 예측에 활용

  • Lee, Ji-Yeong;Kim, Jong-U
    • 한국경영정보학회:학술대회논문집
    • /
    • 2007.06a
    • /
    • pp.135-140
    • /
    • 2007
  • 이탈 고객 예측은 데이터 마이닝에서 다루는 주요한 문제 중에 하나이다. 이탈 고객 예측은 일종의 분류(classification) 문제로 의사결정나무추론, 로지스틱 회귀분석, 인공신경망 등의 기법이 많이 활용되어왔다. 일반적으로 이탈 고객 예측을 위한 모델은 고객의 인구통계학적 정보와 계약이나 거래 정보를 입력변수로 하여 이탈 여부를 목표변수로 보는 형태로 분류 모델을 생성하게 된다. 본 연구에서는 고객과의 지속적인 접촉으로 발생되는 추가적인 사건 정보를 활용하여 연관성 규칙을 생성하고 이 결과를 기존의 방식으로 생성된 분류 모델과 결합하는 이탈 고객 예측 방법을 제시한다. 제시한 방법의 유용성을 확인하기 위해서 특정 국내 신용카드사의 실제 데이터를 활용하여 실험을 수행하였다. 실험 결과 제시된 방법이 기존의 전통적인 분류 모델에 비해서 향상된 성능을 보이는 것을 확인할 수 있었다. 제시된 예측 방법의 장점은 기존의 이탈 예측을 위한 입력 변수들 이외에 고객과 회사간의 접촉을 통해서 생성된 동적 정보들을 통합적으로 활용하여 예측 정확도를 높이고 실시간으로 이탈 확률을 갱신할 수 있다는 점이다.

  • PDF

사례기반 추론에 의한 반도체 패키징 공장의 Cycle-time 예측 모형 개발

  • Kim, Gyu-Jin;Seo, Yong-Mu
    • 한국경영정보학회:학술대회논문집
    • /
    • 2007.11a
    • /
    • pp.611-616
    • /
    • 2007
  • 반도체 패키징 공장에서 싸이클타임(Cycle-time)을 정확히 예측하는 것은 납기일 준수를 통해 고객만족도를 향상시킬 수 있고, 보다 효율적인 스케쥴링을 가능하게 하여 공장 가동률을 높일 수 있게 한다. 그러나 반도체 패키징은 제품 종류가 다양하고 제품마다 특화된 기술을 사용할 뿐만 아니라 공정 순서나, WIP에 따라 싸이클타임이 크게 영향을 받아 그 정확한 예측이 매우 어렵기 때문에 현장 전문가의 판단에 의존하는 경우가 많았다. Fab공정의 경우 전문가를 도와 좀 더 정확한 예측에 도움을 주기 위해 그 동안 전통적 통계 기법 및 시뮬레이션에 기반한 의사결정 모형이 많이 연구되었는데, 최근에는 기계학습 및 인공지능 기법을 사용한 연구가 눈에 띄고 있으며 기존의 방법보다 우수한 성능을 보여 주는 것으로 나타났다. 하지만 아직 기계학습 및 인공지능을 이용한 충분한 연구가 진행되지 못하고 있는 실정이다. 따라서 본 연구에서는 사례기반 추론을 사용하여 패키징 공정의 싸이클타임을 예측하고자 하였으며 그 성능을 인공신경망 모형, 의사결정나무 모형, 그리고 해당 분야 전문가의 예측치와 비교하였다. 실험결과에 따르면 사례기반추론 모형이 가장 뛰어난 성능을 보이는 것으로 나타났다.

  • PDF

Design and Evaluation of ANFIS-based Classification Model (ANFIS 기반 분류모형의 설계 및 성능평가)

  • Song, Hee-Seok;Kim, Jae-Kyeong
    • Journal of Intelligence and Information Systems
    • /
    • v.15 no.3
    • /
    • pp.151-165
    • /
    • 2009
  • Fuzzy neural network is an integrated model of artificial neural network and fuzzy system and it has been successfully applied in control and forecasting area. Recently ANFIS(Adaptive Network-based Fuzzy Inference System) has been noticed widely among various fuzzy neural network models because of its outstanding accuracy of control and forecasting area. We design a new classification model based on ANFIS and evaluate it in terms of classification accuracy. We identified ANFIS-based classification model has higher classification accuracy compared to existing classification model, C5.0 decision tree model by comparing their experimental results.

  • PDF

Factors affecting success and failure of Internet company business model using inductive learning based on ID3 algorithm (ID3 알고리즘 기반의 귀납적 추론을 활용한 인터넷 기업 비즈니스 모델의 성공과 실패에 영향을 미치는 요인에 관한 연구)

  • Jin, Dong-su
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.23 no.2
    • /
    • pp.111-116
    • /
    • 2019
  • New technologies such as the IoT, Big Data, and Artificial Intelligence, starting from the Web, mobile, and smart device, enable new business models that did not exist before, and various types of Internet companies based on these business models has been emerged. In this research, we examine the factors that influence the success and failure of Internet companies. To do this, we review the recent studies on business model and examine the variables affecting the success of Internet companies in terms of network effect, user interface, cooperation with actors, creating value for users. Using the five derived variables, we will select 14 Internet companies that succeeded and failed in seven commercial business model categories. We derive decision tree by applying inductive learning based on ID3 algorithm to the analysis result and derive rules that affect success and failure based on derived decision tree. With these rules, we want to present the strategic implications for actors to succeed in Internet companies.

Performance Improvement of data Mining by Input Data Discrimination (입력자료 판별에 의한 데이터 마이닝의 성능개선)

  • 이재식;이진천
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2000.04a
    • /
    • pp.293-303
    • /
    • 2000
  • 데이터 마이닝의 수행 예측 오차를 줄이기 위한 방법으로 하나의 문제를 여러 기법들을 결합하여 해결하고 있다. 본 연구에서는 새로운 결합 모델을 제시하고 이를 통해 예측 오차를 감소시킬 수 있는 가능성을 제시한다. 제시된 결합모델의 성능을 검증하기 위해서 국내 자동차보험 회사의 고객데이터를 바탕으로 고객이탈 예측문제를 다루었다. 결합모델의 예측결과를 의사결정나무, 사례기반추론 그리고 인공신경망 중 하나의 기법만을 사용하여 예측한 결과와 비교 평가하였다. 평가 결과, 결합 모델의 예측 적중률이 개별 기법의 예측 적중률보다 우수했다.

  • PDF

PAC-Learning a Decision Tree with Pruning (의사결정나무의 현실적인 상황에서의 팩(PAC) 추론 방법)

  • Kim, Hyeon-Su
    • Asia pacific journal of information systems
    • /
    • v.3 no.1
    • /
    • pp.155-189
    • /
    • 1993
  • Empirical studies have shown that the performance of decision tree induction usually improves when the trees are pruned. Whether these results hold in general and to what extent pruning improves the accuracy of a concept have not been investigated theoretically. This paper provides a theoretical study of pruning. We focus on a particular type of pruning and determine a bound on the error due to pruning. This is combined with PAC (Probably Approximately Correct) Learning theory to determine a sample size sufficient to guarantee a probabilistic bound on the concept error. We also discuss additional pruning rules and give an analysis for the pruning error.

  • PDF

SOHO Bankruptcy Prediction Using Modified Bagging Predictors (Modified Bagging Predictors를 이용한 SOHO 부도 예측)

  • Kim Seung-Hyeok;Kim Jong-U
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2006.06a
    • /
    • pp.176-182
    • /
    • 2006
  • 본 연구에서는 기존 Bagging Predictors에 수정을 가한 Modified Bagging Predictors를 이용하여 SOHO 에 대한 부도예측 모델을 제시한다. 대기업 및 중소기업에 대한 기압부도예측 모델에 대한 많은 선행 연구가 있어왔지만 SOHO 만의 기업부도예측 모델에 관한 연구는 미비한 상태이다. 금융기관들의 대출심사시 대기업 및 중소기업과는 달리 SOHO에 대한 대출심사는 이직은 체계화되지 못한 채 신용정보점수 등의 단편적인 요소를 사용하고 있는 것에 현실이고 이에 따라 잘못된 대출로 안한 금융기관의 부실화를 초래할 위험성이 크다. 본 연구에서는 실제 국내은행의 SOHO 데이터 집합이 사용되었다. 먼저 기업부도 예측 모델에서 우수하다고 연구되어진 인공신경망과 의사결정나무 추론 기법을 적용하여 보았지만 만족할 만한 성과를 이쓸어내지 못하여, 기존 기업부도예측 모델연구에서 적용이 미비하였던 Bagging Predictors와 이를 개선한 Modified Bagging Predictors를 제시하고 이를 적용하여 보았다. 연구결과,; SOHO 부도예측에 있어서 본 연구에서 제시한 Modified Bagging Predictors 가 인공신경망과 Bagging Predictors등의 기존 기법에 비해서 성과가 향상됨을 알 수 있었다. 제시된 Modified Bagging Predictors의 유용성을 확인하기 위해서 추가적으로 대수의 공개 데이터 집합을 활용하여 성능을 비교한 결과 Modified Bagging Predictors 가 기존의 Bagging Predictors 에 비해 일관적으로 성과가 향상됨을 알 수 있었다.

  • PDF

A Comparative Study on the Accuracy of Important Statistical Prediction Techniques for Marketing Data (마케팅 데이터를 대상으로 중요 통계 예측 기법의 정확성에 대한 비교 연구)

  • Cho, Min-Ho
    • The Journal of the Korea institute of electronic communication sciences
    • /
    • v.14 no.4
    • /
    • pp.775-780
    • /
    • 2019
  • Techniques for predicting the future can be categorized into statistics-based and deep-run-based techniques. Among them, statistic-based techniques are widely used because simple and highly accurate. However, working-level officials have difficulty using many analytical techniques correctly. In this study, we compared the accuracy of prediction by applying multinomial logistic regression, decision tree, random forest, support vector machine, and Bayesian inference to marketing related data. The same marketing data was used, and analysis was conducted by using R. The prediction results of various techniques reflecting the data characteristics of the marketing field will be a good reference for practitioners.

A Case-Specific Feature Weighting Method in Case-Based Reasoning (사례기반 추론에서 사례별 속성 가중치 부여 방법)

  • 이재식;전용준
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 1999.10a
    • /
    • pp.391-398
    • /
    • 1999
  • 사례기반 추론을 포함한 Lazy Learning 방법들은 인공신경망이나 의사결정 나무와 같은 Eager Learning 방법들과 비교하여 여러 가지 상대적인 장점을 가지고 있다. 그러나 Lazy Learning 방법은 역시 상대적인 단점들도 가지고 있다. 첫째로 사례를 저장하기 위하여 많은 공간이 필요하며, 둘째로 문제해결 시점에서 시간이 많이 소요된다. 그러나 보다 심각한 문제점은 사례가 관련성이 낮은 속성들을 많이 가지고 있는 경우에 Lazy Learning 방법은 사례를 비교할 때에 혼란을 겪을 수 있다는 점이며, 이로 인하여 분류 정확도가 크게 저하될 수 있다. 이러한 문제점을 해결하기 위하여 Lazy Learning 방법을 위한 속성 가중치 부여 방법들이 많이 연구되어 왔다. 그러나 기존에 발표된 대부분의 방법들이 속성 가중치의 유효 범위를 전역적으로 하는 것들이었다. 이에 본 연구에서는 새로운 지역적 속성 가중치 부여 방법을 제안한다. 본 연구에서 제안하는 속성 가중치 부여 방법(CBDFW : 사례기반 동적 속성 가중치 부여)은 사례별로 속성 가중치를 다르게 부여하는 방법으로서 사례기반 추론의 원리를 속성 가중치 부여 과정에 적용하는 것이다. CBDFW의 장점으로서 (1) 수행 방법이 간단하며, (2) 논리적인 처리 비용이 기존 방법들에 비해 낮으며, (3) 신축적이라는 점을 들 수 있다. 본 연구에서는 신용 평가 문제에 CBDFW의 적용을 시도하였고, 다른 기법들과 비교에서 비교적 우수한 결과를 얻었다.

  • PDF

Decision Tree Induction with Imbalanced Data Set: A Case of Health Insurance Bill Audit in a General Hospital (불균형 데이터 집합에서의 의사결정나무 추론: 종합 병원의 건강 보험료 청구 심사 사례)

  • Hur, Joon;Kim, Jong-Woo
    • Information Systems Review
    • /
    • v.9 no.1
    • /
    • pp.45-65
    • /
    • 2007
  • In medical industry, health insurance bill audit is unique and essential process in general hospitals. The health insurance bill audit process is very important because not only for hospital's profit but also hospital's reputation. Particularly, at the large general hospitals many related workers including analysts, nurses, and etc. have engaged in the health insurance bill audit process. This paper introduces a case of health insurance bill audit for finding reducible health insurance bill cases using decision tree induction techniques at a large general hospital in Korea. When supervised learning methods had been tried to be applied, one of major problems was data imbalance problem in the health insurance bill audit data. In other words, there were many normal(passing) cases and relatively small number of reduction cases in a bill audit dataset. To resolve the problem, in this study, well-known methods for imbalanced data sets including over sampling of rare cases, under sampling of major cases, and adjusting the misclassification cost are combined in several ways to find appropriate decision trees that satisfy required conditions in health insurance bill audit situation.