• 제목/요약/키워드: Decision-Tree-Model

검색결과 731건 처리시간 0.026초

의사결정나무기법을 이용한 노인장기요양보험 등급결정모형 개발 (A Determining System for the Category of Need in Long-Term Care Insurance System using Decision Tree Model)

  • 한은정;곽민정;강임옥
    • 응용통계연구
    • /
    • 제24권1호
    • /
    • pp.145-159
    • /
    • 2011
  • 노인장기요양보험은 2008년 7월에 시작된 이후 제도의 안정적 정착과 발전을 위해 여러 가지 면에서 보완해야할 부분이 많은 상태이다. 그 중에서도 장기요양급여의 진입장벽을 결정하는 등급결정모형을 지속적으로 보완하는 것이 가장 중요하다. 본 연구는 제도 시행 이후 급속히 변화하는 장기요양 시장의 현실을 등급결정모형에 반영하고자 제도 도입 이후의 자료를 활용하여 등급결정모형을 구축하여 현행 모형을 보완하고자 하였다. 등급결정모형을 개발하기 위해 데이터마이닝 기법 중 의사결정나무기법을 활용하였으며, 이것은 현행 모형과 비교가 용이하도록 하기 위한 것이다. 이 모형은 기능상태가 나쁜 사람일수록 장기요양서비스량이 많을 것이라는 가정을 전제로 하고 있으며 장기요양서비스량을 서비스 제공시간으로 보았다. 이 연구는 변화된 현실을 충분히 반영하기 위해 등급결정모형을 보완 하였다는 점에서 의의를 갖는다. 그러나 향후에도 서비스 인프라, 급여 이용자의 특성 등 계속 변화하는 환경을 반영하여 등급결정모형을 보완하고 발전시키는 것이 지속적으로 필요하다고 본다.

Doc2Vec 모형에 기반한 자기소개서 분류 모형 구축 및 실험 (Self Introduction Essay Classification Using Doc2Vec for Efficient Job Matching)

  • 김영수;문현실;김재경
    • 한국IT서비스학회지
    • /
    • 제19권1호
    • /
    • pp.103-112
    • /
    • 2020
  • Job seekers are making various efforts to find a good company and companies attempt to recruit good people. Job search activities through self-introduction essay are nowadays one of the most active processes. Companies spend time and cost to reviewing all of the numerous self-introduction essays of job seekers. Job seekers are also worried about the possibility of acceptance of their self-introduction essays by companies. This research builds a classification model and conducted an experiments to classify self-introduction essays into pass or fail using deep learning and decision tree techniques. Real world data were classified using stratified sampling to alleviate the data imbalance problem between passed self-introduction essays and failed essays. Documents were embedded using Doc2Vec method developed from existing Word2Vec, and they were classified using logistic regression analysis. The decision tree model was chosen as a benchmark model, and K-fold cross-validation was conducted for the performance evaluation. As a result of several experiments, the area under curve (AUC) value of PV-DM results better than that of other models of Doc2Vec, i.e., PV-DBOW and Concatenate. Furthmore PV-DM classifies passed essays as well as failed essays, while PV_DBOW can not classify passed essays even though it classifies well failed essays. In addition, the classification performance of the logistic regression model embedded using the PV-DM model is better than the decision tree-based classification model. The implication of the experimental results is that company can reduce the cost of recruiting good d job seekers. In addition, our suggested model can help job candidates for pre-evaluating their self-introduction essays.

머신러닝을 활용한 브랜드별 국내 중고차 가격 예측 모델에 관한 연구 (A Study on the Prediction Models of Used Car Prices for Domestic Brands Using Machine Learning)

  • 임승준;이정호;류춘호
    • 서비스연구
    • /
    • 제13권3호
    • /
    • pp.105-126
    • /
    • 2023
  • 국내 중고차 시장은 지속적으로 성장하고 있으며, 이와 동시에 중고차 온라인 플랫폼 서비스 역시 함께 매년 시장 점유율을 확대하고 있다. 중고차 온라인 플랫폼 서비스는 차량의 제원, 점검 이력, 사고 내역, 그리고 세부 옵션 등을 서비스 이용자에게 제공하고 있다. 대부분의 기존 연구는 차량의 제원과 차량의 일부 옵션을 활용한 중고차 가격의 예측이었으며, 중고차 가격과 일부 제원 변수 간 비선형 관계임을 확인하였다. 이에 따라 연구자들은 이러한 비선형 문제를 해결하기 위해 머신러닝(Machine Learning) 모델의 실행을 제안하였으며, 그 결과 회귀(Regression) 기반 머신러닝 모델은 변수의 실질적인 영향력과 방향성을 알 수 있는 장점이 존재하였으나, 트리(Decision Tree) 기반 머신러닝 모델에 비해 비용함수 수치가 저조한 단점이 존재하였다. 본 연구는 국내 브랜드를 대상으로 차량의 제원과 차량의 옵션, 총 70여 개의 변수를 모두 활용하여 회귀 기반 머신러닝 모델과 트리 기반 머신러닝 모델을 순차적으로 실행하여 두 유형의 머신러닝 모델의 장점을 취합하고자 하였다. 이를 통해 브랜드별 변수의 실질적 영향력과 방향성을 확인한 후 브랜드별 가장 우수한 트리 기반 머신러닝 모델을 선정하였다. 본 연구의 시사점은 다음과 같다. 중고차 온라인 플랫폼 서비스를 이용하는 구매자와 판매자가 전반적인 중고차 가격 예측을 지원할 수 있다. 이에 따라 중고차 온라인 플랫폼 서비스 이용자 간 정보의 비대칭으로 인한 문제 해결 역시 지원이 가능할 것으로 기대한다.

이동통신고객 분류를 위한 의사결정나무(C4.5)와 신경망 결합 알고리즘에 관한 연구 (A Study on the Combined Decision Tree(C4.5) and Neural Network Algorithm for Classification of Mobile Telecommunication Customer)

  • 이극노;이홍철
    • 지능정보연구
    • /
    • 제9권1호
    • /
    • pp.139-155
    • /
    • 2003
  • 본 논문은 결합된 의사결정 나무(C4.5)와 신경망기법을 적용함으로써 고객의 신용에 대한 예측을 높이기 위하여 이동통신 고객의 패턴을 분류하고, 분석하는 새로운 방법에 대하여 연구하였다. 의사 결정나무(C4.5)를 형성하여 선택된 결정변수와 함께 규칙을 생성함으로써, 신경망의 입력벡터 값을 정의하는 체계적인 방법을 제시하였다. 고객 관리측면에서 본 논문은 이동 통신 회사의 기존고객을 분류하여 패턴을 분석함으로써 우수한 고객의 지속적인 관리와 이탈 가능성이 많은 고객을 차별 관리하여 기업이익을 증대시킬 수 있을 것이다. 또한 이러한 분류를 통하여 신규 고객에 반영함으로써 고객의 향후 관리에도 기여할 수 있을 것이다. 실제 이동통신 고객데이터를 중심으로 연구의 결과는 예측의 정확도가 기존의 의사결정 트리 모델 (CART, C4.5), 회귀모형, 신경망 접근 방법과 기존에 연구되었던 결합모델(CART & 신경망)보다 훨씬 높게 연구되었다.

  • PDF

로지스틱 회귀분석과 의사결정나무 분석을 이용한 일 대도시 주민의 우울 예측요인 비교 연구 (Comparative Analysis of Predictors of Depression for Residents in a Metropolitan City using Logistic Regression and Decision Making Tree)

  • 김수진;김보영
    • 한국콘텐츠학회논문지
    • /
    • 제13권12호
    • /
    • pp.829-839
    • /
    • 2013
  • 본 연구는 로지스틱 회귀분석과 의사결정나무 분석을 활용하여 일 대도시 주민의 우울에 영향을 주는 요인을 예측하고 비교하고자 시도된 서술적 조사연구이다. 연구대상은 20세에서 65세 미만의 일 대도시 주민 462명이었다. 자료 수집은 2011년 10월 7일부터 10월 21일까지이었으며, 자료 분석은 SPSS 18.0 프로그램을 이용하여 빈도, 백분율, 평균과 표준편차 및 ${\chi}^2$-test, t-test, 로지스틱 회귀분석, roc curve, 의사결정나무 분석으로 분석하였다. 본 연구 결과, 로지스틱 회귀분석과 의사결정나무 분석에서 공통적으로 나타난 우울 예측요인은 사회부적응, 주관적 신체증상 및 가족 지지이었다. 로지스틱 회귀분석에서 특이도 93.8%, 민감도 42.5%이었고, 본 연구의 모형 적합도를 roc curve 검증 한 결과 AUC=.84으로 본 연구 모형은 적합(p=<.001)하다고 할 수 있다. 우울예측에 대한 의사결정나무 분석은 분류에 대한 예측 정확도에서 특이도 98.3%, 민감도 20.8%이었고, 전체 분류 정확도는 로지스틱 회귀분석은 82.0%, 의사결정나무 분석은 80.5% 이었다. 본 연구 결과 민감성과 분류 정확도와 더 높게 나타난 로지스틱 회귀분석 방법이 지역 주민의 우울 예측 모형을 구축하는데 더 유용한 자료로 사용될 수 있으리라 사료된다.

의사결정 트리 기법을 이용한 그리드 자원선택 시스템 (Grid Resource Selection System Using Decision Tree Method)

  • 노창현;조규철;마용범;이종식
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권1호
    • /
    • pp.1-10
    • /
    • 2008
  • 이 기종의 네트워크와 시스템 자원으로 구성된 그리드 컴퓨팅 환경에서 대용량 데이터를 빠르고 정확하게 처리하기 위해서는 효과적인 그리드 자원선택이 필수적이다. 이를 위해 본 논문은 의사결정 트리 기법을 이용한 그리드 자원선택 시스템을 제안한다. 이 시스템은 자원 정보를 기록한 데이터 셋을 바탕으로 사용자들이 선택하는 자원들을 처리 할 데이터의 특성과 사용자의 요구사항으로 분석해서 자원선택을 위한 의사결정 트리를 구축한다. 그리드 사용자의 자원 요청 시 의사결정 트리를 탐색하여 사용자 요구 및 작업 특성에 적합한 자원들을 선택하여 작업을 할당함으로써 사용자 만족도를 향상시킴은 물론 전체 그리드 시스템의 성능을 개선한다. 실험결과는 본 논문에서 제안한 의사결정 트리 기반의 그리드 자원선택 시스템이 기존 그리드 자원선택 시스템인 Condor-G 및 Nimrod-G와 비교하여 더 높은 작업 처리율 및 자원 이용률과 더 적은 작업 손실 및 처리시간을 제공함으로써 그리드 자원선택 및 데이터 분산 처리에 효과적이라는 사실을 증명한다

  • PDF

빅 데이터 기반의 체납 수용가 예측 모델 (Prediction Model for Unpaid Customers Using Big Data)

  • 정재안;이규환;정회경
    • 한국정보통신학회논문지
    • /
    • 제24권7호
    • /
    • pp.827-833
    • /
    • 2020
  • 본 논문에서는 지자체의 요금 체납을 줄이기 위해 특정 지자체를 대상으로 검침원의 면담 등을 통해 지방상수도 통합정보시스템에서 체납에 영향을 미치는 내부 데이터 요소를 찾았다. 또한 국가 통계 데이터 중에서 체납에 영향을 미치는 후보 데이터를 도출하였다. 독립변수가 종속변수에 미치는 영향도는 정보이득이라는 데이터 집합에서 종속변수에 대한 무질서도를 조사하여 표본 데이터를 수집하였다. 그리고 빅 데이터 분석 알고리즘인 의사결정트리와 로지스틱 회귀기법 중 어느 알고리즘이 더 높은 예측율을 나타내는지 n-fold cross-validation 방법을 사용하여 평가하였다. 이를 통해 지자체의 데이터를 기초로 알고리즘의 성능을 비교한 결과 의사결정트리가 로지스틱회귀보다 더 정확한 수용가 납부 패턴을 찾을 수 있음을 확인하였다. 머신러닝을 이용한 분석 알고리즘 모델 개발의 과정에서는 알고리즘의 정확성 향상을 위해 의사결정트리의 복잡성과 정확성에 직접적인 영향을 주는 최소 데이터 개수와 최대 순도라는 두 개의 환경변수의 최적값을 도출하였다.

의사결정나무를 이용한 근접전투전문가시스템 (Developing an Expert System for Close Combat using Decision Tree)

  • 김형세;문호석;이동근;황명상;김영국
    • 한국국방경영분석학회지
    • /
    • 제36권3호
    • /
    • pp.83-93
    • /
    • 2010
  • 본 논문에서는 훈련용 워게임모델의 근접전투 피해평가를 위한 새로운 근접전투전문가시스템을 제안하였다. 군에서 사용하고 있는 워게임모델에서 피해평가 모의논리는 아주 중요한 모의가능이다. 현재, 육군의 군사단급 워게임모델인 창조21 모델에서는 근접전투 피해평가의 핵심기능이 창조21 모델에서 계산되지 않고, 공개소스와 내부논리를 알 수 없는 미군에서 제작한 근접전투전문가시스템(일명 COBRA)에서 별도로 계산되고, 이 결과가 네트워크를 통해 창조21 모델로 전송되어 근접전투에 대한 피해평가가 이루어진다. 본 논문에서는 COBRA를 대체할 수 있는 근접전투전문가시스템을 의사결정나무를 이용해서 제안하였다. 제안하는 시스템은 실험결과 COBRA와 유사한 성능을 보였고, 시스템의 계산량이 적었고 군사작전 상황에 적합하였다.

의사결정나무기법을 이용한 건설재해 사전 예측모델 개발 (Prediction Model of Construction Safety Accidents using Decision Tree Technique)

  • 조예림;김연철;신윤석
    • 한국건축시공학회지
    • /
    • 제17권3호
    • /
    • pp.295-303
    • /
    • 2017
  • 건설 산업 재해 예방을 위한 연구와 노력에도 불구하고 최근 7년간 국내 건설업 재해자 수가 꾸준히 증가했다. 건설현장에서 발생하는 재해는 다른 산업군에 비해 강도 높은 재해가 발생할 가능성이 크기 때문에 근본적으로 예방할 수 있는 방법이 필요하다. 따라서 본 연구에서는 모형에 대한 해석이 쉽고 변수의 상호작용 효과 해석이 용이한 의사결정나무 기법을 활용하여 건설재해 예측 모델을 제안하였다. 제안된 건설 재해 사전 예측 모델의 현장 활용 가능성을 평가하기 위하여 판별분석기법 기반 모델과의 건설 재해 예측 정확도를 비교하였다. 검토 결과 판별분석 모델에 비해 의사결정나무 모델의 누적 예측 정확도가 더 높은 것으로 나타났다. 의사결정나무 기법을 이용한 모델은 시간이 지남에 따라 데이터가 증가하기 때문에 예측 정확도가 더욱 높아지게 된다. 따라서 본 연구에서 제안된 건설 재해 예측 모델이 건설현장에서 활용된다면 효과적으로 안전 관리를 할 수 있고, 건설업 재해율 감소에도 기여할 수 있을 것으로 기대한다.

의사결정나무분석법을 이용한 간호사의 대체수유교육요구 예측모형 (A Predictive Model using Decision Tree Method on Demand for Alternative Feeding Education by Nurses)

  • 오진아;윤채민;김병수
    • Child Health Nursing Research
    • /
    • 제16권1호
    • /
    • pp.84-92
    • /
    • 2010
  • Purpose: One of the main reasons why mothers quit breast feeding is that the volume of breast milk is inadequate due to insufficiency in suckling. We believe suckling experience may be a factor affecting nipple confusion. So an alternative feeding method, namely cup, spoon, finger, or nasogastric tube feeding may be needed to prevent nipple confusion. The purpose of this study was to construct a predictive model for demand for alternative feeding education by nurses. Methods: A descriptive design with structured self-report questionnaires was used for this study. Data from 175 nurses working in hospitals in Busan were collected between April 1 and 15, 2009. Data were analyzed by decision tree method, one of the data mining techniques using SAS 9.1 and Enterprise Miner 4.3 program. Results: Of the nurses, 81.1% demanded alternative feeding education and 5 factors showed that most of them expressed intention to pay, desire to know about alternative feeding, age, and learning experience. From these results, the derived model is considered appropriative for explaining and predicting demand for alternative feeding education. Conclusion: This confirms that knowledge and compliance in alternative breast feeding for newborn babies should be correct and any inaccuracies or insufficient information should be supplemented.