• 제목/요약/키워드: 의사결정 나무

검색결과 561건 처리시간 0.032초

의사결정나무의 분기법 변화가 예측력에 미치는 영향 (The impact of the change in the splitting method of decision trees on the prediction power)

  • 장영재
    • 응용통계연구
    • /
    • 제35권4호
    • /
    • pp.517-525
    • /
    • 2022
  • 빅데이터 시대에 이르러 다양한 데이터 마이닝 기법이 주요 분석 방법론으로 제안되었다. 복잡 다양한 데이터가 양산되면서 데이터 마이닝 기법은 데이터 과학의 토대를 이루는 방법으로 부각되었다. 본고에서는 해석의 유용성과 예측력 향상의 측면 모두에 초점을 맞추어 다양한 실험 연구를 시행하였다. 구체적인 모형으로는 의사결정나무를 선택하였는데, 이는 실무적 사용 빈도가 높은 방법으로서 활용 폭이 넓을 뿐만 아니라 이해가 쉽고 성능평가가 용이한 방법론이기 때문이다. 의사결정나무모형을 대상으로 이 모형의 구조를 크게 변형시키지 않으면서도 예측력 향상의 목적을 이룰 수 있는 방법을 살펴보았으며 분기변수의 선택 방법이 모형의 성능에 미치는 영향을 분석하였다. 이 효과를 측정하기 위해서 다양한 모의실험 모델을 생성하고 분기법의 변화에 따른 예측력을 비교하였다. 비선형성을 지니면서 단일 분할을 통해서 하위 집합으로 명확하게 구분하기 어려운 복잡한 데이터의 경우에는 선형결합 분기방법이 예측력 제고에 도움을 주는 것으로 나타났다.

하이브리드 의사결정나무와 인공신경망 모델을 이용한 방문학습지사의 고객세분화 (Customer Segmentation of a Home Study Company using a Hybrid Decision Tree and Artificial Neural Network Model)

  • 서광규;안범준
    • 한국산학기술학회논문지
    • /
    • 제7권3호
    • /
    • pp.518-523
    • /
    • 2006
  • 본 논문은 하이브리드 의사결정 나무(CART)와 인공신경망 모델을 개발하여 고객의 이탈에 대한 예측을 높이기 위하여 가정방문 학습지 고객의 패턴을 분류하고, 분석하는 새로운 방법에 대하여 연구하였다. 의사 결정나무(CART5)를 형성하여 선택된 결정변수들은 인공신경망의 입력벡터 값으로 선택되는 새로운 방법을 제시하였다. 고객 관리측면에서 본 논문은 가정방문 학습지 회사의 기존고객을 분류하여 패턴을 분석함으로써 우수한 고객의 지속적인 관리와 이탈 가능성이 많은 고객을 차별 관리하여 기업이익을 증대시킬 수 있을 것이다. 새롭게 제안한 하이브리드 모델은 기존의 의사결정트리모델(CART), 회귀모형, 인공신경망 모델과 비교한 결과 그 예측 정확성이 높음을 확인할 수 있었다.

  • PDF

의사결정나무기법을 이용한 노인장기요양보험 등급결정모형 개발 (A Determining System for the Category of Need in Long-Term Care Insurance System using Decision Tree Model)

  • 한은정;곽민정;강임옥
    • 응용통계연구
    • /
    • 제24권1호
    • /
    • pp.145-159
    • /
    • 2011
  • 노인장기요양보험은 2008년 7월에 시작된 이후 제도의 안정적 정착과 발전을 위해 여러 가지 면에서 보완해야할 부분이 많은 상태이다. 그 중에서도 장기요양급여의 진입장벽을 결정하는 등급결정모형을 지속적으로 보완하는 것이 가장 중요하다. 본 연구는 제도 시행 이후 급속히 변화하는 장기요양 시장의 현실을 등급결정모형에 반영하고자 제도 도입 이후의 자료를 활용하여 등급결정모형을 구축하여 현행 모형을 보완하고자 하였다. 등급결정모형을 개발하기 위해 데이터마이닝 기법 중 의사결정나무기법을 활용하였으며, 이것은 현행 모형과 비교가 용이하도록 하기 위한 것이다. 이 모형은 기능상태가 나쁜 사람일수록 장기요양서비스량이 많을 것이라는 가정을 전제로 하고 있으며 장기요양서비스량을 서비스 제공시간으로 보았다. 이 연구는 변화된 현실을 충분히 반영하기 위해 등급결정모형을 보완 하였다는 점에서 의의를 갖는다. 그러나 향후에도 서비스 인프라, 급여 이용자의 특성 등 계속 변화하는 환경을 반영하여 등급결정모형을 보완하고 발전시키는 것이 지속적으로 필요하다고 본다.

의사결정나무와 신경망 모형 결합에 의한 운전자 우회결정요인 분석 (Drivers Detour Decision Factor Analysis with Combined Method of Decision Tree and Neural Network Algorithm)

  • 강진웅;금기정;손승녀
    • 한국도로학회논문집
    • /
    • 제13권3호
    • /
    • pp.167-176
    • /
    • 2011
  • 본 연구는 불특정 다수의 도로이용자들이 경로우회 시 갖는 의사결정과정속에 내포된 비선형성과 불확실성을 고려한 정도 있는 모형구축으로 주요 우회결정요인을 분석하는 것이 주요 목적이다. 이를 위하여 고속도로 및 국도를 이용하는 운전자를 대상으로 우회여부에 관련된 SP조사를 실시하였고, 조사결과에 대하여 의사결정나무와 신경망이론의 결합된 모형을 구축하여 운전자 우회결정요인을 분석하였다. 분석결과 운전자 우회여부결정에 영향을 미치는 요인은 우회도로 인지여부, 교통정보 신뢰도 및 이용빈도, 경로전환빈도, 나이순으로 나타났다. 또한 오분류표를 통한 기존 모형과의 예측력의 비교결과 결합된 모형의 오분류율이 8.7%로 기존 모형인 로짓모형 12.8%, 의사결정나무 단독 모형 13.8%와 비교했을 때 가장 예측력이 높은 것으로 나타나 운전자 우회결정요인 분석에 관한 모형의 적용 타당성을 확인할 수 있었다. 본 연구의 결과는 향후 교통량 분산효과와 도로망 효율 증대를 위한 효과적인 우회관리전략 수립 시 기초 자료로 활용가능하리라 사료된다.

Decision Tree를 이용한 도시유역홍수방어 대안 도출 (Application of a Decision Tree to Alternative Plans for the Urban Flood Mitigation)

  • 변성호;강현직;한정우;안재현;김태웅
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2007년도 학술발표회 논문집
    • /
    • pp.726-730
    • /
    • 2007
  • 우리나라는 6월부터 9월까지의 우기에 강우가 집중 발생하는 기상특성으로 인해 자연재해의 95% 이상이 집중호우와 태풍에 의한 풍수해로 집계되고 있을 만큼 홍수피해에 취약하며, 오래전부터 홍수방어에 대한 구조적 대책이 시행되어왔다. 본 연구의 목적은 의사결정기법인 Decision Tree(의사결정나무)를 활용하여 유역종합치수계획의 구조적 홍수방어 최적대안 선정을 위한 후보대안들을 제시하여 홍수저감능력을 효율적으로 극대화 하는데 그 목적이 있다. 본 연구는 유역이 가지고 있는 치수적 기능을 최대한 살리고 상 하류의 유기적인 방어 기능을 도모하고자 하였으며, 또한 도시유역 홍수방어 대안 조합 지침을 마련하여 실무에 적용가능한 안을 제시하였다.

  • PDF

전문가 의견을 반영하는 향상된 의사결정나무의 엔트로피 기법 (Decision Tree Algorithm with Improved Entropy Using an Expert Opinion)

  • 박선빈;김동문;윤태복;이지형
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국지능시스템학회 2007년도 추계학술대회 학술발표 논문집
    • /
    • pp.239-242
    • /
    • 2007
  • 최근 데이터의 양이 많아지고 다양해짐에 따라서 데이터를 활용하기 위한 데이터 마이닝에 관한 관심이 중대되고 있다. 데이터 분석을 위한 수집 데이터에는 수집 과정에서 분석가가 원치 않은 데이터 잡음이 발생하는 경우가 있고 그 데이터가 다른 데이터들과 같은 가중치로 데이터 마이닝에 반영되는 경우 예상과 다른 결과를 얻을 수 있다. 따라서 데이터 분석 시 데이터와 전문가 의견이 고려된 데이터 엔트로피(Entropy)를 사용하여 잡음 데이터를 다를 필요가 있다. 본 논문에서는 전문가의견을 이용한 전문가 의견 목록을 만들고 이를 데이터와 비교하여 유사한 정도에 따라 각 데이터에 가중치를 부여한다. 그리고 이 데이터를 활용한 의사결정나무(Decision Tree)를 사용하여 기존 데이터를 이용한 의사결정나무 보다 데이터 잡음의 영향을 줄이는 방법을 제안한다. 제안한 방법은 학습자의 학습 활동에서 수집된 학습 행위 데이터를 사용하여 실험하였다.

  • PDF

의사결정나무 분석을 사용한 고가의료장비의 다빈도 사용 특성 분석 (The diffusion and policy options of the diagnostic imaging technologies in Korea)

  • 최윤정;곽민정;윤민
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권1호
    • /
    • pp.179-185
    • /
    • 2015
  • 최근 고가의료장비의 도입으로 진단기술이 빠르게 발전하고 있으나 이에 따른 건강보험 재정의 부담이 크게 늘어 이에 대한 적절한 관리와 효율적 운영에 대한 정책이 필요하다. 이에 따라 본 연구에서는 의사결정나무분석 모형을 사용하여 CT 의료장비의 검사빈도에 영향을 미치는 요인을 파악하여 효율적 운영에 대한 방안을 제시한다.

데이터 마이닝 기법을 활용한 스마트팩토리 도입 기업의 특성 분석 (An Analysis of the Characteristics of Companies introducing Smart Factory System Using Data Mining Technique)

  • 오정윤;최상현
    • 한국융합학회논문지
    • /
    • 제9권5호
    • /
    • pp.179-189
    • /
    • 2018
  • 현재 스마트팩토리에 관한 연구는 구축 방안이나 설립 시 고려사항 등에 대해 꾸준히 진행되고 있다. 그러나 스마트 팩토리를 도입한 기업에 대해서는 다양한 연구가 이루어지지 않고 있다. 이 연구에서는 스마트팩토리의 기초단계를 적용한 중소기업을 대상으로 설문조사를 실시하였다. 만족도의 특성을 확인하기 위해 군집분석을 하였고, 만족도에 따라 어떠한 특성을 가지는지 확인하기 위해 의사결정나무와 나이브베이즈 분석을 하였다. 군집분석 결과 만족도가 높은 그룹과 낮은 그룹으로 나뉘는 것을 확인하였으며, 의사결정나무와 나이브베이즈 분석을 실시한 결과 만족도가 높을수록 생산성 개선 정도가 높은 것을 확인하였다.

PA기법을 활용한 건설분쟁 예측모델 개발에 관한 연구 - 의사결정나무를 중심으로 - (A Study on the Development of Construction Dispute Predictive Analytics Model - Based on Decision Tree -)

  • 장세림;김한수
    • 한국건설관리학회논문집
    • /
    • 제22권6호
    • /
    • pp.76-86
    • /
    • 2021
  • 건설공사에는 다양한 이해관계자들이 참여하며, 리스크와 클레임 및 분쟁이 발생할 수 있는 가능성이 높다. 분쟁은 비용과 시간의 손실을 발생시키기 때문에, 건설사 입장에서는 건설공사를 효율적으로 관리하고 수익성을 높이기 위해 건설분쟁을 사전에 예측하고 선제적으로 대응하는 것이 중요한 현안이다. 본 연구의 목적은 건설공사 조건에 따라 발생하는 분쟁의 유형과 분쟁유형별 발생확률을 예측할 수 있는 의사결정나무 기반의 건설분쟁 예측모델을 구축하는데 있다. 이는 분쟁을 사전에 예측하고 선제적으로 대응할 수 있는 기회를 제공한다는 측면에서 유용하게 활용될 수 있다.

의사결정나무모형을 이용한 편마암 지역에서의 급경사지재해 예측기법 개발 (Development to Prediction Technique of Slope Hazards in Gneiss Area using Decision Tree Model)

  • 송영석;채병곤
    • 지질공학
    • /
    • 제18권1호
    • /
    • pp.45-54
    • /
    • 2008
  • 본 연구에서는 기 조사된 편마암 지역에서의 급경사지재해 발생지역 및 미발생지역에 대한 현장조사자료 및 토질시험자료를 토대로 통계적인 분석방법인 의사결정나무모형을 이용하여 급경사지재해 예측기법을 개발하였다. 편마암 지역에서의 조사된 급경사지재해 자료는 서울 및 경기지역에서 1998년 집중호우로 발생된 104개소구간이다. 이 가운데 예측모델 개발에 활용된 자료수는 결측치를 제외한 61개소로서, 급경사지재해 발생구간 34개소와 미발생구간 27개소이다. 의사결정나무모형을 이용한 통계적인 분석은 카이제곱 통계량, 지니 지수 및 엔트로피 지수를 적용하여 실시하였다. 분석결과 사면경사, 포화도 및 사면고도가 분리기준으로 선택되었으며, 엔트로피 지수를 이용한 의사결정나무모형 예측모델이 정확도가 가장 높은 것으로 나타났다. 선정된 급경사지재해 예측모델의 분리기준은 최상위부터 사면경사, 포화도 및 사면고도의 순서로 선택되었으며, 각각의 분리기준치는 사면경사의 경우 $17.9^{\circ}$, 포화도의 경우 52.1%, 사면고도의 경우 320m로 결정되었다.