• 제목/요약/키워드: 의사결정나무회귀분석

검색결과 123건 처리시간 0.025초

로지스틱 회귀분석과 의사결정나무 분석을 이용한 일 대도시 주민의 우울 예측요인 비교 연구 (Comparative Analysis of Predictors of Depression for Residents in a Metropolitan City using Logistic Regression and Decision Making Tree)

  • 김수진;김보영
    • 한국콘텐츠학회논문지
    • /
    • 제13권12호
    • /
    • pp.829-839
    • /
    • 2013
  • 본 연구는 로지스틱 회귀분석과 의사결정나무 분석을 활용하여 일 대도시 주민의 우울에 영향을 주는 요인을 예측하고 비교하고자 시도된 서술적 조사연구이다. 연구대상은 20세에서 65세 미만의 일 대도시 주민 462명이었다. 자료 수집은 2011년 10월 7일부터 10월 21일까지이었으며, 자료 분석은 SPSS 18.0 프로그램을 이용하여 빈도, 백분율, 평균과 표준편차 및 ${\chi}^2$-test, t-test, 로지스틱 회귀분석, roc curve, 의사결정나무 분석으로 분석하였다. 본 연구 결과, 로지스틱 회귀분석과 의사결정나무 분석에서 공통적으로 나타난 우울 예측요인은 사회부적응, 주관적 신체증상 및 가족 지지이었다. 로지스틱 회귀분석에서 특이도 93.8%, 민감도 42.5%이었고, 본 연구의 모형 적합도를 roc curve 검증 한 결과 AUC=.84으로 본 연구 모형은 적합(p=<.001)하다고 할 수 있다. 우울예측에 대한 의사결정나무 분석은 분류에 대한 예측 정확도에서 특이도 98.3%, 민감도 20.8%이었고, 전체 분류 정확도는 로지스틱 회귀분석은 82.0%, 의사결정나무 분석은 80.5% 이었다. 본 연구 결과 민감성과 분류 정확도와 더 높게 나타난 로지스틱 회귀분석 방법이 지역 주민의 우울 예측 모형을 구축하는데 더 유용한 자료로 사용될 수 있으리라 사료된다.

회귀의사결정나무에서의 관심노드 찾는 분류 기준법 (Interesting Node Finding Criteria for Regression Trees)

  • 이영섭
    • 응용통계연구
    • /
    • 제16권1호
    • /
    • pp.45-53
    • /
    • 2003
  • 의사결정나무 분석 기법 중 하나인 회귀의사결정나무는 연속적인 반응변수를 예측할 때 사용된다. 나무 구조를 형성할 때, 전통적인 분류 기준법은 왼쪽과 오른쪽 자식노드의 불순도를 결합하여 이루어진다. 그러나 본 논문에서 제안하는 새로운 분류 기준법은 관심있는 한쪽만 선택하고 다른 나머지 자식노드는 큰 관심이 없어 무시함으로써 더 이상 결합하여 구하는 것이 아니다. 따라서 나무 구조는 불균형적일 수 있으나 이해하기가 쉽다. 즉, 관심있는 부분집합을 가능한 한 빨리 찾음으로써 단지 몇 개의 조건으로 쉽게 표현할 수 있으며, 정확도는 다소 떨어지지만 설명력은 아주 높다.

의사결정나무를 이용한 개인휴대통신 해지자 분석

  • 최종후;서두성
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회 1998년도 추계학술대회 논문집
    • /
    • pp.377-380
    • /
    • 1998
  • 본 논문에서는 최근 데이터마이닝의 도구로 활발하게 소개되고 있는 의사결정나무 분석을 이용하여 개인휴대통신의 해지자 분석을 실시한다. 또한 로지스틱 회귀모형을 이용하여 가입고객의 해지 가능성에 대한 점수화를 시도한다.

  • PDF

기계학습 기반의 영화흥행예측 방법 비교: 인공신경망과 의사결정나무를 중심으로 (A Comparison of Predicting Movie Success between Artificial Neural Network and Decision Tree)

  • 권신혜;박경우;장병희
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제7권4호
    • /
    • pp.593-601
    • /
    • 2017
  • 본 연구는 영화산업의 가치사슬단계에 따라 각 단계에서 고려할 수 있는 변인을 활용하여 제작/투자, 배급, 상영단계별 모형을 구성하였다. 모형의 예측력을 높이기 위해 회귀분석으로 유의미한 변인을 도출하여 모형을 추가로 설정하였다. 주어진 변인을 바탕으로 기계학습 분석방법인 인공신경망과 의사결정나무 분석방법 간의 예측력 차이를 비교하였다. 분석 결과, 제작/투자 모형과 배급 모형에서 모든 변인을 투입했을 때는 인공신경망의 정확도가 의사결정나무보다 높았으나, 회귀분석결과에 따라 선정된 변인을 투입하였을 때는 의사결정나무의 정확도가 더 높았다. 상영 모형에서는 회귀분석결과의 반영여부와 관계없이 인공신경망의 정확도가 의사결정나무의 정확도보다 높게 나타났다. 본 논문은 영화흥행 예측연구에 기계학습기법을 적용하여 예측성과가 향상됨을 확인하였다는데 의의가 있다. 선형회귀분석 결과를 기계학습기법에 반영함으로써 기존의 선형적 분석방법의 한계를 극복하고자 하였다.

데이터마이닝 기법을 이용한 국지기상예보칙 작성 방안 연구 (A Study on Creation Plan of the Local Weather Prediction Method Using Data Mining Techniques)

  • 최재훈;이상훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (하)
    • /
    • pp.1351-1354
    • /
    • 2003
  • 데이터 마이닝 기법 중 회귀분석 기법과 의사절정나무 분석 기법을 이용하여 국지기상예보칙을 작성하는 방안을 연구하였다. 회귀분석기법을 이용하여 예보값에 영향을 미치는 예보요소를 도출하고, 도출된 예보요소를 회귀분석 기법과 의사결정나무 분석 기법에 적용하여 예보칙을 작성하였다.

  • PDF

공공 DB 데이터마이닝 기법을 활용한 국내 청소년 삶의 만족도 분석에 관한 실증연구: 의사결정나무 기법을 중심으로 (Analysis of Korean Adolescents' Life Satisfaction based on Public Database and Data Mining Techniques: Emphasis on Decision Tree)

  • 조현진;고건우;이건창
    • 디지털융복합연구
    • /
    • 제18권6호
    • /
    • pp.297-309
    • /
    • 2020
  • 본 연구는 국내 공공 DB에 데이터마이닝 기법인 로지스틱 회귀분석과 의사결정나무 분석을 적용하여 국내 청소년의 삶의 만족도 증진에 관한 의미 있는 의사결정 규칙을 추출하는 과정을 분석한다. 분석을 위하여 한국아동·청소년패널조사(KYCPS) 중에서 중1 패널데이터의 4~6차연도 자료인 고등학생 학년별 자료를 활용하였다. 로지스틱 회귀분석으로 추출된 영향요인은 1학년은 전체 성적 만족도, 주의집중 문제, 우울, 자아 탄력성, 애정, 과잉간섭, 학습활동, 교사관계, 2학년은 가정의 경제 수준, 건강상태, 전체 성적 만족도, 신뢰, 소외, 학습활동, 학교규칙, 교우관계, 교사 관계, 3학년은 가정의 경제 수준, 전체 성적 만족도, 우울, 자아 탄력성, 애정, 학대, 학교규칙, 교사 관계로 나타났다. 의사결정나무 기법을 적용한 결과 국내 고등학생의 삶의 만족도는 개인의 정서 문제, 학교성적, 가정의 경제적 환경, 학교적응 등에 의하여 복합적으로 영향을 받는 것으로 파악되었다.

연속형 반응변수를 위한 데이터마이닝 방법 성능 향상 연구 (A study for improving data mining methods for continuous response variables)

  • 최진수;이석형;조형준
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권5호
    • /
    • pp.917-926
    • /
    • 2010
  • 배깅과 부스팅의 기법은 예측력을 향상 시킨다고 알려져 있다. 이는 비교 실험을 통하여 성능이 검증 되었는데, 목표변수가 범주형인 경우에 특정 의사결정나무 알고리즘인 회귀분류나무만 주로 고려되었다. 본 논문에서는 의사결정나무 외에도 다른 데이터마이닝 방법도 고려하여 목표변수가 연속형인 경우에 배깅과 부스팅 기법의 성능 검증을 위한 비교 실험을 실시하였다. 구체적으로, 데이터마이닝 알고리즘 기법인 선형회귀, 의사결정나무, 신경망에 배깅 및 부스팅 앙상블 기법을 결합하여 8개의 데이터를 비교 분석하였다. 실험 결과로 연속형 자료에 대한 여러 데이터마이닝 알고리즘에도 배깅과 부스팅의 기법이 성능 향상에 도움이 되는 것으로 확인되었다.

의사결정나무를 이용한 화물자동차 투어유형 선택행태 분석 (An Analysis of Choice Behavior for Tour Type of Commercial Vehicle using Decision Tree)

  • 김한수;박동주;김찬성;최창호;김경수
    • 대한교통학회지
    • /
    • 제28권6호
    • /
    • pp.43-54
    • /
    • 2010
  • 최근 화물수요모형에 화물자동차 투어행태를 반영하기 위한 접근방법이 제시되었다. 화물자동차 이동을 투어기반 접근방법으로 모형화 하기 위해서는 화물자동차 투어와 투어유형에 대한 이해가 필요하다. 본 연구는 화물자동차 투어유형을 왕복형 투어와 체인형 투어로 구분하여 이들 투어유형 선택행태를 분석하였다. 투어유형 선택행태를 분석하기 위한 방법으로는 의사결정나무(decision tree)와 로짓모형(logit model)을 이용하였다. 분석결과 화물자동차 투어유형을 분류하는 설명변수로 화물적재율, 평균화물량, 총화물량이 선정되었으며, 의사결정나무와 로짓모형이 유사한 결과를 도출하였다. 또한 소형과 중형 화물자동차의 투어유형을 분류하는 설명변수가 큰 차이를 보이지 않음에 따라 화물자동차 투어를 계획함에 있어 화물을 어떻게 적재할 것인지가 가장 중요한 것으로 나타났다. 의사결정나무와 로짓모형의 예측력을 비교한 결과는 의사결정나무가 로짓모형에 비해 상대적으로 우수한 결과를 보였는데, 이는 화물자동차 투어유형을 분류함에 있어 로짓모형과 같이 설명변수의 선형적 결합에 의한 분류 보다는 의사결정나무와 같이 다수 설명변수들의 규칙조합으로 분류하는 것이 효과적임을 나타낸다.

통계적 분류방법을 이용한 문화재 정보 분석

  • 강민구;성수진;이진영;나종화
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2009년도 춘계학술대회 미래 IT융합기술 및 전략
    • /
    • pp.120-125
    • /
    • 2009
  • 본 논문에서는 통계적 분류방법을 이용하여 문화재 자료의 분석을 수행하였다. 분류방법으로는 선형판별분석, 로지스틱회귀분석, 의사결정나무분석, 신경망분석, SVM분석을 사용하였다. 각각의 분류방법에 대한 개념 및 이론에 대해 간략히 소개하고, 실제자료 분석에서는 "지역별 문화재 통계분석 및 모형개발 연구 1차(2008)"에 사용된 자료 중 익산시 자료를 근거로 매장문화재에 대한 분류방법별 적합모형을 구축하였다. 구축된 모형과 모의실험의 결과를 통해 각각의 적합모형에 대한 비교를 수행하여 모형의 성능을 비교하였다. 분석에 사용된 도구로는 최근 가장 관심을 갖는 R-project를 사용하였다.

  • PDF

학생정보를 이용한 대졸 취업에 미치는 영향력 분석 (Determinants of job finding using student's characteristic information)

  • 조장식
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권5호
    • /
    • pp.849-856
    • /
    • 2011
  • 본 논문은 K-대학교 졸업생들의 취업여부에 미치는 영향력을 분석하기 위해 입학, 재학 및 개인특성 관련 변수들을 사용하였다. 이를 위해 모수적인 방법인 로지스틱 회귀분석을 사용하여 독립변수들의 주효과를 분석하였다. 또한 회귀분석 방법에서 독립변수들의 주효과 결과에 대한 보완으로, 비모수적인 방법인 의사결정나무 분석을 통하여 취업여부에 영향을 주는 독립변수들의 상호작용효과를 분석하였다. 먼저 회귀분석결과, 입학관련 변수들 중에서는 외국어영역 점수가 높을수록 취업확률이 높게 나타났으며, 재학 관련 변수들 중에서는 평균평점이 높을수록 취업확률이 높게 나타났다. 그리고 계열은 예체능계열에 비해서 자연계열이 취업확률이 높게 나타났으며, 개인특성 관련 변수들은 졸업 당시 연령이 작을수록 취업확률이 높게 나타났으며, 졸업시기는 8월 졸업생들에 비해서 2월 졸업생들이 취업확률이 높은 것으로 나타났다. 한편, 의사결정나무분석 결과에서는 졸업시기가 2월이면서 평균평점이 3.51점보다 높으면서 연령이 26.51세보다 작고 자연계열인 경우 취업률이 특히 높게 나타났다. 또한 졸업시기가 8월이면서 예체능계열의 졸업생인 경우 취업률이 특히 낮은 것으로 나타났다.