• 제목/요약/키워드: 의사결정나무 분석

검색결과 406건 처리시간 0.028초

의사결정나무모형을 사용한 성인 생애주기별 취업 영향요인 분석 (Finding factors on employment by adult life cycle using decision tree model)

  • 곽민정;이성석
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권6호
    • /
    • pp.1537-1545
    • /
    • 2016
  • 세계적으로 유가하락과 더불어 경제가 침체되면서 우리나라도 저성장의 기조를 보이고 있고, 노동 시장에서는 취업난이 가중되고 있으므로 취업영향 요인을 파악하여 적절한 취업 정책을 수립하는 것이 절실한 현실이다. 따라서 본 연구에서는 제17차년도 노동패널자료를 사용하여 취업에 영향을 미치는 요인을 파악하고자 한다. 성인 생애주기는 청년기, 중장년기와 노년기로 구분하였으며 취업에 영향을 미치는 요인으로 인구통계학적 변수, 직업관련 변수 그리고 건강관련 변수를 고려하였다. 의사결정나무분석을 사용하여 분석한 결과 청년기에는 학력이 가장 중요한 요인이었으며, 중장년기에는 가장 중요한 요인이 성별이었고, 남성의 경우 건강상태, 여성의 경우, 직업훈련경험, 연령, 건강상태의 순으로 나타났다. 노년기에도 성별이 가장 중요한 요인이었고 그 다음으로 건강상태, 학력 등의 순으로 나타났다.

병원외 심정지 환자의 자발적 순환 회복에 영향을 미치는 요인 (Factors influencing the return of spontaneous circulation of patients with out-of-hospital cardiac arrest)

  • 박일수;김은주;손혜숙;강성홍
    • 디지털융복합연구
    • /
    • 제11권9호
    • /
    • pp.229-238
    • /
    • 2013
  • 병원외 심정지는 오늘날 우리나라의 중대한 보건문제로서, 환자의 퇴원 시 생존율은 3.5%이며, 이 중 1%만이 신경학적 기능을 회복하는 것으로 나타났다. 이처럼 낮은 병원외 심정지 환자의 생존율을 높이기 위해서는 병원 도착 전 환자의 자발적 순환을 회복시키는 것이 매우 중요하다. 따라서 본 연구에서는 질병관리본부의 2009년도 심정지 의무기록 조사 자료를 활용하여 병원외 심정지 환자의 자발적 순환 회복률을 향상시킬 수 있는 요인들에 대한 심층 분석을 수행하였다. 심정지 환자의 자발적 순환 회복에 영향을 미치는 요인은 의사결정나무기법을 적용하여 분석하였으며, 그 결과 도착전 CPR여부, 병원 도착전 심정지 목격여부, 심정지시 활동, 과거력(암/심장질환/뇌졸중), 심정지 발생 장소, 병원전 일반인 CPR여부, 신고~현장 도착까지 걸린 시간, 연령 등이 중요한 요인으로 밝혀졌다. 이 요인들의 조합을 통해 의사결정나무모형으로 분류된 심정지 환자는 총 16개 유형이었으며, 그 중 유형 1의 특징을 갖는 집단의 자발적 순환 회복률(29.6%)이 가장 높게 나타났다. 더불어 비공공장소에서 심정지가 발생한 환자에게 일반인이 CPR을 시행하였을 경우, 심정지 환자의 자발적 순환 회복률이 향상된 것으로 보아 지역주민들에 대한 CPR교육이 중요함을 파악할 수 있었다.

건설현장의 아차사고 연결가능성에 대한 패턴분석 (A Pattern Analysis on the Possibility of Near Miss Connection in Construction Sites)

  • 김상현;신연철;문유미
    • 한국재난정보학회 논문집
    • /
    • 제19권1호
    • /
    • pp.216-230
    • /
    • 2023
  • 연구목적: 아차사고의 분석을 통하여 재해를 예측하여 사고를 예방하는 목적이 있다. 연구방법: 본 연구에 서는 건설 현장의 아차사고 문헌조사 및 데이터를 수집하고, 설문조사를 실시하여 아차사고 연결 가능성 분류를 위해 로지스틱 회귀분석 및 의사결정나무 분석을 이용하였다. 연구결과: 아차사고 types이 정신적, 신체적, 안전습관 행동에 미치는 영향을 분석한 결과, 신체에 영향력이 높은 요인은 아차사고 관리의 필요성, 직종은 전기·정보통신, 건강 상태 순으로, 정신적 요인에서 공사 규모가 영향력이 높았으며, 경험 공종, 중상자 수, 직종 순으로 습관 행동 요인에 영향력이 높은 요인은 착각, 부적절한 작업지시, 신체 부위 순으로 분석되었다. 의사결정나무 분석을 통해 아차사고가 놀랄 정도의 사고로 연결가능성에 영향을 미치는 요인과 패턴을 확인하였다. 결론: 건설현장관계자는 아차사고 관찰을 고려하여 정신적. 신체적 측면의 아차사고와의 연관성에 대한 구체적 관리가 실행되어야 하며, 부적절한 작업지시가 아차사고로 연결되지 않도록 인원 배치, 작업계획, 작업절차 및 방법, 피드백을 통해 중대재해가 저감하는 작업환경을 기대한다.

데이터 마이닝에서 배깅, 부스팅, SVM 분류 알고리즘 비교 분석 (An Empirical Comparison of Bagging, Boosting and Support Vector Machine Classifiers in Data Mining)

  • 이영섭;오현정;김미경
    • 응용통계연구
    • /
    • 제18권2호
    • /
    • pp.343-354
    • /
    • 2005
  • 데이터 마이닝에서 데이터를 효율적으로 분류하고자 할 때 많이 사용하고 있는 알고리즘을 실제 자료에 적용시켜 분류성능을 비교하였다. 분류자 생성기법으로는 의사결정나무기법 중의 하나인 CART, 배깅과 부스팅 알고리즘을 CART 모형에 결합한 분류자, 그리고 SVM 분류자를 비교하였다. CART는 결과 해석이 쉬운 장점을 가지고 있지만 데이터에 따라 생성된 분류자가 다양하여 불안정하다는 단점을 가지고 있다. 따라서 이러한 CART의 단점을 보완한 배깅 또는 부스팅 알고리즘과의 결합을 통해 분류자를 생성하고 그 성능에 대해 평가하였다. 또한 최근 들어 분류성능을 인정받고 있는 SVM의 분류성능과도 비교?평가하였다. 각 기법에 의한 분류 결과를 가지고 의사결정나무를 형성하여 자료가 가지는 데이터의 특성에 따른 분류 성능을 알아보았다. 그 결과 데이터의 결측치가 없고 관측값의 수가 적은 경우는 SVM의 분류성능이 뛰어남을 알 수 있었고, 관측값의 수가 많을 때에는 부스팅 알고리즘의 분류성능이 뛰어났으며, 데이터의 결측치가 존재하는 경우는 배깅의 분류성능이 뛰어남을 알 수 있었다.

다년도 자료를 이용한 고혈압 유병률의 지역간 변이 분석 (Analysis on Geographical Variations of the Prevalence of Hypertension Using Multi-year Data)

  • 김유미;조대곤;홍성옥;김은주;강성홍
    • 대한지리학회지
    • /
    • 제49권6호
    • /
    • pp.935-948
    • /
    • 2014
  • 고혈압과 같은 만성 질환의 관리는 국가보건정책에서 중요한 사업이다. 본 연구는 지역사회 특성이 고혈압의 유병률에 어떻게 영향을 주는지를 분석하였다. 분석을 위해 237개 시군구 소지역의 건강상태 및 건강 행태를 포함한 다년간의 자료를 수집하였다. 지표는 2009~2011년 질병관리본부의 지역사회건강조사와 국민건강보험공단 등의 자료를 사용하였다. 지역간 변이 분석을 위해 지리적 가중회귀분석과 의사결정나무 모형을 이용하였다. 연구결과 다년간 자료를 이용하는 것이 단년간 자료를 이용하는 것보다 더 적합도가 높았는데 이것은 대부분의 변수에서 연도별 유의한 차이가 있었기 때문이다. 또 고혈압 유병률은 당뇨병 및 비만 유병률과 양의 관련성이 있었으며 인구밀도와는 음의 상관관계를 보였다. 특히 이러한 요인들의 지역적 변이는 지리적 가중회귀분석 결과에서 더욱 뚜렷하였다. 이상의 결과를 바탕으로 분석한 의사결정나무 모형에서는 고혈압 유병률에 영향을 미치는 중요한 변수가 지역별로 매우 상이하다는 것을 확인할 수 있었다. 지역주민의 건강상태, 건강행태, 사회경제적 요인의 지역간 차이를 규명하는 것은 고혈압 유병률을 감소시키기 위한 지역별 맞춤형 보건정책을 수립하는데 매우 중요하다. 본 연구의 결과는 만성질환 관리를 위한 맞춤형 지역보건정책을 수립하는데 기초자료를 제공할 수 있다는 데 의의가 있다.

  • PDF

의사결정나무 및 랜덤포레스트 분류 모델을 이용한 교량 안전등급 예측 (Prediction of Safety Grade of Bridges Using the Classification Models of Decision Tree and Random Forest)

  • 홍지수;전세진
    • 대한토목학회논문집
    • /
    • 제43권3호
    • /
    • pp.397-411
    • /
    • 2023
  • 국내에서 공용연수 30년 이상인 노후 교량의 수가 급증하고 있다. 이에 따라 교량 노후도, 상태 및 성능 예측을 바탕으로 한 첨단 유지관리 기술의 중요성이 점차 주목받고 있다. 이 연구에서는 머신러닝 기반의 의사결정나무 및 랜덤포레스트 분류 모델을 사용하여 교량의 안전등급을 예측하는 방법을 제안하였다. 일반국도상 교량 8,850개를 대상으로 해당 모델들을 혼동행렬, 균형 정확도, 재현율, ROC 곡선 및 AUC와 같이 여러가지 평가 지표를 통해 분석한 결과 전반적으로 랜덤포레스트가 의사결정나무보다 더 나은 예측 성능을 보유하였다. 특히 랜덤포레스트 중 랜덤 언더 샘플링 기법은 노후도가 비교적 커서 유지관리에 주의를 기울여야 하는 C, D등급 교량에 대해 재현율 83.4%로 다른 샘플링 기법들보다 예측 성능이 더 뛰어난 것으로 나타났다. 제안된 모델은 최근 점검이 실시되지 않은 교량들의 신속한 안전등급 파악 및 효율적이고 경제적인 유지관리 계획 수립에 유용하게 활용될 수 있을 것으로 기대된다.

데이터마이닝을 활용한 이탈고객 스코어링 모델 개발

  • 한상태;이성건;강현철;유동균
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2001년도 추계학술발표회 논문집
    • /
    • pp.155-161
    • /
    • 2001
  • 최근의 많은 기업에서는 방대한 고객 데이터베이스를 활용하여 자사의 경쟁력을 갖추는 방안으로써 데이터마이닝을 선택하고 있다. 본 연구에서는 데이터마이닝을 활용해 손해보험사의 데이터베이스를 분석하여 자동차보험 고객의 이탈을 방지하는 이탈고객 스코어링 모델을 개발하였다. 분석방법론으로는 의사결정나무와 로지스틱 회귀분석을 사용하였으며 기업에서의 데이터마이닝을 위한 일련의 과정을 상세히 기술하고 기업의 데이터베이스가 가지고 있는 문제점을 지적하였다.

  • PDF

보행자-차량 충돌사고 특성분석 방법론 비교 연구 (Comparison of Methodologies for Characterizing Pedestrian-Vehicle Collisions)

  • 최새로나;정은비;오철
    • 대한교통학회지
    • /
    • 제31권6호
    • /
    • pp.53-66
    • /
    • 2013
  • 최근 운전자의 보행자-차량 충돌사고 감소를 목적으로 한 다양한 연구가 수행되고 있으며, 본 연구에서는 보행자-차량 사고 발생 특성 및 심각도 영향요인 분석을 위하여 다양한 분석방법론을 활용한 보행자 교통사고 분석을 수행하였다. 통계모형과 휴리스틱모형 적용시 각 기법에 따른 결과를 도출함으로써 보행자 사고분석시 분석목적에 적합한 방법론을 제시하는 것을 목적으로 하였다. 이를 위하여 최근 3년간 발생한 경기도 교통사고자료(2008-2010년)를 활용하여 보행자 교통사고의 발생특성을 분석하였다. 또한, 통계모형인 이항 로지스틱 회귀분석, 순서형 프로빗 모형을 이용하여 보행자 교통사고 심각도 증가에 통계적으로 유의한 영향을 미치는 변수를 도출하였으며, 휴리스틱모형인 서포트 벡터 머신, 의사결정나무를 적용하여 교통사고 심각도 분류를 위한 모형을 개발하고 그 결과를 비교분석 하였다. 본 연구의 분석결과는 보행자 교통안전분석의 기초자료로 활용할 수 있으며 향후 국내 보행자-차량 충돌사고 분석시 유용하게 활용될 수 있을 것으로 기대된다.

실시간 CRM을 위한 분류 기법과 연관성 규칙의 통합적 활용;신용카드 고객 이탈 예측에 활용

  • 이지영;김종우
    • 한국경영정보학회:학술대회논문집
    • /
    • 한국경영정보학회 2007년도 International Conference
    • /
    • pp.135-140
    • /
    • 2007
  • 이탈 고객 예측은 데이터 마이닝에서 다루는 주요한 문제 중에 하나이다. 이탈 고객 예측은 일종의 분류(classification) 문제로 의사결정나무추론, 로지스틱 회귀분석, 인공신경망 등의 기법이 많이 활용되어왔다. 일반적으로 이탈 고객 예측을 위한 모델은 고객의 인구통계학적 정보와 계약이나 거래 정보를 입력변수로 하여 이탈 여부를 목표변수로 보는 형태로 분류 모델을 생성하게 된다. 본 연구에서는 고객과의 지속적인 접촉으로 발생되는 추가적인 사건 정보를 활용하여 연관성 규칙을 생성하고 이 결과를 기존의 방식으로 생성된 분류 모델과 결합하는 이탈 고객 예측 방법을 제시한다. 제시한 방법의 유용성을 확인하기 위해서 특정 국내 신용카드사의 실제 데이터를 활용하여 실험을 수행하였다. 실험 결과 제시된 방법이 기존의 전통적인 분류 모델에 비해서 향상된 성능을 보이는 것을 확인할 수 있었다. 제시된 예측 방법의 장점은 기존의 이탈 예측을 위한 입력 변수들 이외에 고객과 회사간의 접촉을 통해서 생성된 동적 정보들을 통합적으로 활용하여 예측 정확도를 높이고 실시간으로 이탈 확률을 갱신할 수 있다는 점이다.

  • PDF

사용자 맞춤형 건강 콘텐츠 추천 알고리즘에 대한 연구 (A Study on Personalized Health Care Contents Recommendation Algorithm)

  • 이하늘;이하영;한아연;신문선
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2017년도 제56차 하계학술대회논문집 25권2호
    • /
    • pp.360-361
    • /
    • 2017
  • 본 논문에서는 웹 또는 앱을 통해 제공되는 무한한 정보 중에서 사용자들에게 필요한 건강 관련 정보를 맞춤형으로 제공하기 위해서 사용자 맞춤형 건강 콘텐츠 추천 알고리즘을 설계한다. 그리하여 집단 지성 알고리즘과 의사 결정 나무를 활용하여 사용자 맞춤형 건강 콘텐츠 추천 서비스를 이용하는 사용자들의 자가건강진단 정보를 활용하여 웹상의 URL 정보를 토대로 맞춤형 정보를 분석, 추천하는 알고리즘의 유용성을 제시한다.

  • PDF