• 제목/요약/키워드: Regression Tree Analysis

검색결과 394건 처리시간 0.033초

학업성취도에 대한 대입전형 요인들의 영향력 분석 (The influence analysis of admission variables on academic achievements)

  • 조장식
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권4호
    • /
    • pp.729-736
    • /
    • 2010
  • 본 논문에서는 부산 소재 K 대학교 신입생들의 학업성취도에 대해 신입생의 특성변수를 포함한 전형관련 변수들에 대한 영향력 분석을 연구한다. 이를 위해 모수적인 방법인 다중회귀분석과 비모수적인 방법인 의사결정나무 분석을 통하여 학업성취도에 대한 전형관련 변수들에 대한 주효과와 상호 작용효과를 각각 분석하였다.

기계학습을 이용한 한우고기 품질 분석 (Analysis of Meat Quality for Hanwoo Beef using Machine Learning)

  • 이웅섭
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.450-452
    • /
    • 2022
  • 최근 빅데이터 기반의 기계학습(Machine learning) 분석이 유전자 분석을 비롯한 다양한 축산분야에 활발하게 접목되어 주목할 만한 결과들을 도출하고 있다. 본 연구에서는 다양한 환경에서 수집된 한우고기 데이터를 기반으로 한우고기 품질에 영향을 미치는 육색, 수소이온농도, 보수력, 전단력, 가열감량에 대한 통계적 특성을 찾고, 이를 기반으로 기계학습의 선형 회귀(Linear regression) 및 회귀 트리(Regression tree) 방안을 이용하여 한우고기의 품질을 예측하는 방안을 제안하였다. 특히 통계적 분석을 통해 한우고기의 식감에 큰 영향을 주는 보수력의 경우 육색이 가장 큰 영향을 주고, 전단력, 가열감량의 경우 수소이온농도가 가장 큰 영향을 주는 요소인 것을 확인하였다. 제안 연구를 통해서 빅데이터 기반 기계학습 방안이 한우고기 품질 연구에 적용 가능함을 확인할 수 있었다. 또한 본 연구의 결과는 한우고기 품질 예측 및 품질 향상 연구에도 유용하게 활용될 수 있다.

  • PDF

DEA모형을 이용한 종합병원의 효율성 측정과 영향요인 (An Investigation of Factors Affecting Management Efficiency in Korean General Hospitals Using DEA Model)

  • 안인환;양동현
    • 한국병원경영학회지
    • /
    • 제10권1호
    • /
    • pp.71-92
    • /
    • 2005
  • The purpose of this study is to analyze the efficiency in management of general hospitals and investigate the major factors on efficiency. Specifically, the management of each general hospital is evaluated by using Data Envelopment Analysis(DEA) technique which is a nonparametric statistical method for measurement of efficiency. Then, the influencing factors are investigated through analyses of Decision-Tree Model and Tobit Regression. The target hospitals were general hospitals in which bed sizes are between 200 and 500 among a total of 276 general hospitals. The main data of financial indicators were collected from 48 hospitals, and it was analyzed by using two statistical models. For Model I, three input and two output variables were used for efficiency evaluation. In particular, three input variables were the number of medical doctors, the number of paramedical personnel, and the bed size. And, two output variables were the numbers of inpatients and outpatients per year, adjusted by bed-size. The results of DEA analysis showed that only seven out of 48 hospitals(15%) turned out to be efficient. The decision-tree analysis also showed that there were six significant influencing factors for Model I. Six factors for Model I were Bed Occupancy Rate, Cost per Adjusted Inpatient, New Visit Ratio of Outpatients, Retired Ratio, Net Profit to Gross Revenues, Net Profit to Total Assets. In addition, the management efficiency of hospital is proved to increase as profit and patient-induced indicators increase and cost-related indicators decrease, by the Tobit regression model of independent variables derived from the decision-tree analysis. This study may be contributable to the development of analytic methodology regarding the efficiency of hospital management in that it suggests the synthetic measures by utilizing DEA model instead of suggesting simple ratio-analyzing results.

  • PDF

Predictors of intentional intoxication using decision tree modeling analysis: a retrospective study

  • Oh, Eun Seok;Choi, Jae Hyung;Lee, Jung Won;Park, Su Yeon
    • Clinical and Experimental Emergency Medicine
    • /
    • 제5권4호
    • /
    • pp.230-239
    • /
    • 2018
  • Objective The suicide rate in South Korea is very high and is expected to increase in coming years. Intoxication is the most common suicide attempt method as well as one of the common reason for presenting to an emergency medical center. We used decision tree modeling analysis to identify predictors of risk for suicide by intentional intoxication. Methods A single-center, retrospective study was conducted at our hospital using a 4-year registry of the institute from January 1, 2013 to December 31, 2016. Demographic factors, such as sex, age, intentionality, therapeutic adherence, alcohol consumption, smoking status, physical disease, cancer, psychiatric disease, and toxicological factors, such as type of intoxicant and poisoning severity score were collected. Candidate risk factors based on the decision tree were used to select variables for multiple logistic regression analysis. Results In total, 4,023 patients with intoxication were enrolled as study participants, with 2,247 (55.9%) identified as cases of intentional intoxication. Reported annual percentages of intentional intoxication among patients were 628/937 (67.0%), 608/1,082 (56.2%), 536/1,017 (52.7), 475/987 (48.1%) from 2013 to 2016. Significant predictors identified based on decision tree analysis were alcohol consumption, old age, psychiatric disease, smoking, and male sex; those identified based on multiple regression analysis were alcohol consumption, smoking, male sex, psychiatric disease, old age, poor therapeutic adherence, and physical disease. Conclusion We identified important predictors of suicide risk by intentional intoxication. A specific and realistic approach to analysis using the decision tree modeling technique is an effective method to determine those groups at risk of suicide by intentional intoxication.

A Combinatorial Optimization for Influential Factor Analysis: a Case Study of Political Preference in Korea

  • Yun, Sung Bum;Yoon, Sanghyun;Heo, Joon
    • 한국측량학회지
    • /
    • 제35권5호
    • /
    • pp.415-422
    • /
    • 2017
  • Finding influential factors from given clustering result is a typical data science problem. Genetic Algorithm based method is proposed to derive influential factors and its performance is compared with two conventional methods, Classification and Regression Tree (CART) and Chi-Squared Automatic Interaction Detection (CHAID), by using Dunn's index measure. To extract the influential factors of preference towards political parties in South Korea, the vote result of $18^{th}$ presidential election and 'Demographic', 'Health and Welfare', 'Economic' and 'Business' related data were used. Based on the analysis, reverse engineering was implemented. Implementation of reverse engineering based approach for influential factor analysis can provide new set of influential variables which can present new insight towards the data mining field.

의사결정나무를 이용한 온라인 자동차 보험 고객 이탈 예측과 전략적 시사점 (Customer Churning Forecasting and Strategic Implication in Online Auto Insurance using Decision Tree Algorithms)

  • 임세현;허연
    • 경영정보학연구
    • /
    • 제8권3호
    • /
    • pp.125-134
    • /
    • 2006
  • 본 연구에서는 온라인 자동차보험 고객 이탈 예측에 있어 의사결정나무를 적용하였다. 우리는 본 연구에서 2003년과 2004년 사이에 온라인 자동차 보험을 계약한 고객의 데이터를 이용하여 의사결정나무를 이용해 고객이탈을 예측하였다. 우리는 C5.0 알고리즘에 기반을 둔 의사결정나무의 예측 결과에 대한 비교를 위해 다변량판별분석과 로짓분석을 이용하였다. 분석결과 의사결정나무 알고리즘은 다른 기법보다 예측성과가 매우 뛰어난 것으로 나타났다. 이러한 실증분석 결과는 온라인 자동차 보험에 있어서 마케팅전략 수립에 유용한 가이드라인을 제공해 줄 것이다.

병원도산의 예측모형 개발연구 (Developing a Combined Forecasting Model on Hospital Closure)

  • 정기택;이훈영
    • 보건행정학회지
    • /
    • 제10권2호
    • /
    • pp.1-21
    • /
    • 2000
  • This study reviewde various parametic and nonparametic method for forexasting hospital closures in Korea. We compared multivariate discriminant analysis, multivartiate logistic regression, classfication and regression tree, and neural network method based on hit ratio of each model for forecasting hospital closure. Like other studies in the literture, neural metwork analysis showed highest average hit ratio. For policy and business purposes, we combined the four analytical method and constructed a foreasting model that can be easily used to predict the probabolity of hospital closure given financial information of a hospital.

  • PDF

한국아동·청소년패널조사 데이터를 이용한 중학생 삶의 만족도 분석 (The Life Satisfaction Analysis of Middle School Students Using Korean Children and Youth Panel Survey Data)

  • 안지혜;윤유동;임희석
    • 디지털융복합연구
    • /
    • 제14권2호
    • /
    • pp.197-208
    • /
    • 2016
  • 본 연구에서는 데이터마이닝의 회귀분석 기법과 의사결정 나무분석 기법을 사용하여 중학생의 삶의 만족도에 영향을 끼치는 요인을 분석하였다. 이를 위해 청소년들을 대상으로 한 한국아동 청소년패널조사(KYCPS) 중1패널 데이터 3차 년도 자료를 활용하였다. 회귀분석을 통해 추출된 공통 영향요인은 자아 존중감, 우울, 전체 성적 만족도, 지역사회 인식, 진로 정체감, 연간 비행 피해 경험 유무, 형제자매 유무, 신뢰, 행동통제, 주의집중으로 나타났다. 이를 통해 중학생의 삶의 만족도는 개인의 정서문제, 자아인식, 또래 애착, 학습습관, 가정환경 요인 등이 복합적으로 영향을 미치는 것을 알 수 있다. 이 중에서 중학생의 삶의 만족도에 예측하기 위한 중요한 영향을 미치는 요인을 분석하기 위해서 의사결정 나무분석 기법을 사용하여 분석한 결과, 자아 존중감, 우울, 진로 정체감, 주의집중으로 나타났다.

대학 컴퓨터 실습 교양과목에서의 학업성취 요인에 대한 연구 (A Study on Factors of the Academic Achievement in Computer Training Courses as the Liberal Arts in University)

  • 김완섭
    • 정보교육학회논문지
    • /
    • 제17권4호
    • /
    • pp.433-447
    • /
    • 2013
  • 본 연구는 실습 중심의 컴퓨터 교양과목에서의 학생들의 학업성취에 영향을 미치는 요인을 발견하기 위한 것이다. 교과목 운영을 통한 교육성과 즉 학생들의 학업성취도를 향상시키기 위해서는 학업성취도에 영향을 미치는 요인들을 분석하고 그 결과를 교육에 반영하여 개선하는 순환 과정이 필요하다. 특히 컴퓨터 실습을 중심으로 하는 실용 교과목은 이론 중심의 과목들과 특성이 다르므로 그 요인에 대한 연구가 요구된다. 본 연구에서는 요인을 발견하기 위한 분석으로 로지스틱 회귀분석과 데이터마이닝 분야의 결정트리 분석을 수행하였다. 실험을 위한 데이터로는 서울소재 S대학의 교양필수과목에서 시행된 MOS 자격증 시험결과를 사용하였다. 로지스틱 회귀분석을 통해서는 담당교수, 수강인원, 수업시간, 그룹(강의기간) 순으로 중요성을 파악할 수 있었다. 데이터마이닝의 의사결정트리 분석을 통해서는 그 외에 학번, 재수강 여부, 강의실 환경의 추가 요인을 발견할 수 있었고, 특히 다양한 요인들이 학업성취에 복합적으로 영향을 미치는 것을 트리 모형을 통해 파악할 수 있었다. 분석 결과의 트리모형을 결과로 제시하였으며, 수식을 제안하여 여러개의 트리 모형으로부터 요인의 중요도를 수치화하여 제시하였다.