• 제목/요약/키워드: 의사결정나무회귀분석

검색결과 123건 처리시간 0.028초

Support Vector Machines을 이용한 개인신용평가 : 중국 금융기관을 중심으로 (An Application of Support Vector Machines to Personal Credit Scoring: Focusing on Financial Institutions in China)

  • 딩쉬엔저;이영찬
    • 산업융합연구
    • /
    • 제16권4호
    • /
    • pp.33-46
    • /
    • 2018
  • 개인신용평가는 은행이 대출을 승인할 때 수익성 있는 의사결정을 적절히 유도할 수 있는 효과적인 도구이다. 최근 많은 분류 알고리즘 및 모델이 개인신용평가에 사용되고 있다. 개인신용평가 기법은 대체로 통계적 방법과 비 통계적 방법으로 구분된다. 통계적 방법에는 선형회귀분석, 판별분석, 로지스틱 회귀분석, 의사결정나무 등이 포함된다. 비 통계적 방법에는 선형계획법, 신경망, 유전자 알고리즘 및 Support Vector Machines 등이 포함된다. 그러나 신용평가모형 개발을 위해 어떠한 방법이 최선인지에 관해서는 일관된 결론을 내리기는 어렵다. 본 논문에서는 중국 금융기관의 개인 신용 데이터를 사용하여 가장 대표적인 신용평가 기법인 로지스틱 회귀분석, 신경망 그리고 Support Vector Machines의 성능을 비교하고자 한다. 구체적으로, 세 가지 모형을 각각 구축하여 고객을 분류하고 분석 결과를 비교하였다. 분석결과에 따르면, Support Vector Machines이 로지스틱 회귀분석과 신경망보다 더 나은 성능을 가지는 것으로 나타났다.

기계학습을 이용한 스마트폰 이용이 보행속도에 미치는 영향 분석 (Effects of Smartphone Usage on Walking Speed using Machine Learning Method)

  • 진혜련;도명식
    • 한국ITS학회 논문지
    • /
    • 제18권2호
    • /
    • pp.93-103
    • /
    • 2019
  • 본 연구에서는 대전광역시 내의 보행로 2개소를 대상으로 보행 중 스마트폰 사용이 보행속도에 미치는 영향을 분석하였다. 분석을 위해 스마트폰 사용실태에 대한 영상자료를 취득하고 도로용량편람에서 제시한 보행자 서비스수준의 보행밀도를 기준으로 보행속도를 산정하였다. 보행속도에 미치는 영향을 분석하기 위한 방법으로는 기계학습을 통한 다중회귀분석과 의사결정나무(Decision tree)를 활용하였으며, 설명변수로는 성별, 스마트폰 미사용, 청각을 이용한 스마트폰 사용, 시각을 이용한 스마트폰 사용, 서비스수준A, 서비스수준B, 서비스수준C가 선정되었다. 분석결과 서비스수준C가 보행속도 변화에 가장 높은 영향을 미치는 것으로 나타났으며, 서비스수준C에서 시각을 활용해 스마트폰을 이용한 여성그룹이 가장 낮은 속도로 보행하는 것으로 나타났다. 특히 음악 감상이나 통화와 같은 청각을 이용한 유형보다 시각을 이용하는 경우 대부분의 경우에서 보행속도가 크게 저하되며 통계적으로 유의한 차이가 있음을 확인하였다.

영어강의의 효과성에 대한 연구 (Study on the effectiveness of english-medium class)

  • 조장식
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권6호
    • /
    • pp.1137-1144
    • /
    • 2012
  • 요즘 대부분의 대학들이 국제화를 목표로 재학생들의 어학능력 및 국제적 경쟁력 강화와 함께 영어강의의 중요성이 증대되고 있다. 본 연구에서는 강의평가점수를 이용해서 과목특성 변수들과 개인특성 변수들 별로 영어강의와 한국어강의의 효과성을 비교하였다. 또한 로지스틱회귀분석과 의사결정나무분석을 이용하여 어떤 요인들이 영어강의가 한국어강의에 비해서 효과적인지를 주효과와 상호작용효과 측면에서 분석하였다. 분석결과에 따르면 영어강의의 효과성에 영향을 미치는 변수로는 학년, 계열, 강좌규모, 평균평점, 계열, 전형방법 등으로 나타났다. 또한 영어강의 효과성이 특히 높은 그룹은 1학년이면서 인문계열인 경우, 그리고 1학년이면서 자연 및 예체능계열이고 평균평점이 높은 그룹이 높게 나타났다. 그리고 영어강의의 효과성 비율이 특히 낮은 그룹은 2-3학년 학생이면서 강좌규모가 크고 인문계열인 경우로 나타났다.

건설현장의 아차사고 연결가능성에 대한 패턴분석 (A Pattern Analysis on the Possibility of Near Miss Connection in Construction Sites)

  • 김상현;신연철;문유미
    • 한국재난정보학회 논문집
    • /
    • 제19권1호
    • /
    • pp.216-230
    • /
    • 2023
  • 연구목적: 아차사고의 분석을 통하여 재해를 예측하여 사고를 예방하는 목적이 있다. 연구방법: 본 연구에 서는 건설 현장의 아차사고 문헌조사 및 데이터를 수집하고, 설문조사를 실시하여 아차사고 연결 가능성 분류를 위해 로지스틱 회귀분석 및 의사결정나무 분석을 이용하였다. 연구결과: 아차사고 types이 정신적, 신체적, 안전습관 행동에 미치는 영향을 분석한 결과, 신체에 영향력이 높은 요인은 아차사고 관리의 필요성, 직종은 전기·정보통신, 건강 상태 순으로, 정신적 요인에서 공사 규모가 영향력이 높았으며, 경험 공종, 중상자 수, 직종 순으로 습관 행동 요인에 영향력이 높은 요인은 착각, 부적절한 작업지시, 신체 부위 순으로 분석되었다. 의사결정나무 분석을 통해 아차사고가 놀랄 정도의 사고로 연결가능성에 영향을 미치는 요인과 패턴을 확인하였다. 결론: 건설현장관계자는 아차사고 관찰을 고려하여 정신적. 신체적 측면의 아차사고와의 연관성에 대한 구체적 관리가 실행되어야 하며, 부적절한 작업지시가 아차사고로 연결되지 않도록 인원 배치, 작업계획, 작업절차 및 방법, 피드백을 통해 중대재해가 저감하는 작업환경을 기대한다.

청년 1인가구 임차인의 주거만족도에 관한 연구: 부산·경남지역을 중심으로 (A Study on the Residential Satisfaction of Single Youth Households Tenants)

  • 권정표;강정규
    • 토지주택연구
    • /
    • 제13권2호
    • /
    • pp.65-79
    • /
    • 2022
  • 본 연구에서는 부산·경남지역 청년 1인가구 임차인의 주거만족도에 영향을 미치는 주요 특성 및 청년층 주거관에 대한 영향력을 분석하고 세부적으로 분류하여 향후 주거 문제 및 방향에 대한 시사점을 제시하고자 한다. 이를 위해 선행연구를 토대로 한 이론을 바탕으로 청년 1인가구 임차인의 주거 특성 만족도에 대한 주요 변수 및 향후 1인가구 지속 의향, 혼인 의향 및 가구원 증가에 대한 의향을 질문하기 위한 청년층 주거관에 대한 변수도 포함하여 연구하였다. 실증분석은 설문조사의 결과를 바탕으로 SPSS Statistics 25.0 통계 프로그램을 사용하여 다중회귀분석 및 의사결정나무모형 분석을 실시하였다. 실증분석 결과 첫째, 주거 임차특성 만족도 및 1인가구 지속 의향은 자연적 특성, 주거 특성, 물리적 특성, 1인가구 지속 의향 순으로 주거만족도에 정(+)의 영향을 미치는 것으로 나타났다. 둘째, 주거 임차특성 만족도 및 향후 혼인 의향은 자연적 특성, 주거 특성, 물리적 특성 순으로 주거만족도에 정(+)의 영향을 미치는 것으로 나타났다. 셋째, 주거 임차특성 만족도 및 향후 가구원 증가 의향은 자연적 특성, 주거 특성, 물리적 특성 만족도 순으로 주거만족도에 정(+)의 영향을 미치는 것으로 나타났다. 넷째, 주거만족도를 종속변수로 한 의사결정나무모형 분석 결과, 자연적 특성이 3.4 초과이며, 전세일 때 주거만족도가 가장 높게 나타났다. 본 연구의 시사점은 다음과 같다. 첫째, 부산·경남지역 청년 1인가구의 주거환경 개선 정책이 필요하다. 둘째, 부산·경남지역 청년 1인가구 임차인을 위한 맞춤형 주택 공급은 청년층의 주거만족도를 향상시키는데 도움이 될 것이다. 셋째, 부산·경남지역 청년 1인가구 임차인의 라이프스타일에 적합한 공간에 일정비율 주거공급이 이루어져야 한다.

데이터마이닝 기법을 활용한 한국인의 고위험 음주 예측모형 개발 연구 (Developing the high-risk drinking predictive model in Korea using the data mining technique)

  • 박일수;한준태
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권6호
    • /
    • pp.1337-1348
    • /
    • 2017
  • 본 연구는 질병관리본부에서 실시한 전국 규모의 자료인 지역사회건강조사 2014년 자료를 이용하여 고위험 음주자들의 특성 및 요인을 파악하고 고위험 음주 예측모형을 개발했다. 예측모형 개발은 데이터마이닝 방법 중 로지스틱 회귀분석, 의사결정나무, 신경망 분석 3가지 방법을 적용했으며, 로지스틱 회귀분석의 주요 결과로는 40대 남자의 위험도가 높았고, 사무직과 판매서비스직의 위험도가 높았다. 특히 현재 흡연자인 경우 고위험 음주 위험도가 높았다. 3가지 방법 중 AUROC (area under a receiver operation characteristic curve) 측면에서 신경망 분석과 로지스틱 회귀분석이 가장 높게 나타났다. 또한 고위험 음주 예방을 위한 우선 관리 대상자를 선정함에 있어 신경망 분석과 로지스틱 회귀분석으로 개발된 예측모형의 사후확률을 기초로 두 가지 모형 모두 예측분포의 상위 10%인 집단에 해당되는 경우를 선정한 결과 신경망 분석이나 로지스틱 회귀모형 1가지 모형으로 적용하는 것보다 반응률 및 향상도가 다소 개선되는 것으로 나타났다. 본 연구에서 개발된 고위험 음주 예측모형과 우선 관리 대상자 선정 방법은 문제적 음주 예방 및 개선 교육, 절주 프로그램 개발 등에 보다 세분화되고 효과적인 건강관리 서비스를 제공을 위한 기초자료가 될 수 있을 것이다.

초음파를 이용한 한우 육량등급의 조기예측 (Early Prediction of Carcass Yield Grade by Ultrasound in Hanwoo)

  • 이용준;석홍기;김석중;송영한
    • Journal of Animal Science and Technology
    • /
    • 제45권2호
    • /
    • pp.327-334
    • /
    • 2003
  • 본 시험은 초음파를 이용하여 한우의 도체형질을 조기에 예측하기 위하여 거세한우 66두를 대상으로 18, 21 및 24개월령에 도체형질을 측정하고, 중회귀 분석 및 의사결정나무 분석을 이용하여 24개월령 출하시 도체형질을 예측하였다. 그 결과를 요약하면 다음과 같다. 도체육량등급에 따라 군을 분류하고 성장에 따른 도체형질의 변화를 관찰한 결과, 등지방 두께는 전기간에 걸쳐 각 도체육량등급간에 유의적(p<0.05)인 차이를 보이며 A, B, C등급 순으로 얇게 나타났다. 중회귀 분석에 의한 도체육량등급의 예측율은 18, 21 및 24개월령에서 각각 78.8%, 86.4% 및 90.9%를 나타냈으며, 의사결정나무 분석에 의한 도체육량등급 예측율은 각 개월령에 따라 78.8%, 89.4% 및 89.4%를 나타냈다.

도로위의 기상요인이 교통사고에 미치는 영향 - 부산지역을 중심으로 - (The effect of road weather factors on traffic accident - Focused on Busan area -)

  • 이경준;정임국;노윤환;윤상경;조영석
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권3호
    • /
    • pp.661-668
    • /
    • 2015
  • 교통사고는 인구의 증가와 그에 따른 자동차의 증가로 인하여 매년 증가하고 있다. 그러한 교통사고의 원인은 운전자의 부주의뿐만 아니라 도로상의 기상상황에 의해 영향을 받는다. 특히, 강수량, 시계, 습도, 흐림 정도, 기온 등에 의해 많은 교통사고들이 영향을 받는다. 따라서 본 연구는 다양한 기상 요인의 영향 정도에 따른 교통사고 발생 유무의 분석을 목적으로 하였다. 부산 해운대구의 센텀남대로 및 해운대로의 2013년도 교통사고 발생 자료와 지역별 상세 기상 관측 자료인 AWS 기상자료(시간당 강수량, 강수유무, 기온, 풍속), 시간대, 요일을 활용하여 로지스틱 회귀모형 및 의사결정나무모형을 이용하여 분석하였다. 그 결과 기상 요인 중 강수유무와 기온이 교통사고 발생에 영향을 미치는 요인으로 나타났다. 이러한 결과는 도로위의 기상상태에 따른 교통사고의 발생을 예측하는데 유용하게 사용할 수 있을 것이다.

나이브 베이즈 분류와 기상예보자료 기반의 농업용 저수지 저수율 전망을 위한 저수율 예측 다중선형 회귀모형 개발 (Development of Multiple Linear Regression Model to Predict Agricultural Reservoir Storage based on Naive Bayes Classification and Weather Forecast Data)

  • 김진욱;정충길;이지완;김성준
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2018년도 학술발표회
    • /
    • pp.112-112
    • /
    • 2018
  • 최근 이상기후로 인한 국부적인 혹은 광역적인 가뭄이 빈번하게 발생하고 있는 추세이며 발생횟수 뿐 아니라 가뭄 심도 및 지속기간이 과거보다 크게 증가하여 그에 따른 피해가 커질 것으로 예측되고 있다. 특히, 2014~2015년도의 유례없는 가뭄으로 인해 저수지 용수공급이 제한되면서 많은 농가들이 피해를 입었다. 본 연구의 목적은 전국 농업용 저수지를 대상으로 기상청 3개월 예보자료를 활용 할 수 있는 농업용 저수지 저수율 다중선형 회귀 모형을 개발하여 저수율 전망정보를 생산하는 것이다. 본 연구에서는 전국에 적용 가능한 저수율 다중선형 회귀 모형개발을 위해 5개의 기상요소(강수량, 최고기온, 최저기온, 평균기온, 평균풍속)와 관측 저수지 저수율을 활용했다. 기상자료는 2002년부터 2017년까지의 기상청 63개 지상관측소로부터 기상관측자료를 수집하였다. 본 연구에서는 저수율 전망 단계를 세 단계로 나누었다. 첫 번째 단계로 농어촌공사에서 전국 511개 용수구역을 대상으로 군집분석 및 의사결정나무 분석을 통해 제시한 65개 대표저수지를 대상으로 기상자료 및 관측 저수율 자료를 이용하여 다중선형 회귀분석을 실시하였다. 수집한 기상요소와 저수율을 독립변수로 하여 월별 회귀식을 산정한 결과 결정계수($R^2$)는 0.51~0.95로 나타났다. 두 번째 단계로 대표저수지의 회귀분석 결과를 전국의 저수지로 확대하기 위해 나이브 베이즈 분류법을 적용하여 전국 3098개의 저수지를 65의 군집으로 분류하고 각각의 군집에 해당되는 월별 회귀식을 산정하였다. 마지막으로 전국 저수지로 산정된 회귀식과 농업 가뭄 예측을 위해 기상청의 GS5(Global Seasonal Forecasting System 5) 3개월 예보자료를 수집하여 회귀식에 적용해 2017년 전국 저수지의 3개월 저수율 전망정보를 생산하였다. 본 연구의 전국 저수지 군집결과 기반의 저수율 전망기술은 2017년도 관측 저수율과 비교한 결과 유의한 상관성을 나타냈으며 이 결과는 추후 농업용 저수지의 물 공급 및 농업가뭄 전망 자료로서 이용이 가능할 것으로 판단된다.

  • PDF

KOSDAQ 시장의 관리종목 지정 탐지 모형 개발 (Development of a Detection Model for the Companies Designated as Administrative Issue in KOSDAQ Market)

  • 신동인;곽기영
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.157-176
    • /
    • 2018
  • 관리종목은 상장폐지 가능성이 높은 기업들을 즉시 퇴출하기 보다는 시장 안에서 일정한 제약을 부여하고, 그러한 기업들에게 상장폐지 사유를 극복할 수 있는 시간적 기회를 주는 제도이다. 뿐만 아니라 이를 투자자 및 시장참여자들에게 공시하여 투자의사결정에 주의를 환기시키는 역할을 한다. 기업의 부실화로 인한 부도 예측에 관한 연구는 많이 있으나, 부실화 가능성이 높은 기업에 대한 사회, 경제적 경보체계라 할 수 있는 관리종목에 관한 연구는 상대적으로 매우 부족하다. 이에 본 연구는 코스닥 기업들 가운데 관리종목 지정 기업과 비관리종목 기업을 표본으로 삼아 로지스틱 회귀분석과 의사결정나무 분석을 이용하여 관리종목 지정 예측 모형을 개발하고 검증하였다. 분석결과에 따르면 로지스틱 회귀분석 모형은 ROE(세전계속사업이익), 자기자본현금흐름률, 총자산회전율을 사용하여 관리종목 지정을 예측하였으며, 전체 평균 예측 정확도는 검증용 데이터셋에 대해 86%의 높은 성능을 보여주었다. 의사결정나무 모형은 현금흐름/총자산과 ROA(당기순이익)를 통한 분류규칙을 적용하여 약 87%의 예측 정확도를 보여주었다. 로지스틱 회귀분석 기반의 관리종목 탐지 모형의 경우 ROE(세전계속사업이익)와 같은 구체적인 관리종목 지정 사유를 반영하면서 기업의 활동성에 초점을 맞추어 관리종목 지정 경향성을 설명하는 반면, 의사결정 관리종목 탐지 모형은 기업의 현금흐름을 중심으로 하여 관리종목 지정을 예측하는 것으로 나타났다.