• 제목/요약/키워드: 로지스틱 회귀 분석

검색결과 1,683건 처리시간 0.027초

머신러닝 기법을 이용한 대설피해 예측 및 적합성 검토 (Prediction of Snow Damage Using Machine Learning Technique)

  • 이형주;정건희
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2020년도 학술발표회
    • /
    • pp.192-192
    • /
    • 2020
  • 취약성 분석의 결과로 폭설에 의한 기후노출은 현재에는 강원권이 가장 취약한 것으로 나타났다. 그러나 미래에는 강원권, 충청권, 호남권을 연결하는 축으로 취약지역이 확대될 것으로 전망된다. 본 연구에서는 다양한 머신러닝 기법을 이용하여 대설피해 예측을 실시하였다. 머신러닝 기법으로는 로지스틱회귀모형, 서포트벡터 머신, 의사결정트리 모형을 적용하였다. 종속변수로 대설피해액 자료를 이용하였고, 독립변수로 기상관측자료, 사회·경제적 요소를 사용하였다. 결과적으로 기존에 사용했던 다중회귀모형과 머신러닝 기법으로 예측한 예측력을 비교 및 분석하였고, 예측력이 가장 높은 머신러닝 기법을 제시하였다. 본 연구에서 대설피해 예측을 위해 사용된 예측력이 가장 높은 기법을 활용하여 대설피해를 예측한다면, 미래에 전국적으로 확대될 대설피해에 대해 효과적으로 대비할 수 있을 것으로 기대된다.

  • PDF

산재보험 부정수급 식별모형에 관한 연구 (A Study on the Fraud Detection of Industrial Accident Compensation Insurance)

  • 함승오;홍정식
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회 2008년도 추계학술대회 및 정기총회
    • /
    • pp.342-345
    • /
    • 2008
  • 산재 발생 시 산재근로자는 근로복지공단을 통해서 각종 급여를 받게 된다. 본 논문은 심사 과정과 급여지급 후에 부정수급으로 판명된 산재 청구 건을 데이터 마이닝을 통해서 분석하여 부정수급의 유형을 발견하고자 한다. 이 연구에서는 서울관내 4개 지사에서 8년 동안(2000년$\sim$2007년)의 총 61,536명의 최초요양 신청을 한 산재근로자 자료를 대상으로 하였고, 종속변수에 영향을 미치는 8개의 독립변수를 선택해서 사용한다. 데이터 마이닝을 적용함에 있어서 가장 효율적인 허위 부정 탐지 모델을 만들기 위해 의사결정나무분석(Decision Tree)과 로지스틱 회귀분석(Logistic Regresion)등의 다양한 기법을 적용하여 결과를 비교분석 하고, 오분류 비용을 적용하여, 최적의 분류결정 값을 가지는 모델을 도출한다. 분석결과, 로지스틱 회귀분석이 산재보험 부정수급 유형 발견에 보다 효과적인 모델로 판명되었다. 또한 판별점(Cut-Off) 0.01로 했을 때 4개변수(요양기간, 업종형태, 의료기관, 재해발생형태)가 부정수급에 탐지하는데 영향력이 큰 변수로 선정되었다.

  • PDF

데이터 마이닝을 이용한 교통사고 심각도 분류분석 (Data Mining for Road Traffic Accident Type Classification)

  • 손소영;신형원
    • 대한교통학회지
    • /
    • 제16권4호
    • /
    • pp.187-194
    • /
    • 1998
  • 본 연구는 교통사고 심각도와 관련된 중요변수를 찾고 이들 변수를 바탕으로 신경망, Decision Tree, 로지스틱 회귀분석을 이용하여 사고 심각도 분류 예측모형을 추정하였다. 다수의 범주형 변수로 이루어진 교통사고 통계원표상의 설명변수 들로부터 사고 심각도 변화에 영향력 있는 변수 선택을 위하여 독립성 검정을 위한 $x^2$ test와 Decision Tree를 이용하였고, 선택된 변수들은 신경망과 로지스틱 회귀분석의 기초로 이용되었다. 분석결과 세가지기법간에 분류정확도에는 유의한 차이가 없는 것으로 나타났다. 그러나 Decision Tree가 설명변수 선택능력과 분석수행시간, 사고 심각도 결정요인 식별의 용이함 측면에서 범주형 종속변수인 사고 심각도의 분석에 적합한 것으로 보이며 사고 심각도에는 보호장구가 가장 큰 영향을 미치는 것으로 재입증되었다.

  • PDF

데이터 마이닝을 이용한 교통사고 심각도 분류분석 (Data Mining for Road Traffic Accident Type Classification)

  • 손소영
    • 대한교통학회:학술대회논문집
    • /
    • 대한교통학회 1998년도 Proceedings 제34회 추계 학술발표회
    • /
    • pp.373-381
    • /
    • 1998
  • 본 연구는 교통사고 심각도와 관련된 중요변수를 찾고 이들 변수를 바탕으로 신경망, Decision Tree, 로지스틱 회귀분석을 이용하여 사고 심각도 분류 예측모형을 추정하였다. 다수의 범주형 변수로 이루어진 교통사고 통계원표상의 설명변수 들로부터 사고 심각도변화에 영향력 있는 변수선택을 위하여 $X^2$ 독립성 검정과 Decision Tree를 이용하였고, 선택된 변수들은 신경망과 로지스틱 회귀분석의 기초로 이용되었다. 분석결과 세가지기법간에 분류정확도에는 유의한 차이가 없는 것으로 나타났다. 그러나 decision Tree가 설명변수 선택능력과 분석수행시간, 사고 심각도 결정요인 식별의 용이함 측면에서 범주형 종속변수인 사고 심각도의 분석에 적합합 것으로 보이며 사고 심각도에는 보호장구가 가장 큰 영향을 미치는 것으로 재입증되었다.

  • PDF

한국 제조기업의 혁신성과에 영향을 미치는 장애요인에 관한 연구

  • 김재영;황정재;박재민
    • 한국기술혁신학회:학술대회논문집
    • /
    • 한국기술혁신학회 2017년도 추계학술대회 논문집
    • /
    • pp.483-497
    • /
    • 2017
  • a본 논문에서는 과학기술정책연구원에서 조사한 2016년 한국기술혁신조사(KIS 2016) 데이터를 이용하여 한국 제조기업의 혁신성과에 영향을 미치는 혁신저해요인에 관한 분석을 진행하였다. KIS 2016 데이터의 제조업 기업 수는 4000개였는데 이 중 혁신 설문에서 제시한 혁신 저해요인 중 아무것도 겪지 않았다고 답한 기업과 응답이 누락된 기업을 제외한 3159개 기업의 데이터를 활용하여 분석을 진행하였으며, 분석 방법으로는 로지스틱 회귀모형을 사용하였다. 자료를 바탕으로 요인분석을 실시하였으며, 그에 따라 혁신 저해요인으로 자금 문제, 기업 역량 요인, 필요 요인 총 세 가지 요인이 추출되었다. 이를 바탕으로 로지스틱 회귀분석 결과 자금 문제와 기업 역량 요인의 경우 혁신 제품의 시장 출시에 정(+)의 영향을 미치는 것으로 나타났으며 필요 요인의 경우 음(-)의 영향을 미치는 것으로 나타나 기업의 혁신 성공에 있어서는 기술혁신의 필요성에 대한 인식 제고가 시급한 것으로 분석되었다.

  • PDF

한우 거세우 고기 관능평가 데이터의 로지스틱 회귀분석 (Logistic Regressions with Sensory Evaluation Data about Hanwoo Steer Beef)

  • 이혜정;김재희
    • 응용통계연구
    • /
    • 제23권5호
    • /
    • pp.857-870
    • /
    • 2010
  • 국립축산과학원에서는 2006년 부터 2008년 까지 전국 소비자들을 대상으로 한우 거세우 표본 시료에 대한 관능 평가 조사를 실시하여 데이터를 수집하였으며 본 연구에서는 한우 관능 평가 데이터에 대해 사회 인구학적 요인과 한국 소비자들의 맛 평가에 대한 연관성을 탐구하고자 한다. 소비자 거주지역, 연령, 성별, 직업, 월수입과 쇠고기 부위를 설명변수로 맛등급 평가를 반응변수로 이항 다중 로지스틱 모형과 다항 다중 로지스틱 모형을 적합하고 회귀계수별 유의성 검정과 적합도 검정을 실시한다. 단계별 변수 선택으로 최종 모형을 선택하고 반응변수 범주에 대한 오즈비를 계산하여 맛등급과 설명변수들 간의 관련성을 파악한다. 또한 맛과 관련 있는 연속형 변수를 설명변수로 포함한 경우에 대해서도 이항 다중 로지스틱 모형과 다항 다중 로지스틱 모형을 적합하고 비교한다. 그 결과 거주 지역, 연령, 월수입과 쇠고기 부위 변수들이 선택되었으며 영남지역에서 맛에 대한 오즈가 큰 편이며 수입이 많고 연령이 높을수록 맛에 대한 오즈가 작은 편이었다. 요리법으로는 탕에 대한 구이의 오즈비가 큰 편이며 쇠고기 부위별로는 우둔에 비해서 등심이 다른 부위들 보다 맛에 대한 차이가 크다고 볼 수 있다. 연속형 변수로는 연도가 맛등급에 큰 영향을 미치는 변수로 나타났다.

로버스트추정에 바탕을 둔 주성분로지스틱회귀 (Principal Components Logistic Regression based on Robust Estimation)

  • 김부용;강명욱;장혜원
    • 응용통계연구
    • /
    • 제22권3호
    • /
    • pp.531-539
    • /
    • 2009
  • 로지스틱회귀분석은 고객관계관리를 위한 데이터마이닝 분야에서 많이 사용되는 기법인데, 이 분야의 모형설정 과정에서는 연관성이 매우 높은 설명변수들이 모형에 함께 포함되어 다중공선성의 문제를 유발하며, 더욱이 회귀자료에 이상점들이 포함되면 최우추정량은 심각한 결함을 갖게 된다. 두 가지 문제점을 동시에 해결하기 위하여 로버스트주성분로지스틱회귀를 적용할 수 있는데, 본 논문에서는 주성분의 선정기준을 결정하는 모형을 개발하고, 주성분모형에서의 추정치에 미치는 이상점의 영향을 축소하기 위한 로버스트추정법을 제안하였다. 제안된 추정법은 다중공선성과 이상점이 유발하는 문제들을 적절히 해결해 준다는 사실이 모의실험을 통하여 확인되었다.

노인의 사망요인 분석: 치매와 타 원인간의 비교

  • 김한곤
    • 한국인구학
    • /
    • 제30권1호
    • /
    • pp.49-66
    • /
    • 2007
  • 본 연구는 2001년 한국에서 사망한 60세 이상 노인들 62,000명의 사망기록 자료를 이용하여 사망원인의 다양성을 보여주는 한편 치매에 의한 사망원인을 가장 잘 예측할 수 있는 변수를 경험적으로 규명하고자 실시하였다. 이와 같은 목적을 위한 연구내용은 다음과 같다. 첫째, 노인들의 주요 사망원인에 해당하는 악성종양, 뇌혈관 질환, 심장병, 당뇨, 만성 호흡기 질환, 치매, 고혈압, 간 질환, 사고, 결핵 및 기타 질병 등 11개 사망원인에 대하여 빈도분석을 실시하였다. 둘째, 60세 이상 사망자들 가운데 치매에 의한 사망원인과 나머지 19개의 사망원인을 비교하여 치매에 의한 사망에 영향을 미치는 요인들을 다항로지스틱회귀분석을 통해 분석하였다. 그 결과, 한국의 노인인구 가운데 연령이 높을수록 치매로 인하여 사망할 가능성(우도비)이 높으며 여성이 남성에 비해 치매에 의하여 사망할 가능성이 높은 것으로 밝혀졌다. 그러나 교육수준이 높을수록 치매에 의하여 사망할 가능성이 낮은 것으로 나타났으며 거주지역은 치매에 의한 사망과 통계적으로 유의미한 관계가 있었으나 일관성은 없는 것으로 밝혀졌다. 한편 결혼지위는 치매에 의한 사망과 통계적으로 유의미한 관계가 없는 것으로 나타났다.

로지스틱 회귀분석을 이용한 중부·남부 고속도로별 사망사고 원인 분석 및 비교에 관한 연구 (A Study on the Cause of Death Accident between Cental & Southern Area Highways using Logistic Regression Analysis)

  • 윤병조;백준혁;양승룡
    • 한국재난정보학회:학술대회논문집
    • /
    • 한국재난정보학회 2017년 정기학술대회
    • /
    • pp.209-210
    • /
    • 2017
  • 본 연구는 고속도로 40개선을 중부 남부 그룹으로 나누어 종단경사, 월별, 가해자연령구간 측면에서 사고 특성을 파악함으로써 유의하게 지역별 고속도로 사망사고를 높이는 요인을 분석하고자 했다. 조사된 노선 중 88올림픽선, 남해선, 호남선, 울산선 등을 포함한 18개 고속도로 노선을 남부 그룹으로, 경인선, 영동선, 서울외곽순환선 등을 포함한 11개 고속도로 노선을 중부 그룹으로 나누어 비교 분석 결과는 다음과 같았다. 고속도로에서의 사망사고 주요 원인의 비율 1위 과속, 2위 주시태만으로 비슷했으나 남부 고속도로 그룹은 요인 중 졸음에만 유의했다. 중부 고속도로 그룹에서도 졸음 시 유의하게 나타났으며 남부보다 오즈비가 1.22배 높게 나타났다. 추가로 중부 고속도로 그룹에서 주시태만(오즈비 1.477), 운전자기타(오즈비 0.347)이 유의하게 도출되었다.

  • PDF

학생 중도탈락 예측 모델에 관한 연구 (A Study on the Prediction Model for Student Dropout)

  • 이종혁;김대학;길준민
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.37-40
    • /
    • 2018
  • 빅데이터 산업 부상과 함께 교육 데이터 분석 분야가 새롭게 주목받고 있다. 교육 현장에서 학습 데이터의 양과 종류는 꾸준히 증가하고 있고 이를 분석하기 위한 정보기술도 계속 발전하고 있다. 한편, 학교 교육은 사회적 성취와 밀접한 관련이 있어 사회이동의 중요한 수단이 되는 만큼 학교 교육으로부터 이탈할 위험이 있는 학생들을 조기에 발견하여 이탈을 방지하는 것은 매우 중요하다. 본 논문은 대학생의 중도탈락을 예방하기 위해 로지스틱 회귀분석과 다층 퍼셉트론 기법을 이용해 학습 데이터를 분석하여 예측 모델을 생성하고 해당 모델을 평가한다. 평가 결과, 다층 퍼셉트론 모델이 로지스틱 회귀분석 모델에 비해 정확도와 재현율은 우수하였지만 정밀도는 약간 저조하였다.