• Title/Summary/Keyword: 로지스틱회귀모형

검색결과 432건 처리시간 0.023초

출발지 공간 연관성을 고려한 지역별 수단선택확률 추정 연구 (Estimating Probability of Mode Choice at Regional Level by Considering Spatial Association of Departure Place)

  • 엄진기;박만식;허태영
    • 한국철도학회논문집
    • /
    • 제12권5호
    • /
    • pp.656-662
    • /
    • 2009
  • 일반적으로 교통수단선택 모형은 이용자의 인구 및 개인통행특성 등을 반영한 수단별 선호도를 효용함수로 구축하여 분석하고 있다. 본 연구에서는 이용자의 출발지에 대한 공간적 연관성을 수단선택모형에 고려한 방법을 제시하였다. 이를 위하여 공간적 연관성을 포함하는 공간로지스틱 회귀모형을 고려하였다. 신뢰성있는 추정값을 얻기 위해 베이지안 기법을 적용하였으며 이 연구에서 제시한 방법론은 수단선호도 조사가 이루어지지 않은 지역에 대해서도 수단분담률을 추정할 수 있을 것으로 기대된다.

서울 경마 경기 우승마 예측 모형 연구 (Analysis of Horse Races: Prediction of Winning Horses in Horse Races Using Statistical Models)

  • 최혜민;황나영;황찬경;송종우
    • 응용통계연구
    • /
    • 제28권6호
    • /
    • pp.1133-1146
    • /
    • 2015
  • 경마 산업은 국내 합법 사행산업의 대부분을 차지하고 있다. 그러나 사행성 도박이라는 인식 하에 여타 스포츠 산업에 비해 활발한 통계적 분석이 이루어지지 않고 있다. 본 연구의 목적은 다양한 데이터마이닝 기법을 이용하여 우승마를 예측하는 모형 개발에 있다. 모형 적합에 사용한 데이터는 한국 마사회에서 제공하는 자료를 바탕으로 하였으며, 경마 성적표, 경주마 정보, 기수 정보, 조교사 정보 등을 사용하였다. 예측 모형은 크게 두 모형으로 나누어 순위를 기반으로 한 모형과 기록을 기반으로 한 모형으로 적합하였고, 분석 방법으로는 선형회귀분석, 랜덤 포레스트, 로지스틱 회귀 분석을 사용하였다. 그 결과 말 기본 정보와 과거 우승 경력, 기수의 과거 우승 경력 등이 순위 예측에 큰 영향을 미치는 것을 알 수 있었다. 모형 적합에 사용되지 않은 최근 1개월 간 데이터를 이용하여 단승식, 복승식, 삼복승식으로 배팅한 결과 모형 간 큰 차이가 없었고, 모두 양의 수익을 얻을 수 있었다.

Support Vector Machines을 이용한 개인신용평가 : 중국 금융기관을 중심으로 (An Application of Support Vector Machines to Personal Credit Scoring: Focusing on Financial Institutions in China)

  • 딩쉬엔저;이영찬
    • 산업융합연구
    • /
    • 제16권4호
    • /
    • pp.33-46
    • /
    • 2018
  • 개인신용평가는 은행이 대출을 승인할 때 수익성 있는 의사결정을 적절히 유도할 수 있는 효과적인 도구이다. 최근 많은 분류 알고리즘 및 모델이 개인신용평가에 사용되고 있다. 개인신용평가 기법은 대체로 통계적 방법과 비 통계적 방법으로 구분된다. 통계적 방법에는 선형회귀분석, 판별분석, 로지스틱 회귀분석, 의사결정나무 등이 포함된다. 비 통계적 방법에는 선형계획법, 신경망, 유전자 알고리즘 및 Support Vector Machines 등이 포함된다. 그러나 신용평가모형 개발을 위해 어떠한 방법이 최선인지에 관해서는 일관된 결론을 내리기는 어렵다. 본 논문에서는 중국 금융기관의 개인 신용 데이터를 사용하여 가장 대표적인 신용평가 기법인 로지스틱 회귀분석, 신경망 그리고 Support Vector Machines의 성능을 비교하고자 한다. 구체적으로, 세 가지 모형을 각각 구축하여 고객을 분류하고 분석 결과를 비교하였다. 분석결과에 따르면, Support Vector Machines이 로지스틱 회귀분석과 신경망보다 더 나은 성능을 가지는 것으로 나타났다.

음주운전 초.재범자 특성 비교 (Comparison of Behavior Patterns between First and Repeated Offenders in Driving While Intoxicated(DWI))

  • 정철우;장명순
    • 대한교통학회지
    • /
    • 제27권3호
    • /
    • pp.149-160
    • /
    • 2009
  • 본 연구의 목적은 음주운전초 재범자들의 특성을 비교하고, 운전자의 혈중 알코올 농도 모형과 음주운전 재범에 모형을 개발하는 데에 있다. 운전자의 혈중 알코올 농도 예측모형은 다중회귀분석을, 음주운전 재범모형은 로지스틱 회귀분석 방법을 이용하였다. 본 연구에 따른 결과를 요약하면 다음과 같다. 첫째, 음주운전 재범자는 초범자에 비하여 형사전과와 교통사고 경력이 많았으며, 무면허 운전자는 운전면허 소지자에 비하여 혈중 알코올 농도가 높았다. 둘째, 음주운전 운전자들의 혈중 알코올 농도 회귀모형이 개발되었으며, 형사전과, 운전거리가 주요 변수임을 알 수 있었다. 셋째, 음주운전 재범 모형이 개발되었으며 과거 교통사고 경력, 운전면허 유무, 형사전과가 재범에 가장 중요한 요인인 것으로 나타났다.

기운 일반화 t 분포를 이용한 이진 데이터 회귀 분석 (Binary regression model using skewed generalized t distributions)

  • 김미정
    • 응용통계연구
    • /
    • 제30권5호
    • /
    • pp.775-791
    • /
    • 2017
  • 이진 데이터는 일상 생활에서 자주 접할 수 있는 데이터이다. 이진 데이터를 회귀 분석하는 방법으로 로지스틱(Logistic), 프로빗(Probit), Cauchit, Complementary log-log 모형이 주로 쓰이는데, 이 방법 이외에도 Liu(2004)가 제시한 t 분포를 이용한 로빗(Robit) 모형, Kim 등 (2008)에서 제시한 일반화 t-link 모형을 이용한 방법 등이 있다. 유연한 분포를 이용하면 유연한 회귀 모형이 가능해지는 점에 착안하여, 이 논문에서는 Theodossiou(1998)에서 제시된 기운 일반화 t 분포 (Skewed Generalized t Distribution)의 이용하여 우도 함수를 최대로 하는 이진 데이터 회귀 모형을 소개한다. 기운 일반화 t 분포를 R glm 함수, R sgt 패키지를 연결하여 이 논문에서 제시한 방법을 R로 분석할 수 있는 방법을 소개하고, 피마 인디언(Pima Indian) 데이터를 분석한다.

급경사지 붕괴 예측을 위한 모형 개발 (Development of model for prediction of land sliding at steep slopes)

  • 박기병;주용성;박덕근
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권4호
    • /
    • pp.691-699
    • /
    • 2011
  • 현재까지 우리나라뿐만 아니라 세계적으로 급경사지 붕괴는 대표적인 자연재해로 알려져 있다. 급경사지 붕괴 피해를 방지하기 위해 행해진 많은 선행 연구를 바탕으로 일부 국내기관에서는 급경사지 평가표를 만들어 붕괴 예측에 활용하고 있다. 하지만, 대부분의 기존 연구는 비통계전문가들에 의해 행해졌기 때문에 평가표 구성의 통계적 타당성을 제시하지 못했다. 본 연구는 전국 지역을 대상으로 급경사지 (암반사면, 토사사면) 붕괴에 영향을 미칠 것으로 예상되는 인자들의 자료를 수집하고 그 인자들의 가중치를 판정하기 위하여 로지스틱 회귀분석 방법을 사용하였다. 선행연구들 중에 로지스틱 회귀분석을 이용한 기존의 연구들이 있었지만 다중공선성을 전혀 고려하지 않았기 때문에 결과가 신뢰할 만하지 못하다. 본 연구에서는 다중공선성을 제거된 급경사지 붕괴 예측모형을 제시하였다.

신용평가에서 로지스틱 회귀를 이용한 미결정자 추론 (Undecided inference using logistic regression for credit evaluation)

  • 홍종선;정민섭
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권2호
    • /
    • pp.149-157
    • /
    • 2011
  • 본 연구는 신용평가 과정에서 발생하는 미결정자를 결측자료 문제로 간주하여 MAR와 MNAR 가정 하에서 추론한다. MAR 가정에서 미결정자 추론은 결정자들에 대한 로지스틱 회귀모형의 회귀 계수벡터를 이용하여 미결정자의 부도 확률을 구한 후 결정자의 부도확률과 비교하여 미결정자의 미래 상태를 판단한다. 그리고 MNAR 가정에서의 미결정자 추론은 특성변수가 추가한 로지스틱 모형으로부터 미결정자의 부도확률을 구하고 미결정자를 예측하는 방법을 제안하였다. 두 종류의 실제 자료에 대하여 모의실험을 한 결과, MAR 가정에서 미결정자의 비율이 증가하더라도 원자료의 오분류율과 추론한 결과 차이가 없으며, MNAR 가정에서는 추가적인 변수를 고려하여 미결정자를 추정하였기 때문에 미결정자의 오분류율이 MAR 가정에서의 오분류율보다 감소하고 나아가 전체에서 미결정자가 차지하는 비율이 증가함에 따라 전체의 오분류율이 더욱 감소함을 발견하였다.

손해배상액과 무효심판 판례를 이용한 특허 로열티율 산정 회귀모형 (Regression Models for Determining the Patent Royalty Rates using Infringement Damage Awards and Inter-Partes Review Cases)

  • 양동홍;강근석;김성철
    • 한국전자거래학회지
    • /
    • 제23권1호
    • /
    • pp.47-63
    • /
    • 2018
  • 무형자산의 가치평가에 많이 사용되고 있는 수익접근법과 시장접근법의 특성을 모두 가지고 있는 로열티공제법을 사용하여 지식재산권의 경제적 가치를 평가할 때, 로열티공제법의 중요한 투입변수인 로열티율을 객관적으로 산정하는 수리적 모형을 제시한다. 이를 위하여 미국의 특허침해 손해배상액을 로열티율로 산정한 판례를 참고로 하여 로열티율을 종속변수로, 당해 특허권의 특허지표를 독립변수로 하여 로열티율 산정 회귀모형을 적용한다. 또한 미국의 당사자계재심(Inter-Partes Review)판례를 참고로 하여 특허무효거절 결과를 종속변수로 하고 당해 특허권의 특허지표를 독립변수로 하여 로지스틱회귀 모형을 적합시킨다. 최종 로열티율은 위의 로열티율 산정 회귀모형에서 산출된 로열티율과 로지스틱회귀모형에서 산출된 특허무효거절 확률을 결합하여 산정한다. 마지막으로, 본 논문에서 구축된 모형에 의해 산정된 로열티율과 기준 방식에 의해 산정된 로열티율을 비교하여 제안된 모형의 객관성과 신뢰성을 분석한다.