• 제목/요약/키워드: 이항모형

검색결과 280건 처리시간 0.026초

제로팽창 모형을 이용한 보험데이터 분석 (A Zero-Inated Model for Insurance Data)

  • 최종후;고인미;전수영
    • 응용통계연구
    • /
    • 제24권3호
    • /
    • pp.485-494
    • /
    • 2011
  • 계수(Count) 데이터는 반응변수가 음이 아닌 계수로, 자동차 사고건수나 지진이 일어난 횟수, 보험처리 발생건수 등을 말한다. 이런 경우에는 주로 포아송 회귀모형을 사용하지만, 평균과 분산이 동일한 경우만 이용될 수 있다는 제약이 따른다. 실증적 자료에서는 그룹 간 이질성으로 인해 분산이 매우 큰 과대산포(Overdispersion) 현상을 볼 수 있는데, 이를 무시할 경우 회귀계수나 표준오차가 편의되는 현상이 발생한다. 보험은 보장성 개념이 강하기 때문에 실제로 보험처리가 발생하지 않는 경우가 많아, 보험처리 건수에 '0'값이 있을 수 있다. 본 논문에서는 '0'값이 많은 자료의 분석을 위해 제로팽창 모형(Zero-Inflated Model)을 고려하고, 여러 모형들의 효율성을 실증자료를 통하여 비교하였다. 실증 자료 분석 결과, 과대산포와 제로팽창 현상이 존재하는 자료에서 제로팽창 음이항 모형(Zero-Inflated Negative Binomial Regression Model)이 가장 효율적인 모형임을 보여 주었다.

로지스틱 회귀모형을 이용한 비대칭 종형 확률곡선의 추정 (Estimation of Asymmetric Bell Shaped Probability Curve using Logistic Regression)

  • 박성현;김기호;이소형
    • 응용통계연구
    • /
    • 제14권1호
    • /
    • pp.71-80
    • /
    • 2001
  • 로지스틱 회귀모형은 이항 반응자료에 대한 가장 보편적인 일반화 선형모형으로 독립변수에 대한 확률함수를 추정하는데 이용된다. 많은 실제적 상황에서 확률함수가 종형의 곡선형태로 표현되는데 이 경우에는 2차항을 포함한 로지스틱 회귀모형을 이용한 분석은 대칭성을 갖는 확률함수에 대한 가정으로 인해 비대칭 형태의 종형곡선에서는 확률함수의 신뢰성이 저하되고, 2차항을 포함하기 때문에 독립변수의 효과를 설명하기가 쉽지 않다는 제한점을 가지고 있다. 본 논문에서는 이러한 문제점을 해소하기 위해서 로지스틱 회귀분석과 반복적 이분법을 이용하여 종형의 형태에 관계없이 확률곡선을 추정하는 방법론을 제안하고 모의 실험을 통해 2차항을 포함한 로지스틱 회귀모형과 비교하고자 한다.

  • PDF

고속도로 연계성을 반영한 고속철도 수단선택모형 개발 및 적용 (Development of Mode Choice Model and Applications Considering Connectivity of Express Way)

  • 조항웅;정성봉;김시곤;오재학
    • 한국철도학회논문집
    • /
    • 제14권4호
    • /
    • pp.383-389
    • /
    • 2011
  • 지금까지 고속철도와 고속도로의 계획 및 건설은 시설 간 연계 환승에 대한 고려 없이 개별시설 확충 위주로 진행되었으며. 이로 인해 시설의 효율적 투자 및 활용은 이루어지지 않았다. 본 연구에서는 고속도로 연계성 향상으로 고속철도 수단선택행태에 미치는 영향을 다항로짓모형(Multinominal Logit Model)과 이항로짓모형(Binary Logit Model)을 활용하여 분석하였다. 모형개발을 위한 설문조사는 고속철도, 고속버스, 장거리 승용차 이용자를 대상으로 통행실태조사와 진술선호조사를 수행하였으며, 이를 통해 고속철도와 연계 환승수단에 대한 수단분담모형을 구축하였다. 수단선택모형을 통하여 고속도로와 고속철도가 연계 시 동탄역을 대상으로 사례분석을 수행한 결과 서울~부산 간 약 2시간의 통행시간이 단축되었으며, 이로 인해 약 30%의 수요증가 효과가 있는 것으로 분석되었다. 본 연구를 통하여 고속철도와 고속도로의 계획 시 연계 환승을 고려하여 건설 및 운영이 이루어질 경우, 고속철도의 이동성 기능과 고속도로의 접근성 기능을 결합함으로써 수단간 효율성을 극대화할 수 있을 것으로 판단된다.

종분포모형의 불확실성 확인을 위한 앙상블모형 적용 (Applying Ensemble Model for Identifying Uncertainty in the Species Distribution Models)

  • 권혁수
    • 대한공간정보학회지
    • /
    • 제22권4호
    • /
    • pp.47-52
    • /
    • 2014
  • 종분포모형은 생물다양성 평가, 보호지역 지정, 서식지 관리 및 복원, 기후변화 예측 등의 다양한 분야에 활용되고 있으나 공공이나 정책분야에서는 모형의 불확실성으로 인하여 활용이 제한적이었다. 최근에는 이러한 모형의 불확실성을 저감하기 위하여 앙상블이나 합의모형 등의 다중모형을 적용하는 연구가 증가하고 있다. 이에 본 연구에서는 히어리를 대상으로 단일모형과 앙상블(다중) 모형을 적용하고 이를 비교하는 연구를 수행하였다. 모형은 AUC와 kappa, TSS를 이용하여 적합도를 평가하였으며, 이 중 모형 간의 비교가 용이하고 이항형 지도로 바로 변환할 수 있는 TSS가 효과적이었다. 단일모형과 앙상블 모형 모두 높은 모형적합도를 나타내었으며, 다중 모형 중에서는 RF, Maxent, GBM이 높게, GAM, SRE는 비교적 낮게 평가되었다. 예측지도에서는 단일모형에 비해 다중모형의 예측범위가 과대 추정되는 경향이 있었다. 이는 여러 모형이 중첩된 결과로 현장전문가와 모형전문가들 간의 협력연구를 통하여 적절한 모형 선택과 가중치 부여 등을 통하여 문제를 해결할 수 있다. 앙상블모형을 공간의사결정이나 보호지역계획에 활용하기 위해서는 불확실성의 정도와 원인을 파악하고, 이를 저감하려는 개선작업과 함께 결과의 불확실성이나 위험성을 인지하고 의사결정을 해야 한다.

한국국민의 가계 금융부채에 대한 체감도 분석 (Analysis of Stress level of Korean Household Members due to Household Debt)

  • 오만숙;현승미
    • 응용통계연구
    • /
    • 제22권2호
    • /
    • pp.297-307
    • /
    • 2009
  • 최근 금융위기의 요인이 되고 있는 가계부채에 대하여 가계구성원이 느끼는 부담감, 즉, 가계부채에 대한 체감도에 가계구성원의 속성들(주택점유형태, 가구주 학력, 가구주 연령, 월소득, 거주지역)이 미치는 영향을 2004년도 국민은행이 조사한 실제자료를 가지고 분석하였다. 체감도를 부채에 대한 부담감이 낮음과 높음의 이항자료로 구분하여 가계구성원의 속성들을 설명변수로 갖는 로지스틱 회귀분석을 수행하였다. 적합도에 대한 우도비 통계량을 이용한 후진제거법을 사용하여 간단하면서도 자료를 잘 적합시키는 모형을 선택한 결과 2개의 2차 교호작용을 갖는 모형이 선택되었다. 선택된 모형에 대한 계수 추정치를 통하여 각 속성이 부채 체감도에 대하여 미치는 영향을 분석하였다. 또한 가계부채의 유무에 대하여 가계구성원의 속성들이 미치는 영향을 로지스틱 회귀모형을 통하여 유사한 방법으로 분석하였다 자가주택일수록, 월소득이 증가할수록, 가구주 학력이 낮을수록 그리고 가구주 연령이 낮아질수록 부채에 대한 체감도가 낮아짐을 알 수 있었다.

도시화 정도에 따른 결혼이주여성의 지역사회통합에 미치는 차별적 영향 분석: 특별·광역시 지역과 도지역 거주자의 비교 (Discriminant Factors Influencing the Community Integration of Immigrant Women on Marriage: Comparison of Regional Traits)

  • 김경범;박철민
    • 한국콘텐츠학회논문지
    • /
    • 제18권4호
    • /
    • pp.214-222
    • /
    • 2018
  • 본 연구는 결혼이주여성을 특별 광역시지역과 도지역 거주자 구분하여, 거주지의 특성이 지역사회통합에 미치는 차별적 영향 변인 분석을 목적으로 하였으며, 특별 광역시지역 거주 결혼이주여성 163명, 도지역 거주 결혼이주여성 182명을 대상으로 설문조사를 실시하여 결과를 분석하였다. 이항로짓모델(binary logit model)을 주로 이용하여 분석한 결과를 보면 다음과 같다. 첫째, 모형의 적합성은 특별 광역시지역 모형과 도지역 모형 모두 적합한 것으로 나타났다. 둘째, 특별 광역시지역 모형과 도지역 모형의 영향력을 비교한 결과, 개인적 특성 및 가족적 특성은 특별 광역시 지역보다 도지역에서 지역사회통합에 강한 영향을 미치는 반면, 사회적 특성은 도지역보다 특별 광역시 지역에서 지역사회통합에 강한 영향을 미치는 것으로 나타났다. 이는 향후 정책적 개입에 있어 차별화된 전략이 요구됨을 시사한다.

차량 주행궤적을 이용한 후미추돌 가능성 예측 모형 (Prediction of Rear-end Crash Potential using Vehicle Trajectory Data)

  • 김태진;오철;강경표
    • 대한교통학회지
    • /
    • 제29권3호
    • /
    • pp.73-82
    • /
    • 2011
  • 최근 교통상황을 정확하게 관측할 수 있는 교통류 검지에 관한 기술개발과 더불어 개별차량 주행궤적을 이용한 교통안전도 평가기법에 대한 관심이 높아지고 있다. 본 연구에서는 개별차량의 주행궤적을 이용하여 다음시점(t+1) 의 후미추돌 확률을 산출하는 방법론을 제시하였다. 신뢰성 있는 예측 기법인 칼만 필터링(Kalman Filtering)을 이용하여 주행궤적을 예측하고, 예측된 시점에 대한 개별차량의 후미추돌 확률을 산출하였다. 안전도를 평가하는 확률모형을 수립하기 위해서 서해안 고속도로의 동영상 자료로부터 개별차량의 주행궤적을 추출하였다. 추출한 개별차량의 주행궤적 자료를 이항 로지스틱 회귀분석(Binary logistic regression)을 이용하여 차량의 차로변경 결정 확률 모형을 생성하였고, exponential decay function을 이용하여 surrogate safety measure(SSM)의 하나인 time-to-collision(TTC)기반의 추돌확률 모형을 생성하였다. 미시적 교통류 시뮬레이터인 VISSIM에서 추출한 개별차량의 주행궤적 데이터를 이용하여 제안된 방법론을 평가하였다. 본 연구의 결과는 교통류 감시, 제어 및 정보 시스템에 효과적으로 적용될 수 있으며, 나아가 교통사고 예방에 효율적인 대안이 될 수 있을 것으로 판단된다.

ZAM을 이용한 원형교차로 원인별 사고모형 개발 (Accident Models of Circular Intersection by Cause Using ZAM)

  • 나희;박병호
    • 한국도로학회논문집
    • /
    • 제14권2호
    • /
    • pp.101-108
    • /
    • 2012
  • 이 연구는 국내 원형교차로에서 발생한 교차로 사고를 다루고 있다. 연구의 목적은 ZAM을 이용하여 원인별 사고모형을 개발하는데 있다. 주요결과는 다음과 같다. 첫째, 교차로 운행방법 위반에서는 ZINB 모형이 적합한 것으로 분석되었다. 둘째, 안전거리 미확보에서도 ZINB 모형이 적합한 것으로 분석되었다. 마지막으로 공통변수로는 교통량과 회전차로 폭이 선정되었다. 교통량이 많을수록 그리고 회전차로 폭이 좁을수록 사고가 많이 발생하는 것으로 분석되었다. 특정변수로는 접근로수와 감속 시설수가 채택되었고, 접근로수가 증가할수록 그리고 감속시설수가 적을수록 사고가 증가하는 것으로 분석되었다. 이 연구는 원형교차로 사고연구에 기여할 것으로 기대된다.

다변량 다수준 이항자료에 대한 일반화선형혼합모형 (Generalized Linear Mixed Model for Multivariate Multilevel Binomial Data)

  • 임화경;송석헌;송주원;전수영
    • 응용통계연구
    • /
    • 제21권6호
    • /
    • pp.923-932
    • /
    • 2008
  • 우리는 자명하지 않은 상관 구조를 갖는 복잡한 다변량 자료에 직면하는 경우가 있다. 예를 들어 군집 구조 자료의 경우 생략된 변수들이 한 개 이상의 관측값에 동시적으로 영향을 줄 수 있기 때문에 결과들 간에 상관 구조를 모형화하는 것은 추정량의 효율성과 정확한 표준오차의 계산 등의 타당한 추론을 위해서 중요하다 관측값들 간에 종속성을 두는 표준 방법으로는 관측 값들이 관찰되지 않은 어떤 변수를 공유한다고 가정하는 것인데, 이러한 가정에 대해 본 연구에서는 다수준 모형을 고려한 상관된 임의효과 모형을 적합시켰다. 추정은 준모수적 접근방법으로 임의계수 분포에 대한 모수적 가정 없이 유한혼합 EM-알고리즘을 통하여 수행되었다.

로지스틱회귀모형의 변수선택에서 로그-오즈 그래프를 통한 로그-밀도비 연구 (A study on log-density with log-odds graph for variable selection in logistic regression)

  • 강명욱;신은영
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권1호
    • /
    • pp.99-111
    • /
    • 2012
  • 반응변수가 주어졌을 때 설명변수의 조건부 확률분포의 로그-밀도비는 로지스틱회귀모형에서 어떤 설명변수가 어떻게 모형에 포함되는지에 대한 변수선택문제에서 유용한 정보를 제공한다. 설명변수의 조건부 확률분포가 좌우대칭이 아닌 경우 감마분포로 가정하는 것이 적절하고 이 경우 x항과 log(x)항이 모형에 포함되어야 한다. 로그-오즈 그래프는 변수선택문제를 연구하는데 매우 중요한 도구가 된다. 이러한 그래픽적 연구에 의하면, x|y = 0과 x|y = 1의 두 분포가 겹치는 경우에서는 x항과 log(x)항 모두 필요하다. 그리고 두 분포가 분리된 경우에는 x항 또는 log(x)항 중 하나만 필요하다.