• 제목/요약/키워드: 음이항 회귀

검색결과 97건 처리시간 0.031초

고속도로 평면선형상 사고빈도분포 추정을 통한 음이항회귀모형 개발 (기하구조요인을 중심으로) (Fitting Distribution of Accident Frequency of Freeway Horizontal Curve Sections & Development of Negative Binomial Regression Models)

  • 강민욱;도철웅;손봉수
    • 대한교통학회지
    • /
    • 제20권7호
    • /
    • pp.197-204
    • /
    • 2002
  • 교통사고예측 및 예방을 위해서는 실제적으로 도로설계과정에서 제어가 가능한 도로 기하구조요소에 대한 사고관계를 파악함이 타당하다. 즉, 도로의 설계자는 도로건설에 앞서 기하구조요소와 사고와의 관계를 현장자료를 통해 정확히 밝혀 도로설계에 반영해야 한다. 이를 위해, 교통사고의 빈도분포를 박히는 것은 가장 기본이 되는 일이며, 교통사고 예측모형개발에 선행되어야 한다. 일반적으로 교통사고건수의 경우 분산이 평균보다 큰 과분산(overdispersion)의 특징을 가지고 있어 음이항 분포를 따른다고 알려져 있다. 따라서 본 논문은 사고모형의 개발에 앞서, 사고발생지점에 대한 도로설계요소와 기타 잠재적인 사고발생 관련요인이 비교적 잘 파악되어있는 호남고속도로를 중심으로 평면 선형상 곡선부에 대하여 교통사고의 분포를 적합도 검정을 통해 알아보고자 하였다. 사고자료는 한국도로송사의 호남고속도로 5년(1996∼2000)간 자료를 분석에 맞게 정리하였으며, 강민욱과 송봉수(2002)에서 제시한 평면선형에 있어서의 구간분할법을 이용하여 배향곡선구간과 단일곡선구간에 대한 사고분석을 하였다. 적합도 분석결과, 예상대로 음이항분포가 사고건수를 설명하기에 가장 적합한 확률분포로 제시되었으며, 이를 통해 최우추정법을 이용한 음이항회귀모형을 개발하였다. 구간분할법을 적용한 음이항회귀모형의 경우, 기존의 확률회귀토형에 비하여 높은 결정계수를 갖았으며, 모형에서 적용된 기하구조요소로는 차량 노출계수, 곡선반경, 단위거리 당 편경사변화값 등이다.

서로 다른 산포를 허용하는 이변량 영과잉 음이항 회귀모형 (Bivariate Zero-Inflated Negative Binomial Regression Model with Heterogeneous Dispersions)

  • 김동석;정슬기;이동희
    • Communications for Statistical Applications and Methods
    • /
    • 제18권5호
    • /
    • pp.571-579
    • /
    • 2011
  • 본 연구에서는 두 반응 변수에 서로 다른 산포를 허용하는 새로운 이변량 영과잉 음이항 회귀모형을 제안하고, Deb과 Trivedi (1997)에 나타난 헬스케어 자료를 이용하여 두 반응변수가 갖는 서로 다른 산포도를 무시한 Wang (2003)이 제안한 이변량 영과잉 음이항 회귀모형과의 효율성을 로그우도와 AIC의 관점에서 비교 하였다. 모형적합결과, 본 연구에서 제안한 모형이 모형선택기준 관점에서 기존모형에 비하여 월등히 우수한 결과를 보여주었다.

폴랴-감마 잠재변수에 기반한 베이지안 영과잉 음이항 회귀모형: 약학 자료에의 응용 (A Bayesian zero-inflated negative binomial regression model based on Pólya-Gamma latent variables with an application to pharmaceutical data)

  • 서기태;황범석
    • 응용통계연구
    • /
    • 제35권2호
    • /
    • pp.311-325
    • /
    • 2022
  • 0의 값을 과도하게 포함하는 가산자료는 다양한 연구 분야에서 흔히 나타난다. 영과잉 모형은 영과잉 가산자료를 분석하기 위해 가장 일반적으로 사용되는 모형이다. 영과잉 모형에 대한 전통적인 베이지안 추론은 조건부 사후분포의 형태가 폐쇄형 분포로 나타나지 않아 모형 적합 과정이 용이하지 않다는 한계점이 존재했다. 그러나 최근 Pillow와 Scott (2012)과 Polson 등 (2013)이 제안한 폴랴-감마 자료확대전략으로 인해, 로지스틱 회귀모형과 음이항 회귀모형에서 깁스 샘플링을 통한 추론이 가능해지면서, 영과잉 모형에 대한 베이지안 추론이 용이해졌다. 본 논문에서는 베이지안 추론에 기반한 영과잉 음이항 회귀모형을 Min과 Agresti(2005)에서 분석된 약학 연구 자료에 적용해본다. 분석에 사용된 자료는 경시적 영과잉 가산자료로 복잡한 자료 구조를 가지고 있다. 모형 적합 과정에서는 깁스 샘플링을 통한 추론을 수행하기 위해 폴랴-감마 자료확대전략을 사용한다.

기계학습을 활용한 데이터 기반 경찰신고건수 예측 (The Data-based Prediction of Police Calls Using Machine Learning)

  • 최재훈
    • 한국빅데이터학회지
    • /
    • 제3권2호
    • /
    • pp.101-112
    • /
    • 2018
  • 본 연구는 기계학습의 하나인 신경망 분석과 음이항 회귀분석을 활용하여 경찰신고건수를 예측하고자 2016년 6월부터 2017년 5월까지 충남지방경찰청에 접수된 112신고 데이터를 이용하여 예측모델을 개발하였다. 모델을 개발하기 위해 경찰신고건수에 영향을 줄 수 있는 시간, 휴일, 휴일 전날, 계절, 기온, 강수량, 풍속, 관할면적, 인구, 외국인 수, 단독주택비율, 기타주택비율 변수 등을 활용하였다. 변수의 종류에 따라 몇몇은 경찰신고건수와 양의 상관관계 또는 음의 상관관계가 확인되었다. 사용된 두 개의 방법론을 비교한바, 신경망분석의 예측 결과는 예측 값과 실제 값의 상관계수 0.7702, RMSE 2.557이고, 음이항 회귀분석은 상관계수 0.7158, RMSE 2.831으로 나타났다. 신경망분석은 해석가능성은 낮지만, 음이항 회귀분석에 비해 예측력이 뛰어나다는 것이 확인되었다. 향후 경찰관서에서 본 연구의 예측모델을 기초로 하여 최적의 경찰력 배치를 할 수 있을 것으로 기대된다.

영과잉 음이항회귀 모형을 이용한 보험설계사들의 이직횟수 적합 (Fit of the number of insurance solicitor's turnovers using zero-inflated negative binomial regression)

  • 전희주
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권5호
    • /
    • pp.1087-1097
    • /
    • 2017
  • 본 연구는 계수자료 (count data)를 반응변수로 갖는 포아송회귀 모형, 음이항회귀 모형, 영과잉 포아송회귀 모형, 영과잉 음이항회귀 모형의 4 모형의 비교를 통해 보험 설계사들의 이직횟수 적합을 위한 최적모형을 찾고자 한다. 보험설계사 이직횟수의 분산이 평균보다 큰 과대산포가 존재하고 0인 경우의 비중이 높을 경우에 영과잉 음이항회귀 모형을 적합하는 것이 타당함을 보여주고 보험 설계사들의 이직횟수에 영향을 주는 요인을 규명하고자 한다. 로그우도값, AIC, SBC 등을 고려하여 보험설계사 이직횟수 적합을 최적의 모형은 영과잉 이항모형과 음이항회귀모형의 결합인 영과잉 음이항 모형이 선택되었다. 영과잉 이항모형에 포함된 변수로는 성별, 총 보험설계사 근무연월, 교차모집 설계사 등록, 보유고객 수, 소속회사 유형이었고, 음이항회귀 모형에 포함된 변수로는 직무만족, 조직몰입, 채널경영만족, 총 보험설계사 근무연월, 현 직장에서 근무연월, 소속회사 유형이었다. 영과잉 음이항회귀 모형의 적합결과, 이직횟수에 유의한 영향을 주는 요인으로는 현 직장에서 근무연월, 총 보험설계사 근무연월, 소속회사 유형, 채널경영만족, 직무만족 순으로 나타났다.

제로팽창 음이항 회귀모형에 대한 베이지안 추론 (Bayesian Inference for the Zero In ated Negative Binomial Regression Model)

  • 심정숙;이동희;정병철
    • 응용통계연구
    • /
    • 제24권5호
    • /
    • pp.951-961
    • /
    • 2011
  • 본 논문에서는 제로팽창 음이항(ZINB) 회귀모형에서 회귀계수에 대한 추론방법으로 마코프체인몬테카를로(MC MC) 기법을 이용한 베이지안 추론방법을 제안하였다. 본 연구에서 고려한 ZINB 회귀모형은 반응변수의 평균뿐만 아니라 제로팽창확률에 대한 회귀모형을 고려한 것으로서 Jang, et al.(2010)의 연구를 확장한 것이다. 아울러 실제사례에 본 연구에서 제안한 베이지안 추론방법을 적용하고 과대산포를 허용하지 않는 제로팽창 포아송(ZIP) 회귀모형과 적합결과를 DIC를 이용하여 비교하였다. 실제 사례분석 결과 ZINB 회귀모형의 DIC가 ZIP모형보다 작게 나타나 ZINB 회귀모형이 ZIP 회귀모형보다 잘 적합되었음을 알 수 있었다.

중소기업 청년인턴 이직횟수 결정요인 분석 (The study on the determinants of the number of job changes)

  • 박성익;류장수;김종한;조장식
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권2호
    • /
    • pp.387-397
    • /
    • 2015
  • 본 연구에서는 청년인턴 DB와 고용보험 DB를 사용하여 중소기업 청년인턴의 이직횟수에 영향을 미치는 요인을 분석하였다. 이직횟수는 음수가 아닌 정수 값만 가지는 계수 데이터 (count data)이므로 일반적인 선형회귀모형을 적용하는 것은 문제가 있다. 따라서 계수 데이터에 적합한 회귀모형으로 포아송 회귀모형, 영과잉 포아송 회귀모형, 음이항 회귀모형, 영과잉 음이항 회귀모형 등 4개의 회귀모형을 적용하였다. 분석결과 최적모형으로 영과잉 음이항 회귀모형이 선택되었다. 주요 분석결과를 정리하면 다음과 같다. 첫째, 통제집단 (비인턴집단)에 비해서 처리집단 (인턴집단)이 통계적으로 유의하게 이직경험이 낮게 나타났다. 둘째, 연령이 작을수록 통계적으로 유의하게 이직경험이 낮게 나타났다. 셋째, 여자에 비해서 남자가 유의하게 이직횟수가 높게 나타났다. 마지막으로 기업규모가 클수록 이직횟수가 유의하게 감소하는 것으로 나타났다.

음이항 회귀모형을 이용한 공간구문론 및 도시특성요소가 범죄발생에 미치는 영향 연구 (A Study on the Influence of the Space Syntax and the Urban Characteristics on the Incidence of Crime Using Negative Binomial Regression)

  • 김형준;최열
    • 대한토목학회논문집
    • /
    • 제36권2호
    • /
    • pp.333-340
    • /
    • 2016
  • 본 연구는 부산광역시를 대상으로 범죄발생에 영향을 미치는 요인 특히, 공간구문론에 의한 영향을 분석한 실증적 연구이다. 정확한 분석을 위해 본 연구에서는 가산자료 분석의 대표적 방법인 포아송 회귀분석과 음이항 회귀분석을 활용하여 분석을 수행하였다. 5대 범죄발생에 미치는 영향을 분석한 결과, 총 13개 변수 중 8개 변수가 유의하게 나타났다. 인구학적 특성변수에서는 여성인구비율, 65세 노인인구 비율이, 토지이용 특성변수에서는 행정구역면적과 상업지면적비가 통계적으로 유의하게 나타났다. 범죄대응 특성변수인 CCTV는 그 수가 증가할수록 범죄발생은 감소한다고 나타났다. 공간구문 특성변수에서는 연결도, 국부통합도, 전체통합도가 통계적으로 유의하게 나타났다. 그 중에서 연결도는 그 수치가 낮을수록 연결된 다른 공간이 적기 때문에 갑작스런 방해자의 출현 가능성이 낮고, 통행인에 의한 감시도가 낮아져 범죄발생 요인이 되는 것으로 나타났다. 이러한 분석들을 통해 본 연구는 차후 범죄예방적 측면의 도시계획 입안 및 실천에 기여할 수 있는 기초적 자료를 제공하고자 한다.

포아송 및 음이항 회귀분석을 이용한 해상운임 결정요인이 해운선사의 블랭크 세일링에 미치는 영향 분석 연구 (A Study on Impact of Factors Influencing Maritime Freight Rates Using Poisson and Negative Binomial Regression Analysis on Blank Sailings of Shipping Companies)

  • 류원형;남형식
    • 한국항해항만학회지
    • /
    • 제48권1호
    • /
    • pp.62-77
    • /
    • 2024
  • 해상운송 산업에서는 공급과 수요의 불균형이 지속적으로 증가하면서 세계 주요 해운선사들이 해운 시황에 따른 선복량을 탄력적으로 조절하기 위해 블랭크 세일링을 주요 수단으로 사용하고 있다. 일반적으로 블랭크 세일링은 중국의 춘절 기간에 맞추어 많이 실시되어 왔지만, 2020년부터 시작된 글로벌 팬데믹과 미국·중국 간 무역 전쟁 등과 같은 특수한 상황으로 인해 최근 해운선사들은 기존 대비 큰 규모의 블랭크 세일링을 실시하였다. 이러한 블랭크 세일링은 화물 운송 지연에 직접적 영향을 미치기 때문에 기업과 소비자의 측면에서 부정적인 영향을 초래할 수 있다. 따라서 본 연구는 이에 선제적으로 대응하기 위해 포아송 회귀모형과 음이항 회귀모형을 활용하여 해상운임 결정요인이 해운선사의 블랭크 세일링에 미치는 영향력을 분석하였다. 분석 결과, 포아송 회귀분석의 2M의 경우 유의한 변수로 글로벌 컨테이너 해상물동량, 컨테이너 선복량, 컨테이너선 해체량, 컨테이너선 신조선가지수, OECD 인플레이션을 도출하였고, 음이항 회귀분석의 Ocean Alliance의 경우 글로벌 컨테이너 해상물동량과 컨테이너선 발주량을, THE Alliance의 경우 컨테이너선 선복량과 금리를, Non-Alliance의 경우 국제유가, 글로벌 공급망 압력지수, 컨테이너선 선복량, OECD 인플레이션을, Total Alliance의 경우 컨테이너선 선복량과 금리를 유의한 변수로 도출할 수 있었다.

차량유형별 로터리 사고모형 (Accident Models of Rotary by Vehicle Type)

  • 한수산;박병호
    • 대한교통학회지
    • /
    • 제29권6호
    • /
    • pp.67-74
    • /
    • 2011
  • 이 연구는 차량유형별 로터리 교통사고를 다루고 있다. 이 논문은 차량유형별 교통사고 특성을 비교 분석하고, 사고모형을 개발하는데 그 목적이 있다. 이를 위해 이 연구에서는 차량유형을 세 그룹으로 나누어 그 차이점을 분석하고, 국내 로터리 자료를 이용하여 포아송 및 음이항 회귀모형과 ZAM모형을 개발하는데 중점을 두고 있다. 주요 연구결과는 다음과 같다. 첫째, 승용차량과 화물 및 승합차, 원동기의 사고건수를 종속변수로 하는 통계적으로 의미있는 2개의 ZIP 모형과 1개의 음이항 모형이 개발되었다. 둘째, 모형별 채택된 독립변수를 활용하여 세 모형의 차이가 비교 분석되었다. 마지막으로 로터리 사고를 예방하기 위해 조명시설, 과속방지턱과 같은 교통안전시설물 설치가 필요한 것으로 평가되었다.