• 제목/요약/키워드: 음이항

검색결과 145건 처리시간 0.048초

고속도로 평면선형상 사고빈도분포 추정을 통한 음이항회귀모형 개발 (기하구조요인을 중심으로) (Fitting Distribution of Accident Frequency of Freeway Horizontal Curve Sections & Development of Negative Binomial Regression Models)

  • 강민욱;도철웅;손봉수
    • 대한교통학회지
    • /
    • 제20권7호
    • /
    • pp.197-204
    • /
    • 2002
  • 교통사고예측 및 예방을 위해서는 실제적으로 도로설계과정에서 제어가 가능한 도로 기하구조요소에 대한 사고관계를 파악함이 타당하다. 즉, 도로의 설계자는 도로건설에 앞서 기하구조요소와 사고와의 관계를 현장자료를 통해 정확히 밝혀 도로설계에 반영해야 한다. 이를 위해, 교통사고의 빈도분포를 박히는 것은 가장 기본이 되는 일이며, 교통사고 예측모형개발에 선행되어야 한다. 일반적으로 교통사고건수의 경우 분산이 평균보다 큰 과분산(overdispersion)의 특징을 가지고 있어 음이항 분포를 따른다고 알려져 있다. 따라서 본 논문은 사고모형의 개발에 앞서, 사고발생지점에 대한 도로설계요소와 기타 잠재적인 사고발생 관련요인이 비교적 잘 파악되어있는 호남고속도로를 중심으로 평면 선형상 곡선부에 대하여 교통사고의 분포를 적합도 검정을 통해 알아보고자 하였다. 사고자료는 한국도로송사의 호남고속도로 5년(1996∼2000)간 자료를 분석에 맞게 정리하였으며, 강민욱과 송봉수(2002)에서 제시한 평면선형에 있어서의 구간분할법을 이용하여 배향곡선구간과 단일곡선구간에 대한 사고분석을 하였다. 적합도 분석결과, 예상대로 음이항분포가 사고건수를 설명하기에 가장 적합한 확률분포로 제시되었으며, 이를 통해 최우추정법을 이용한 음이항회귀모형을 개발하였다. 구간분할법을 적용한 음이항회귀모형의 경우, 기존의 확률회귀토형에 비하여 높은 결정계수를 갖았으며, 모형에서 적용된 기하구조요소로는 차량 노출계수, 곡선반경, 단위거리 당 편경사변화값 등이다.

베이지안 음이항 분기과정을 이용한 한국 메르스 발생 연구 (A study on MERS-CoV outbreak in Korea using Bayesian negative binomial branching processes)

  • 박유하;최일수
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권1호
    • /
    • pp.153-161
    • /
    • 2017
  • 전염병 확산에 대한 확률과정모형으로 활용되는 분기과정은 실제 데이터를 통해 모수를 추정할 수 있다는 장점이 있다. 음이항 분포를 분기과정의 생산 분포 모형으로 적용할 수 있는데 음이항 분포를 적용하기 위해서는 평균과 산포 모수를 추정하여야한다. 기존의 생물학 연구와 역학 연구 분야에서는 이를 최대우도법을 이용하여 추정하고 있다. 그러나 대부분의 역학 자료의 특성상 분기과정에서 이용되는 음이항 분포는 소표본이어서 최대우도 추정량의 정도를 충족시킬 수 없다. 본 논문에서는 소표본 자료에서 좋은 통계량의 성질을 만족한다고 알려져 있는 베이지안을 이용하여 모수를 추정하는 방법을 제안한다. 2015년 국내 메르스 사례에 베이지안 방법을 적용하여 모수를 추정하고 사후 분포를 적합하였다. 그 결과 어떠한 사전 분포를 가정하더라도 안정적으로 모수를 추정하는 것을 알 수 있었다. 추정된 산포 모수를 이용하여 분기과정에서의 전염병 소멸 확률을 유도하였다.

조건부 포아송 및 음이항 분포를 이용한 영-과잉 INGARCH 자료 분석 (Zero-Inflated INGARCH Using Conditional Poisson and Negative Binomial: Data Application)

  • 윤재은;황선영
    • 응용통계연구
    • /
    • 제28권3호
    • /
    • pp.583-592
    • /
    • 2015
  • 영-과잉(zero-inflation) 현상은 최근 계수(count) 시계열 분석의 주요토픽으로 다루어지고 있다. 본 논문에서는 영-과잉 계수 시계열의 변동성을 연구하고 있다. 기존의 정수형 모형인 INGARCH(integer valued GRACH) 모형에 조건부 포아송 및 조건부 음이항 분포를 사용하여 변동성에 영-과잉 현상을 추가하였다. 모수 추정 방법으로 EM알고리즘을 사용하였으며 국내 콜레라 발생건수에 적용시켜 보았다.

서로 다른 산포를 허용하는 이변량 영과잉 음이항 회귀모형 (Bivariate Zero-Inflated Negative Binomial Regression Model with Heterogeneous Dispersions)

  • 김동석;정슬기;이동희
    • Communications for Statistical Applications and Methods
    • /
    • 제18권5호
    • /
    • pp.571-579
    • /
    • 2011
  • 본 연구에서는 두 반응 변수에 서로 다른 산포를 허용하는 새로운 이변량 영과잉 음이항 회귀모형을 제안하고, Deb과 Trivedi (1997)에 나타난 헬스케어 자료를 이용하여 두 반응변수가 갖는 서로 다른 산포도를 무시한 Wang (2003)이 제안한 이변량 영과잉 음이항 회귀모형과의 효율성을 로그우도와 AIC의 관점에서 비교 하였다. 모형적합결과, 본 연구에서 제안한 모형이 모형선택기준 관점에서 기존모형에 비하여 월등히 우수한 결과를 보여주었다.

기계학습을 활용한 데이터 기반 경찰신고건수 예측 (The Data-based Prediction of Police Calls Using Machine Learning)

  • 최재훈
    • 한국빅데이터학회지
    • /
    • 제3권2호
    • /
    • pp.101-112
    • /
    • 2018
  • 본 연구는 기계학습의 하나인 신경망 분석과 음이항 회귀분석을 활용하여 경찰신고건수를 예측하고자 2016년 6월부터 2017년 5월까지 충남지방경찰청에 접수된 112신고 데이터를 이용하여 예측모델을 개발하였다. 모델을 개발하기 위해 경찰신고건수에 영향을 줄 수 있는 시간, 휴일, 휴일 전날, 계절, 기온, 강수량, 풍속, 관할면적, 인구, 외국인 수, 단독주택비율, 기타주택비율 변수 등을 활용하였다. 변수의 종류에 따라 몇몇은 경찰신고건수와 양의 상관관계 또는 음의 상관관계가 확인되었다. 사용된 두 개의 방법론을 비교한바, 신경망분석의 예측 결과는 예측 값과 실제 값의 상관계수 0.7702, RMSE 2.557이고, 음이항 회귀분석은 상관계수 0.7158, RMSE 2.831으로 나타났다. 신경망분석은 해석가능성은 낮지만, 음이항 회귀분석에 비해 예측력이 뛰어나다는 것이 확인되었다. 향후 경찰관서에서 본 연구의 예측모델을 기초로 하여 최적의 경찰력 배치를 할 수 있을 것으로 기대된다.

확률모수를 이용한 교통사고예측모형 개발 -수도권 및 부산광역시 4지 교차로를 대상으로- (A Development of Traffic Accident Model by Random Parameter : Focus on Capital Area and Busan 4-legs Signalized Intersections)

  • 이근희;노정현
    • 한국ITS학회 논문지
    • /
    • 제14권6호
    • /
    • pp.91-99
    • /
    • 2015
  • 본 연구는 서울, 수도권 및 부산광역시의 4지 신호교차로를 대상으로 도로의 기하구조측면, 교통특성, 환경특성 등 다양한 요인을 고려하여 교통사고예측모형을 구축하고 교차로사고와의 상호관계를 규명하고자 하였다. 분석 결과 기존의 음이항 모형보다 확률적 음이항 모형의 설명력이 높게 나타났으며 총 52개의 변수 중 10개의 변수가(주도로의 차로 수, 주도로의 좌회전 교통량, 주도로의 주행제약시설 수, 부도로의 우회전 교통량, 부도로의 교차로 시거, 교차로의 총 현시, 부도로의 중앙분리대 유무, 부도로의 제한속도, 부도로의 교통섬 유무, 부도로의 속도제약시설 수) 도시부 4지 신호교차로에서 교통사고에 영향을 미치는 유의한 변수로 나타났다. 또한 10개의 유의한 변수 중 2개의 변수가(부도로의 교차로 시거, 부도로의 차량 주행속도 제약 시설물 수)가 확률적 변수로 나타났다.

폴랴-감마 잠재변수에 기반한 베이지안 영과잉 음이항 회귀모형: 약학 자료에의 응용 (A Bayesian zero-inflated negative binomial regression model based on Pólya-Gamma latent variables with an application to pharmaceutical data)

  • 서기태;황범석
    • 응용통계연구
    • /
    • 제35권2호
    • /
    • pp.311-325
    • /
    • 2022
  • 0의 값을 과도하게 포함하는 가산자료는 다양한 연구 분야에서 흔히 나타난다. 영과잉 모형은 영과잉 가산자료를 분석하기 위해 가장 일반적으로 사용되는 모형이다. 영과잉 모형에 대한 전통적인 베이지안 추론은 조건부 사후분포의 형태가 폐쇄형 분포로 나타나지 않아 모형 적합 과정이 용이하지 않다는 한계점이 존재했다. 그러나 최근 Pillow와 Scott (2012)과 Polson 등 (2013)이 제안한 폴랴-감마 자료확대전략으로 인해, 로지스틱 회귀모형과 음이항 회귀모형에서 깁스 샘플링을 통한 추론이 가능해지면서, 영과잉 모형에 대한 베이지안 추론이 용이해졌다. 본 논문에서는 베이지안 추론에 기반한 영과잉 음이항 회귀모형을 Min과 Agresti(2005)에서 분석된 약학 연구 자료에 적용해본다. 분석에 사용된 자료는 경시적 영과잉 가산자료로 복잡한 자료 구조를 가지고 있다. 모형 적합 과정에서는 깁스 샘플링을 통한 추론을 수행하기 위해 폴랴-감마 자료확대전략을 사용한다.

이변량 음이항 모형에서 붓스트랩 방법을 이용한 과대산포에 대한 검정 (Testing for Overdispersion in a Bivariate Negative Binomial Distribution Using Bootstrap Method)

  • 전명식;정병철
    • 응용통계연구
    • /
    • 제21권2호
    • /
    • pp.341-353
    • /
    • 2008
  • 본 연구에서는 이변량 음이항 분포에서 과대산포와 "내재적 상"의 존재유무에 대한 가설검정 문제를 다루었다. 과대산포에 대한 스코어 검정의 표준정규분포 근사는 명목 유의수준을 과소추정한 반면 "내재적 상"에 대한 스코어 검정은 명목유의수준을 과대 추정하고 있음을 보였다. 본 연구에서는 이와 같은 스코어 검정의 표준정규분포 근사의 문제점을 해결하기 위하여 붓스트랩 방법을 제안하였다. 스코어 검정에 대한 붓스트랩 방법은 두 검정에서 명목유의수준을 제대로 유지하고 검정력도 높게 나타나 스코어 검정의 표준정규분포 근사에 존재하는 문제를 해결하는 효율적인 대안으로 판단된다.

차량유형별 로터리 사고모형 (Accident Models of Rotary by Vehicle Type)

  • 한수산;박병호
    • 대한교통학회지
    • /
    • 제29권6호
    • /
    • pp.67-74
    • /
    • 2011
  • 이 연구는 차량유형별 로터리 교통사고를 다루고 있다. 이 논문은 차량유형별 교통사고 특성을 비교 분석하고, 사고모형을 개발하는데 그 목적이 있다. 이를 위해 이 연구에서는 차량유형을 세 그룹으로 나누어 그 차이점을 분석하고, 국내 로터리 자료를 이용하여 포아송 및 음이항 회귀모형과 ZAM모형을 개발하는데 중점을 두고 있다. 주요 연구결과는 다음과 같다. 첫째, 승용차량과 화물 및 승합차, 원동기의 사고건수를 종속변수로 하는 통계적으로 의미있는 2개의 ZIP 모형과 1개의 음이항 모형이 개발되었다. 둘째, 모형별 채택된 독립변수를 활용하여 세 모형의 차이가 비교 분석되었다. 마지막으로 로터리 사고를 예방하기 위해 조명시설, 과속방지턱과 같은 교통안전시설물 설치가 필요한 것으로 평가되었다.

과대산포 가산자료의 새로운 표본선택모형 (A new sample selection model for overdispersed count data)

  • 조성은;조준;김형문
    • 응용통계연구
    • /
    • 제31권6호
    • /
    • pp.733-749
    • /
    • 2018
  • 어떠한 연구에서 관심의 대상이 되는 관찰치가 부분적으로 관측 가능할 때 표본선택의 문제가 일어난다. 이러한 자료를 분석하기 위해 헤크만은 표본선택 모형을 개발하였고 이변량 정규분표의 가정 하에 최대우도방법을 사용하여 모수를 추정하였다. 최근 이항자료와 포아송 자료에 대한 표본선택모형이 제안되었다. 이를 분포조정에 기초하여 과대산포 자료에 대한 모형으로 확장하고자 한다. 표본선택이 없는 과대산포 자료는 흔히 음이항 분포로 분석되어진다. 따라서 음이항 분포를 이용하고 분포조정을 도입한 과대산포 자료에 대한 새로운 모형을 제시하고자 한다. 실제 자료를 이용하여 분석을 하였다. 모의실험 결과 프로파일 우도함수를 이용하여 모수에 대해 추정한 결과는 안정적이다.