• 제목/요약/키워드: 음이항회귀모형

검색결과 74건 처리시간 0.026초

제로팽창 모형을 이용한 보험데이터 분석 (A Zero-Inated Model for Insurance Data)

  • 최종후;고인미;전수영
    • 응용통계연구
    • /
    • 제24권3호
    • /
    • pp.485-494
    • /
    • 2011
  • 계수(Count) 데이터는 반응변수가 음이 아닌 계수로, 자동차 사고건수나 지진이 일어난 횟수, 보험처리 발생건수 등을 말한다. 이런 경우에는 주로 포아송 회귀모형을 사용하지만, 평균과 분산이 동일한 경우만 이용될 수 있다는 제약이 따른다. 실증적 자료에서는 그룹 간 이질성으로 인해 분산이 매우 큰 과대산포(Overdispersion) 현상을 볼 수 있는데, 이를 무시할 경우 회귀계수나 표준오차가 편의되는 현상이 발생한다. 보험은 보장성 개념이 강하기 때문에 실제로 보험처리가 발생하지 않는 경우가 많아, 보험처리 건수에 '0'값이 있을 수 있다. 본 논문에서는 '0'값이 많은 자료의 분석을 위해 제로팽창 모형(Zero-Inflated Model)을 고려하고, 여러 모형들의 효율성을 실증자료를 통하여 비교하였다. 실증 자료 분석 결과, 과대산포와 제로팽창 현상이 존재하는 자료에서 제로팽창 음이항 모형(Zero-Inflated Negative Binomial Regression Model)이 가장 효율적인 모형임을 보여 주었다.

근린환경 요인을 고려한 카셰어링 대여소 배치 방안 연구 (A Study on Optimizing Depot Location in Carsharing Considering the Neighborhood Environmental Factors)

  • 서지민;석종수
    • 한국ITS학회 논문지
    • /
    • 제16권5호
    • /
    • pp.49-59
    • /
    • 2017
  • 이 연구는 인천광역시에서 2016년 한 해 동안 운영된 카셰어링 업체의 차량 운행 기록을 바탕으로 카셰어링 이용 특성을 분석하고, 카셰어링 이용에 영향을 미치는 근린환경 요인을 규명했다. 카셰어링 이용자는 여성보다 남성이 많고 20 30대가 주를 이루며, 과거보다 이용 연령대가 넓어지고 단거리 이용이 증가했다는 특징이 있다. 음이항 회귀 모형을 활용해서 카셰어링 이용과 근린환경 요인의 관계를 분석한 결과, 대중교통 승 하차 인원이 많고 주거용 건물 연면적 비율이 높은 지역에서 카셰어링 이용이 활발한 것으로 나타났다. 따라서 향후 카셰어링 차량 대여소를 선정할 때, 대중교통 이용이 활발하고 주거용 건물 비율이 높은 지역을 중심으로 검토하는 것이 카셰어링 활성화에 기여할 수 있다.

영-과잉 회귀모형을 활용한 폭염자료분석 (Heat-Wave Data Analysis based on the Zero-Inflated Regression Models)

  • 김성태;박만식
    • Journal of the Korean Data Analysis Society
    • /
    • 제20권6호
    • /
    • pp.2829-2840
    • /
    • 2018
  • 음이 아닌(non-negative) 측정값을 가지는 확률변수에 있어서, 영(0)이 과도하게 측정되는 자료를 반연속형(semi-continuous) 자료와 영-과잉(zero-inflated) 자료로 구분한다. 이러한 자료에서는 특정 확률 분포(probability distribution) 하에서의 확률보다 훨씬 큰 확률로 0을 관측하게 되는데, 연속형(continuous) 확률분포를 고려하는 경우에는 반연속형으로, 이산형(discrete) 확률분포를 고려하는 경우에는 영-과잉이라고 한다. 본 연구에서는 경계값(0)의 측정 여부에 관한 모형과 0보다 큰 확률변수에 대한 확률분포를 활용한 모형 등 두 개의 부문으로 이루어진 모형, 즉 2-부문 모형(two-part model)을 소개하고자 한다. 특히, 이산형 확률분포 중 포아송 분포와 음이항 분포를 고려한 영-과잉 회귀모형(regression model)을 설명하고 그 특성을 파악하고자 한다. 실증연구에서는 이러한 영-과잉 회귀모형을 활용하여 지난 10년(2009년부터 2018년) 간 한국의 여름철(6-8월) 폭염주의보(heat-wave advisory) 및 폭염경보(heat-wave warning) 발생일수를 적합하였다. 또한 공간예측기법 중 하나인 범용크리깅(universal kriging)을 이용하여 적합결과를 바탕으로 한 폭염 발생일수에 대한 예측지도를 작성하였다.

발명자 네트워크의 공간적 결정요인 분석 (An Analysis of Spatial Determinants of Inventor Networks in Korea)

  • 정준호
    • 한국경제지리학회지
    • /
    • 제19권1호
    • /
    • pp.1-17
    • /
    • 2016
  • 본 논문은 내국인 특허출원 자료에서 복수 발명자들의 주소지들을 파악하고 가산자료의 특성을 통제할 수 있는 영과잉 음이항 회귀모형을 사용하여 230개 시군구 간 발명자 네트워크의 공간구조와 그것의 결정요인을 분석한다. 발명자 네트워크의 공간적 연계에 영향을 미치는 몇 가지 요인들이 확인된다. 이출지역이 민간 R&D, 고등교육수준, 인구규모, 특허 생산성 등과 같은 R&D 관련 지역 특수적 자산들을 많이 보유하면 동태적인 수요효과를 통해 공간적 연계는 다른 지역으로 확대된다. 그리고 물리적 거리뿐만 아니라 기술적 거리에서도 거리조락현상이 나타난다. 이입지역이 R&D 관련 지역 특수적 자산을 많이 보유하면 유사한 논리로 공간적 연계에서 정(+)의 효과가 발생한다.

  • PDF

화물차 DTG 데이터를 활용한 고속도로 졸음운전 위험구간 분석 (The Hazardous Expressway Sections for Drowsy Driving Using Digital Tachograph in Truck)

  • 조종석;이현석;이재영;김덕녕
    • 대한교통학회지
    • /
    • 제35권2호
    • /
    • pp.160-168
    • /
    • 2017
  • 지난 10년 간 졸음운전은 전체 고속도로 사고건수의 약 23%로 교통사고 사망원인 중 가장 높은 비중을 차지하고 있다. 과속, 주시태만 등 운전자 과실이 주요원인인 일반적인 사고유형과 달리, 졸음운전은 졸음이라는 불가항력적 원인에 의해 발생한다는 점에서 타 사고유형과 차별화된 접근이 요구된다. 그 동안의 졸음운전 감소대책은 일반적인 교통사고 대책과 마찬가지로 사고다발지점과 같은 특정지점(spot)에 집중하였으나, 도로특성(해당구간의 화물차 비율 등) 또는 시간특성(누적주행시간에 따른 위험 운전행동 증가 등)을 고려한 감소대책이 필요함에 따라, 본 연구에서는 시 공간적으로 확대한 구간(link) 개념을 도입하였다. 고속도로 졸음운전 위험구간 분석을 위해 화물차 디지털 운행기록계(digital tacho graph: DTG) 자료를 활용하였으며, 이를 바탕으로 졸음운전 위험구간을 산정하였다. 위험 행동지표와 사고 발생건수 간의 상관 분석을 위해 음이항 회귀모형(negative binomial regression)을 통한 졸음사고 예측모형을 추정하였으며 모형의 결과 값을 바탕으로 경험적 베이즈(empirical Bayes: EB) 추정치와 구간별 잠재적 안전개선 지수(potential for safety improvement: PSI)를 산출하여 졸음운전 위험 구간을 선정하였다. 졸음사고 모형 추정 결과, 연평균 일교통량, 화물차 비율, DTG 수집 자료건수, 평균 과속비율(20km/h 초과), 평균 급감속비율 및 평균 급차로변경비율이 늘어날 경우 졸음운전 사고건수 역시 증가하는 것으로 분석되었다.

감마 일반화 선형 모형에서의 가능도비 검정과 F-검정 비교연구 (Comparing the performance of likelihood ratio test and F-test for gamma generalized linear models)

  • 조성일;한정섭;이우주
    • 응용통계연구
    • /
    • 제31권4호
    • /
    • pp.475-484
    • /
    • 2018
  • 감마 일반화 선형모형은 음이 아니며 치우침이 있는 반응변수에 유용한 모형으로 알려져 있다. 그러나 포아송 분포 또는 이항 분포에 기반한 일반화 선형모형에 비해 적은 관심을 받아왔다. 특히, 회귀계수의 유의성 검정에 대해서는 연구가 면밀히 되어 있지 않다. 본 논문에서는 감마 일반화 선형 모형의 검정에 대해 다양한 통계량들을 알아보고 수치 연구를 통해 그들의 성능을 비교한다. 수치 실험의 결과 부분 이탈도 검정 방법의 문제점이 나타났으며, 가능도비 검정 방법과 F-검정 방법이 좋은 성능을 보임을 확인하였다.

야간 및 일출몰 시간대 교통안전에 영향을 미치는 고속도로 기하구조 특성분석 (Characteristics of Geometric Conditions Affecting Freeway Traffic Safety at Nighttime, Sunrise, and Sunset)

  • 홍성민;김준기;오철
    • 대한교통학회지
    • /
    • 제30권4호
    • /
    • pp.95-106
    • /
    • 2012
  • 고속의 주행속도로 고속도로를 주행하는 운전자는 교통사고 예방을 위하여 일반도로 운전자와 비교하여 도로선형, 교통상황, 환경요인에 보다 신속하고 능동적으로 반응해야 한다. 특히 야간 및 일출몰 시간대에는 운전자의 도로선형변화 인지 능력이 주간 보다 떨어질 수 있으므로, 이러한 시간대에 발생하는 교통사고와 도로기하구조 특성을 체계적으로 분석하고 대응방안을 도출 것은 고속도로 교통안전 제고를 위해 대단히 중요한 작업이다. 본 연구에서는 교통안전과 고속도로의 기하구조의 특성과의 관계를 주간과 야간으로 비교하여 분석하였다. 또한 일출 및 일몰과 같이 태양의 고도가 운전자의 전방 상황주시에 영향을 주는 환경에서 도로의 선형과 교통안전과의 관계를 추가로 분석하여 위험한 도로조건을 찾고자 하였다. 본 연구에서는 이를 위해 사고발생 시간대를 주간, 야간, 일출몰 3가지로 나누어 포아송회귀분석과 음이항회귀분석을 활용하여 고속도로 교통사고빈도 모형을 도출하였다. 분석대상 구간은 전국 고속도로 중 제한속도를 110km/h로 운영 중인 서해안선, 중부선, 중부내륙선으로 설정하였으며, 분석구간의 2007년~2010년 4년간 교통사고 자료를 활용하였다. 분석결과 시간대에 따라 교통사고에 영향을 미치는 요인들은 차이가 있는 것으로 나타났다. 본 연구결과는 고속도로 교통사고 예방을 위해 야간 및 일출몰 시간대에 운전자의 안전운전을 지원할 수 있는 다양한 대응방안을 수립하는데 효과적으로 활용될 수 있을 것으로 기대된다.

서울시 점멸신호 운영에 따른 교통사고 분석 및 개선방안에 관한 연구 (Analysis of Accident Characteristics and Improvement Strategies of Flash Signal-operated Intersection in Seoul)

  • 김승준;박병정;이진학;김옥선
    • 한국ITS학회 논문지
    • /
    • 제13권6호
    • /
    • pp.54-63
    • /
    • 2014
  • 우리나라 교통사고의 심각성은 OECD 회원국 평균보다 굉장히 높은 수준이며 보행자 사고는 이보다 더 심각한 상황이다. 그럼에도 불구하고 경찰청은 야간의 불필요한 신호대기를 최소화하고 운전자의 운전편의를 개선하기 위하여 점멸신호운영을 확대하고 있는 추세이다. 비록 경찰청은 점멸신호운영이 사고감소에도 긍정적인 영향을 미친다고 발표하고 있지만, 대부분의 해외연구들은 이와는 상반되는 결과를 제시하고 있다. 본 연구에서는 서울시내 54개 점멸신호 운영 교차로를 대상으로 점멸신호운영이 교통사고에 미치는 영향을 분석하고 이에 대한 개선방안을 제시하였다. 분석자료는 점멸신호가 운영되고 있는 교차로의 3년(2011~2013) 동안 사고자료와 사고에 영향을 미칠 것으로 판단되는 교통량과 교차로 기하구조(교차로면적, 좌회전차로, 차선수 등)를 바탕으로 하였다. 평균보다 분산이 큰 교통사고자료의 고유특성을 반영하기 위하여 음 이항 회귀모형(Negative Binomial Regression Model)을 사용하였으며, 모형구축 결과 보행과 연관된 횡단보도 면적 및 버튼식 보행신호기 개수가 사고와 밀접한 연관이 있는 것으로 나타났다. 또한 기존 연구결과와는 달리 일반신호운영교차로에 비해 점멸신호운영교차로의 사고안전성이 더 취약한 것으로 분석되었으며, 그 격차는 약 9% 정도로 나타났다.

도로 안전성 분석 모형에 관한 연구: 전라북도 국도 권역을 중심으로 (A Study on the Road Safety Analysis Model: Focused on National Highway Areas in Cheonbuk Province)

  • 임준범;김준기;이수범;김현진
    • 대한토목학회논문집
    • /
    • 제34권2호
    • /
    • pp.583-595
    • /
    • 2014
  • 현재 우리나라의 교통정책은 도로의 신설 확장은 지양하고, 도로의 선형 및 시설을 개량하여 안전성을 증대시키고, 친환경적이며 효율적으로 운영할 수 있는 방향으로 나아가고 있다. 이는 국가 도로사업 중 하나인 제2차 국도 5개년계획('06~'10)이 확장 53건(71%), 개량 22건(29%)인 반면, 제3차 국도 5개년계획('11~'15)은 확장 22건(30%), 개량 50건(70%)로 변화된 것으로 나타나고 있다. 이러한 시설개량위주의 도로사업을 좀 더 효과적으로 추진하기 위해서는 도로의 안전성을 객관적이고 과학적으로 판단하여 사업을 선정하고, 사업에 따른 안전성 향상에 대한 평가가 이루어져야 한다고 판단된다. 본 연구는 이러한 도로별 안전성 분석 및 평가를 위한 모형을 개발하는데 목적이 있다. 본 연구의 주요내용은 미국의 HSM (Highway Safety Manual)을 근간으로 하여 한국실정에 맞게 도로의 안전성을 분석하고 평가할 수 있는 모형을 개발하는 것이다. 모형 정립을 위한 데이터 구축은 전라북도 권역 5개 국도호선을 대상으로 기하구조 요인이 동일하다고 판단되는 구간을 동질성 구간으로 구분하였고, 구분된 1,452개 구간에 대하여 도로 기하구조, 시설물, 교통량, 기상상태, 토지이용 등의 대표값을 수집하였다. 수집된 자료는 교통사고와 각 도로요소의 상관관계 분석을 수행하여 어떠한 요인이 교통사고에 큰 영향을 미치는지 분석하였고, 이를 바탕으로 음이항회귀모형으로 사고모형을 정립하였다. 개발된 모형을 가지고 교통량과 도로구간연장을 이용하여 발생사고건수를 예측하는 안전성능함수와 도로기하구조 및 교통특성 등의 변화에 따라 사고빈도 변화를 결정하는 사고수정계수를 도출하였다.

지체와 사고를 고려한 신호교차로 서비스수준 산정에 관한 연구 (Level of Service of Signalized Intersections Considering both Delay and Accidents)

  • 박제진;박성용;하태준
    • 대한교통학회지
    • /
    • 제26권3호
    • /
    • pp.169-178
    • /
    • 2008
  • 서비스수준은 통행속도, 통행시간, 통행자유도, 안락감 그리고 교통안전 등 도로의 운행상태를 설명하는 개념으로 도로시설별로 효과척도에 따른 서비스수준이 등급화되어 있고, 이를 이용하여 도로시설의 수행능력을 평가하고 있다. 그러나 도로시설의 안전성에 대한 문제가 대두되어지면서 신호교차로의 ${\upsilon}/c$ 비와 교통사고율은 기존 연구에서 U 자형의 2차함수 형태로 나타남을 제시하고 있다. 이는 교통소통에 의한 서비스수준이 우수하다고 하여 교통사고의 위험 측면에서도 안전하다고 말할 수 없음을 시사해 주고 있는 것이다. 즉, 현재 신호교차로 평가는 도로용량과 관련한 효과척도인 서비스수준 개념에 교통안전은 내포되어 있지 않음을 보여주고 있다. 따라서 본 연구에서는 신호교차로를 대상으로 교통소통(지체)과 교통안전(사고)을 동시에 고려한 서비스수준을 개발하여 신호교차로에 대한 새로운 평가과정 및 평가방법을 제시하고자 한다. 첫째, 광주광역시 신호교차로 50개 지점을 대상으로 2002${\sim}$2004년에 발생한 교통사고와 교통사고관련 자료를 수집하여 평균제어지체시간-EPDO 와 평균제어지체시간-사고율의 관계를 분석한 결과, 지체시간이 클수록 EPDO 와 사고율은 음지수함수 형태로 감소하는 것으로 나타나 현 신호교차로 수행평가 기준인 서비스수준에 교통안전 측면을 포함시켜 새로운 서비스수준을 개발해야 할 필요성이 있음을 증명하였다. 둘째, 교통류에 따른 사고유형별 사고건수가 음이항분포로 추론됨에 따라 교통사고예측모형으로 차대차의 경우 16개, 차대사람의 경우 4개의 음이항회귀모형을 개발하였다. 셋째, 지점별 연간지체비용과 연간사고비용을 이용하여 운영비용에 대한 확률밀도함수를 추정한 후, 서비스수준 등급에 대한 백분율을 적용시켜 서비스수준 기준을 제시하였다. 마지막으로, 본 연구에서 도출된 교통사고예측모형과 새로운 서비스수준을 활용하여 임의의 신호교차로에 대한 평가과정을 분석표로 제시하였다.