• 제목/요약/키워드: binomial data

검색결과 343건 처리시간 0.02초

제로팽창 모형을 이용한 보험데이터 분석 (A Zero-Inated Model for Insurance Data)

  • 최종후;고인미;전수영
    • 응용통계연구
    • /
    • 제24권3호
    • /
    • pp.485-494
    • /
    • 2011
  • 계수(Count) 데이터는 반응변수가 음이 아닌 계수로, 자동차 사고건수나 지진이 일어난 횟수, 보험처리 발생건수 등을 말한다. 이런 경우에는 주로 포아송 회귀모형을 사용하지만, 평균과 분산이 동일한 경우만 이용될 수 있다는 제약이 따른다. 실증적 자료에서는 그룹 간 이질성으로 인해 분산이 매우 큰 과대산포(Overdispersion) 현상을 볼 수 있는데, 이를 무시할 경우 회귀계수나 표준오차가 편의되는 현상이 발생한다. 보험은 보장성 개념이 강하기 때문에 실제로 보험처리가 발생하지 않는 경우가 많아, 보험처리 건수에 '0'값이 있을 수 있다. 본 논문에서는 '0'값이 많은 자료의 분석을 위해 제로팽창 모형(Zero-Inflated Model)을 고려하고, 여러 모형들의 효율성을 실증자료를 통하여 비교하였다. 실증 자료 분석 결과, 과대산포와 제로팽창 현상이 존재하는 자료에서 제로팽창 음이항 모형(Zero-Inflated Negative Binomial Regression Model)이 가장 효율적인 모형임을 보여 주었다.

개인여행비용법(Individual Travel Cost Model)에 의한 금정산 방문객의 경제적 가치추정 (A Study on the Estimating Visitor's Economic Value of the Mt. Kumjung by Using Individual Travel Cost Model)

  • 주수현;이동철;허윤정
    • 경영과정보연구
    • /
    • 제33권2호
    • /
    • pp.301-315
    • /
    • 2014
  • 부산의 금정산은 도시 숲의 중요성이 부각되면서 시민들의 방문이 증가하고 있으며 이로 인해 생태계 보전을 위한 비용은 증가하고 있다. 도시 숲에 대한 보전과 이용의 양 측면을 고려하면서 지속가능한 환경자원으로서 금정산을 보호하기 위해서는 비용편익 관점에서 정책적 판단이 중요해지고 있다. 이와 관련하여 도시 숲의 편익을 화폐적 가치로 측정하여 환경정책의 경제적 효율성을 확보하자는 취지에서 금정산의 가치를 추정하였다. 본 연구에서는 금정산을 당일 방문한 20세 이상의 성인 남녀를 개인면접의 방식으로 설문을 조사하여 개인여행비용법(ITCM)으로 가치를 추정하였다. 종속변수인 여행횟수가 특성상 비음정수이므로 가산자료모형인 포아송 모형, 음이항 모형, 절단된 포아송 모형 및 절단된 음이항 모형을 사용하였다. 분석결과를 바탕으로 추정된 금정산의 1회 여행에서 얻은 경제적 가치는 60,669원이고, 총경제적 가치는 252,383원으로 계산되었다. 여행비용(COST)을 적용하였을 때 절단된 음이항 모형으로부터 관광수요모형을 추정하여 보니 예상했던 바와 같이 여행비용(COST)이 적을수록 여행 횟수가 증가하였고, 연령(AGE), 결혼여부(MAR), 그리고 경관 만족도(SATI)는 방문수요에 영향을 미치지 못하는 것으로 분석되었다.

  • PDF

Computer Program Development for Probability Distribution

  • Choi, Hyun-Seok;Song, Gyu-Moon
    • Journal of the Korean Data and Information Science Society
    • /
    • 제16권3호
    • /
    • pp.581-589
    • /
    • 2005
  • The purpose of this thesis is to develop and introduce Add-in program which we can systematically, visually and dynamically study discrete probability distribution of binomial distribution, poisson distribution and hypergeometric distribution, and continuous probability distribution of normal distribution, exponential distribution, and the definition and characteristics of t distribution, F distribution and ${\chi}^2$ distribution to be driven from normal distribution, and graphs, the computation process of probability by using VBA which is the device of Excel.

  • PDF

The Role of Artificial Observations in Testing for the Difference of Proportions in Misclassified Binary Data

  • Lee, Seung-Chun
    • 응용통계연구
    • /
    • 제25권3호
    • /
    • pp.513-520
    • /
    • 2012
  • An Agresti-Coull type test is considered for the difference of binomial proportions in two doubly sampled data subject to false-positive error. The performance of the test is compared with the likelihood-based tests. It is shown that the Agresti-Coull test has many desirable properties in that it can approximate the nominal significance level with compatible power performance.

후진 미분 연산자를 이용한 이산확률분포의 적률 유도 (Derivations of moments for discrete probability distributions using backward difference operators)

  • 조길호
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권3호
    • /
    • pp.505-513
    • /
    • 2011
  • 본 논문의 목적은 후진 미분 연산자를 이용하여 이산확률분포에 대한 원점으로부터의 r차 적률을 구하는 공식을 유도한다. 이 공식을 이용함으로써 r차 적률은 0에서 계산된 $x^r$의 r번째 후진 미분 연산자까지의 일차결합으로써 계산됨을 알 수 있다.

The Role of Artificial Observations in Misclassified Binary Data with Common False-Positive Error

  • Lee, Seung-Chun
    • 응용통계연구
    • /
    • 제25권4호
    • /
    • pp.697-706
    • /
    • 2012
  • An Agresti-Coull type test is considered for the difference of binomial proportions in two doubly sampled data subject to common false-positive error. The performance of the test is compared with likelihood-based tests. The Agresti-Coull test has many desirable properties in that it can approximate the nominal significance level well, and has comparable power performance with a computational advantage.

사고유형에 따른 원형교차로 사고모형 (Accident Models of Circular Intersections by Type in Korea)

  • 한수산;김경환;박병호
    • 한국도로학회논문집
    • /
    • 제13권3호
    • /
    • pp.103-110
    • /
    • 2011
  • 이 논문은 사고유형에 따른 교통사고를 다루고 있다. 연구의 목적은 두 가지 사고유형의 특성을 분석하고, 유형별 모형을 개발하는데 있다. 이를 위해 이 연구는 두 집단 사이의 차이점을 분석하고, 국내 원형교차로 자료를 사용하여 포아송 및 음이항 회귀모형을 개발하는데 그 목적이 있다. 주요 결과는 다음과 같다. 첫째, 차대차 사고가 73.41%로 가장 많은 비중을 차지하는 것으로 분석되었다. 둘째, 차대사람과 차대차 사고건수 및 EPDO를 종속변수로 통계적으로 의미 있는 2개의 포아송 모형과 2개의 음이항 모형이 개발되었다. 셋째, 사고유형별 심각도모형의 공통변수는 교통량, 그리고 특정변수로는 우회전 별도차로 수, 과속방지턱, 진출입구 수 및 횡단보도 수가 채택되었다.

Estimation of the Cure Rate in Iranian Breast Cancer Patients

  • Rahimzadeh, Mitra;Baghestani, Ahmad Reza;Gohari, Mahmood Reza;Pourhoseingholi, Mohamad Amin
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제15권12호
    • /
    • pp.4839-4842
    • /
    • 2014
  • Background: Although the Cox's proportional hazard model is the popular approach for survival analysis to investigate significant risk factors of cancer patient survival, it is not appropriate in the case of log-term disease free survival. Recently, cure rate models have been introduced to distinguish between clinical determinants of cure and variables associated with the time to event of interest. The aim of this study was to use a cure rate model to determine the clinical associated factors for cure rates of patients with breast cancer (BC). Materials and Methods: This prospective cohort study covered 305 patients with BC, admitted at Shahid Faiazbakhsh Hospital, Tehran, during 2006 to 2008 and followed until April 2012. Cases of patient death were confirmed by telephone contact. For data analysis, a non-mixed cure rate model with Poisson distribution and negative binomial distribution were employed. All analyses were carried out using a developed Macro in WinBugs. Deviance information criteria (DIC) were employed to find the best model. Results: The overall 1-year, 3-year and 5-year relative survival rates were 97%, 89% and 74%. Metastasis and stage of BC were the significant factors, but age was significant only in negative binomial model. The DIC also showed that the negative binomial model had a better fit. Conclusions: This study indicated that, metastasis and stage of BC were identified as the clinical criteria for cure rates. There are limited studies on BC survival which employed these cure rate models to identify the clinical factors associated with cure. These models are better than Cox, in the case of long-term survival.

음이항 회귀모형을 이용한 공간구문론 및 도시특성요소가 범죄발생에 미치는 영향 연구 (A Study on the Influence of the Space Syntax and the Urban Characteristics on the Incidence of Crime Using Negative Binomial Regression)

  • 김형준;최열
    • 대한토목학회논문집
    • /
    • 제36권2호
    • /
    • pp.333-340
    • /
    • 2016
  • 본 연구는 부산광역시를 대상으로 범죄발생에 영향을 미치는 요인 특히, 공간구문론에 의한 영향을 분석한 실증적 연구이다. 정확한 분석을 위해 본 연구에서는 가산자료 분석의 대표적 방법인 포아송 회귀분석과 음이항 회귀분석을 활용하여 분석을 수행하였다. 5대 범죄발생에 미치는 영향을 분석한 결과, 총 13개 변수 중 8개 변수가 유의하게 나타났다. 인구학적 특성변수에서는 여성인구비율, 65세 노인인구 비율이, 토지이용 특성변수에서는 행정구역면적과 상업지면적비가 통계적으로 유의하게 나타났다. 범죄대응 특성변수인 CCTV는 그 수가 증가할수록 범죄발생은 감소한다고 나타났다. 공간구문 특성변수에서는 연결도, 국부통합도, 전체통합도가 통계적으로 유의하게 나타났다. 그 중에서 연결도는 그 수치가 낮을수록 연결된 다른 공간이 적기 때문에 갑작스런 방해자의 출현 가능성이 낮고, 통행인에 의한 감시도가 낮아져 범죄발생 요인이 되는 것으로 나타났다. 이러한 분석들을 통해 본 연구는 차후 범죄예방적 측면의 도시계획 입안 및 실천에 기여할 수 있는 기초적 자료를 제공하고자 한다.

ZAM 모형을 이용한 청주시 간선가로 구간의 사고모형 개발 (Developing the Accident Models of Cheongju Arterial Link Sections Using ZAM Model)

  • 박병호;김준용
    • 한국도로학회논문집
    • /
    • 제12권2호
    • /
    • pp.43-49
    • /
    • 2010
  • 본 연구는 청주시의 가로구간 교통사고를 다루고 있다. 연구의 목적은 가로구간의 사고모형을 개발하는 데 있다. 이를 위해서 이 연구에서는 전체 322개 세부구간으로 분리된 간선도로의 사고 자료를 이용하여 ZAM 모형을 개발하는데 중점을 두고 있다. ZAM 모형의 일종인 ZIP(zero inflated Poisson model)과 ZINB(zero inflated negative binomial model)를 중심으로 분석한 연구의 주요결과는 다음과 같다. 첫째, 모형의 적합성을 결정하는 Vuong 통계 값과 과분산계수 ${\alpha}$의 t 통계 값을 바탕으로 개발된 다양한 모형을 평가한 결과, 포아송, 음이항, ZIP 및 ZINB 회귀모형 중 ZINB 모형이 최적인 것으로 나타난다. 둘째, ZINB 모형은 t, ${\rho}$${\rho}^2$값 (0.63)의 관점에서 보면, 다른 모형에 비해서 통계적으로 매우 의미 있는 모형으로 평가된다. 마지막으로, 개발된 ZINB 모형의 사고 요인은 교통량, 진출입구 수 그리고 중앙분리대 길이로 분석된다. 교통량과 진출입구 수는 사고발생에 '+'요인, 그리고 중앙분리대 길이는 '-'요인으로 평가된다.