• 제목/요약/키워드: Correlated-Binomial Model

검색결과 9건 처리시간 0.033초

Comparison of Three Binomial-related Models in the Estimation of Correlations

  • Moon, Myung-Sang
    • Communications for Statistical Applications and Methods
    • /
    • 제10권2호
    • /
    • pp.585-594
    • /
    • 2003
  • It has been generally recognized that conventional binomial or Poisson model provides poor fits to the actual correlated binary data due to the extra-binomial variation. A number of generalized statistical models have been proposed to account for this additional variation. Among them, beta-binomial, correlated-binomial, and modified-binomial models are binomial-related models which are frequently used in modeling the sum of n correlated binary data. In many situations, it is reasonable to assume that n correlated binary data are exchangeable, which is a special case of correlated binary data. The sum of n exchangeable correlated binary data is modeled relatively well when the above three binomial-related models are applied. But the estimation results of correlation coefficient turn to be quite different. Hence, it is important to identify which model provides better estimates of model parameters(success probability, correlation coefficient). For this purpose, a small-scale simulation study is performed to compare the behavior of above three models.

Tests for homogeneity of proportions in clustered binomial data

  • Jeong, Kwang Mo
    • Communications for Statistical Applications and Methods
    • /
    • 제23권5호
    • /
    • pp.433-444
    • /
    • 2016
  • When we observe binary responses in a cluster (such as rat lab-subjects), they are usually correlated to each other. In clustered binomial counts, the independence assumption is violated and we encounter an extra-variation. In the presence of extra-variation, the ordinary statistical analyses of binomial data are inappropriate to apply. In testing the homogeneity of proportions between several treatment groups, the classical Pearson chi-squared test has a severe flaw in the control of Type I error rates. We focus on modifying the chi-squared statistic by incorporating variance inflation factors. We suggest a method to adjust data in terms of dispersion estimate based on a quasi-likelihood model. We explain the testing procedure via an illustrative example as well as compare the performance of a modified chi-squared test with competitive statistics through a Monte Carlo study.

일반화 이항모형의 적합도 평가 (Comparative Simulation Studies on Generalized Binomial Models)

  • 백은주;김기영
    • Communications for Statistical Applications and Methods
    • /
    • 제18권4호
    • /
    • pp.507-516
    • /
    • 2011
  • 상관된 이항자료에 대한 일반화 이항모형들을 비교한 연구들은 고려한 모형과 비교기준에서 결과가 제한적이라는 측면이 있다. 이 연구는 모형선택의 가능한 지침을 제공하기 위해 모의실험을 통하여 모형별 적합도와 베르누이 시행의 성공확률 및 급내상관계수에 대한 ML추정량들을 비교하였다. 모수의 특정영역을 제외하고 포괄적 적합도나 추정량의 MSE 및 편의 등 성분적합에서는 대부분의 모형이 일정 수준의 경쟁적 관계에 있는 것으로 나타났다. 그러나 고려한 모형들 중 특히 일반화 확장베타이항모형 (Prentice, 1986)은 거의 모든 모수영역과 비교기준에 걸쳐 일관되게 양호한 수행력을 가지는 것으로 평가되었다.

영과잉 공간자료의 분석 (Zero In ated Poisson Model for Spatial Data)

  • 한준희;김창훈
    • 응용통계연구
    • /
    • 제28권2호
    • /
    • pp.231-239
    • /
    • 2015
  • 가산자료(counts data)를 적합 하는 경우 보통 포아송 모형이 가장 먼저 고려된다. 과산포 문제가 있을 경우도 유사 포아송(quasi Poisson) 모형이나 음이항(Negative binomial) 모형으로 대부분 설명이 가능하다. 하지만, 가산자료 중에는 포아송분포를 가정한 기대 빈도 이상으로 많은 0이 관측되는 자료가 있고 이를 영과잉(Zero inflated) 가산 자료라고 부른다. 영과잉 가산자료를 설명하기 위해 영과잉 포아송(ZIP) 모형이나 영과잉 음이항(ZINB) 모형을 이용할 수 있다. 더 나아가 영과잉 가산자료가 공간상관관계까지 있을 경우 영과잉 문제뿐만 아니라 유의할 수 있는 공간효과까지 고려해야하고 이를 위해 혼합효과모형(mixed effects model)이 고려 될 수 있다. 본 연구에서 사용된 2004년 기준 부산시 남성동별 갑상선암 발생자수 자료를 이용하여, 일반선형 포아송모형, 영과잉 포아송모형, 공간 영과잉 포아송모형을 적합하여 비교해보았다.

다변량 다수준 이항자료에 대한 일반화선형혼합모형 (Generalized Linear Mixed Model for Multivariate Multilevel Binomial Data)

  • 임화경;송석헌;송주원;전수영
    • 응용통계연구
    • /
    • 제21권6호
    • /
    • pp.923-932
    • /
    • 2008
  • 우리는 자명하지 않은 상관 구조를 갖는 복잡한 다변량 자료에 직면하는 경우가 있다. 예를 들어 군집 구조 자료의 경우 생략된 변수들이 한 개 이상의 관측값에 동시적으로 영향을 줄 수 있기 때문에 결과들 간에 상관 구조를 모형화하는 것은 추정량의 효율성과 정확한 표준오차의 계산 등의 타당한 추론을 위해서 중요하다 관측값들 간에 종속성을 두는 표준 방법으로는 관측 값들이 관찰되지 않은 어떤 변수를 공유한다고 가정하는 것인데, 이러한 가정에 대해 본 연구에서는 다수준 모형을 고려한 상관된 임의효과 모형을 적합시켰다. 추정은 준모수적 접근방법으로 임의계수 분포에 대한 모수적 가정 없이 유한혼합 EM-알고리즘을 통하여 수행되었다.

일반화 기하분포를 이용한 ARL의 수정에 관한 연구 (A Study on the Alternative ARL Using Generalized Geometric Distribution)

  • 문명상
    • 품질경영학회지
    • /
    • 제27권4호
    • /
    • pp.143-152
    • /
    • 1999
  • In Shewhart control chart, the average run length(ARL) is calculated using the mean of a conventional geometric distribution(CGD) assuming a sequence of identical and independent Bernoulli trials. In this, the success probability of CGB is the probability that any point exceeds the control limits. When the process is in-control state, there is no problem in the above assumption since the probability that any point exceeds the control limits does not change if the in-control state continues. However, if the out-of-control state begins and continues during the process, the probability of exceeding the control limits may take two forms. First, once the out-of-control state begins with exceeding probability p, it continues with the same exceeding probability p. Second, after the out-of-control state begins, the exceeding probabilities may very according to some pattern. In the first case, ARL is the mean of CGD with success probability p as usual. But in the second case, the assumption of a sequence of identical and independent Bernoulli trials is invalid and we can not use the mean of CGD as ARL. This paper concentrate on that point. By adopting one generalized binomial distribution(GBD) model that allows correlated Bernoulli trials, generalized geometric distribution(GGD) is defined and its mean is derived to find an alternative ARL when the process is in out-of-control state and the exceeding probabilities take the second form mentioned in the above. Small-scale simulation is performed to show how an alternative ARL works.

  • PDF

주거지역 가로환경 및 일상 걷기가 정신 건강에 미치는 영향 - 서울시 대상으로 - (Estimation of the Effects of Daily Walking Hours and Days on the Mental Health of Urban Residents - The Case in Seoul -)

  • 구본유;백승주;윤희연
    • 한국조경학회지
    • /
    • 제52권1호
    • /
    • pp.87-100
    • /
    • 2024
  • 본 연구는 도시민의 가로환경 이용을 매개로 하여 주거지역 가로환경 질이 도시민의 정신 건강에 미치는 영향을 밝히고자 하였다. 영과잉 음이항 회귀모형을 통해 보행 활동과 가로환경이 도시민의 우울 증세에 미치는 영향을 확인하였다. 연구 범위는 2017년 대한민국 서울특별시로 한정하였으며, 우울 유병 증세를 종속 변수, 가로환경 변수 및 보행 변수, 개인 특성을 독립 변수로 이용하였다. 나아가, 가로 녹지와 보행 빈도의 상호작용 효과를 살펴, 녹지에서 걷는 행위가 정신 건강에 미치는 상승효과를 분석하였다. 연구 결과, 가로 녹지 면적 비율이 높을수록 우울증세가 나타나지 않았다. 보행 빈도가 높을수록 우울 증세가 나타나지 않거나, 우울 증세가 존재할 경우에도 약하게 나타났다. 또한, 가로 녹지에서의 보행 빈도가 늘어날수록 우울 증세가 약하게 나타나는 상호작용 효과를 확인하였다. 시각적 복잡성은 낮을수록 우울 증세가 나타나지 않았다. 본 연구는 도시민의 정신 건강 문제를 지역사회차원에서 다루는 데에 기여하며, 가로 녹지와 보행 빈도의 시너지 효과를 발견함으로써 주거지역 가로 녹지 환경이 도시민 정신 건강 증진에 미치는 중요성을 강조하였다.

2단계 추이모형에 의한 금강하구호의 공수도달시간의 평가 (An Evaluation of the Emptiness Passage Time of the Kuemgang Estuary Reservoir by Two-Step Transition Model)

  • 이재형;정만
    • 물과 미래
    • /
    • 제26권3호
    • /
    • pp.113-124
    • /
    • 1993
  • 본 연구는 금강하구호의 운영정책을 효율적으로 수립할 수 있도록, 2단계 추이모형으로부터 저수지 정상분포와 공수도달시간을 평가하는 데 있다. 이를 위해서 저수량과 유량의 결합분포에 이산 Markov과정을 도입하였으며, 저수지 유입량 분포로는 이항분포를 이용하였다. 계산결과, 대청댐 건설이전인 1952년부터 1980년 유량자료로부터 갈수시 자기 상관계수의 도입에 따른 저수지 정상분포의 공수확률은 0.952에서 0.904로 감소하며, 대청댐 건설이후인 1981-1989년까지는 저수지 정상분포의 공수확률은 0.900에서 0.829로 감소하였다. 한편 평균공수도달시간은 초기 저수량이 1단위에서 댐건설전은 23일에서 37일로 증가하며, 건설후는 29일에서 61일로 증가하는 것으로 나타났다. 이는 비교적 용량이 적은 금강하구호에서 저수율이 낮을 때 정상분포, 공수도달시간 등이 저수지 유입량의 자기상관계수에 따라 변화함을 알 수 있다. 따라서 갈수시 감강하구호의 효율적인 이수관리를 위해서는 유입량의 자기상관성을 고려해야 한다.

  • PDF

기분장애 환자에서 한의치료 이용과 관련된 요인분석: 제2기 한국의료패널 자료를 중심으로 (Analysis of Factors Related to the Use of Korean Medicine Treatment in Patients with Mood Disorders: Based on 2019 Korea Health Panel Annual Data)

  • 이경은;권찬영
    • 동의신경정신과학회지
    • /
    • 제34권4호
    • /
    • pp.349-358
    • /
    • 2023
  • Objectives: We used the 2019 Korea Health Panel Annual Data to analyze factors related to visits to Korean medicine (KM) outpatient clinics among patients with mood disorders in Korea. Methods: Individuals aged 19 years or older, with depressive or bipolar disorders, and with a record of using Western medicine (WM) and/or the KM medical service were included. The 266 subjects were classified into the WM group or the integrative medicine (IM) group. The Andersen healthcare utilization model was used to analyze factors that potentially influenced the subjects' healthcare utilization. Binomial logistic regression analysis was used to analyze factors influencing the use of IM medical services. Results: Among the subjects, 75.56% (n=201) were in the WM group, and 24.44% (n=65) were in the IM group. Statistically significant differences were observed in residential areas, total annual income, the presence of disability, and the level of pain/discomfort between the two groups. Regression analysis found that residential areas and pain/discomfort were factors related to the use of IM services. Specifically, reporting "a lot" of pain/discomfort compared to "no" pain/discomfort showed a significant positive relationship with the use of IM (odds ratio=4.57, 95% confidence interval=1.79 to 11.70). Conclusions: This study was the first to analyze the status of KM medical service use and related factors among patients with mood disorders in Korea. The finding that the presence of pain/discomfort was positively correlated with the use of KM services is potentially related to medically unexplained physical symptoms or somatization phenomena.