• 제목/요약/키워드: Correlated binomial data

검색결과 8건 처리시간 0.016초

Comparison of Three Binomial-related Models in the Estimation of Correlations

  • Moon, Myung-Sang
    • Communications for Statistical Applications and Methods
    • /
    • 제10권2호
    • /
    • pp.585-594
    • /
    • 2003
  • It has been generally recognized that conventional binomial or Poisson model provides poor fits to the actual correlated binary data due to the extra-binomial variation. A number of generalized statistical models have been proposed to account for this additional variation. Among them, beta-binomial, correlated-binomial, and modified-binomial models are binomial-related models which are frequently used in modeling the sum of n correlated binary data. In many situations, it is reasonable to assume that n correlated binary data are exchangeable, which is a special case of correlated binary data. The sum of n exchangeable correlated binary data is modeled relatively well when the above three binomial-related models are applied. But the estimation results of correlation coefficient turn to be quite different. Hence, it is important to identify which model provides better estimates of model parameters(success probability, correlation coefficient). For this purpose, a small-scale simulation study is performed to compare the behavior of above three models.

Mixed Effects Kernel Binomial Regression

  • Hwang, Chang-Ha
    • Journal of the Korean Data and Information Science Society
    • /
    • 제19권4호
    • /
    • pp.1327-1334
    • /
    • 2008
  • Mixed effect binomial regression models are widely used for analysis of correlated count data in which the response is the result of a series of one of two possible disjoint outcomes. In this paper, we consider kernel extensions with nonparametric fixed effects and parametric random effects. The estimation is through the penalized likelihood method based on kernel trick, and our focus is on the efficient computation and the effective hyperparameter selection. For the selection of hyperparameters, cross-validation techniques are employed. Examples illustrating usage and features of the proposed method are provided.

  • PDF

Tests for homogeneity of proportions in clustered binomial data

  • Jeong, Kwang Mo
    • Communications for Statistical Applications and Methods
    • /
    • 제23권5호
    • /
    • pp.433-444
    • /
    • 2016
  • When we observe binary responses in a cluster (such as rat lab-subjects), they are usually correlated to each other. In clustered binomial counts, the independence assumption is violated and we encounter an extra-variation. In the presence of extra-variation, the ordinary statistical analyses of binomial data are inappropriate to apply. In testing the homogeneity of proportions between several treatment groups, the classical Pearson chi-squared test has a severe flaw in the control of Type I error rates. We focus on modifying the chi-squared statistic by incorporating variance inflation factors. We suggest a method to adjust data in terms of dispersion estimate based on a quasi-likelihood model. We explain the testing procedure via an illustrative example as well as compare the performance of a modified chi-squared test with competitive statistics through a Monte Carlo study.

영과잉 공간자료의 분석 (Zero In ated Poisson Model for Spatial Data)

  • 한준희;김창훈
    • 응용통계연구
    • /
    • 제28권2호
    • /
    • pp.231-239
    • /
    • 2015
  • 가산자료(counts data)를 적합 하는 경우 보통 포아송 모형이 가장 먼저 고려된다. 과산포 문제가 있을 경우도 유사 포아송(quasi Poisson) 모형이나 음이항(Negative binomial) 모형으로 대부분 설명이 가능하다. 하지만, 가산자료 중에는 포아송분포를 가정한 기대 빈도 이상으로 많은 0이 관측되는 자료가 있고 이를 영과잉(Zero inflated) 가산 자료라고 부른다. 영과잉 가산자료를 설명하기 위해 영과잉 포아송(ZIP) 모형이나 영과잉 음이항(ZINB) 모형을 이용할 수 있다. 더 나아가 영과잉 가산자료가 공간상관관계까지 있을 경우 영과잉 문제뿐만 아니라 유의할 수 있는 공간효과까지 고려해야하고 이를 위해 혼합효과모형(mixed effects model)이 고려 될 수 있다. 본 연구에서 사용된 2004년 기준 부산시 남성동별 갑상선암 발생자수 자료를 이용하여, 일반선형 포아송모형, 영과잉 포아송모형, 공간 영과잉 포아송모형을 적합하여 비교해보았다.

일반화 이항모형의 적합도 평가 (Comparative Simulation Studies on Generalized Binomial Models)

  • 백은주;김기영
    • Communications for Statistical Applications and Methods
    • /
    • 제18권4호
    • /
    • pp.507-516
    • /
    • 2011
  • 상관된 이항자료에 대한 일반화 이항모형들을 비교한 연구들은 고려한 모형과 비교기준에서 결과가 제한적이라는 측면이 있다. 이 연구는 모형선택의 가능한 지침을 제공하기 위해 모의실험을 통하여 모형별 적합도와 베르누이 시행의 성공확률 및 급내상관계수에 대한 ML추정량들을 비교하였다. 모수의 특정영역을 제외하고 포괄적 적합도나 추정량의 MSE 및 편의 등 성분적합에서는 대부분의 모형이 일정 수준의 경쟁적 관계에 있는 것으로 나타났다. 그러나 고려한 모형들 중 특히 일반화 확장베타이항모형 (Prentice, 1986)은 거의 모든 모수영역과 비교기준에 걸쳐 일관되게 양호한 수행력을 가지는 것으로 평가되었다.

다변량 다수준 이항자료에 대한 일반화선형혼합모형 (Generalized Linear Mixed Model for Multivariate Multilevel Binomial Data)

  • 임화경;송석헌;송주원;전수영
    • 응용통계연구
    • /
    • 제21권6호
    • /
    • pp.923-932
    • /
    • 2008
  • 우리는 자명하지 않은 상관 구조를 갖는 복잡한 다변량 자료에 직면하는 경우가 있다. 예를 들어 군집 구조 자료의 경우 생략된 변수들이 한 개 이상의 관측값에 동시적으로 영향을 줄 수 있기 때문에 결과들 간에 상관 구조를 모형화하는 것은 추정량의 효율성과 정확한 표준오차의 계산 등의 타당한 추론을 위해서 중요하다 관측값들 간에 종속성을 두는 표준 방법으로는 관측 값들이 관찰되지 않은 어떤 변수를 공유한다고 가정하는 것인데, 이러한 가정에 대해 본 연구에서는 다수준 모형을 고려한 상관된 임의효과 모형을 적합시켰다. 추정은 준모수적 접근방법으로 임의계수 분포에 대한 모수적 가정 없이 유한혼합 EM-알고리즘을 통하여 수행되었다.

기분장애 환자에서 한의치료 이용과 관련된 요인분석: 제2기 한국의료패널 자료를 중심으로 (Analysis of Factors Related to the Use of Korean Medicine Treatment in Patients with Mood Disorders: Based on 2019 Korea Health Panel Annual Data)

  • 이경은;권찬영
    • 동의신경정신과학회지
    • /
    • 제34권4호
    • /
    • pp.349-358
    • /
    • 2023
  • Objectives: We used the 2019 Korea Health Panel Annual Data to analyze factors related to visits to Korean medicine (KM) outpatient clinics among patients with mood disorders in Korea. Methods: Individuals aged 19 years or older, with depressive or bipolar disorders, and with a record of using Western medicine (WM) and/or the KM medical service were included. The 266 subjects were classified into the WM group or the integrative medicine (IM) group. The Andersen healthcare utilization model was used to analyze factors that potentially influenced the subjects' healthcare utilization. Binomial logistic regression analysis was used to analyze factors influencing the use of IM medical services. Results: Among the subjects, 75.56% (n=201) were in the WM group, and 24.44% (n=65) were in the IM group. Statistically significant differences were observed in residential areas, total annual income, the presence of disability, and the level of pain/discomfort between the two groups. Regression analysis found that residential areas and pain/discomfort were factors related to the use of IM services. Specifically, reporting "a lot" of pain/discomfort compared to "no" pain/discomfort showed a significant positive relationship with the use of IM (odds ratio=4.57, 95% confidence interval=1.79 to 11.70). Conclusions: This study was the first to analyze the status of KM medical service use and related factors among patients with mood disorders in Korea. The finding that the presence of pain/discomfort was positively correlated with the use of KM services is potentially related to medically unexplained physical symptoms or somatization phenomena.

사내벤처캐피탈의 투자포트폴리오 운영성향과 기술혁신 효과 (Corporate Venture Capital and Technological Innovation: Effects of Investment Portfolio Composition)

  • 안현섭;윤지환
    • 기술혁신연구
    • /
    • 제26권4호
    • /
    • pp.29-56
    • /
    • 2018
  • 최근 글로벌 기업들은 신기술 확보를 위해 사내벤처캐피탈(Corporate Venture Capital, CVC)을 설립하여 기술벤처에 투자하고 있다. 본 연구의 목적은 CVC의 투자 포트폴리오 운영방식 차이가 모기업의 기술혁신 효과에 영향을 주는지 통계적으로 실증 분석하기 위함에 있다. 구체적으로 CVC의 '시드(Seed)', '초기(Early)', '확장(Expansion)', '후기(Late)' 4가지 투자 단계별로 투자된 금액비중에 따라 매년 투자 포트폴리오 성장잠재성과 리스크 수준이 달라진다는 것을 발견하였고, 포트폴리오의 공격적인 투자성향과 외부 파트너십이 모기업 기술 혁신효과에 미치는 영향에 대해 분석하였다. 연구를 위해 글로벌 70개 CVC들이 21년간 투자한 실적 데이터를 음이항 패널 회귀분석(negative binomial panel regression)을 통해 검증하였다. 연구의 결과, 벤처 포트폴리오 내 시드/초기 단계 기업들에 투자한 금액이 클수록 기술혁신 효과는 증가하지만, 일정 수준 이상부터는 오히려 효과가 감소하는 Inverted U형 관계를 확인하였다. 또한, 각 투자단계별 벤처기업들에 공동 투자한 외부 파트너 수가 포트폴리오 운영성향과 기술혁신 효과 사이의 Inverted U형 관계를 약화시키는 조절효과를 통계적으로 실증하였다. 본 논문은 기업이 투자포트폴리오를 구성할 때 투자 단계와 경과시점을 고려할 경우 투자성과를 극대화할 수 있다는 점에서 기획 담당자, 벤처 투자자, 정책 관리자 등에 시사점을 제공할 수 있다.