• 제목/요약/키워드: 분산추정량

검색결과 317건 처리시간 0.033초

젖소군의 유생산 수준별 이질성 분산 보정 (Adjustment of heterogeneous variance by milk production level of dairy herd)

  • 조광현;이준호;박경도
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권4호
    • /
    • pp.737-743
    • /
    • 2014
  • 본 연구는 젖소의 검정성적, 총 502,228개를 이용하여 젖소군 분산에 대한 이질성을 비교 검증하고 동질적인 분산을 유도하기 위하여 수행되었다. 유량, 유지방량과 유단백량에 대한 유전력은 각각 0.28, 0.26과 0.24로 추정되었으며, 출생년도별 평균 육종가는 HV (heterogenous variance) 모형의 추정치가 animal 모형의 것보다 일괄적으로 낮게 나타났다. 국제유전능력평가 기준에 적용된 씨수소 545두에 대한 유량, 유지방량, 유단백량의 평균 육종가는 각각 453.54kg, 10.75kg과 14.33kg이었으며, 이질성이 보정된 경우의 평균 육종가는 각각 432.06kg, 10.15kg과 13.40kg으로서 모든 유생산형질에서 보정된 자료의 육종가 평균이 일괄적으로 낮게 나타났다. animal 모형에서 데이터세트 I과 II사이의 표현형 상관계수는 유량 0.839, 유지방량 0.821, 유단백량 0.837이었으며, HV 모형에서는 유량 0.841, 유지방량 0.820, 유단백량 0.836으로 두 모형에서 거의 유사한 결과를 나타내었다. animal 모형과 HV 모형으로 비교한 결과 유량에서 ${\theta}$값은 15.157에서 16.105, 유지방량은 -0.227에서 -0.196으로 증가하였으나 유단백량의 경우 0.630에서 0.586으로 감소하였다.

k-모집단 동질성검정에서 피어슨검정의 오차성분 분석에 관한 연구 (Error cause analysis of Pearson test statistics for k-population homogeneity test)

  • 허순영
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권4호
    • /
    • pp.815-824
    • /
    • 2013
  • 국가단위의 조사와 같은 대규모 표본조사에서는 표본의 대표성을 확보하기 위해 층화, 집락, 계통, 불균등확률추출 등을 종합적으로 사용하는 복합표본설계가 일반화되어 있다. 이러한 복합표본설계에 기초한 범주형 자료분석에서는 자료의 독립성과 다항분포를 가정하는 전통적인 피어슨검정이 왜곡된 검정결과를 가져올 수 있다. 본 연구는 복합표본설계에 의한 범주형조사자료의 k-모집단 동질성검정에서 설계기반 일치통계량인 Wald 검정통계량을 유도하고, 전통적인 피어슨검정통계량을 사용할 경우 발생할 수 있는 오차요인을 항목별로 분해하여, 분산의 편의에 의한 영향, 추정량의 편의에 의한 영향, 기타 분산의 편의와 추정량의 편의가 교락되어 미치는 영향으로 각각 분해하는 식을 도출하였다. 또한, 도출된 식의 각 항목이 피어슨 카이제곱검정통계량에 미치는 상대적 크기를 경험적으로 확인하기 위해 국민건강영양조사 제4기 2차년도 자료를 이용해 경험분석 하였다. 분석결과, 변수에 따른 차이는 있지만 대체로 분산의 편의가 미치는 영향이 추정량의 편의가 미치는 영향보다 크다는 것을 명확히 확인할 수 있었다.

선호강도를 반영한 지불의사액 자료의 준모수적 분석 (Dealing with the Willingness-to-Pay Data with Preference Intensity : A Semi-parametric Approach)

  • 유승훈
    • 자원ㆍ환경경제연구
    • /
    • 제14권2호
    • /
    • pp.447-474
    • /
    • 2005
  • 응답자들에 따라 지불의사액(willingness to pay : WTP) 조사에서 응답한 WTP에 대한 확신도, 즉 선호의 강도가 다를 수 있다. 본 연구는 선호강도의 정도에 대한 정보를 얻기 위해 응답자가 응답한 WTP에 대해 선호강도가 어떤지에 대한 응답을 이끌어 내었다. 선호강도를 반영한 WTP 자료의 분석을 위해 본 논문에서는 Type 3 토빗모형의 적용을 고려한다. 이 모형을 추정하기 위해서는 통상 동분산 및 이변량 정규성을 만족하는 오차항 구조를 가정한 모수적 2단계 추정법을 적용한다. 하지만 이 가정들이 만족되지 않는다면 추정치는 비일치적이게 된다. 동분산과 정규성 가설에 대해 검정한 결과 유의수준 1%에서 두 가정은 모두 기각되었다. 따라서 모수적 Type 3 토빗모형을 추정하는데 요구되는 가정은 너무 제약적이라 할 수 있다. 본 연구에서는 이 모수적 모형에 대한 대안으로 준모수적 Type 3 토빗모형을 적용한다. 분석결과 준모수적 추정은 모수적 추정보다 유의하게 우수하였으며, 더욱더 중요하게는 모수적 모형으로부터 계산된 평균 WTP 추정치는 준모수적 모형으로부터 계산된 것과 유의하게 다름을 알 수 있었다.

  • PDF

Information Matrix에 따른 Generalized Logistic 분포의 최우도 추정량 정확도에 관한 연구 (A Study on the Accuracy of the Maximum Likelihood Estimator of the Generalized Logistic Distribution According to Information Matrix)

  • 신홍준;정영훈;허준행
    • 한국수자원학회논문집
    • /
    • 제42권4호
    • /
    • pp.331-341
    • /
    • 2009
  • 본 연구에서는 generalized logistic(GL) 분포의 최우도 추정량(maximum likelihood estimate)에 대한 불확실성 추정을 위하여 사용되는 관측정보행렬(observed information matrix)과 Fisher 정보행렬(Fisher information matrix)의 정확도를 비교해 보고자 하였다. 타 분포형에 대한 기존의 연구결과에서 표본의 크기가 클 경우 매개변수 추정시 관측정보행렬이 동시에 추정되어 계산시간도 단축되고 Fisher 정보행렬의 정확도와도 차이도 거의 없어 관측정보행렬의 사용이 추천된 바 있으나, 최근 사용이 증가되고 있는 GL 분포에 대한 연구결과는 아직 전무한 실정이며 기존 연구문헌의 결과를 토대로 구체적인 연구 없이 관측정보행렬을 사용하고 있는 상황이다. 따라서 본 연구에서는 이를 위해 모의실험을 수행하였으며, 모의 결과 최우도법에 의한 매개변수의 분산 및 공분산은 기존의 연구 결과와 비슷한 결과를 보이나, quantile에 대한 불확실성 추정에는 관측정보행렬보다 Fisher 정보행렬의 사용이 더 적절할 것으로 판단되었다.

카드뮴 분석에서의 측정불확도 추정 (Quantifying Uncertainty in Cadmium Analytical Measurements)

  • 강길진;선남규
    • 식품과학과 산업
    • /
    • 제40권1호
    • /
    • pp.27-35
    • /
    • 2007
  • 측정불확도란 시험결과에 대하여 측정량을 합리적으로 추정한 값들의 분산 특성을 나타내는 파라미터(parameter)로써 ILAC(국제시험소인정협력체) 등의 국제기구와의 측정결과에 대한상호인정 및 신뢰성 확보에 필수적인 요소이다. 국제표준(ISO/IEC 17025)에 맞는 시험분석 결과의 도출을 위해서는 먼저 소급성을 유지하고 그에 따른 불확도를 산출하여야 한다. 소급성은 실험의 모든 과정에 불확도를 가지고 끊기지 않는 비교연결을 통한 국제(국가)표준과 연관시키는 시스템으로, sampling에서 측정결과의 도출까지 소급성을 유지하는 것만이 측정결과의 신뢰성(정확 및 정밀)을 유지하는 최상의 시스템이다. Guide to the Expression of Uncertainty in Measurements(GUM)에 의한 불확도 계산 절차는 측정량(measurand)의 함수 표현, 입력량의 표준불확도(standard uncertainty)의 계산(표준편차, 평균의 표준편차), 합성표준불확도(combined uncertainty)의 계산, 확장불확도(expanded uncertainty)의 계산을 통한 통계적 추정을 하는 것이다. 오렌지 쥬스 중 카드뮴을 분석함에 있어서, 실험실에 대해서는 국제표준화(ISO17025) 시스템을 도입하고 분석시약 및 기기에 대하여 소급성을 유지하여, 분석결과의 신뢰성을 확보하기 위한 측정불확도를 산출하였다.

복합패널 데이터에 기초한 최소제곱 패널회귀추정량의 설계기반 성질 (Design-Based Properties of Least Square Estimators of Panel Regression Coefficients Based on Complex Panel Data)

  • 김규성
    • Communications for Statistical Applications and Methods
    • /
    • 제17권4호
    • /
    • pp.515-525
    • /
    • 2010
  • 본 논문에서는 패널회귀모형에서 회귀계수의 일반최소제곱추정량과 가중최소제곱추정량의 설계기반 성질을 살펴보았다. 복합표본이 주어진 경우에 두 추정량의 설계편향을 구하여 가중최소제곱추정량의 설계편향의 크기가 더 작음을 보였다. 또한 한국복지패널 데이터를 대상으로 모의실험을 실시하여 다음의 결과를 얻었다. 첫째, 일반최소제곱추정치의 상대편향이 가중최소제곱추정치의 상대편향보다 약 2배 정도 크게 나타났고 일반최소제곱추정치의 편향비가 더 크게 나타났다. 그리고 표본수가 증가하면 일반최소제곱 추정치의 상대편향은 완만하게 줄어든 반면 가중최소제곱추정치의 상대편향은 급속도로 줄어들었다. 둘째, 표본수가 증가하면 일반초소제곱추정치와 가중최소제곱추정치의 분산과 평균제곱오차는 모두 줄어들였다. 그러나 평균제곱오차에서 차지하는 편향제곱의 비율은 표본수가 증가할 때 일반최소제곱추정치에서는 증가하는 반면 가중최소제곱추정치에서는 감소하는 경향이 나타났다. 마지막으로 거의 모든 경우에 일반최소제곱추정치의 분산이 가중최소제곱추정치의 분산보다 작게 나타났다. 그리고 많은 경우에 일반최소제곱추정치의 평균제곱오차가 가중최소제곱추정치의 평균제곱오차보다 작게 나타났다. 그러나 표본수가 증가할수록 일반최소제곱추정치의 평균제곱오차가 가중최소제곱추정치의 평균제곱오차보다 커지는 경우가 늘어났다.

확률비례추출법에 의한 확률화응답기법에 관한 연구 (A Study on the Randomized Response Technique by PPS Sampling)

  • 이기성
    • 응용통계연구
    • /
    • 제19권1호
    • /
    • pp.69-80
    • /
    • 2006
  • 본 연구에서는 매우 민감한 조사에서 모집단이 집락의 크기가 서로 다른 여러 개의 집락으로 구성되어 있을 때, 집락의 크기에 비례하게 추출확률을 부여하는 확률비례추출법(probability proportional to size : pps)을 이용한 확률화응답기법을 제안하고자 한다. 민감한 속성에 대한 모수의 추정치와 분산 및 분산추정량을 구하여 이론적 체계를 구축하고, 확률비례추출법에 의한 확률화응답기법과 등확률 2단계 추출법에 의한 확률화응답기법의 효율성을 비교해 보고자 한다. 또한, 실제조사를 통해 제안한 확률비례추출법에 의한 확률화응답기법에 대한 실용화의 타당성을 검토하고자 한다.

하천홍수량의 지역화를 위한 일반화회귀모형의 개발 (Development of Generalized Regression Model for Regionalization of River Floods)

  • 조국광;이진형
    • 물과 미래
    • /
    • 제23권1호
    • /
    • pp.79-87
    • /
    • 1990
  • 본 연구에서는 회귀모형의 오차분석을 모형오차분석과 표본오차분산으로 분리하므로써 오차분산에 대한 합리적이고도 편의되지 않은 추정량을 제공해 줄 수 있는 일반화 최소자승법을 이용하여 한강 및 낙동강유역의 유량관측점에서 수집된 연최대홍수량 자료를 유역특성 및 강우량 자료와 연관시키는 지역화회귀모형을 개발하였다. 본 모형은 계측지점으로부터 미계측지점으로 수문정보를 전달해주기 위한 수단으로 사용될 수 있다.

  • PDF

평균-분산 가속화 실패시간 모형에서 벌점화 변수선택 (Penalized variable selection in mean-variance accelerated failure time models)

  • 권지훈;하일도
    • 응용통계연구
    • /
    • 제34권3호
    • /
    • pp.411-425
    • /
    • 2021
  • 가속화 실패시간모형은 로그 생존시간과 공변량간의 선형적 관계를 묘사해 준다. 가속화 실패시간모형에서 생존시간의 평균뿐만 아니라 변동성에도 영향을 미치는 공변량 효과를 추론하는 것은 흥미가 있다. 이를 위해 생존시간의 평균뿐만 아니라 분산을 모형화 하는 것이 필요하며, 이러한 모형을 평균-분산 가속화 실패시간모형이라 부른다. 본 논문에서는 벌점 가능도함수를 이용하여 평균-분산 가속화 실패시간모형에서 회귀모수에 대한 변수선택 절차를 제안한다. 여기서 벌점함수로서 LASSO, ALASSO, SCAD 그리고 HL (계층가능도)와 같은 네 가지 벌점함수를 연구한다. 제안된 변수선택 절차를 통해 중요한 공변량의 선택 뿐만 아니라 회귀모수의 추정을 동시에 제공할 수 있다. 제안된 방법의 성능은 모의실험을 통해 평가하고, 하나의 임상 예제자료를 통해 제안된 방법을 예증하고자 한다.

범주형 반복측정자료를 위한 일반화 추정방정식의 소표본 특성 (Small Sample Characteristics of Generalized Estimating Equations for Categorical Repeated Measurements)

  • 김동욱;김재직
    • 응용통계연구
    • /
    • 제15권2호
    • /
    • pp.297-310
    • /
    • 2002
  • Liang과 Zeger는 이산형 혹은 연속형 반복측정자료를 분석하기 위한 일반화 추정방정식 (GEE)을 제안하였다 GEE모형은 범주형 반복측정자료의 모형으로 확장될 수 있으며, 이 GEE추정량은 대표본인 경우 다변량 정규분포를 따른다. 그러나 GEE는 대표본근사이론에 기초한다. 본 논문에서는 소표본인 경우 반복 측정된 순서자료에 대한 GEE추정량의 성질을 연구한다. 우리는 두가지 방법을 사용하여 두그룹의 반복 측정된 순서자료를 생성하며 모의실험을 통하여 소표본인 경우 여러 개 범주를 갖는 순서반응 자료에 대하여 GEE추정량의 1종 오류율, 검정력, 상대효율, 두 그룹의 표본크기가 다를 경우 효과, 그리고 분산 추정량의 성질등을 연구한다.