• 제목/요약/키워드: sample inclusion probability

검색결과 12건 처리시간 0.019초

포함확률비례추출에서 회귀계수 최소제곱추정량의 근사분산 (Approximate Variance of Least Square Estimators for Regression Coefficient under Inclusion Probability Proportional to Size Sampling)

  • 김규성
    • Communications for Statistical Applications and Methods
    • /
    • 제19권1호
    • /
    • pp.23-32
    • /
    • 2012
  • 본 논문은 유한모집단에서 회귀계수추정량의 근사편향과 근사분산을 다루고 있다. 유한모집단에서 고정크기 포함확률비례표본을 추출하고 이 표본에서 조사된 데이터에 기초하여 회귀계수를 일반최소제곱추정량과 가중최소제곱추정량으로 추정할 때 두 추정량의 편향, 분산 그리고 평균제곱오차의 근사식을 유도하였다. 그리고 두 추정량의 효율을 비교하기 위하여 두 추정량의 분산을 비교하는 필요충분조건을 제시하였다. 또한 수치적인 비교를 위하여 간단한 예제를 소개하였다.

Mean estimation of small areas using penalized spline mixed-model under informative sampling

  • Chytrasari, Angela N.R.;Kartiko, Sri Haryatmi;Danardono, Danardono
    • Communications for Statistical Applications and Methods
    • /
    • 제27권3호
    • /
    • pp.349-363
    • /
    • 2020
  • Penalized spline is a suitable nonparametric approach in estimating mean model in small area. However, application of the approach in informative sampling in a published article is uncommon. We propose a semiparametric mixed-model using penalized spline under informative sampling to estimate mean of small area. The response variable is explained in terms of mean model, informative sample effect, area random effect and unit error. We approach the mean model by penalized spline and utilize a penalized spline function of the inclusion probability to account for the informative sample effect. We determine the best and unbiased estimators for coefficient model and derive the restricted maximum likelihood estimators for the variance components. A simulation study shows a decrease in the average absolute bias produced by the proposed model. A decrease in the root mean square error also occurred except in some quadratic cases. The use of linear and quadratic penalized spline to approach the function of the inclusion probability provides no significant difference distribution of root mean square error, except for few smaller samples.

Analysis of Nested Case-Control Study Designs: Revisiting the Inverse Probability Weighting Method

  • Kim, Ryung S.
    • Communications for Statistical Applications and Methods
    • /
    • 제20권6호
    • /
    • pp.455-466
    • /
    • 2013
  • In nested case-control studies, the most common way to make inference under a proportional hazards model is the conditional logistic approach of Thomas (1977). Inclusion probability methods are more efficient than the conditional logistic approach of Thomas; however, the epidemiology research community has not accepted the methods as a replacement of the Thomas' method. This paper promotes the inverse probability weighting method originally proposed by Samuelsen (1997) in combination with an approximate jackknife standard error that can be easily computed using existing software. Simulation studies demonstrate that this approach yields valid type 1 errors and greater powers than the conditional logistic approach in nested case-control designs across various sample sizes and magnitudes of the hazard ratios. A generalization of the method is also made to incorporate additional matching and the stratified Cox model. The proposed method is illustrated with data from a cohort of children with Wilm's tumor to study the association between histological signatures and relapses.

Effects of Health Behavior Factors and Mental Health Factors in Korean Obese Adults on Their Metabolic State: Utilizing the Korea National Health and Nutrition Examination Survey Data

  • Song, Jeonghee;Han, Jeongwon
    • International Journal of Contents
    • /
    • 제13권3호
    • /
    • pp.49-58
    • /
    • 2017
  • This is a descriptive research study that classified Korean adults with obesity into those with Metabolically Healthy Obesity and those with Metabolically Unhealthy Obesity based on the data from the fifth and sixth South Korea's National Health and Nutrition Examination Surveys, designed due to the development of information and communication technology, to examine the impacts of obese adults' health behavior factors and mental health factors on their metabolic state. With respect to data analysis, the collected data were analyzed by complex sample statistics. The results of this study can be summarized as follows: Men who were smoking at the time of the survey had a 1.29 times higher probability of inclusion in the MUO group than in the MHO group. Women who had a high stress cognition rate had a 1.02 times higher probability of inclusion in the MUO group than in the MHO group. This study is significant as it provides the basic data for establishing strategies of nursing intervention for the promotion of obese adults' health, and it suggests that it is necessary to develop a program for the promotion of obese adults' health based on these results.

응답률이 관심변수의 지수함수를 따를 경우 정보적 표본설계 기법을 이용한 모수추정 (Estimation using informative sampling technique when response rate follows exponential function of variable of interest)

  • 정희영;신기일
    • 응용통계연구
    • /
    • 제30권6호
    • /
    • pp.993-1004
    • /
    • 2017
  • 표본조사에서는 추정의 정확성 및 정밀성 향상을 위해 흔히 층화추출법을 사용하며 층 내에서는 동일한 표본 가중치를 이용하여 표본을 추출한다. 그러나 실제 응답률은 관심변수 값에 영향을 받을 수 있기 때문에 주어진 동일한 가중치는 응답률을 반영하여 보정되어야 한다. 또한 관심변수가 연속형 보조변수와 선형 관계가 있고 보조변수를 기준으로 층이 나누어진 경우에는 층 내에서 동일한 가중치를 사용하는 것 보다 층을 세분화한 후 얻어진 가중치를 사용하는 것이 효과적일 수 있다. 본 연구에서는 응답률이 관심변수 자료 값의 지수함수이고, 관심변수가 보조변수와 선형 관계가 있을 때 정보적 표본설계 기법을 이용하여 추정의 정확성과 정밀성을 높이는 방법을 제안하였다. 또한 모의실험을 통하여 제안된 방법의 우수성을 확인하였다.

응답률이 선형인 표본조사에서 편향 보정 추정 (Bias adjusted estimation in a sample survey with linear response rate)

  • 정희영;신기일
    • 응용통계연구
    • /
    • 제32권4호
    • /
    • pp.631-642
    • /
    • 2019
  • 다수의 항목무응답이 발생한 표본조사에서는 추정의 정확성이 떨어진다. 이를 해결하기 위한 많은 방법이 개발되었으나 응답률이 관심변수에 의해 영향을 받는 경우임에도 이를 고려하지 않고 랜덤으로 무응답이 발생한다는 가정 하에서 사용하는 무응답 처리 방법을 사용하게 되면 편향이 발생하는 것으로 알려져 있다. Chung과 Shin (2017)과 Min과 Shin (2018)은 응답률이 관심변수의 함수인 경우에서 발생된 편향을 적절히 처리하여 추정의 정확성을 향상시키는 방법을 제안하였다. 본 연구에서는 응답률 함수가 선형(linear)이면서 초모집단 모형의 오차가 정규분포를 따르는 경우를 살펴보았으며 층별 모집단 수가 편향 보정에 영향을 주는지도 살펴보았다. 모의실험을 통하여 제안된 추정량의 성능을 살펴보았으며 실제 자료 분석을 통해 이를 확인하였다.

모의실험을 기반으로 지수형 응답률 보정을 위한 세부 층 결정에 관한 연구 (A study on the determination of substrata using the information of exponential response rate by simulation studies)

  • 민주원;신기일
    • 응용통계연구
    • /
    • 제31권5호
    • /
    • pp.621-636
    • /
    • 2018
  • 정보적 표본설계 기법을 적용하여 무응답의 영향을 줄이기 위한 연구가 진행되고 있다. 특히 초모집단모형(super population model)에 포함된 오차의 분포가 정규분포를 따르고 응답률이 지수함수를 따를 때 지수형 응답률 정보를 모수추정에 사용함으로써 추정의 정확성이 향상되는 것으로 알려져 있다. 최근 Chung과 Shin (2017)은 정보적 표본설계의 가중치를 구하기 위해 세부 층을 등간격으로 나누는 방법을 고려하였으며 세부 층의 개수가 추정의 정확성에 영향을 주는 것을 확인하였다. 이에 본 연구에서는 주어진 표본 규모에 따른 최적의 세부 층 개수와 최적의 층 경계를 구하기 위해 등간격, 분위수, LH 알고리즘을 이용하여 층을 나누는 방법을 살펴보았으며 모의실험을 통하여 각 방법의 결과를 비교하였다. 또한 다양한 형태의 보조변수 분포를 이용하여 실무에서 사용할 수 있는 세부 층 경계와 세부 층 개수를 정하는 기준을 제안하였다.

Impact of Marketing Losses on Efficiency in Transacting Banana in Scarce Rainfall Zone of Andhra Pradesh, India

  • Kumar, K. Nirmal Ravi
    • Agribusiness and Information Management
    • /
    • 제9권2호
    • /
    • pp.1-11
    • /
    • 2017
  • Introduction: To analyze the impact of marketing losses on efficiency in transacting banana in Kurnool district of SRZ in Andhra Pradesh and to assess the opinions of the farmers on the constraints in transacting banana. Research back ground, Materials and Methods: The study relies exclusively on primary information obtained from the banana farmers of Kurnool District. Purposive sampling procedure was followed for the selection of the study area. Top two mandals in the district and top two villages in each mandal are selected in accordance with the area under cultivation of banana. Probability proportion to size was followed regarding the selection of sample farmers and accordingly 60 marginal, 37 small and 23 other farmers were selected and thereby, the total sample size was 120. Result and Discussion: Three marketing channels were identified in the marketing of banana in Kurnool district viz., Producer ${\rightarrow}$ Local-exporter ${\rightarrow}$ Wholesaler ${\rightarrow}$ Retailer ${\rightarrow}$ Consumer (Channel-I), Producer ${\rightarrow}$ Wholesaler ${\rightarrow}$ Cart-vendor ${\rightarrow}$ Consumer (Channel-II) and Producer ${\rightarrow}$ Juice-holder ${\rightarrow}$ Consumer (Channel-III). With the inclusion of marketing losses in the price spread analysis of banana in all the three channels, the marketing costs of all the intermediaries were increased and thereby, the farmer's share in consumer's rupee and Net Marketing Margins of the agencies are on the decline. So, without inclusion of marketing losses, the farmer's share in consumer's rupee and Net Marketing Margins of all the agencies are overvalued. The higher the marketing losses, the more is the negative impact on farmer's net selling price, net marketing margins of the intermediaries and marketing efficiency. The sample farmers are facing major problems in marketing of banana like frequent price fluctuations, unorganized marketing and lack of transportation facilities on priority basis. Suggestions: It is suggested to educate the farmers regarding the optimum maturity index for harvest, use of mechanical harvesters, proper placement of fruits during storage and ripening, better packaging and cushioning technologies to absorb shocks during transportation, strengthening of storage facilities and transport facilities, encourage co-operative marketing etc., to promote marketing efficiency of banana in the study area.

Analyses of the Effects of Government Export Promotion Programs on Export Performance: Empirical Evidence for Small and Medium-Sized Enterprises in Korea

  • Beom-Cheol Cin;Kuk-Hyun Choe
    • Journal of Korea Trade
    • /
    • 제26권5호
    • /
    • pp.39-55
    • /
    • 2022
  • Purpose - This study empirically examines the effect of the Korean government export promotion program (EPP) on small and medium-sized enterprise (SMEs) export performance using firm-level data. Unlike most previous studies that investigated some specific samples of firms, this study analyzes a vast amount of SME data of the Korean Small and Medium Business Administration over the period 2005 to 2008. Design/methodology - An endogeneity problem arises when a firm's probability of being selected is correlated with the likelihood of successfully implementing EPPs. To control for the endogeneity of the EPPs in a relatively short-period sample, we employ 2-Stage Residual Inclusion (2SRI) RE-Tobit and bivariate Tobit procedure. Findings - Analyses show that Korean government EPPs have positive significant effects on SME exports. Empirical results also show that SME export activities are significantly encouraged by R&D investment and capital intensity, but not obviously by labor productivity. Originality/value - This study provides evidence that SME capital intensity, R&D investment, and the number of workers are significant determinants to SME exporting activities, whereas per worker labor cost and employee education are not. These results imply that even for SMEs, firm size is a major factor in promoting exporting activities.

가중치 보정 추정량에 대한 일반적인 분산 추정법 연구 (Variance Estimation for General Weight-Adjusted Estimator)

  • 김재광
    • 응용통계연구
    • /
    • 제20권2호
    • /
    • pp.281-290
    • /
    • 2007
  • 유한 모집단에서 총계 추정에는 표본의 각 관측값으로 만들어지는 선형 추정량이 사용되는데 이때 사용되는 가중치는 표본 추출 확률의 역수를 사용한 기본 가중치를 모집단 전체에서 얻어지는 보조 정보를 이용하여 보정한 형태로 종종 사용된다. 이렇게 보정된 가중치를 사용한 추정량은 그렇지 않은 추정량보다 효율이 더 좋아질 수 있는 장점이 있으나 이러한 경우 분산 추정은 더 어려워지게 된다. 본 연구에서는 보정된 가중치를 사용한 추정량의 분산 추정을 다룬다. 가중치 보정의 일반적인 형태를 밝히고 이 경우 가중치 보정항은 유한개의 장애 모수(nuisance parameter)의 함수로 나타낼 수 있으므로 이 장애 모수에 대한 테일러 전개를 사용한 분산 추정식을 구한다. 이렇게 구현된 분산 추정식은 기존의 가중치 보정 추정량뿐만 아니라 보다 일반적인 경우에서도 적용될 수 있다는 장점이 있다. 몇가지 응용 사례와 모의 실험 결과를 소개한다.