• 제목/요약/키워드: 표본가중평균

검색결과 35건 처리시간 0.018초

유한모집단에서 가중평균에 포함된 가중치의 효과 (Weighting Effect on the Weighted Mean in Finite Population)

  • 김규성
    • 한국조사연구학회지:조사연구
    • /
    • 제7권2호
    • /
    • pp.53-69
    • /
    • 2006
  • 표본조사에서 가중치는 설계 단계와 분석 단계에서 만들어지고 부여될 수 있다. 설계 단계의 가중치는 추출확률이나 응답률 등과 같은 표본 데이터 획득 지표에 관련되어 있고 분석 단계의 가중치는 모집단 수치나 다른 보조 변수정보 등과 같은 외적인 정보와 관련되어 있다. 그리고 최종가중치는 설계 단계의 가중치와 분석 단계의 가중치의 곱으로 만들어진다. 이 논문에서는 분석 단계에서 부여되는 가중치에 초점을 맞추어 가중평균으로 모평균을 추정할 때 가중평균에 포함된 가중치가 모평균 추론에 미치는 영향을 고찰하였다. 유한모집단에서 각 조사단위에 조사변수와 가중치가 쌍으로 있고 표본추출확률이 균등한 경우를 가정하였다. 이러한 조건에서 가중평균의 편향과 평균제곱오차를 구하여 가중평균은 모평균의 편향 추정량임을 보였고, 편향의 방향과 크기는 조사변수와 가중치의 상관관계로 설명할 수 있음을 보였다. 즉, 만일 가중치와 조사변수가 양의 상관관계가 있으면 가중평균은 모평균을 과대 추정하게 되고, 만일 음의 상관관계가 있으면 모평균을 과소 추정하게 된다. 그리고 두 변수의 상관계수가 크면 편향은 증가한다. 가중평균에 대한 이론적인 수식 유도와 함께 편향의 크기와 평균제곱오차의 크기를 수치적으로 검토하기 위하여 모의실험을 실시하였다. 모의실험에서는 상관계수가 -0.2과 0.6사이에 있는 9개의 가중치를 생성하였고, 표본수는 100부터 400까지 고려하여 편향의 크기와 평균제곱오차의 크기를 수치적으로 구하였다. 하나의 결과로써 상관계수가 0.55이고 표본수가 400인 경우에 가중평균의 편향의 제곱이 평균제곱오차에서 차지하는 비율은 무려 82%에 이르는 것으로 나타났는데, 이는 가중평균의 편향이 어떤 경우에는 매우 심각할 수도 있음을 보여주는 것이다.

  • PDF

복합패널 데이터에 기초한 최소제곱 패널회귀추정량의 설계기반 성질 (Design-Based Properties of Least Square Estimators of Panel Regression Coefficients Based on Complex Panel Data)

  • 김규성
    • Communications for Statistical Applications and Methods
    • /
    • 제17권4호
    • /
    • pp.515-525
    • /
    • 2010
  • 본 논문에서는 패널회귀모형에서 회귀계수의 일반최소제곱추정량과 가중최소제곱추정량의 설계기반 성질을 살펴보았다. 복합표본이 주어진 경우에 두 추정량의 설계편향을 구하여 가중최소제곱추정량의 설계편향의 크기가 더 작음을 보였다. 또한 한국복지패널 데이터를 대상으로 모의실험을 실시하여 다음의 결과를 얻었다. 첫째, 일반최소제곱추정치의 상대편향이 가중최소제곱추정치의 상대편향보다 약 2배 정도 크게 나타났고 일반최소제곱추정치의 편향비가 더 크게 나타났다. 그리고 표본수가 증가하면 일반최소제곱 추정치의 상대편향은 완만하게 줄어든 반면 가중최소제곱추정치의 상대편향은 급속도로 줄어들었다. 둘째, 표본수가 증가하면 일반초소제곱추정치와 가중최소제곱추정치의 분산과 평균제곱오차는 모두 줄어들였다. 그러나 평균제곱오차에서 차지하는 편향제곱의 비율은 표본수가 증가할 때 일반최소제곱추정치에서는 증가하는 반면 가중최소제곱추정치에서는 감소하는 경향이 나타났다. 마지막으로 거의 모든 경우에 일반최소제곱추정치의 분산이 가중최소제곱추정치의 분산보다 작게 나타났다. 그리고 많은 경우에 일반최소제곱추정치의 평균제곱오차가 가중최소제곱추정치의 평균제곱오차보다 작게 나타났다. 그러나 표본수가 증가할수록 일반최소제곱추정치의 평균제곱오차가 가중최소제곱추정치의 평균제곱오차보다 커지는 경우가 늘어났다.

카즈분포족에 대한 지수가중이동평균관리도 (EWMA control chart for Katz family of distributions)

  • 조교영
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권4호
    • /
    • pp.681-688
    • /
    • 2010
  • 통계적 공정관리에서 결점수를 모니터링 하는데는 c-관리도가 사용된다. 전통적인 c-관리도는 표본에서 결점의 발생은 포아송분포를 따른다는 가정 하에서 만들어진다. 포아송 분포에 대한 가정이 맞지 않을 때에는 X-관리도가 사용될 수 있다. 지수가중이동평균관리도는 공정의 작은 변화를 찾는 데 유용한 것으로 알려져 있다. 본 논문에서는 다양한 카즈분포족으로부터 생성된 계수자료에 대하여 3시그마 X-관리도와 지수가중이동평균관리도의 효율을 평균 런의 길이에 근거하여 비교한다. 즉, 자료가 어떤 분포로부터 생성되었는지 알 수 없을 때, X-관리도와 지수가중이동평균관리도를 비교하는 것이다.

연년 산림자원조사 자료를 이용한 임목축적 추정 (Estimation of Forest Growing Stock by Combining Annual Forest Inventory Data)

  • 임종수;정일빈;김종찬;김성호;류주형;신만용
    • 한국산림과학회지
    • /
    • 제101권2호
    • /
    • pp.213-219
    • /
    • 2012
  • 제5차 국가산림자원조사는 다양한 산림자원의 현황을 평가하고 시간경과에 따른 산림자원의 변화를 모니터링하기 위하여 연년조사체계로 개편되었다. 본 연구는 충청북도를 대상으로 연년조사체계에서 수집된 현지조사 표본점 자료를 이용하여 일정시점의 평균임목축적을 추정하기 위한 방법을 모색하기 위해 수행되었다. 연년통계량의 산출을 위하여 임상구분의 표본층을 고려하지 않은 단순임의추출법과 표본층을 고려한 사후층화이중추출법의 추정식을 이용한 추정치를 비교한 결과, 사후층화이중추출법에 의한 추정치의 정확도가 높은 것으로 나타났다. 최근 5년간 수집된 현지조사 자료를 통합하기 위하여 조사년도의 차이를 고려하지 않은 시차 무시법(Temporally Indifferent Method), 조사년도별 추정치를 산출한 후 통합하는 단순이동평균법, 그리고 연도별 표본개수에 의해 가중치를 부여하는 가중이동평균법에 의한 평균임목축적과 추정분산을 비교하였다. 평균임목축적은 시차 무시법과 가중이동평균법에서 동일한 것으로 나타났지만, 추정치의 정도를 나타내는 추정분산은 가중이동평균법을 이용한 것이 약간 향상되었으며, 결과적으로 연도별 변이를 반영할 수 있는 가중이동평균법이 보다 적합한 것으로 평가되었다.

로버스트 지수가중 이동평균(EWMA) 관리도 (A Robust EWMA Control Chart)

  • 남호수;이병근;주철민
    • Journal of the Korean Data and Information Science Society
    • /
    • 제10권1호
    • /
    • pp.233-241
    • /
    • 1999
  • 본 논문에서는 공정평균을 관리하기 위한 관리도로서 지수가중 이동평균(EWMA)관리도를 고려하였다. 기존의 표본평균에 기초한 관리도의 비로버스트성 (non-robustness)에 근거하여 공정평균의 로버스트 추정량인 M-추정량에 기초한 지수가중 이동평균 관리도를 제안하였다. 제안된 관리도의 성능을 기존의 관리도와 비교해 보기 위하여 다양한 상황에서 모의실험을 행하였으며, 실험결과 제안된 관리도의 우수성이 입증되었다.

  • PDF

K-평균 군집방법을 이요한 가중커널분류기 (Kernel Pattern Recognition using K-means Clustering Method)

  • 백장선;심정욱
    • 응용통계연구
    • /
    • 제13권2호
    • /
    • pp.447-455
    • /
    • 2000
  • 본 논문에서는 커널분류기에 요구되는 다량의 계산량과 자료저장공간을 감소시키도록 고안된 최적군집방법을 적용한 K-평균 가중커널분류기법이 제안되었다. 이 방법은 원래의 훈련표본보다 작은 수의 참고벡터들과 그들의 가중값을 들을 찾아 원래 커널분류 기준을 근사화하여 패턴을 인식하는 것이다. K-평균 가중커널분류기법은 가중파젠윈도우(WPW)분류기법을 개량한 것으로서 참고벡터들을 계산하기 위한 초기 부적절하게 군집된 관측값들을 최적으로 재군집화 함으로써 WPW기법의 단범을 극복하였다. 실제자료들에 제안된 방법을 적용한 결과 WPW분류기법보다 참고벡터들의 대표성과 자료축소면에서 월등히 향상된 결과를 확인하였다

  • PDF

패널회귀모형에서 회귀계수 추정량의 설계기반 성질 (Design-based Properties of Least Square Estimators in Panel Regression Model)

  • 김규성
    • 한국조사연구학회지:조사연구
    • /
    • 제12권3호
    • /
    • pp.49-62
    • /
    • 2011
  • 본 논문에서는 패널회귀모형에서 회귀계수 추정량으로 일반최소제곱추정량과 가중최소 제곱추정량의 설계기반 성질을 고찰한다. 회귀계수의 최소제곱추정량을 선형화하여 일반최소제곱추정량의 근사편향, 근사분산, 그리고 근사평균제곱오차의 수식과, 가중최소제곱추정량의 근사분산 수식을 유도한 후, 모의실험을 통하여 두 추정량의 근사분산 및 근사평균 제곱오차의 크기를 수치적으로 비교한다. 모의실험에서는 한국복지패널 3개년 데이터를 모집단으로 간주하고, 가구소득 변수를 관심변수로 하며 가구와 가구주 관련 7개 변수를 설명변수로 하는 유한모집단 회귀계수를 고려한다. 두 추정량의 설계기반 성질을 비교하기 위하여 표본수를 50에서 1,000까지 50 간격으로 설정하여 일반최소제곱추정량의 근사편향, 근사분산 그리고 가중최소제곱추정량의 근사분산을 계산한다. 모의실험을 통하여 다음과 같은 경향을 확인하였다. 첫째, 표본의 크기가 커지면 일반최소제곱추정량의 평균제곱오차가 가중최소제곱추정량의 분산보다 커진다. 둘째, 일반최소제곱추정량의 평균제곱오차를 가중최소제곱추정량의 분산으로 나눈비(ratio)는 설명변수에 따라 크기가 다르게 나타나고, 일반최소제곱추정량의 편향이 클수록 큰 값을 보인다. 셋째, 분산만 비교하면 일반최소제곱추정량의 분산이 가중최소제곱추정량의 분산보다 대부분의 경우에 더 작게 나타난다.

  • PDF

과학기술 콘텐츠 제공 웹 사이트의 고객만족도에 관한 연구 (A Study on Customer's Satisfaction of Web site providing Science & Technology Contents)

  • 김윤종;문영호
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2003년도 춘계종합학술대회논문집
    • /
    • pp.303-307
    • /
    • 2003
  • 기존의 고객만족지수 산출방법은 크게 나누어 단일문항평가방법, 복수문항산술평균방법, 항목별 가중평균방법 등이 있고, 항목별 가중평균방법에서 가중치의 산정방법에 따라 여러 가지의 모형이 있고, 이들에 대한 장단점이 있다. 본 논문에서 적용한 고객만족도 모형은 단일문항평가방법과 항목별 가중평균방법을 병용하였고, 지금까지의 연구와는 다르게 고객만족도점수 산정 방법에 역점을 두었다. 모집단에서 표본을 추출하여 여러 요소와 항목에 대한 질문을 통하여 얻은 결과를 지수화하는 작업으로 산출되는 고객만족도 지수를 접하는 사람들은 100점 만점의 점수라고 생각하여 판단하게 되고, 특히 설문지의 응답자가 생각하는 100점 만점의 점수와는 큰 괴리가 있다. 이와 같은 문제점을 해결하기 위하여 본 연구에서 고객만족도 점수 모형을 개발하고 과학기술 콘텐츠 제공 웹 사이트의 고객만족도 점수를 산출하였다.

  • PDF

지역교육청 수요자 만족도조사를 위한 표본설계에 관한 연구 (A sample survey design for service satisfaction evaluation of regional education offices)

  • 허순영;장덕준
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권4호
    • /
    • pp.669-679
    • /
    • 2010
  • 지역교육청 수요자 만족도조사를 위한 표본설계는 경상남도의 2009년 경남지역교육청 고객만족도 조사의 표본크기에 기초하여 시 군별 지역교육청평가에 맞추어 설계하였다. 대도시의 구단위 지역 교육청과 달리 지방의 시 군 교육청은 학생수와 학교수, 학급당 학생수 등의 변동이 크다. 시간 비용 등을 고려하여 전체 표본크기를 작게 하면서도 각 시 군 교육청 평가에 필요한 최소표본수를 확보하도록 설계하였다. 경상남도는 10개의 시지역과 10개의 군지역을 가지고 있고, 학생수가 상대적으로 작은 군지역교육청 평가에 필요한 최소표본수를 확보하기위해 지역별 평가에 필요한 최소표본을 우선배분한 후, 나머지는 지역별 학급수에 비례배분하였고, 표본학교는 지역과 학교설립유형별로 층화하여 학급수에 비례하여 추출하였다. 표본학교 내에서 조사대상 학생은 2단집락추출하였다. 지역별 추출율의 상이함을 보정하기 위해 가중치를 산정하였다. 조사자료의 분석은 가중치를 적용하여 가중평균, 가중총합 등을 이용하며, 분산의 추정은 통계소프트웨어에서 제공하는 균형반복복제, 잭나이프, 선형화방법 등을 사용할 수 있다.

임의중단모형에서 신뢰도의 비모수적 통합형 추정량

  • 이재만;차영준;장덕준
    • Communications for Statistical Applications and Methods
    • /
    • 제5권3호
    • /
    • pp.685-694
    • /
    • 1998
  • 임상실험이나 신뢰성공학 분야에서 임의 중단자료를 이용한 비모수적 신뢰도 추정량으로 Kaplan-Meier 추정량과 Nelson형 추정량이 많이 사용되고 있다. 그러나 Nelson형 추정량은 평균제곱오차의 관점에서 Kaplan-Meier 추정량보다 추정능력이 우수한 반면 편의는 신뢰도가 감소함에 따라 양의 방향으로 점증하는 소표본 특성을 갖는다. Nelson형 추정량의 이러한 특성 때문에 신뢰도의 함수로 표현되는 잔여수명 분위수함수 등의 추정시에는 평균제곱오차의 관점에서 Kaplan-Meier 추정량보다 추정능력이 떨어짐을 볼 수 있다. 이러한 점을 고려하여 이 두 추정량을 가중평균으로 통합한 새로운 비모수적 신뢰도 추정량을 제안하고 추정량의 특성을 비교 분석하였다.

  • PDF