• 제목/요약/키워드: 표본 포함확률

검색결과 58건 처리시간 0.025초

유한모집단에서 가중평균에 포함된 가중치의 효과 (Weighting Effect on the Weighted Mean in Finite Population)

  • 김규성
    • 한국조사연구학회지:조사연구
    • /
    • 제7권2호
    • /
    • pp.53-69
    • /
    • 2006
  • 표본조사에서 가중치는 설계 단계와 분석 단계에서 만들어지고 부여될 수 있다. 설계 단계의 가중치는 추출확률이나 응답률 등과 같은 표본 데이터 획득 지표에 관련되어 있고 분석 단계의 가중치는 모집단 수치나 다른 보조 변수정보 등과 같은 외적인 정보와 관련되어 있다. 그리고 최종가중치는 설계 단계의 가중치와 분석 단계의 가중치의 곱으로 만들어진다. 이 논문에서는 분석 단계에서 부여되는 가중치에 초점을 맞추어 가중평균으로 모평균을 추정할 때 가중평균에 포함된 가중치가 모평균 추론에 미치는 영향을 고찰하였다. 유한모집단에서 각 조사단위에 조사변수와 가중치가 쌍으로 있고 표본추출확률이 균등한 경우를 가정하였다. 이러한 조건에서 가중평균의 편향과 평균제곱오차를 구하여 가중평균은 모평균의 편향 추정량임을 보였고, 편향의 방향과 크기는 조사변수와 가중치의 상관관계로 설명할 수 있음을 보였다. 즉, 만일 가중치와 조사변수가 양의 상관관계가 있으면 가중평균은 모평균을 과대 추정하게 되고, 만일 음의 상관관계가 있으면 모평균을 과소 추정하게 된다. 그리고 두 변수의 상관계수가 크면 편향은 증가한다. 가중평균에 대한 이론적인 수식 유도와 함께 편향의 크기와 평균제곱오차의 크기를 수치적으로 검토하기 위하여 모의실험을 실시하였다. 모의실험에서는 상관계수가 -0.2과 0.6사이에 있는 9개의 가중치를 생성하였고, 표본수는 100부터 400까지 고려하여 편향의 크기와 평균제곱오차의 크기를 수치적으로 구하였다. 하나의 결과로써 상관계수가 0.55이고 표본수가 400인 경우에 가중평균의 편향의 제곱이 평균제곱오차에서 차지하는 비율은 무려 82%에 이르는 것으로 나타났는데, 이는 가중평균의 편향이 어떤 경우에는 매우 심각할 수도 있음을 보여주는 것이다.

  • PDF

GLO분포를 대상으로 왜곡도 계수를 고려한 확률도시 상관계수 검정통계량 추정 (A Study on Estimation of Probability Plot Correlation Coefficient Considering the Skewness for GLO distribution)

  • 안현준;신홍준;김수영;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2015년도 학술발표회
    • /
    • pp.39-39
    • /
    • 2015
  • 극치 수문(Hydrologic extremes)분야에서는 수문자료의 분포에 따라 Gumbel, GEV, 그리고 GLO 분포와 같은 다양한 확률통계 분포형이 존재한다. GEV와 GLO 분포형의 경우 Gumbel 분포형과 달리 형상매개변수가 포함된 3변수 분포형으로써 이상 기후 현상으로 인한 잦은 극치 수문사상을 표현하는데 좀 더 유연한 것으로 알려져 있다. 특히 GLO 분포형의 경우 영국에서 홍수빈도해석 시 적정분포형으로 선정된바 있다(Institute of Hydrology, 1999). 다양한 분포형 중에서 표본 자료를 대표할 수 있는 분포형을 선정하는 통계적 기법이 적합도 검정이다. 적합도 검정에는 $x^2$-검정, Cramer von-Mises 검정, Kolmogorov-Smirnov 검정, PPCC(probability plot correlation coefficient, 확률도시 상관계수)검정 등이 있으며 그 중 PPCC 검정은 이용방법이 간편하면서도 뛰어난 기각능력을 보이는 것으로 알려져 있다. 본 연구에서는 극치 수문분야에서 널리 이용되고 있는 GLO 분포형을 대상으로 자료의 왜곡도 영향을 고려할 수 있는 확률도시 상관계수 검정의 검정통계량을 추정하여 보았다.

  • PDF

이중 추출 자료를 이용한 측정오차분산의 추정 (Measurement Error Variance Estimation Based on Subsample Re-measurements)

  • 허순영
    • 한국조사연구학회:학술대회논문집
    • /
    • 한국조사연구학회 2003년도 춘계학술발표대회
    • /
    • pp.34-41
    • /
    • 2003
  • 많은 경우, 측정오차분산은 알려지지 않은 참값 또는 참값과 연관된 공변수들의 함수로 표현될 수 있다 이 논문은 단위 당 반복측정에 기초한 단위 내 표본분산을 이용한 선형측정오차분산의 추정에 관한 연구이다 이 논문은 다음의 내용을 포함한다: (1) 측정오차의 크기를 나타내는 상수 $\delta$의 추정; (2) 유한모집단으로부터의 복합표본, 작은 측정오차라는 조건하에 선형측정오차분산의 추정; (3) 부표본에 포함될 확률을 설명하기 위한 성향틴헝 추정 미국의 제3차 건강영양조사자료를 사용하여 이상의 결과들을 이용한 경험적 분석을 실행하였다.

  • PDF

정준대응분석에서 붓스트랩 방법 활용 (Applications of Bootstrap Methods for Canonical Correspondence Analysis)

  • 고현석;전명식;정형철
    • 응용통계연구
    • /
    • 제28권3호
    • /
    • pp.485-494
    • /
    • 2015
  • 정준대응분석은 생태학에서 장소, 종 그리고 환경변수의 관계를 시각적으로 보기 위해 가장 많이 사용되는 서열화 방법 중의 하나이다. 그런데 이 방법은 표본이 바뀔 때마다 분석결과가 달라지기 때문에 종 간의 생태학적 유사성에 대한 일관된 해석을 어렵게 한다. 본 연구에서는 이러한 문제점을 해결하기 위해 정준대응분석에 붓스트랩 방법을 활용하였다. 이를 통해 전체 관찰 자료수에 반비례하여 좌표점의 변이가 나타나고, 붓스트랩 신뢰구간을 사용한 포함확률이 명목확률에 근사함을 확인하였다.

적응 기각 추출을 기반으로 하는 난수 생성기의 성능 비교 (Performance comparison of random number generators based on Adaptive Rejection Sampling)

  • 김효태;조성일;최태련
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권3호
    • /
    • pp.593-610
    • /
    • 2015
  • 적응 기각 추출 (adaptive rejection sampling)방법은 특정한 형태의 확률분포로 부터 확률표본을 추출하기 위한 대표적인 난수생성기 (random number generator)로서, 추출된 표본으로부터 제안분포 (proposal distribution)가 개선이 되는 장점을 가지고 있다. 그러나, 기존에 제안된 적응기각추출 방법은 확률분포의 형태가 로그-오목 함수 (log-concave function)인 경우에만 사용이 가능하기 때문에 적용범위가 제한적이다. 최근의 연구결과에서는, 이러한 단점을 보완하기 위해 다양한 형태의 적응기각추출이 진행되고 있으며, 이에 본 논문에서는 기존의 적응기각추출 방법을 포함한 총 5가지의 난수 생성 방법에 대해서 고찰하고, 아울러 모의실험을 통해 각 방법들간의 성능에 대하여, 적합성과 효율성의 관점에서 실증적으로 비교 분석하도록 한다.

층화 및 층화 이표본 조건부 무관질문모형 (A Stratified and Two Sample Stratified Conditional Unrelated Question Model)

  • 이기성
    • Journal of the Korean Data Analysis Society
    • /
    • 제20권6호
    • /
    • pp.2883-2893
    • /
    • 2018
  • 본 논문에서는 모집단이 층으로 구성되어 있고 얻고자 하는 속성이 민감할 때, 덜 민감한 속성 B와 강요응답으로 구성되어 있는 확률장치를 통해 "예"라고 응답한 사람들에게만 민감한 속성 A 와 무관한 속성 Y를 포함하고 있는 Greenberg et al.(1969)의 무관질문모형을 사용하도록 하여 모집단이 층화된 경우 층화추정을 위한 층화 조건부 무관질문모형을 제안하였다. 그리고 제안한 층화 조건부 무관질문모형에서 각 층에 표본을 배분할 때 비례배분과 최적배분 문제를 다루었다. 또한 층화 조건부 무관질문모형을 무관한 속성이 미지인 경우 두 개의 독립표본을 이용하는 층화 이표본 조건부 무관질문모형으로 확장하였으며, 제안한 층화 이표본 조건부 무관질문모형의 두 번째 단계에서 사용되는 h층의 표본의 크기에 대한 최적값을 도출하여 최소분산을 구하였다. 마지막으로 층화 조건부 무관질문모형이 층화 무관질문모형과 층화 Carr et al.(1982)의 모형보다 효율적이 되는 조건을 제시하여 일정한 조건하에서 제안한 모형이 기존 모형들보다 효율적임을 보였으며, 제안한 층화 조건부 무관질문모형이 ${\pi}_{h2}$ 값이 작고 ${\pi}_{hy}$ 값이 작을수록 층화 Carr et al.(1982)의 모형보다 효율적임을 수치적으로 보였다.

Bayesian Analysis for Burr-Type XStrength-Stress Model

  • Kang, Sang-gil;Ko, Jeong-Hwan;Lee, Woo-Dong
    • 한국산업정보학회논문지
    • /
    • 제4권4호
    • /
    • pp.47-52
    • /
    • 1999
  • 본 논문에서는 Burr Type-X 분포하에서 stress-strength 의 신뢰도를 추정하는 데 사용되어지는 비정보적 사전분포들을 개발하는 것이다. 개발된 reference 사전분포가 first order matching 사전분포가 된다는 것이 밝혀졌으며, 또한 matching 사전분포하에서 사후분포의 타당성을 밝혔다. 소표본하에서, 고전적 포함확률들이 주여져 있다.

  • PDF

거시경제 및 통화정책 기조 변화가 통화정책의 유효성에 미친 영향 분석 (Effectiveness of Monetary Policy in Korea Due to Time Varying Monetary Policy Stance)

  • 김태봉
    • KDI Journal of Economic Policy
    • /
    • 제36권3호
    • /
    • pp.1-23
    • /
    • 2014
  • 본고는 4개의 거시변수들을 포함한 Time Varying VAR 모형을 통해 한국의 통화정책 변화를 평가하였다. 첫째, 외환위기나 금융위기 때와 같이 통화정책이 환율변동에 대해 민감하게 변화하는 시기가 존재하므로 위기를 포함한 긴 표본 안에서 한국의 통화정책을 평가할 때는 환율을 모형안에 포함시키는 것이 필요하다. 둘째, 표본기간 내에서 이례적인 큰 변동성이 때때로 나타나는 한국 거시변수들을 설명하기 위해서는 stochastic volatilities를 TVP-VAR 모형 내에서 설정할 필요가 있다. 한편, 2000년대 거시변수들의 안정화는 stochastic volatilities의 감소에 의해 설명되며, 부분적으로는 거시경제의 구조를 반영하는 충격반응함수에 의해서도 설명된다. 셋째, 통화정책의 인플레이션에 대한 유효성의 크기는 예전에 비해 최근 약화된 편이나 유효성의 지속성은 비교적 높아진 것으로 나타났다. 마지막으로 인플레이션 안정화에 대한 통화정책의 기조는 물가안정목표제가 도입되기 전에 비해 그 후에 적극적인 방향으로 개선되어 왔음을 보이고 있다. 하지만 우리나라의 통화정책은 그 기조가 경기변동에 비해 인플레이션 안정화에 대하여 여전히 덜 적극적인 것을 감안할 때 개선될 여지가 있는 것으로 판단된다.

  • PDF

기업연구개발활동통계 개선방안에 관한 연구

  • 조성표;박선영;한기인;노민선;배한수;김현아
    • 기술경영경제학회:학술대회논문집
    • /
    • 기술경영경제학회 2009년도 동계학술발표회
    • /
    • pp.313-332
    • /
    • 2009
  • 본 연구에서는 국가의 연구개발활동조사에서 기업연구개발활동 통계에 대한 효과적인 산출방법을 제시하고자 하였다. 이를 위하여 국내 외 연구개발 통계방법을 조사한 후 이를 토대로 우리나라에서 기업연구개발활동에 대한 자료의 수집 및 분석에 대한 개선방안을 제시하였다. 대부분의 국가에서는 대기업은 전수조사, 소규모 기업은 표본조사를 수행하고 있으나, 우리나라에서는 연구소 등록법인에 대하여 전수조사를 행하고 있다. 전수조사는 비용이 많이 들고 비 표본오차로 인하여 모집단에 대한 체계적인 추정이 불가능하다는 문제점이 있다. 현재 산업기술진흥협회에 등록된 연구기관의 수가 20,000개를 넘어서고 있어 전수조사는 한계에 다다른 것으로 생각되어 표본조사 도입에 대한 타당성과 방법론을 중점적으로 검토하였다. 먼저, 표본조사의 타당성을 평가하기 위하여 현재 전수조사를 통해 수집된 자료를 이용하여 표본조사를 수행한 결과를 비교 분석하였다. 산업별(24개), 그룹별(8개)로 구분하여 216개 셀별로 모집단수/표본수를 곱하여 산정 (셀별추정법)한 결과, 전수 통계치와 거의 동일하게 나타났다. 따라서, 산업별, 그룹별로 세분하여 모집단수/표본수를 곱하여 추정하는 셀별추정법이 타당한 것으로 평가할 수 있다. 이상의 분석결과를 토대로 새로운 조사설계방안을 제시하면 다음과 같다. 직전연도 조사기업은 직전연도 연구개발비 수준과 기업종류(대기업, 벤처기업, 중소기업), 그리고 산업에 따라 셀을 분할한다. 대기업, 연구개발비 수준이 높은 기업 등 주요한 셀에 대하여는 전수조사를 실시한다. 나머지 셀에 대하여는 각 셀별 연구개발지출의 분포가 동질적이기 때문에 표본 추출방법은 단순임의추출법(SRS)을 사용한다. 다만 전년도 미계상된(또는 미포함된) 기업에 대하여는 신규 대형 연구소 진입 등을 고려하여 규모비례확률추출법(PPS)을 고려하는 것이 바람직할 것으로 판단된다. 일부 기업들이 특정 항목에 대한 자료를 제공하지 않는 항목무응답의 경우, 누락된 자료에 대하여는 대체기법(Imputation Algorithm)에 따라 이를 추정한다. 이러한 표본조사방법은 전수조사에서 발생하는 비 표본오차를 해소하고, 자료수집비용 및 소규모기업의 행정적 부담을 경감할 수 있다는 장점이 있다. 향후 연구에서는 좀 더 구체적인 조사방법론을 강구할 필요가 있으며, 이와 함께, 연구개발에 대한 다양한 측면의 정보를 수집하기 위해 새로운 설문지를 개발할 필요성이 있다.

  • PDF

국가산림자원조사 자료를 이용한 소나무의 진계생장 추정식 개발 (Development of Ingrowth Estimation Equations for Pinus densiflora in Korea Derived from National Forest Inventory Data)

  • 문가현;임종수;신만용
    • 한국산림과학회지
    • /
    • 제107권4호
    • /
    • pp.402-411
    • /
    • 2018
  • 본 연구는 국가산림자원조사(NFI) 고정표본점 자료를 기반으로 우리나라에 분포하는 강원지방소나무와 중부지방소나무의 진계생장 추정식을 개발하기 위한 목적으로 수행되었다. 이를 위해 5년 동안의 진계생장량을 파악할 수 있는 정보를 제공하는 제5차 및 제6차 NFI의 동일 표본점 자료를 활용하였다. 진계생장 추정식 개발을 위한 2단계 접근법에 따라 첫 번째 단계에서는 진계생장 발생확률을 추정하기 위해 로지스틱 회귀모형을 이용하여 분석을 수행하였으며, 두 번째 단계에서는 진계생장이 발생한 표본점만을 대상으로 회귀식을 이용하여 진계생장량을 추정하였다. 또한 최적 모형의 선정은 회귀계수가 추정된 후보모형에 대해 모형의 평균편의(MD), 모형의 정도(SDD), 그리고 모형의 표준오차(SED)의 3가지 평가통계량을 분석한 결과에 근거하여 도출하였다. 그 결과 진계확률 추정식은 진계가 발생하지 않은 표본점 수에 기반한 로지스틱 회귀모형(모형 VI)이 선정되었고, 진계생장량 추정식에는 수종구성(SC) 변수를 포함한 지수함수식(모형 VII)이 최적모형으로 분석되었다. 이상과 같이 개발된 진계생장 추정식은 다양한 임분조건에 대해 추정능력을 평가하였으며, 적합도나 활용적인 측면에서 문제가 없는 것으로 평가되었다.