• 제목/요약/키워드: 확률표본

검색결과 469건 처리시간 0.025초

POT 방법을 이용한 이변량 빈도해석 적정 표본크기 연구 (Study on Optimal Sample Size for Bivariate Frequency Anlaysis using POT)

  • 주경원;김한빈;남우성;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2015년도 학술발표회
    • /
    • pp.38-38
    • /
    • 2015
  • 최근 다변량 확률모형을 이용한 빈도해석이 여러 수문분야에 걸쳐 연구되고 있다. 기존 일변량 빈도해석에 비해 변수활용에 대한 자유도와 물리적 현상을 정확하게 표현할 수 있다는 장점이 있으나, 표본자료의 부족, 매개변수 추정 및 적합도 검정 등의 어려움으로 실제 분야에 사용되기 어려운 점이 있다. 본 연구에서는 copula 모형에 대하여 Cramer-von Mises(CVM) 적합도 검정 시 표본자료의 적정 크기를 결정하기 위하여 Peaks-Over-Threshold(POT) 방법을 이용하였다. 서울지점의 기상청 시강우 자료를 이용하여 빈도해석을 수행하였으며, Gumbel copula 모형에 대하여 매개변수 추정은 maximum pseudolikelihood method(MPL) 방법을 이용하였다. 50년의 기록 자료에 대하여 표본크기를 50개부터 2500개까지 조절하여 CVM 통계값과 p-value를 기준으로 적정 표본크기를 산정하였다.

  • PDF

층화 다지 확률화응답모형 (A Stratified Multi-proportions Randomized Response Model)

  • 이기성;박경순
    • 응용통계연구
    • /
    • 제28권6호
    • /
    • pp.1113-1120
    • /
    • 2015
  • 본 논문에서는 사회적으로나 개인적으로 매우 민감한 조사에서 세대별, 연령별 또는 계층별에 따라 조사하고자 하는 모집단이 여러 개의 층으로 구성되어 있고, 각 층이 다지속성으로 되어 있는 경우에, Abul-Ela 등의 다지모형과 Eriksson의 다지무관모형에서 사용한 단순임의추출법 대신에 층화추출법을 적용하여 각 층의 다지속성에 대한 모비율의 추정뿐만 아니라 모집단 전체 모비율에 대한 추정을 할 수 있는 층화 다지 확률화응답모형을 제안하였다. 그리고 층화 다지모형에 있어서 각 층의 표본배분에 대하여 비례배분과 최적배분을 고려하여 다루었다. 또한 층화 다지 확률화응답모형들간의 효율성을 비교해 본 결과 Eriksson의 다지무관모형이 Abul-Ela 등의 다지모형보다 효율적임을 알 수 있었다.

인터넷을 활용한 표본조사 방법에 관한 사례연구 (Methodology for Internet Survey: Case Study)

  • 윤은성;김영원
    • 한국조사연구학회지:조사연구
    • /
    • 제3권1호
    • /
    • pp.25-51
    • /
    • 2002
  • 본 연구에서는 설문지 형태 등 다양한 요인들이 인터넷 조사의 응답률 및 신뢰성에 미치는 영향을 고찰하기 위해 숙명여자대학교 재학생960명을 표본으로 추출하여 전자우편조사를 실시하였다. 조사 결과 53.9%의 응답률을 얻었으며, 이를 통해 인터넷조사에서 단일스크린 형태와 다중스크린형태, 사전통보, 응답 재요청 등의 요인에 따른 응답률을 분석하였다. 또한 사례연구를 통해 비확률추출법인 자발적 참여에 의한 인터넷조사와 확률추출법인 전자우편조사 결과를 비교했을 경우 전자우편조사에서 보다 성실한 응답을 얻을 수 있다는 결론을 얻었다. 비록 제한적인 모집단을 연구대상으로 했지만 과학적인 확률추출을 적용한 신뢰성 있는 인터넷조사방법의 구현이 무엇보다 중요하고, 아울러 특정 집단을 모집단으로 하는 경우 확률추출에 의한 인터넷조사 방법의 구현이 현실적으로 가능하다는 사실을 확인할 수 있었다.

  • PDF

제한조건이 있는 선형회귀 모형에서의 베이지안 변수선택 (Bayesian Variable Selection in Linear Regression Models with Inequality Constraints on the Coefficients)

  • 오만숙
    • 응용통계연구
    • /
    • 제15권1호
    • /
    • pp.73-84
    • /
    • 2002
  • 계수에 대한 부등 제한조건이 있는 선형 회귀모형은 경제모형에서 가장 흔하게 다루어지는 것 중의 하나이다. 이는 특정 설명변수에 대한 계수의 부호를 음양 중 하나로 제한하거나 계수들에 대하여 순서적 관계를 주기 때문이다. 본 논문에서는 이러한 부등 제한이 있는 선형회귀 모형에서 유의한 설명변수의 선택을 해결하는 베이지안 기법을 고려한다. 베이지안 변수선택은 가능한 모든 모형의 사후확률 계산이 요구되는데 본 논문에서는 이러한 사후확률들을 동시에 계산하는 방법을 제시한다. 구체적으로 가장 일반적인 모형의 모수에 대한 사후표본을 깁스 표본기법을 적용시켜 얻은 후 이를 이용하여 모든 가능한 모형의 사후확률을 계산하고 실제적인 자료에 본 논문에서 제안된 방법을 적용시켜 본다.

국소 최적성과 순차 기준을 바탕으로 한 검파 기법: 2. 성능 분석 (Detection Schemes Based on Local Optimality and Sequential Criterion: 2. Performance Analysis)

  • 최상원;강현구;이주미;박소령;김선용;송익호
    • 한국통신학회논문지
    • /
    • 제30권10C호
    • /
    • pp.1027-1035
    • /
    • 2005
  • 이 논문에서는, 약한 신호를 검파하는 데에 알맞도록 1부에서 얻은 순차 검파 방식의 성능을 고정 표본 검파방식, 순차 확률비 검파 방식, 끝을 자른 순차 확률비 검파 방식의 성능과 견주어 본다. 제안한 순차 검파 방식은 순차 확률비 검파 방식과 견주어 볼 때, 얼개가 같거나 덜 복잡하고 신호를 더 빠르게 검파할 때가 많다. 아울러, 제안한 순차 검파 방식은 고정 표본 검파 방식과 끝을 자른 순차 확률비 검파 방식과 견주어 얼개가 덜 복잡하거나 같고 필요한 관측수가 늘 적다.

목표 범주가 희귀한 자료의 과대표본추출에 대한 연구 (A Study on the Adjustment of Posterior Probability for Oversampling when the Target is Rare)

  • 김은나;이성건;최종후
    • 응용통계연구
    • /
    • 제24권3호
    • /
    • pp.477-484
    • /
    • 2011
  • 반응/미반응 목표변수를 갖는 모집단에서 관심 목표범주의 빈도가 극히 작을 경우, 즉 희귀할(rare) 경우, 모형 구축을 위한 데이터마트를 형성할 때 반응/미반응 범주 구성비는 구축된 모형의 성능에 영향을 준다. 본 연구는 이러한 점에 착안하여 반응/미반응 범주 구성비와 모형성능의 관련성을 모형평가 통계량에 기반하여 판단한다. 이로써 데이터마트 형성에 이상적인 반응/미반응 범주 구성비를 탐지하려는데 본 연구의 목적을 두고 있다. 또한 일반적으로 목표범주의 빈도가 희귀할 경우, 분할 표본추출에 의하여 희귀사건(rare event)을 과대표본추출(oversampling)하는 것이 일반적이며, 이로부터 기인하는 사후확률에 대한 편향을 조정하게 된다. 본 연구에서는 사후확률 조정방법으로 오프셋(offset) 방법과 가중치 방법(sampling weights)을 적용하고 이를 비교하였다.

자본자산가격의 운동법칙을 표상하는 연속시간 확률매분방정식의 추정방법 - 비시뮬레이션 방법 -

  • 이일균
    • 재무관리논총
    • /
    • 제10권1호
    • /
    • pp.1-44
    • /
    • 2004
  • 연속시간모형은 시간의 흐름에 대응되는 자본자산의 운동의 성질과 시간의 흐름에 따라 형성되는 자본자산의 가격을 동시적으로 파악할 수 있는 것이 큰 장점이다. 연속시간 확률미분방정식을 구성하는 표류함수와 확산함수가 폐형해나 해석적 형태로 존재하지 않는 경우가 대부분이다. 여기에서 모수추정의 어려움이 발생한다. 전이 확률밀도함수의 인지 또는 발견의 어려움과 표류함수와 확산함수의 적분 불가능성은 최대가능도법의 사용을 어렵게 만든다. 여기에서 모수방법 보다는 비모수방법을 통하여 연속 확률 미분방정식을 추정하려는 성향이 존재한다. 밀도를 모르면 표본적률을 사용하여 모수를 추정할 수 있으므로 일반화 적률법이 연속시간 확률미분방정식의 모수 추정과 검정에 사용되고 있다. 전이밀도의 값을 시뮬레이션을 통하여 얻는 마코브연쇄 몬테카를로 방법, 전이밀도를 무한소 생성작용소를 통하여 얻는 방법, 비 모수방법, 여러 종류의 전개에 의하여 얻은 표류함수와 확산함수의 전이밀도에 대한 최대가능도법 등 여러 종류의 연속시간 확률미분방정식의 실증분석에서 사용되고 있다. 이 논문에서는 연속시간 확률미분방정식의 실증분석 방법들을 정리하는데 목적이 있다. 이일균(2004)은 이 논문과의 자매논문으로 시뮬레이션에 의한 확률미분방정식의 추정을 다루고 있어 시뮬레이션방법은 그 논문에 미룬다.

  • PDF

극한강우를 고려한 SIR알고리즘과 Bootstrap을 활용한 강우빈도해석 (Rainfall Frequency Analysis Using SIR Algorithm and Bootstrap Methods)

  • 문기호;경민수;김형수
    • 대한토목학회논문집
    • /
    • 제30권4B호
    • /
    • pp.367-377
    • /
    • 2010
  • 본 연구에서는 기상청 산한 56개 기상관측소의 연최대치계열 일 강우자료를 대상으로 Bootstrap기법과 SIR알고리즘을 이용하여 표본을 재추출한 후, 빈도해석을 적용하여 결과를 비교검토 하였다. SIR알고리즘은 기존에 발생되었던 극한 사상에 가중치를 두어 표본을 재추출하는 방법으로 과거에 발생한 극한사상이 기후변화에 의해서 더욱 빈발하게될 것 이라는 가정에 기초한다고 할 수 있다. 반면에 Bootstrap기법은 현재 발생한 사상에 동일한 가중치를 두어 표본을 재추출하는 방법이다. 따라서 두 방법의 차이를 계산하여 기후변화로 인한 극한강우의 빈도별 확률강우량의 변화를 산정할 수 있다. 비교결과 SIR알고리즘에 의하여 재추출된 강우를 이용하여 산정된 확률강우량의 경우, Bootstrap기법에 의해서 재추출된 강우를 이용하여 산정한 확률강우량에 비해 지점에 따라 작게는 -10%정도의 감소와 크게는 60%정도의 차이를 보임을 확인하였다.

몬테카를로 시뮬레이션의 난수 생성에 관한 교사들의 이해에 관한 연구 (Study on Teachers' Understanding on Generating Random Number in Monte Carlo Simulation)

  • 허남구;강향임
    • 대한수학교육학회지:학교수학
    • /
    • 제17권2호
    • /
    • pp.241-255
    • /
    • 2015
  • 본 연구는 35명의 예비교사와 현직교사를 대상으로 몬테카를로 시뮬레이션의 난수 생성 아이디어에 관한 이해를 분석하여 학교현장에 교육적 함의를 제공하는데 그 목적이 있다. 연구의 분석 결과, 실험 대상의 70%가 확률 문제 해결을 위해 제시된 세 가지 유형의 난수 생성 아이디어에서 적절한 아이디어를 선택하지 못했고, 자신의 선택을 설명하는 과정에서 오류를 나타냈다. 오류 유형으로는 첫째, 연속확률분포에서 한 점 또는 경계가 선택될 확률은 확률밀도함수에 대입한 값과 같다. 둘째, 교사B의 아이디어는 조건부확률로 문제를 변형하여 표본공간을 확장한 것임에도 처음 제시된 표본공간으로만 문제를 해석하려는 오류를 나타냈다. 셋째, 두 확률변수 X, Y가 독립일 때에만 $P(X=x,\;Y=y)=p(X=x){\times}P(Y=y{\mid}X=x)$이 성립한다는 오류를 나타냈다.