• 제목/요약/키워드: 확률표본

검색결과 469건 처리시간 0.032초

조건부확률 개념의 교수학적 분석과 이해 분석 (A Didactic Analysis of Conditional Probability)

  • 이정연;우정호
    • 대한수학교육학회지:수학교육학연구
    • /
    • 제19권2호
    • /
    • pp.233-256
    • /
    • 2009
  • 이 연구는 조건부확률 개념에 대한 교수학적 분석을 시도하고, 학생들의 조건부확률 개념의 이해에 관하여 분석하였다. 수학적, 역사 발생적, 심리학적, 인식론적 관점의 분석을 통하여, 조건사건을 표본공간으로 하는 확률이라는 대상 개념, 사전확률이 사후확률로 변화하는 확률 수정의 과정 개념, 조건사건의 확인, 사건의 시간 순서와 조건관계의 구분, 인과관계와 조건관계의 구분, 가추적 사고의 이해가 조건부확률 이해의 핵심적인 요소임을 확인하였다. 또한, 고등학생과 대학생의 지필 검사와 면담을 통하여 학생들의 이해와 오개념에 대해 분식하였다. 이를 토대로 교육과정에의 시사점을 도출하였다.

  • PDF

확률강우량 산정을 위한 대규모 기후 앙상블 모의자료의 적용 (Application of a large-scale climate ensemble simulation database for estimating the extreme rainfall)

  • 김영규;손민우
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.333-333
    • /
    • 2022
  • 본 연구는 저빈도·고강도의 확률강우량 산정을 위해, 대규모 기후 앙상블 모의실험 기반으로 생성된 d4PDF(Data for Policy Decision Making for Future Change)를 적용하는 것을 목적으로 수행되었다. 또한, d4PDF 를 이용하여 산정된 확률강우량과 관측자료 및 빈도해석을 통해서 산정된 확률강우량을 비교함으로써 빈도해석의 적용에 따라 발생하는 불확실성을 분석하였다. 이와 같은 연구는 용담댐에 위치한 금산, 임실, 전주, 장수 관측소를 대상으로 수행되었다. d4PDF 자료는 총 50 개의 앙상블로 구성되어 있으며, 하나의 앙상블은 60 년 동안의 기상자료를 제공하기 때문에 한 지점에서 3,000 개의 연 최대 일 강우량을 수집 및 활용하는 것이 가능했다. 이와 같은 d4PDF 의 특징을 토대로 본 연구는 빈도해석 방법을 적용하지 않고, 3000 개의 연 최대 일 강수량을 비모수적 접근법(Non-parametric approach)에 따라 규모별로 나열하여, 10 년부터 1000 년의 재현기간을 갖는 확률강우량을 산정했다. 그 후, 관측 자료와 Gumbel 및 GEV(General extreme value) 분포를 토대로 산정된 확률강우량과의 편차를 산정하였다. 그 결과, 재현기간과 관측 기간의 차이가 증가할수록 이 편차가 증가하였으며, 이 결과는 짧은 관측 기간과 빈도해석의 적용은 재현기간이 증가할수록 신뢰하기 어려운 확률강우량을 제시한다는 것을 의미한다. 반면에, d4PDF 는 대규모 표본을 이용함으로써 이와 같은 불확실성을 최소화시켜 합리적인 저빈도·고강도의 확률강우량을 제시하였다.

  • PDF

이변량 Laplace 분포와 응용

  • 홍성식;홍종선
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2003년도 춘계 학술발표회 논문집
    • /
    • pp.127-130
    • /
    • 2003
  • 주변분포가 Laplace 분포인 세 가지 형태의 이변량 Laplace 분포를 연구한다. 각각의 이변량 Laplace 분포의 확률밀도함수와 누적분포함수를 유도하고, 분포의 그래프를 그려봄으로써 분포의 형태를 알아본다. 조건부 적률을 정리하여 조건부 첨도와 조건부 왜도를 구하고 분포의 성질을 파악한다. 상관계수를 구하여 다른 이변량 분포의 상관계수와 비교해 보았다. 그리고 정의된 분포함수를 응용하여 이변량 Laplace 분포를 따르는 난수벡터를 발생하는 알고리즘을 제안하였으며, 생성된 난수벡터의 표본으로부터 구한 표본평균과 중앙값의 분산-공분산 행렬식을 구하고 이변량 정규분포에 대응하는 행렬식과 비교 토론하였다.

  • PDF

중도절단된 생존함수의 신뢰구간 비교연구

  • 이경화;이재원
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2005년도 춘계 학술발표회 논문집
    • /
    • pp.251-255
    • /
    • 2005
  • 중도절단된 자료와 표본수가 적은 자료를 가지는 생존분석에서 생존율을 추정하거나 두 집단의 생존율을 비교할 때 정규분포 근사를 가정한 신뢰구간을 이용하는 데는 많은 어려움이 생긴다. 생존함수의 신뢰구간에 대한 중도절단을, 표본의 크기에 따른 다양한 상황의 모의실험을 통하여 Kaplan-Meier, Nelson, 적률 추정량 그리고 cox model의 ${\beta}$을 가지고 붓스트랩을 이용한 신뢰구간과 비모수 신뢰구간, 우도비 신뢰구간의 실제 포함 확률을 비교해보고자 한다.

  • PDF

층화모집단 평균에 대한 붓스트랩 추론 (On Statistical Inference of Stratified Population Mean with Bootstrap)

  • 허태영;이두리;조중재
    • Communications for Statistical Applications and Methods
    • /
    • 제19권3호
    • /
    • pp.405-414
    • /
    • 2012
  • 층화확률추출은 모집단을 어떤 층화기준에 의해 여러 층으로 분할한 다음 각 층으로부터 독립적으로 표본을 임의추출하는 방법으로 여러 가지 장점을 가지고 있어 실제 조사에서 많이 활용되고 있다. 본 연구에서는 대규모 표본조사에서 많이 사용하고 있는 층화확률추출을 사용하여 추출된 표본을 통해 모평균에 대한 붓스트랩 추정량과 신뢰구간 및 가설검정 등 통계적 추론에 대하여 연구하였다. 층화모집단에서의 모평균의 추정량과 관련된 극한 분포이론들을 기초로 붓스트랩 일치성을 근거로 층화 모평균에 대해 표준 붓스트랩 방법, 백분위수 붓스트랩 방법, 스튜던트화 붓스트랩 방법을 활용한 신뢰구간과 붓스트랩 가설검정 방법을 제안하였으며, 모의실험을 통해 신뢰구간 추정 방법들의 유효성을 확인하였다.

무시할 수 없는 무응답을 가지고 있는 교체표본조사에서의 무응답 대체와 교체그룹 편향 추정 (Nonignorable Nonresponse Imputation and Rotation Group Bias Estimation on the Rotation Sample Survey)

  • 최보승;김대영;김기환;박유성
    • 응용통계연구
    • /
    • 제21권3호
    • /
    • pp.361-375
    • /
    • 2008
  • 본 논문에서는 패널의 일부를 규칙적으로 교체하는 4-8-4 교체표본설계에서 발생할 수 있는 항목 무응답을 대체하는 방법에 대하여 연구하였다. 특히 소득이나 취업과 같이 민감한 질문에 대하여 발생할 수 있는 무응답에 대하여 무시할 수 없는 무응답(nonignorable nonresponse) 체계하에서 발생하는 무응답을 가정하였다. 무응답들의 대체방법으로 모형에 기반한 대체방법을 고려하였으며 베이지안 방법을 이용하여 사후확률밀도함수를 최대화하는 최대사후우도추정량(maximum posterior likelihood estimator)을 구하였다. 그리고 대체된 자료를 이용하여 면접시점이 달라질 때 발생하는 편향을 추정하였으며 추정된 편향을 제거한 후 연속적인 두 조사기간에서의 각 칸의 확률과 고정된 시점에서의 주변확률을 계산하였다. 모의실험을 통해 최종적으로 도출된 결과를 평균제곱오차와 편향의 관점에서 비교하였다.

불확실성을 갖는 작업 할당 문제를 위한 표본 평균 근사법 (Sample Average Approximation Method for Task Assignment with Uncertainty)

  • 김광
    • 한국산업정보학회논문지
    • /
    • 제28권1호
    • /
    • pp.27-34
    • /
    • 2023
  • 최상의 에이전트-작업 할당을 결정하는 문제는 조합 최적화(combinatorial optimization)의 대표적인 문제이자 NP-난해(NP-hard)임이 알려져 있다. 본 연구에서는 에이전트와 작업의 할당 시 결정되는 작업 수행 확률(completion probability)이 불확실한 상황에서의 문제를 다룬다. 에이전트나 작업 내부의 요인 혹은 시스템 외적인 요소로 인한 작업 수행 확률은 고정적이기보다 불확실성을 갖는 것이 일반적이다. 불확실성을 고려하지 않은 할당 결정은 변동성이 있는 현실 상황에서 효과적이지 않은 결정이 될 수 있다. 작업 수행 확률의 불확실성을 수학적으로 반영하기 위해 본 연 구에서는 추계적 계획법(stochastic programming)을 활용한 수리 모형을 제시한다. 본 연구에서는 효율적으로 문제를 풀기 위해 표본 평균 근사법(sample average approximation)을 활용한 알고리즘을 제안한다. 본 문제 해결 방법론을 이용해 효과적인 할당 결정과 상한값과 하한값을 구할 수 있고, 결과의 성능을 확인하기 위해 최적 격차(optimality gap)와 분산을 실험을 통해 제시한다. 이를 통해 알고리즘으로 구한 할당 결정의 우수성 및 강건성을 보인다.

우리나라 초등학교 수학에서 가능성 지도에 대한 고찰과 개선 방안 탐색 (A study on the mathematics curriculum for elementary school in Korea to improve teaching of chance)

  • 고은성;탁병주
    • 한국수학교육학회지시리즈A:수학교육
    • /
    • 제61권1호
    • /
    • pp.29-45
    • /
    • 2022
  • 본 연구는 우리나라 초등학교 수학과 교육과정에서 가능성 지도가 우연(chance)과 무작위성(randomness)의 개념과 관련하여 어떻게 이루어지고 있는지 비판적으로 고찰하여 문제점을 분석하고자 한다. 이를 위해 먼저 우연과 무작위성 개념에 대해 살펴보고, 이를 바탕으로 우리나라 초등학교 수학에서 가능성 지도의 문제점을 제시하였다. 우리나라 초등학교 수학과 교육과정에서는 자료에 기반을 둔 추론의 경험이 결여되어 있었으며, 무작위성 지도가 적절히 이루어지지 않고 있었다. 또한 표본공간의 지도가 누락되면서 모순적인 소재가 활용되고 있었다. 마지막으로 가능성에 대한 지도가 특정 학년에 편중되어 지도되고 있음을 지적하였다. 확률 지도의 개선을 위해 크게 확률 실험의 지도와 표본공간의 지도를 제안하며, 또한 특정 학년에 편중된 구성을 위해 자료 영역의 내용을 조절할 것을 제안한다.

대학졸업자의 전공계열별 직업노동시장 성과: 이공계 위기의 노동시장 원인론을 중심으로 (Occupational Labor Market Activities by College Majors: On the Crisis of Science and Engineering Majors)

  • 김창환;김형석
    • 한국인구학
    • /
    • 제29권3호
    • /
    • pp.1-27
    • /
    • 2006
  • 본 연구는 이공계 전공자들의 노동시장 성과, 특히 사회적 위신이 타 전공자들에 비해 낮다는 논의에 대한 경험적 검증이다. 대학졸업자의 전공계열에 따라 고용 확률, 고위직, '좋은 직업' 획득 확률에 차이가 있는지를 2000년 인구주택총조사의 2% 표본을 이용하여 분석하였다. 표본 선택편향을 수정한 2단계 프로빗 모형 분석 결과, 이학계와 공학계열 전공자가 인문사회계열 전공자에 비해 고용, 고위직, '좋은 직업' 획득 확률이 유의하게 낮다는 증거는 발견되지 않았다. 하지만 공학계 전공자의 경우 노동생애 초기에는 인문사회계 전공자에 비해 유의하게 높은 '좋은 직업' 획득 확률을 가지지만 연령 증가와 더불어 이러한 이점이 빠르게 사라져 40대 이후로는 인문사회계보다 '좋은 직업' 획득 확률이 낮다. 이는 공학계에서는 현장 경험에 의한 인적 자본의 축적률이 낮고, 대학에서 습득한 기술이 급격히 노화되기 때문일 가능성을 시사한다.

대표성을 위한 R-indicator의 사용과 추정법 연구 (Usage and Estimation of R-indicator for Representative)

  • 박현아;이기재
    • 응용통계연구
    • /
    • 제28권3호
    • /
    • pp.417-427
    • /
    • 2015
  • 표본의 대표성을 측정하기 위한 척도로 응답률이 사용된다. 즉 높은 응답률일수록 표본의 대표성을 더 잘 나타낸다고 할 수 있다. 그러나 높은 응답률이라 할지라도 무응답이 존재하는 것이므로 표본의 대표성을 설명하기에는 한계가 있는 경우가 발생한다. 그래서 Schouten 등 (2009)에서는 R-indicator라는 새로운 척도를 제시하여 표본의 대표성을 더 설명할 수 있게 하였다. 본 논문에서는 R-indicator도 표본에 의해 추정되어야 한다는 것에 착안하여 그것에 관한 새로운 추정량을 제시한다. 또한 여러 모의실험하에 R-indicator의 대표성으로써의 설명력과 제안된 추정량의 편향과 효율을 기존의 추정량과 비교분석하며 실제자료에도 제안한 추정량을 적용하여 표본의 대표성을 설명한다.