• 제목/요약/키워드: 통계추론

검색결과 358건 처리시간 0.025초

부등 제한 조건하에서의 베이지안 추론 (Bayesian Inference with Inequality Constraints)

  • 오만숙
    • 응용통계연구
    • /
    • 제27권6호
    • /
    • pp.909-922
    • /
    • 2014
  • 부등제한 조건 (>,<,=)과 관련된 베이지안 추론에서 다음의 세 가지 주제에 대하여 기존의 연구와 최근의 연구동향 그리고 추후 연구주제에 대하여 살펴보았다 : ⅰ) 모수에 대한 여러 부등제한 조건들의 비교, ⅱ) 모수에 부등제한 조건을 부여하는 것이 타당하다고 할 때 모수의 동등성에 관한 동시 다중 검정, ⅲ) 순서적 범주형 변수에 대한 분할표에서 스코어 모수에 순서적 부등제한 조건을 가정 할 때 스코어 모수의 동등성에 대한 다중 검정.

통계적 문제해결 과정에서 나타난 예비초등교사들의 통계적 추론 분석 : 질문 생성 단계를 중심으로 (Statistical Reasoning of Preservice Elementary School Teachers Engaged in Statistical Problem Solving: Focused on Question Posing Stage)

  • 이은정;박민선
    • 한국수학교육학회지시리즈C:초등수학교육
    • /
    • 제22권4호
    • /
    • pp.205-221
    • /
    • 2019
  • 이 연구는 통계적 문제해결 과정 중에 설문지 질문 생성 단계에서 나타나는 예비초등교사들의 통계적 추론을 조사하고 이것이 이후 단계들에서의 활동에 어떻게 영향을 미치는지를 분석하는 데 목적을 두었다. 이를 위해 24개 조의 교육대학교 2학년 학생들 80명이 통계적 문제해결 과정을 직접 실행하고 통계 보고서를 작성하였으며, 그 중 22개 조의 보고서를 분석하였다. 분석 결과, 설문지 질문 생성 단계에서 예비교사들의 9가지 통계적 추론이 확인되었으며, 특히 그 중 질문 명확화 지향 추론과 변이 기반 추론은 기존 연구에서 보고되지 않았던 추론이었다. 또한, 설문지 질문 생성 단계에서의 통계적 추론이 이후 단계의 활동에 미친 영향을 알아보기 위해 자료 분석 및 결론 단계에서 예비교사들이 보고서에 기술하였던 어려움 및 이슈를 확인하였다. 그 결과, 예비교사들의 어려움이 설문지 질문 생성 과정에서의 모집단 관련 추론, 범주 수준 추론, 표준화 추론, 질문의 일관성 지향 추론, 질문 명확화 지향 추론과 관련이 있는 것으로 나타났다. 그동안 선행연구에서 질문 생성하기 단계에 크게 주목하지 않았다는 점에 비추어보면, 본 연구 결과는 질문 생성 단계에서 나타나는 다양한 통계적 추론에 좀 더 주목할 필요가 있다는 점과 질문 생성 단계에서 적절한 통계적 추론이 이루어지도록 하기 위한 교수 방안들을 논의할 필요가 있다는 점을 시사한다.

통계적 추론에서 특이점의 영향을 평가하기 위한 탐색적 자료분석 그림도구로서의 불꽃그림 (Firework plot for evaluating the impact of outliers in statistical inference)

  • 문승호
    • 응용통계연구
    • /
    • 제31권1호
    • /
    • pp.155-165
    • /
    • 2018
  • 특이점 및 영향점은 자료분석을 하는 데 사용되는 수치적 측도들을 왜곡한다. 각종 자료분석에 있어서의 특이점 검색을 위한 검정 통계량이나 그림도구에 관한 연구는 꾸준히 전개되어 왔다. Jang과 Anderson-Cook (Quality and Reliability Engineering International, 30, 1409-1425, 2014)은 불꽃그림이란 이름을 붙인 그림도구를 발표하였는데 특이점이나 영향점이 일변량/이변량 자료분석 및 회귀분석에 어떠한 영향을 미치는지 알기 위하여 3-D 불꽃그림 및 불꽃그림 행렬을 제시하였다. 본 연구에서는 이러한 불꽃그림이 통계적 추론에서 특이점을 찾아내고 이러한 특이점의 영향을 평가하기 위한 탐색적 자료분석 그림도구로서 사용될 수 있음을 보였다.

혼합효과모형의 리뷰 (Review of Mixed-Effect Models)

  • 이영조
    • 응용통계연구
    • /
    • 제28권2호
    • /
    • pp.123-136
    • /
    • 2015
  • 관측 가능한 변수들 사이의 관계를 묘사한 갈릴레오의 물리학 법칙 발견 이후, 과학은 큰 성과를 거두며 발전해왔다. 그러나, 관측할 수 없는 변량효과를 함께 이용하여 더 많은 자연 현상을 설명할 수 있게 되었고, 이를 이용한 최초의 통계적 모형인 혼합효과모형이 소개되었다. 계산기술의 발달과 더불어 복잡한 현상에 대한 추론을 위하여 혼합효과모형은 그 중요성이 더욱 커지고 있다. 이러한 혼합효과모형은 최근 다단계 일반화 선형모형을 포함한 여러 모형으로 확장되었으며, 관측할 수 없는 변량효과를 추론하기 위한 다단계 가능도가 제시되었다. 혼합효과모형 특집호를 통해 이러한 모형들이 여러 통계학적 문제점을 해결하는 과정을 제시하고, 앞으로 어떤 확장이 추가적으로 요구되는 지에 대하여 논할 것이다. 빈도록적 접근법과 베이지안 접근법을 함께 다룬다.

유역 특성이 하천 총인 농도에 미치는 영향 분석 (Effect of watershed characteristics on river TP concentration)

  • 서지유;김상단
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.165-165
    • /
    • 2021
  • 전 세계적으로 하천 수질이 저하되고 있다. 이는 수생태계의 손상을 야기하고 인류를 위한 하천의 물 공급원 기능에 저해 요소로 작용한다. 오염된 수생태계에 대한 효과적인 맞춤형 관리전략을 수립하려면 수질의 시공간적 변동 요인을 이해하는 것이 중요하다. 시간적 및 공간적 변동성이 모두 중요하지만, 본 연구에서는 낙동강 전체 유역에서 나타나는 공간적인 변동성에 집중하여 하천 수질의 공간적 차이에 영향을 미치는 요인을 식별하고 그들의 상대적 중요성을 분석하고자 하였다. 분석을 위해 낙동강 유역 전역의 40개 수질오염총량관리 단위유역에서 5년 동안 수집된 하천 총인 농도와 유역특성 자료를 사용하였다. 총인 농도의 공간적 변동성에 영향을 미치는 주요 유역특성을 식별하기 위한 통계모델 선정을 위해 완전 탐색 접근법과 베이지안 추론이 적용되었다. 완전 탐색은 두 단계에 걸쳐 진행되었으며, 1 단계 완전 탐색의 결과로 유역특성 자료들의 중요도가 선정되었으며 2 단계 완전탐색 결과로 통계모델이 우선 선정되었다. 우선 선정된 통계모델은 베이지안 추론을 통해 모델의 정확도와 불확실성이 분석되었고 공간적 변동성 분석을 위한 최적 모델이 선정되었다. 본 연구의 결과로 낙동강 하천 총인 농도의 공간적 변동성에 영향을 미치는 주요 유역특성에 대한 통찰력이 제공된다. 또한 식별된 주요 유역특성은 유역특성 변화에 대한 하천의 수질 반응을 예측하는데 사용될 수 있을 것으로 기대된다.

  • PDF

천문학에서의 대용량 자료 분석 (Analysis of massive data in astronomy)

  • 신민수
    • 응용통계연구
    • /
    • 제29권6호
    • /
    • pp.1107-1116
    • /
    • 2016
  • 최근의 탐사 천문학 관측으로부터 대용량 관측 자료가 획득되면서, 기존의 일상적인 자료 분석 방법에 큰 변화가 있었다. 고전적인 통계적인 추론과 더불어 기계학습 방법들이, 자료의 표준화로부터 물리적인 모델을 추론하는 단계까지 자료 분석의 전 과정에서 활용되어 왔다. 적은 비용으로 대형 검출 기기들을 이용할 수 있게 되고, 더불어서 고속의 컴퓨터 네트워크를 통해서 대용량의 자료들을 쉽게 공유할 수 있게 되면서, 기존의 다양한 천문학 자료 분석의 문제들에 대해서 기계학습을 활용하는 것이 보편화되고 있다. 일반적으로 대용량 천문학 자료의 분석은, 자료의 시간과 공간 분포가 가지는 비 균질성 때문에 야기되는 효과를 고려해야 하는 문제를 가진다. 오늘날 증가하는 자료의 규모는 자연스럽게 기계학습의 활용과 더불어 병렬 분산 컴퓨팅을 필요로 하고 있다. 그러나 이러한 병렬 분산 분석 환경의 일반적인 자료 분석에서의 활용은 아직 활발하지 않은 상황이다. 천문학에서 기계학습을 사용하는데 있어서, 충분한 학습 자료를 관측을 통해 획득하는 것이 어렵고, 그래서 다양한 출처의 자료를 모아서 학습 자료를 수집해야 는 것이 일반적이다. 따라서 앞으로 준 지도학습이나 앙상블 학습과 같은 방법의 역할이 중요해 질 것으로 예상된다.

로버스트 회귀추정에 의한 신뢰구간 구축 (On Confidence Intervals of Robust Regression Estimators)

  • 이동희;박유성;김기환
    • 응용통계연구
    • /
    • 제19권1호
    • /
    • pp.97-110
    • /
    • 2006
  • 대부분의 자료는 여러가지 원인으로 인한 특이치로 오염되어 있으며, 이러한 상황에서 신뢰성 있는 추정량을 얻어내고 이에 대한 통계적 추론을 시행하는 것은 중요한 문제이다. 그러나 이제까지 제안된 로버스트 회귀추정량들은 계산상의 어려움과 정규오차모형에서 최소제곱추정량에 비하여 떨어지는 효율성때문에 통계적 추론의 정확성을 확신할 수 없었다. 최근 제안된 Lee(2004)의 가중자기조율회귀추정량(weighted self-tuning estimator, WSTE)은 다른 로버스트 회귀추정량에 비하여 정확한 계산과정과 그에 따른 추정량의 점근적 정규성 및 고붕괴점을 갖는다. 그러나 통계적 추론을 위하여 이제까지 널리 사용해왔던 로버스트 추정량에 기반한 가중최소제곱추정방법(weighted least squares estimator)은 WSTE에서조차 정규오차모형하에서 최소제곱추정량과 동일한 수준의 효율성을 제공해주지 는 못한다. 본 논문에서는 WSTE에 기반한 또다른 통계적 추론 방법을 제안하고, 이 방법을 사용함으로써 정규오차모형 및 대표본에서 보다 정확한 결과를 얻을 수 있음을 몬테칼로 모의실험을 통해 제시하였다.

제로팽창 음이항 회귀모형에 대한 베이지안 추론 (Bayesian Inference for the Zero In ated Negative Binomial Regression Model)

  • 심정숙;이동희;정병철
    • 응용통계연구
    • /
    • 제24권5호
    • /
    • pp.951-961
    • /
    • 2011
  • 본 논문에서는 제로팽창 음이항(ZINB) 회귀모형에서 회귀계수에 대한 추론방법으로 마코프체인몬테카를로(MC MC) 기법을 이용한 베이지안 추론방법을 제안하였다. 본 연구에서 고려한 ZINB 회귀모형은 반응변수의 평균뿐만 아니라 제로팽창확률에 대한 회귀모형을 고려한 것으로서 Jang, et al.(2010)의 연구를 확장한 것이다. 아울러 실제사례에 본 연구에서 제안한 베이지안 추론방법을 적용하고 과대산포를 허용하지 않는 제로팽창 포아송(ZIP) 회귀모형과 적합결과를 DIC를 이용하여 비교하였다. 실제 사례분석 결과 ZINB 회귀모형의 DIC가 ZIP모형보다 작게 나타나 ZINB 회귀모형이 ZIP 회귀모형보다 잘 적합되었음을 알 수 있었다.

잠재범주분석을 이용한 원인적 영향력 추론에 관한 연구 (Estimating Average Causal Effect in Latent Class Analysis)

  • 박가영;정환
    • 응용통계연구
    • /
    • 제27권7호
    • /
    • pp.1077-1095
    • /
    • 2014
  • 관찰연구를 이용하여 인과관계를 추론할 경우 무작위 통제시험과는 달리 교란변수로 인한 편향을 제어하기 위한 통계적 전략이 필요하다. 최근에는 성향점수(propensity score) 를 이용한 짝짓기나 원인변수의 역확률을 가중치로 사용하는 주변구조모형이 제안되어 사용되고 있다. 이러한 인과관계 추론은 처치(treatment)가 명확히 주어진 경우에 교란변수를 통제하고 그 처치가 결과에 미치는 영향을 평가하는 방법에 초점이 맞추어져 있다. 하지만 기존의 방법의 경우 원인변수인 처치가 직접관측이 가능한 범주형 변수이고 결과변수 또한 직접관측이 가능한 변수인 경우에만 사용할 수 있는 한계를 갖고 있다. 본 연구에서는 원인변수인 처치와 결과변수의 결괏값의 직접적인 관측이 어려운 경우, 측정오차를 고려한 잠재범주모형(latent class analysis)의 변수로 모형화 함으로써 잠재범주 간의 원인적 영향력을 추정하는 방법을 제시하고자 한다. 그리고 미국의 The National Longitudinal Study of Adolescent Health 자료를 이용하여, 약물사용의 잠재범주에 대한 청소년기의 비행(delinquency)이라는 잠재범주의 원인적 영향력을 추정하였다.

비대칭 지수멱 오차를 가지는 자기회귀모형에서의 베이지안 추론 (Bayesian Inference for Autoregressive Models with Skewed Exponential Power Errors)

  • 류현남;김달호
    • 응용통계연구
    • /
    • 제27권6호
    • /
    • pp.1039-1047
    • /
    • 2014
  • 시계열 자료를 위한 가장 기본적인 모형인 자기회귀모형을 고려한다. 흔히 시계열 자료에서 정규성 가정이 위배되는 경우가 발생하며, 정규성 가정을 완화하기 위한 방법으로 두꺼운 꼬리를 가지는 분포 또는 비대칭 분포를 고려할 수 있다. 비대칭 지수멱 분포의 사용은 비뚤림이 있는 두꺼운 꼬리를 가지는 자기회귀모형의 이상치의 영향을 줄이고 로버스트한 추론을 할 수 있도록 한다. 본 논문에서는 자기회귀모형에 대한 오차항에 정규분포 보다 첨도와 왜도에 유연함을 가지는 분포를 고려함으로써 정규성 가정을 완화하여 추론하고자 하였다. 정규분포의 대안으로 비대칭 지수멱 분포를 고려하였으며 정규분포의 결과와 비교 하여 비대칭 지수멱 분포의 로버스트함을 보였다. 또한 주어진 분포에 대한 효율적인 베이지안 추론을 하기 위하여 SIR 알고리즘과 격자망 방법을 고려하였다.