• 제목/요약/키워드: 통계추론

검색결과 358건 처리시간 0.025초

폴랴-감마 잠재변수에 기반한 베이지안 영과잉 음이항 회귀모형: 약학 자료에의 응용 (A Bayesian zero-inflated negative binomial regression model based on Pólya-Gamma latent variables with an application to pharmaceutical data)

  • 서기태;황범석
    • 응용통계연구
    • /
    • 제35권2호
    • /
    • pp.311-325
    • /
    • 2022
  • 0의 값을 과도하게 포함하는 가산자료는 다양한 연구 분야에서 흔히 나타난다. 영과잉 모형은 영과잉 가산자료를 분석하기 위해 가장 일반적으로 사용되는 모형이다. 영과잉 모형에 대한 전통적인 베이지안 추론은 조건부 사후분포의 형태가 폐쇄형 분포로 나타나지 않아 모형 적합 과정이 용이하지 않다는 한계점이 존재했다. 그러나 최근 Pillow와 Scott (2012)과 Polson 등 (2013)이 제안한 폴랴-감마 자료확대전략으로 인해, 로지스틱 회귀모형과 음이항 회귀모형에서 깁스 샘플링을 통한 추론이 가능해지면서, 영과잉 모형에 대한 베이지안 추론이 용이해졌다. 본 논문에서는 베이지안 추론에 기반한 영과잉 음이항 회귀모형을 Min과 Agresti(2005)에서 분석된 약학 연구 자료에 적용해본다. 분석에 사용된 자료는 경시적 영과잉 가산자료로 복잡한 자료 구조를 가지고 있다. 모형 적합 과정에서는 깁스 샘플링을 통한 추론을 수행하기 위해 폴랴-감마 자료확대전략을 사용한다.

기초 통계량을 이용한 저작자 진위 추론

  • 이근무;이근우
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2001년도 추계학술발표회 논문집
    • /
    • pp.69-73
    • /
    • 2001
  • 이 논문에서 문장특성을 파악하는 방법으로 주로 이용한 것은 특정문자의 출현율이다. 어떤 사람이나 그 글 속에는 자신의 개성이 들어있다. 문장의 길이를 비롯하여 문장의 구조나 어휘량, 유의어 중에서 선호하는 글자, 평서문이나 의문문의 사용, 품사의 사용, 문두나 문말에 오는 글자 등에서 각각의 개성이 드러난다. 그 중에서도 접속사나 조사, 접두어, 접미어 등 상대적으로 의미적인 요소보다는 형식적인 요소에 가까운 영역에서 문장의 특성이 두드러지는 것으로 보고되어 있다, 이런 특징을 이용하여 화랑세기의 저작자의 진위를 추론하고자 한다.

  • PDF

추세계수 국소선형근사법의 특성과 해석 (Mathematical Review on the Local Linearizing Method of Drift Coefficient)

  • 윤민;최영수;이윤동
    • 응용통계연구
    • /
    • 제21권5호
    • /
    • pp.801-811
    • /
    • 2008
  • 확산모형은 금융현상을 모형화하기 위한 방법으로 자주 사용된다. 특히 최근에 제안된 다양한 확산모형들은 정교한 추론방법을 필요로 하게 되고, 이러한 필요성에 따라 정밀도가 높은 여러 가지 추론 방법에 대한 연구가 진행되고 있다. 본 논문에서는 확률편미분방정식에 의하여 표현되는 확산과정의 추론을 위하여 사용되는 여러 가지 방법 중 우도추론법에 대하여 살펴보게 된다. 다양한 우도추론법 중에서도, 근사적 우도추론법의 일종인 추세계수 국소선형근사법을 중심으로 그 수리적 성질을 검토한다.

초등학생들의 과학 글쓰기에 나타나는 과학적 추론의 학년별 차이 (Scientific Reasoning Differences in Science Writing of Elementary School Students by Grades)

  • 임옥기;김효남
    • 한국과학교육학회지
    • /
    • 제38권6호
    • /
    • pp.839-851
    • /
    • 2018
  • 이 연구의 목적은 초등학생들의 과학 글쓰기에 나타나는 과학적 추론의 학년별 차이를 분석하는 것이다. 이를 위해 과학 글쓰기 활동지와 분석틀을 개발하였다. 국가수준의 성취도 평가 중상위 수준의 서울 지역의 한 초등학교 3학년부터 6학년 학생들에게 개발한 과학글쓰기활동을 하도록 하여, 총 320명의 과학 글쓰기 자료를 수집하여 분석하였다. 연구 결과는 다음과 같다. 3학년 학생들의 글 중 52%, 4학년 학생들의 글 중 68%, 5학년 학생들의 글 중 85%, 그리고 6학년 학생들의 글 중 89%가 과학적 추론을 포함하고 있었다. 초등학생들이 쓴 과학 글에는 귀납적 추론, 연역적 추론, 귀추적 추론과 같은 세 가지 유형의 과학적 추론이 포함되어 있었다. 귀추적 추론이 나타난 글은 귀납적 추론이나 연역적 추론에 비해 상대적으로 매우 적었다. 그리고 과학적 추론 수준에서는 각 과학적 추론 유형별로 3 수준의 글이 가장 많았다. 귀납적 추론과 연역적 추론에서는 학년이 올라감에 따라 점점 높은 수준의 글을 썼으나, 귀추적 추론에서는 그러한 경향이 나타나지 않았다. 학년별로 귀납적 추론, 연역적 추론, 귀추적 추론에 의한 글이 모두 나타났다. 귀납적 추론과 연역적 추론 수준은 통계적으로 유의한 학년별 차이를 나타내었다. 그러나 귀추적 추론 수준은 통계적으로 유의한 학년별 차이를 나타내지 않았다. 3학년의 귀납적 추론과 연역적 추론 수준은 다른 학년과 비교하여 많이 낮은 편이었다.

베이지안 통계 추론 (On the Bayesian Statistical Inference)

  • 이호석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (C)
    • /
    • pp.263-266
    • /
    • 2007
  • 본 논문은 베이지안 통계 추론에 대하여 논의한다. 논문은 베이지안 추론, Markov Chain과 Monte Carlo 적분, MCMC(Markov Chain Monte Carlo) 기법, Metropolis-Hastings 알고리즘, Gibbs 샘플링, Maximum Likelihood Estimation, EM 알고리즘, 상실된 데이터 보완 기법, BMA(Bayesian Model Averaging) 순서로 논의를 진행한다. 이러한 통계적 기법들은 대용량의 데이터를 처리하는 생물학, 의학, 생명 공학, 과학과 공학, 그리고 일반 데이터 조사와 처리 등에 사용되고 있으며, 최적의 추론 결과를 이끌어 내는데 중요한 방법을 제공하고 있다. 그리고 마지막으로 PC(Principal Component) 분석 기법에 대하여 논의한다. PC 분석 기법도 데이터 분석과 연구에 많이 활용된다.

  • PDF

로짓모형의 비모수적 추론의 비교 (Comparison of Some Nonparametric Statistical Inference for Logit Model)

  • 정형철;김대학
    • 응용통계연구
    • /
    • 제15권2호
    • /
    • pp.355-366
    • /
    • 2002
  • 범주형 자료의 구조파악에 주로 이용되는 로짓모형에서 비모수적 방법을 이용한 모수의 신뢰구간추정과 가설검정 등의 통계적 추론에 대하여 살펴보았다. 모수에 대한 통계적 추론에서 정규분포에 근거한 모수적 방법(Wald 방법)보다는 붓스트랩 방법이나 임의순열을 활용한 비모수적 방법이 많이 활용되고 있다. 본 연구에서는 로짓모형의 모수에 대한 비모수적 추론방법으로 붓스트랩(bootstrap)과 임의순열(random permutation)의 두 방법을 고려하고 모의실험을 통하여 가설검정의 검정력과 신뢰구간추정의 포함확률을 비교하였고 사례분석을 다루었다.

통계적 추론 학습을 위한 시뮬레이션 중심 웹 코스웨어의 설계와 구현 (Design and implementation of Web Course_ware based on Simulation for statistical Inference Study)

  • 최은선;최진식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (A)
    • /
    • pp.113-118
    • /
    • 2006
  • 고등학교 수학과 교육과정에서의 ‘확률과 통계'단원은 실제로 자료의 수집과 요약을 통하여 자료 분석방법을 배우고 사회와 자연현상을 인식하고 추론하는 능력을 기르는데 목표를 두고 있다. 추상적인 수학내용을 직접 시도하거나 학생들이 실제적인 자료를 수집하고 직접 자료를 해석하고 추론해 보는 경험과정은 수학실험과 시뮬레이션이라는 컴퓨터 학습을 통해 가능하고 개념학습의 전 단계에서 보다 구성적이고 탐구적인 활동을 강화할 수 있다. 본 논문에서는 ‘확률과 통계'의 교수-학습과정에서 수학적 시뮬레이션을 활용한 웹 기반 학습모형을 제시하여 학습자들에게 수학적 내용과 관련된 구체적 매체를 조작하는 컴퓨터 실험 활동을 통하여 수학에서의 원리발견과 통계적 추론을 경험하고 유도할 수 있는 탐구적 학습 환경을 조성해 보고자 한다.

  • PDF

평균 벡터의 평활함수모형에 대한 안부점근사 -스튜던트화 분산을 중심으로- (Saddlepoint Approximation to the Smooth Functions of Means Model)

  • 나종화;김주성
    • 응용통계연구
    • /
    • 제14권2호
    • /
    • pp.333-344
    • /
    • 2001
  • 통계적 추론에 사용되는 많은 통계량들은 평균벡터의 평활함수의 형태로 표현이 가능하다. 본 연구에서는 이들 통계량들의 분포함수에 대한 안부점근사법을 제시하였다. 이 방법은 Na(1998)에서 제시된 일반적 통계량의 분포함수에 대한 안부점근사법이 평균벡터의 평활함수모형에 특히 유용하게 사용될 수 있음을 보인 것이다. 이 근사법은 정규근사에 비해 근사의 정도가 뛰어나며, 특히 통계량의 꼬리부분의 확률에 대해서도 정확도가 그대로 유지되는 장점이 있어 정밀한 추론이 요구되는 많은 문제에 효과적으로 사용될 수 있다. 모의 실험에 사용할 평균벡터의 평활함수 모형으로는 스튜던트화 분산을 고려하였다.

  • PDF

보조 혼합 샘플링을 이용한 베이지안 로지스틱 회귀모형 : 당뇨병 자료에 적용 및 분류에서의 성능 비교 (Bayesian logit models with auxiliary mixture sampling for analyzing diabetes diagnosis data)

  • 이은희;황범석
    • 응용통계연구
    • /
    • 제35권1호
    • /
    • pp.131-146
    • /
    • 2022
  • 로지스틱 회귀 모형은 다양한 분야에서 범주형 종속 변수를 예측하거나 분류하기 위한 모형으로 많이 사용되고 있다. 로지스틱 회귀 모형에 대한 전통적인 베이지안 추론 기법으로 메트로폴리스-헤이스팅스 알고리즘이 많이 사용되었지만, 수렴의 속도가 느리고 제안 분포에 대한 적절성을 보장하기 어렵다. 따라서, 본 논문에서는 모형에 대한 베이지안 추론 방법으로 Frühwirth-Schnatter와 Frühwirth (2007)에서 제안된 보조 혼합 샘플링(auxiliary mixture sampling) 기법을 사용하였다. 이 방법은 모형의 선형성과 정규성을 만족시키기 위해 두 단계에 거쳐 잠재변수를 도입하며, 결과적으로 깁스 샘플링을 통한 추론을 가능하게 한다. 제안한 모형의 효과를 검증하기 위해 2020년 지역사회 건강조사 당뇨병 자료에 적용하여 메트로폴리스-헤이스팅스를 사용한 모형과 추론 결과를 비교 분석하였다. 또한, 다양한 분류 모형들과 본 논문에서 제안한 모형의 분류 성능을 비교한 결과 제안된 모형이 분류 분석에서도 좋은 성능을 보이는 것을 확인할 수 있었다.

AUC 차이를 이용한 미결정자 추론방법 (Undecided inference using the difference of AUCs)

  • 홍종선;나해린
    • 응용통계연구
    • /
    • 제34권2호
    • /
    • pp.141-152
    • /
    • 2021
  • 미결정자 추론을 재평가하기 위해 기존 변수에 새로운 변수들을 추가하는 통계 모형이 필요하다. 미결정자와 결정자의 양성률은 다르게 계산되기 때문에 MNAR 가정이 필요하다. 본 연구에서는 두 통계적 모형이 계층 관계를 가지고 있으므로, 두 AUC 차이의 신뢰구간을 이용하여 MNAR 가정하에서 미결정자를 추론한다. AUC 차이 신뢰구간의 추정방법 중에서 모의실험을 통하여 네 종류의 방법의 성능이 우수함을 발견하였다. 그리고 네 종류의 방법을 바탕으로 로지스틱 회귀를 이용한 미결정자 추론에 도움이 되는 변수를 선택하는 방법을 제안한다.