• 제목/요약/키워드: 사전확률

검색결과 416건 처리시간 0.023초

조건부확률 개념의 교수학적 분석과 이해 분석 (A Didactic Analysis of Conditional Probability)

  • 이정연;우정호
    • 대한수학교육학회지:수학교육학연구
    • /
    • 제19권2호
    • /
    • pp.233-256
    • /
    • 2009
  • 이 연구는 조건부확률 개념에 대한 교수학적 분석을 시도하고, 학생들의 조건부확률 개념의 이해에 관하여 분석하였다. 수학적, 역사 발생적, 심리학적, 인식론적 관점의 분석을 통하여, 조건사건을 표본공간으로 하는 확률이라는 대상 개념, 사전확률이 사후확률로 변화하는 확률 수정의 과정 개념, 조건사건의 확인, 사건의 시간 순서와 조건관계의 구분, 인과관계와 조건관계의 구분, 가추적 사고의 이해가 조건부확률 이해의 핵심적인 요소임을 확인하였다. 또한, 고등학생과 대학생의 지필 검사와 면담을 통하여 학생들의 이해와 오개념에 대해 분식하였다. 이를 토대로 교육과정에의 시사점을 도출하였다.

  • PDF

국어사전의 명사 뜻풀이말 Parser (A Parser for Noun's Definition in Korean Dictionary)

  • 허정;김준수;이수광;옥철영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.321-323
    • /
    • 2000
  • 국어 사전은 자연 언어 처리에서 필요로 하는 많은 정보를 구조적으로 포함하고 있으므로, 사전으로부터 다양한 언어 지식을 자동으로 획득할 수 있는 방법이 필요하다. 본 연구는 이러한 자동 지식 획득을 위한 기본적인 도구로서 국어 사전의 뜻풀이말 파서를 구현하는 것을 목적으로 한다. 이를 위해서 우선 국어 사전의 뜻풀이말을 대상으로 일정한 수준의 구문 부착 말뭉치를 구축하고, 이 말뭉치로부터 통계적인 방법에 기반하여 문법 규칙과 확률을 자동으로 추출한다. 본 연구는 이를 응용한 확률적 차트 파서를 구현하는 것이다. 그 결과 고려대 태거보다 11.61%의 정확률 향상을 보였는데, 이로써 구문 구조 정보가 품사 태깅에도 유용함을 알 수 있었다.

  • PDF

모델의 사전 확률 추정을 이용한 HMM 구조의 최적화 (HMM Topology Optimization using Model Prior Estimation)

  • 하진영;박미나
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.325-327
    • /
    • 2001
  • 본 논문은 온라인 문자 인식을 연속 밀도 HMM의 구조의 최적화 문제를 다룬다. 최적이란 최소한의 모델 파라미터를 사용하여 최소한의 오류를 허용하는 것이라고 정의할 수 있다. 본 연구에서는 HMM 구조의 최적화를 위해 Bayesian 모델 선택 방법론을 사용한다. 먼저 잘 알려진 BIC(Bayesian Information Criterion)을 적용해보고, 그것을 HMM의 복잡한 구조에 적합하도록 본 논문에서 제안한 HBIC(HMM-Oriented BIC)와 비교해본다. BIC는 모델의 사전 확률 분포를 추정하지 않고 다변량 정규분포라고 가정하는데 비해 HBIC는 모델의 각 파라미터로부터 사전 확률을 추정한 후 그것들을 사용함으로써 더 좋은 결과를 얻도록 한다. 실험 결과 BIC와 HBIC 둘 다 기존 방법보다 모델의 파라미터 수를 현저히 감소시킴을 확인했고, HBIC가 BIC에 비해 더 적은 수의 파라미터를 사용해도 비슷한 인식률을 얻을 수 있었다.

  • PDF

콘크리트 구조물의 합리적인 압축강도 추정기법 연구 (Realistic Estimation Method of Compressive Strength in Concrete Structure)

  • 오병환;양인환
    • 콘크리트학회지
    • /
    • 제11권2호
    • /
    • pp.241-249
    • /
    • 1999
  • 실제 구조물의 정확하고 합리적인 압축강도 추정을 위해서는 통계학적으로 많은 실험데이타가 필요하다. 그러나, 실제로 압축강도 자료가 제한되어 있기 때문에 추정에 어려움이 있다. 따라서, 본 연구에서는 적은 자료를 가지고 콘크리트의 실제적인 압축강도 추정을 위해 합리적인 베이시안 기법을 도입하여 콘크리트 강도추정 방법을 제시하였다. 여기서, 콘크리트의 평균 압축강도는 확률변수로 고려한다. 콘크리트 압축강도의 베이시안 업데이팅을 위해 사전확률분포는 기존의 자료를 반영하여 표현하며, 우도함수는 측정치의 특성을 반영하였다. 사후확률분포는 사전확률분포와 우도함수를 조합하여 나타내었다. 콘크리트 교량 현장에서 제작한 실린더 공시체로부터 측정한 자료를 이용하여 수치해석을 수행하였다. 수치해석결과는 상대적으로 적은 개수의 측정자료를 사용하고도 실제에 가까운 사후확률분포를 추정할 수 있는 것을 보여 주고 있다. 또한, 우도함수 분포의 신뢰구간에 대한 사전확률분포의 신뢰구간의 상대적인 크기는 사후확률분포의 결정에 영향을 미치는 것으로 나타났다. 본 논문에서 제시된 방법은 적은 현장측정자료를 가지고도 합리적인 강도추정이 가능함을 보여주고 있으며, 실제에 유용하게 활용될 수 있을 것으로 사료된다.

깁스표본기법을 이용한 설명변수 선택문제에서 사전분포의 설정-선형회귀모형을 중심으로-

  • 박종선;남궁평;한숙영
    • Communications for Statistical Applications and Methods
    • /
    • 제4권2호
    • /
    • pp.333-343
    • /
    • 1997
  • 선형회귀분석에서 변수의 선택문제는 최적의 모형을 찾는데 아주 중요한 부분을 차지한다. George와 McCulloch(1993)는 계층적 베이즈 모형과 깁스표본법을 이용하여 선형회귀모형에서 변수를 선택하는 문제를 고려하였다. 이 논문에서는 George와 McCulloch의 모형을 바탕으로 각각의 설명변수가 모형에 포함될 사전확률을 객관적인 기준에 의하여 결정하는 문제를 고려하여 보았다.

  • PDF

베이즈의 균일분포에 관한 소고 (On Bayes' uniform prior)

  • 허명회
    • 응용통계연구
    • /
    • 제7권2호
    • /
    • pp.263-268
    • /
    • 1994
  • 베이스(Thomas Bayes)는 역사적인 1764년 논문에서 공 W의 위치 $\theta$에 대한 추론 문제를 생각한 바 있다. 이 때 그는 $\theta$에 대한 사전(prior) 분포로서 균일(uniform) 분포를 가정하였는데, 본 소고에서는 이 사전분포가 단순한 주관적 확률이 아닌 논리적 확률로 간주될 수 있음을 보일 것이다.

  • PDF

기분석 어절 사전과 음절 단위의 확률 모델을 이용한 한국어 형태소 분석기 복제 (Cloning of Korean Morphological Analyzers using Pre-analyzed Eojeol Dictionary and Syllable-based Probabilistic Model)

  • 심광섭
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권3호
    • /
    • pp.119-126
    • /
    • 2016
  • 본 논문에서는 어절 단위의 기분석 사전과 음절 단위의 확률 모델을 이용하는 한국어 형태소 분석기가 실용성이 있는지를 검증한다. 이를 위해 기존의 한국어 형태소 분석기 MACH와 KLT2000을 복제하고, 복제된 형태소 분석기의 분석 결과가 MACH와 KLT2000 분석 결과와 얼마나 유사한지 정밀도와 재현율로 평가하는 실험을 하였다. 실험은 1,000만 어절 규모의 세종 말뭉치를 10개의 세트로 나누고 10배수 교차 검증을 하는 방식으로 하였다. MACH의 분석 결과를 정답 집합으로 하고 MACH 복제품의 분석 결과를 평가한 결과 정밀도와 재현율이 각각 97.16%와 98.31%였으며, KLT2000 복제품의 경우에는 정밀도와 재현율이 각각 96.80%와 99.03%였다 분석 속도는 MACH 복제품의 경우 초당 30.8만 어절이며, KLT2000 복제품은 초당 43.6만 어절로 나타났다. 이 실험 결과는 어절 단위의 기분석 사전과 음절 단위의 확률 모델로 만든 한국어 형태소 분석기가 실제 응용에 사용될 수 있을 정도의 성능을 가진다는 것을 보여준다.

커널 판별분석의 오분류확률에 대한 붓스트랩 조정

  • 백장선
    • Communications for Statistical Applications and Methods
    • /
    • 제2권2호
    • /
    • pp.249-265
    • /
    • 1995
  • 본 논문에서는 확률분포가 알려져 있지 않은 두 모집단 중 어느 하나로 새로운 관측치를 분류할 때 오분류확률이 분석자에 의해 사전에 정해진 수준에 부합할 수 있도록 커널 판별함수의 임계치를 결정하였다. 정해진 오분류확률을 만족시키기 위한 판별함수의 임계치는 붓스트랩(bootstrap)기법을 판별 함수에 적용시켜 계산된다. 본 논문에서 제시도된 방법은 모집단에 대한 모수적 가정이 없으므로 어느 분포에도 적용가능하며, 모집단이 정규분포, 대수정규분포, 이산형과 연속형 변수가 혼합된 분포의 경우 모의실험을 통하여 그 성능에 대한 검증을 하였다.

  • PDF

토빗회귀모형에서 베이지안 구간추정 (Bayesian Interval Estimation of Tobit Regression Model)

  • 이승천;최병수
    • 응용통계연구
    • /
    • 제26권5호
    • /
    • pp.737-746
    • /
    • 2013
  • Tobin (1958)에 의해 처음 소개된 절단 회귀모형에서 베이지안 추정은 최대가능도 추정보다 실제값에 가까운 것으로 알려져 있으나 베이지안 방법론이 구간추정 문제에 있어서도 성공적으로 작동할 수 있을 지에 대해서는 알려진 바가 없다. 일반적으로 베이지안 방법론에서 사전분포는 분석자의 사전정보를 반영하기 때문에 주관적인 분석이 될 수 밖에 없는데, 이렇게 주관적인 분석에서는 빈도학파들이 요구하는 기준을 따르기 어렵다. 그러나 무정보사전분포는 때때로 빈도학파적 특성을 갖는 베이지안 추론을 가능하게 한다. 본 연구에서는 절단 회귀모형에서 무정보사전분포에 의한 베이지안 신뢰구간의 빈도학파적 특성을 살펴보고 최대가능도 추정 신뢰구간과 포함확률을 비교한다. 이를 통해 최대가능도 추정의 표준오차가 과소 추정되고 있음 밝힌다.

차량 네트워크에서 최적의 컨텐츠 분배 기반의 사전 캐싱 방안 (Proactive Caching Strategy Based on Optimal Content Distribution in Content Centric Vehicular Networks)

  • 박성진;이의신
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제9권6호
    • /
    • pp.131-136
    • /
    • 2020
  • 차량 환경의 통신에서 콘텐츠의 사전 캐싱은 사용자로부터 콘텐츠 서버까지의 지연시간을 감소시킬 수 있다. 하지만 어디에, 어느 량 만큼의 사전 캐싱을 해야하는 지에 대한 문제점은 아직도 해결되지 않고 있다. 본 논문에서는 차량의 이동 확률을 토대로 차량이 다음으로 이동하게 될 기지국 후보들에게 각각 최적화된 량만큼의 콘텐츠를 분산시켜 사전 캐싱하는 방안을 제시한다. 우선, 각 차량의 이동 확률은 Markov Chain을 이용하여 학습되었다. 그리고 분산하여 사전 캐싱할 콘텐츠의 량은 무선 환경을 기반으로 최적화되었다. NS-3를 기반으로 진행된 실험에서 제안방안은 기존 방안에 비하여 최소의 지연시간을 유지하며 트래픽을 가장 많이 절약한 결과가 도출되었다.