• 제목/요약/키워드: Bayesian statistical method

검색결과 307건 처리시간 0.025초

독립표본에서 두 모비율의 차이에 대한 가중 POLYA 사후분포 신뢰구간 (The Weighted Polya Posterior Confidence Interval For the Difference Between Two Independent Proportions)

  • 이승천
    • 응용통계연구
    • /
    • 제19권1호
    • /
    • pp.171-181
    • /
    • 2006
  • 모비율 차이의 구간 추정에서 표준으로 인식되고 있는 Wald 신뢰구간은 모비율 구간 추정과 마찬가지로 포함확률의 근사성에서 문제가 있다는 것이 알려져 있다. 이에 대한 대안으로 모비율 차이의 신뢰구간에 대한 많은 연구가 있어 왔으나 대부분의 신뢰구간은 매우 복잡한 과정을 통해 얻어지게 되어 있어 실용성에 대한 문제가 제기될 수 있다. 이와 비교하여 Agresti와 Caffo(2000)에 의해 제시된 신뢰구간은 매우 간편한 식에 의해 구할 수 있어 이해하기 쉽고 포함확률과 포함확률의 평균절대오차에 있어 다른 복잡한 신뢰 구간과 필적할 수 있다. 그러나 Agresti-Caffo 신뢰 구간은 포함확률이 명목 신뢰수준을 상회하는 보수적인 구간으로 알려져 있다. 본 논문에서는 이승천(2005)에서 이항비율의 신뢰구간을 구하기 위해 사용된 가중 Polya 사후분포를 이용하여 두 모비율 차이의 신뢰구간을 구하였다. 이렇게 구하여진 신뢰구간은 간편성은 물론 Agresti-Caffo 신뢰구간의 보수성을 개선하였다.

모바일 비디오기기 위에서의 중요한 객체탐색을 위한 문맥인식 특성벡터 선택 모델 (Context Aware Feature Selection Model for Salient Feature Detection from Mobile Video Devices)

  • 이재호;신현경
    • 인터넷정보학회논문지
    • /
    • 제15권6호
    • /
    • pp.117-124
    • /
    • 2014
  • 모바일 기기를 사용한 실시간 비디오 영상처리분야의 중요 객체탐색 및 추적의 문제에 있어서 난제는 복잡한 배경속에서 전경을 구분해 내는 일이다. 본 논문에서는 기계학습을 위한 특성벡터 선정의 문제를 위한 문맥인식 모델을 제시하여 잡음제거를 위한 기계학습기반의 구분자를 구현하였다. 수학적으로 NP-hard로 알려진 가장 가까운 이웃을 사용한 문맥인식 특성벡터 선정 알고리즘의 구현에 있어서, 본 논문은 연산횟수를 줄인 유사방법론에 대해 자세히 거론하였다. 또한, 문맥인식 성격을 가미한 특성벡터 선정을 통해 얻어진 특성 공간에서의 향상된 분리성에 대해 주성분 분석을 통해 엄밀한 분석결과를 제시하였다. 전반적인 성능 향상의 정도를 계측하기 위해 다양한 기계학습 방법론, 예를 들어, 다층신경망, 지원벡터기계, 나이브베이지안, 회귀분석 등을 사용해 비교결과를 제시하였다. 본 논문에서 제시한 방법론의 성능과 계산상 자원사용에 대한 내용을 결론으로 서술하였다.

연관분석을 위한 베이지안 모형 선택: 상호상관성 변수를 중심으로 (Bayesian Model Selection for Linkage Analyses: Considering Collinear Predictors)

  • 서영주
    • 응용통계연구
    • /
    • 제18권3호
    • /
    • pp.533-541
    • /
    • 2005
  • 본 저자는 앞선 연구에서 제안한 SSVS 방법을 이용하여 한 양적형질에 대한 연관분석에 있어, QTL에 가까이 있는 관련된 표지유전자들의 위치를 정하고자 한다. 본 논문에서는 QTL에 연관되어 있고 동시에 서로 연관되어 있는 몇 가지 표지유전자들을 대상으로 하는데, 이 유전자 좌위들의 i.b.d. 값들을 상호 상관이 있는 예측변수로서 고려하여, SSVS 방법으로 분석한다. 두개의 QTL에 강하게 연관되어 있는 표지유전자들 만을 동시에 고려한 분석의 결과, QTL에 가장 가까이 위치한 표지 유전자가 다른 유전자들보다 더 분명하게 양적형질과의 관련성을 보여주었다. SSVS를 이용한 상호 상관이 있는 표지 유전자들의 분석의 결과는 전통적인 다중회귀분석을 이용한 결과와 거의 일치했다. 본 모의실험을 바탕으로, 복합 양적형질에 대하여 서로 연관된 다중의 표지유전자들을 동시에 연관분석을 수행하는 데에 SSVS 방법이 상당히 유용하다고 결론 내린다.

그리드 단체 위의 디리슐레 분포에서 마르코프 연쇄 몬테 칼로 표집 (MCMC Algorithm for Dirichlet Distribution over Gridded Simplex)

  • 신봉기
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권1호
    • /
    • pp.94-99
    • /
    • 2015
  • 비모수 베이스 통계학, 확률적 표집에 기반한 추론 등이 기계학습의 주요 패러다임으로 등장하면서 디리슐레(Dirichlet) 분포는 최근 다양한 그래프 모형 곳곳에 등장하고 있다. 디리슐레 분포는 일변수 감마 분포를 벡터 분포로 확장한 형태의 하나이다. 본 논문에서는 감마 분포를 갖는 임의의 자연수 X를 K개의 자연수의 합으로 임의 분할 할 때 각 부분의 크기 비율을 디리슐레 분포에서 표집하는 방법을 제안한다. 일반적으로 디리슐레 분포는 연속적인 (K-1)-단체(simplex) 위에 정의 되지만 자연수로 분할하는 표본은 자연수라는 조건 때문에 단체 내부의 이산 그리드 점에만 정의된다. 본 논문에서는 단체 위의 그리드 상의 이웃 점들의 확률 분포로부터 마르코프연쇄 몬테 칼로(MCMC) 제안 분포를 정의하고 일련의 표본들의 마르코프 연쇄를 구현하는 알고리듬을 제안한다. 본 방법은 마르코프 모델, HMM 및 준-HMM 등에서 각 상태별 시간 지속 분포를 표현하는데 활용 가능하다. 나아가 최근 제안된 전역-지역(global-local) 상태지속 분포를 동시에 모형화하는 감마-디리슐레 HMM에도 응용가능하다.

Genetic Contribution of Indigenous Yakutian Cattle to Two Hybrid Populations, Revealed by Microsatellite Variation

  • Li, M.H.;Nogovitsina, E.;Ivanova, Z.;Erhardt, G.;Vilkki, J.;Popov, R.;Ammosov, I.;Kiselyova, T.;Kantanen, J.
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제18권5호
    • /
    • pp.613-619
    • /
    • 2005
  • Indigenous Yakutian cattle' adaptation to the hardest subarctic conditions makes them a valuable genetic resource for cattle breeding in the Siberian area. Since early last century, crossbreeding between native Yakutian cattle and imported Simmental and Kholmogory breeds has been widely adopted. In this study, variations at 22 polymorphic microsatellite loci in 5 populations of Yakutian, Kholmogory, Simmental, Yakutian-Kholmogory and Yakutian-Simmental cattle were analysed to estimate the genetic contribution of Yakutian cattle to the two hybrid populations. Three statistical approaches were used: the weighted least-squares (WLS) method which considers all allele frequencies; a recently developed implementation of a Markov chain Monte Carlo (MCMC) method called likelihood-based estimation of admixture (LEA); and a model-based Bayesian admixture analysis method (STRUCTURE). At population-level admixture analyses, the estimate based on the LEA was consistent with that obtained by the WLS method. Both methods showed that the genetic contribution of the indigenous Yakutian cattle in Yakutian-Kholmogory was small (9.6% by the LEA and 14.2% by the WLS method). In the Yakutian-Simmental population, the genetic contribution of the indigenous Yakutian cattle was considerably higher (62.8% by the LEA and 56.9% by the WLS method). Individual-level admixture analyses using STRUCTURE proved to be more informative than the multidimensional scaling analysis (MDSA) based on individual-based genetic distances. Of the 9 Yakutian-Simmental animals studied, 8 showed admixed origin, whereas of the 14 studied Yakutian-Kholmogory animals only 2 showed Yakutian ancestry (>5%). The mean posterior distributions of individual admixture coefficient (q) varied greatly among the samples in both hybrid populations. This study revealed a minor existing contribution of the Yakutian cattle in the Yakutian-Kholmogory hybrid population, but in the Yakutian-Simmental hybrid population, a major genetic contribution of the Yakutian cattle was seen. The results reflect the different crossbreeding patterns used in the development of the two hybrid populations. Additionally, molecular evidence for differences among individual admixture proportions was seen in both hybrid populations, resulting from the stochastic process in crossing over generations.

CA 72-4 참고치 설정에 관한 연구 (A Study on Establishment of Reference Value of CA 72-4)

  • 안재석;김지나;조예지;윤상혁;김윤철
    • 핵의학기술
    • /
    • 제25권2호
    • /
    • pp.25-28
    • /
    • 2021
  • CA 72-4는 두 종류의 단일클론항체 CC49와 B72.3을 사용하여 혈청 내 종양관련단백인 TAG-72(tumor associated glycoprotein 72)를 측정 하여 결과를 나타내는 종양표지자이다. CA 72-4는 위암, 난소암, 췌장암등의 진단에 사용되고 있으며 특히 위암에 높은 특이도를 나타내는 것으로 알려져 있다. 본 연구는 CA 72-4의 참고치 재검증을 통하여 제조사에서 제공하는 참고치를 재평가 하고, 나아가 임상에서 보다 정확한 진단을 내리는데 유용한 도움을 주고자 진행하였다. 2020년 11월 국립암센터 건강검진센터에서 건강검진을 진행한 환자 271명을 대상으로 하였다. 대상자의 성별은 남자 140명 여자 131명 이었고, 30대부터 60대까지의 환자를 대상으로 진행하였다. 시약은 CA 72-4 IRMA KIT (ISOTOPES, Hungary)를 사용하였고, 감마카운터는 Dream Gamma-10(신진메딕스, Korea)을 사용하여 측정하였다. 종양표지자 참고치 설정 시 주로 사용하는 Hoffmann 법과 Bayesian 법으로 통계처리 하였다. 대상자 271명의 CA72-4를 측정한 결과 평균(Mean, M)값은 4.54 U/mL 이었고 중앙값(Median)은 3.30 U/mL 이었다. 3SD(standard deviation)를 벗어난 24명의 값을 제외하고 측정한 결과 M값은 3.53 U/mL, 중앙값은 3.00 U/mL, SD는 1.89 이었다. 이 값을 토대로 계산한 참고치 값은 7.31 U/mL 이었다. 제조사에서 제공되는 참고치는 4 U/mL 이하이며 이것은 본 연구에서 계산되어진 값인 7.31 U/mL과는 다소 차이가 있어 검사실 환경에 맞게 참고치 재설정이 필요해 보인다. 현재 국립암센터 위암센터에서는 지속적으로 현재 사용하고 있는 참고치에 관하여 문의가 오고 있다. 이번에 진행된 연구와 더불어 추가적인 연구를 진행한다면 보다 정확한 참고치 설정이 가능할 것이다.

신경망 모형을 이용한 태풍시기의 남해안 기압예측 연구 (Study on the Sea Level Pressure Prediction of Typhoon Period in South Coast of the Korean Peninsula Using the Neural Networks)

  • 박종길;김병수;정우식;서장원;손용희;이대근;김은별
    • 대기
    • /
    • 제16권1호
    • /
    • pp.19-31
    • /
    • 2006
  • The purpose of this study is to develop the statistical model to predict sea level pressure of typhoon period in south coast of the Korean Peninsula. Seven typhoons, which struck south coast of the Korean Peninsula, are selected for this study, and the data for analysis include the central pressure and location of typhoon, and sea level pressure and location of 19 observing site. Models employed in this study are the first order regression, the second order regression and the neural network. The dependent variable of each model is a 3-hr interval sea level pressure at each station. The cause variables are the central pressure of typhoon, distance between typhoon center and observing site, and sea level pressure of 3 hrs before, whereas the indicative variable reveals whether it is before or after typhoon passing. The data are classified into two groups - one is the full data obtained during typhoon period and the other is the data that sea level pressure is less than 1000 hPa. The stepwise selection method is used in the regression model while the node number is selected in the neural network by the Schwarz's Bayesian Criterion. The performance of each model is compared in terms of the root-mean square error. It turns out that the neural network shows better performance than other models, and the case using the full data produces similar or better results than the case using the other data.