• Title/Summary/Keyword: 조건부 독립성

Search Result 37, Processing Time 0.029 seconds

A Study on Mante1-Haenszel Test of Conditional Independence ($2\times2$ 분할표를 이용한 조건부 독립성 검정)

  • 김지현;임현선
    • The Korean Journal of Applied Statistics
    • /
    • v.11 no.2
    • /
    • pp.257-268
    • /
    • 1998
  • Many epidemiological studies investigate whether an association exists between a binary risk factor X and a binary response variable Y. They analyse whether an observed association between X and Y persists when the level of another factor Z that might influence the association is controlled. This involves testing conditional independence of X and Y controlling for Z. The Mantel-Haenszel test is most widely used to test conditional independence for sparse tables. But if the association between X and Y varies along the levels of Z, Mantel-Haenszel test has a low power problem. In this study, we propose an alternative test procedure which overcomes the low power problem in that case. We find out the null distribution of the alternative test statistic and compare its performance with the Mantel-Haenszel test by simulation.

  • PDF

Determination of the Group of Classifiers by Minimizing the Conditional Entropy (조건부 엔트로피의 최소화를 통하여 인식기의 집합을 결정하는 방법)

  • Kang, Hee-Joong
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2008.06c
    • /
    • pp.569-573
    • /
    • 2008
  • 패턴인식 문제를 다루는 연구에서 인식 성능을 향상시키고자 베이스 에러율의 상한인 조건부 엔트로피를 응용하는 시도가 있었다. 본 논문에서는 다수의 인식기로 구성된 다수 인식기 시스템이 우수한 성능을 보이도록 인식기의 집합을 결정하는 문제에서 이러한 조건부 엔트로피의 최소화를 통하여 시도한 방법과 다른 방법들을 간단하고 분명한 예제를 통하여 비교, 분석해 보았다. 다수 인식기의 결합 방법으로 대표적인 투표 기법과 조건부 독립 가정의 베이지안 기법을 사용하였으며, 조건부 엔트로피의 최소화를 통하여 인식기의 집합을 결정하는 방법에 대한 유용성을 확인할 수 있었다.

  • PDF

Semantic analysis of the independency concepts in the probability (확률에서 독립성 개념의 의미 분석)

  • Yoo, Yoon-Jae
    • The Mathematical Education
    • /
    • v.48 no.3
    • /
    • pp.353-358
    • /
    • 2009
  • The article discusses the independence concept occurring in the learning of probability. The author does not distinguishes the independence in the events from the independence in the trials. Instead, the author suggests the physico-empirical independence and the logico-mathematical independence to distinguish between the two concepts.

  • PDF

Independence tests using coin package in R (coin 패키지를 이용한 독립성 검정)

  • Kim, Jinheum;Lee, Jung-Dong
    • Journal of the Korean Data and Information Science Society
    • /
    • v.25 no.5
    • /
    • pp.1039-1055
    • /
    • 2014
  • The distribution of a test statistic under a null hypothesis depends on the unknown distribution of the data and thus is unknown as well. Conditional tests replace the unknown null distribution by the conditional null distribution, that is, the distribution of the test statistic given the observed data. This approach is known as permutation tests and was developed by Fisher (Fisher, 1935). Theoretical framework for permutation tests was given by Strasser and Weber(1999). The coin package developed by Hothon et al. (2006, 2008) implements a unified approach for conditional inference via the generic independence test. Because convenient functions for the most prominent problems are available, users will not have to use the extremely flexible procedure. In this article we briefly review the underlying theory from Strasser and Weber (1999) and explain how to transform the data to perform the generic function independence test. Finally it was illustrated with a few real data sets.

Comparison of model selection criteria in graphical LASSO (그래프 LASSO에서 모형선택기준의 비교)

  • Ahn, Hyeongseok;Park, Changyi
    • Journal of the Korean Data and Information Science Society
    • /
    • v.25 no.4
    • /
    • pp.881-891
    • /
    • 2014
  • Graphical models can be used as an intuitive tool for modeling a complex stochastic system with a large number of variables related each other because the conditional independence between random variables can be visualized as a network. Graphical least absolute shrinkage and selection operator (LASSO) is considered to be effective in avoiding overfitting in the estimation of Gaussian graphical models for high dimensional data. In this paper, we consider the model selection problem in graphical LASSO. Particularly, we compare various model selection criteria via simulations and analyze a real financial data set.

Study for independence of hits in professional baseball games (프로야구 경기에서 안타의 독립성에 대한 연구)

  • Kim, Byungsoo;Park, Youngwook;Jang, Nayoung
    • Journal of the Korean Data and Information Science Society
    • /
    • v.24 no.6
    • /
    • pp.1421-1428
    • /
    • 2013
  • In this paper, we would like to test whether the hit at a particular bat has a dependency with the hitting results at the previous bats in professional baseball games. For this purpose, we used the 2011 Korean Baseball League data. We find out that the hitting percentage at a particular bat has no dependency with the hit at the previous bat, after reviewing the conditional probability of hit at each bat and the lift. From the independence test of hits at consecutive bats, and hit at a particular bat with no hits at previous bats, we can conclude that hits at particular bats are not dependent on the hits at previous bats in most cases. Hence, we can safely conclude that a hit at a particular bat is statistically independent from the hits at the previous bats.

A Stratified and Two Sample Stratified Conditional Unrelated Question Model (층화 및 층화 이표본 조건부 무관질문모형)

  • Lee, Gi-Sung
    • Journal of the Korean Data Analysis Society
    • /
    • v.20 no.6
    • /
    • pp.2883-2893
    • /
    • 2018
  • We suggest a stratified conditional unrelated question randomized response model to more efficiently estimate a sensitive character A when the population is composed of several strata. In that model, only the respondents who answered "yes" through randomization device which was consisted of a less sensitive character B and a question forcing to answer "yes" respond to our suggested model and we deal with two allocation problems of proportional allocation and optimal one. We expand the suggested model into two sample stratified conditional unrelated question model to cover the case of unknowing unrelated character and deduce minimal variance through optimal sample size of stratum h. Finally, we show that the suggested model is more efficiency than stratified unrelated models and the stratified Carr et al.'s model (1982) under some given conditions, and show numerically that the smaller the values ${\pi}_{h2}$ and ${\pi}_{hy}$, the more efficiency the fit of the model.

Formulating the Landscape Preference Model Using a Mixed Conditional Logit (조건부 로짓함수를 이용한 경관선호 모델: 지리산 국립공원 방문자를 대상으로)

  • Lee, Deokjae
    • Journal of Korean Society of Forest Science
    • /
    • v.95 no.6
    • /
    • pp.768-777
    • /
    • 2006
  • The purpose of this study lies in formulating the landscape preference model using a conditional logit that involves the effect of visual elements as well as landscape itself on landscape preferences. To measure landscape preferences, a photo-questionnaire composed of paired photographs of the Cairngorms National Park of Scotland and the Jirisan National Park of Korea was distributed to visitors to the Jirisan National Park of Korea. Visual elements of landscape quantitatively measured by photogrammetry were reduced to orthogonal principal components that were subsequently used as explanatory variables in a conditional logit. As a result, the mixed conditional logit including the effect of landscape itself satisfied the Independence of Irrelevant Alternatives (IIA) property and showed reliable goodness of fit (${\rho}^2=0.25$). It was concluded that the mixed conditional logit including the effect of landscape itself was appropriate for landscape preference model rather than usual conditional logit excluding the effect.

A Study on Estimation of Soil Moisture Multiple Quantile Regression Model Using Conditional Merging and MODIS Land Surface Temperature Data (조건부 합성기법과 MODIS LST를 활용한 토양수분 다중분위회귀모형 산정 연구)

  • Jung, Chung Gil;Lee, Ji Wan;Kim, Da Rae;Kim, Se Hun;Kim, Seong Joon
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2018.05a
    • /
    • pp.23-23
    • /
    • 2018
  • 본 연구에서는 다중분위회귀분석모형(Multiple Quantile Regression Model, MQRM)과 MODIS(MODerate resolution Imaging Spectroradiometer) LST (Land Surface Temperature) 자료를 이용하여 전국 공간토양수분을 산정하였다. 공간토양수분을 산정하기 위한 과정은 크게 두가지로 구분된다. 첫 번째로 기존의 MODIS LST 자료를 조건부 합성 보정기법을 적용하여 실측 LST 자료와 비교하여 위성 LST 자료가 갖고 있는 오차를 보정하였다. 그 결과, 조건부 합성 보정기법을 적용하기전 전국 71개 지상관측지점에서 관측한 실측 LST와 MODIS LST의 $R^2$는 전체 평균 0.70으로 어는정도 유의성 있는 상관관계를 나타냈으나 조건부 합성 보정기법을 적용한 후 실측 LST와 MODIS LST의 $R^2$는 전체 평균 0.92로 상당히 크게 향상됨을 알 수 있었다. 두 번째로 보정된 MODIS LST를 이용하여 다중분위회귀분석 모형을 개발하고 토양수분을 예측하는 단계로 입력자료로 위성영상 자료와 관측자료를 융합하여 사용하였다. 위성영상 자료로는 보정된 MODIS LST와 MODIS NDV를 구축하였고 일단위 강수량 및 일조시간의 기상자료는 기상청으로부터 전국 71개 지점에 대해 구축하여 IDW 공간보간기법을 이용한 공간자료로 구축하였다. 토양수분 결과를 비교하기 위한 관측 토양수분은 자동농업기상관측(Automated Agriculture Observing System, AAOS)지점에서 2013년 1월부터 2015년 12월까지의 실측 일단위 토양수분 자료를 구축하여 사용하였다. 다중분위회귀분석 모형은 LST 인자를 중심으로 각각의 분위(0.05, 0.25, 0.5, 0.75, 0.95)에 해당되는 값의 회귀식을 NDVI, 강수 입력자료를 독립인자로서 조합하여 계절 및 토성에 따른 총 80개의 회귀식을 산정하였다. 관측 토양수분과 모의 토양수분을 비교한 결과 $R^2$가 0.70 (철원), 0.90 (춘천), 0.85 (수원), 0.65 (서산), 0.78 (청주), 0.82 (전주), 0.62 (순천), 0.63 (진주), 0.78 (보성)로 높은 상관성을 보였다. 본 연구에서는 다중분위회귀 모형의 성능을 검증하기 위해 기존의 다중선형회귀모형의 결과와 비교하여 크게 개선됨을 나타냈다.

  • PDF

A Study on Estimation of Soil Moisture Multiple Linear Regression Model Using Conditional Merging and MODIS Land Surface Temperature Data (조건부 합성기법과 MODIS LST를 활용한 토양수분 다중선형 회귀모형 산정 연구)

  • Jung, Chung Gil;Lee, Ji Wan;Kim, Da Rae;Kim, Se Hun;Kim, Seong Joon
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.103-104
    • /
    • 2017
  • 본 연구에서는 다중회귀분석모형(MLRM)과 MODIS (MODerate resolution Imaging Spectroradiometer) LST (Land Surface Temperature) 자료를 이용하여 전국 공간토양수분을 산정하였다. 공간토양수분을 산정하기 위한 과정은 크게 두가지로 구분된다. 첫 번째로 기존의 MODIS LST 자료를 조건부 합성 보정기법을 적용하여 실측 LST 자료와 비교하여 위성 LST 자료가 갖고 있는 오차를 보정하였다. 그 결과, 조건부 합성 보정기법을 적용하기전 전국 71개 지상 관측지점에서 관측한 실측 LST와 MODIS LST의 R2는 전체 평균 0.70으로 어는정도 유의성 있는 상관관계를 나타냈으나 조건부 합성 보정기법을 적용한 후 실측 LST와 MODIS LST의 R2는 전체 평균 0.92로 상당히 크게 향상됨을 알 수 있었다. 두 번째로 보정된 MODIS LST를 이용하여 다중회귀분석 모형을 개발하고 토양수분을 예측하는 단계로 입력자료로 위성영상 자료와 관측자료를 융합하여 사용하였다. 위성영상 자료로는 보정된 MODIS LST와 MODIS NDV를 구축하였고 일단위 강수량 및 일조시간의 기상자료는 기상청으로부터 전국 68개 지점에 대해 구축하여 IDW 공간보간기법을 이용한 공간자료로 구축하였다. 토양수분 결과를 비교하기 위한 관측 토양수분은 자동농업기상관측(Automated Agriculture Observing System, AAOS)지점에서 2013년 1월부터 2015년 12월까지의 실측 일단위 토양수분 자료를 구축하여 사용하였다. 다중회귀분석 모형은 각각의 입력자료를 독립인자로서 조합하여 12개의 시나리오를 만들었다. 시공간적 경향을 고려하기 위하여 계절별, 토양 토성(soil texture)를 구분하여 회귀분석을 실시하였다. 관측 토양수분과 모의 토양수분을 비교한 결과 $R^2$가 0.80 (철원), 0.90 (춘천), 0.80 (수원), 0.63 (서산), 0.77 (청주), 0.82 (전주), 0.52 (순천), 0.63 (진주), 0.99 (보성)로 높은 상관성을 보였다. 본 연구에서는 토양수분을 예측하기 위한 인자 중 가장 민간함 LST를 보정하지 않는 토양수분 예측 방법은 상당한 오차를 포함하게 되어 실측 토양수분 결과와 크게 차이가 나타남을 보여주었다.

  • PDF