• Title/Summary/Keyword: 인과확률

Search Result 84, Processing Time 0.023 seconds

Proposition of causally confirmed measures in association rule mining (인과적 확인 측도에 의한 연관성 규칙 탐색)

  • Park, Hee Chang
    • Journal of the Korean Data and Information Science Society
    • /
    • v.25 no.4
    • /
    • pp.857-868
    • /
    • 2014
  • Data mining is the representative analysis methodology in the era of big data, and is the process to analyze a massive volume database and summarize it into meaningful information. Association rule technique finds the relationship among several items in huge database using the interestingness measures such as support, confidence, lift, etc. But these interestingness measures cannot be used to establish a causality relationship between antecedent and consequent item sets. Moreover, we can not know association direction by them. This paper propose causally confirmed association thresholds to compensate for these problems, and then check the three conditions of interestingness measures. The comparative studies with basic association thresholds, causal association thresholds, and causally confirmed association thresholds are shown by simulation studies. The results show that causally confirmed association thresholds are better than basic and causal association thresholds.

저선량 방사선 영향과 발현암의 인과성 문제

  • Lee, Jae-Gi
    • Radioisotope journal
    • /
    • v.15 no.3
    • /
    • pp.78-92
    • /
    • 2000
  • 낮은 선량의 방사선피폭으로 인한 건강 위해의 여부에 대하여 과학적 현황을 고찰하였다. 선량과 영향 사이에 문턱 없는 선형비례 모델(LN-T모델)에 대해 역학적, 수학적, 방사선생물학적 측면의 긍정적 논리와 호메시스, 적응반응, 통계적 관점의 비판적 논거를 대비하여 평가하였다. 방사선 피폭이력자에게 발현한 확률적 영향 특히 백혈병을 포함한 암에 대해 그 질환의 방사선 인과성 판단에 대한 애로와 접근 방향을 논의하였다. 객관적인 평가 지표의 하나로 기인확률(PC)을 적용하되 근로자에 대한 제도적 배려 등 고려할 사항을 논의하였다.

  • PDF

IWRAP모델에 의한 목포대교부근 충돌확률 분석

  • Kim, Gwang-Il;Jeong, Jung-Sik;Park, Gye-Gak
    • Proceedings of the Korean Institute of Navigation and Port Research Conference
    • /
    • 2011.06a
    • /
    • pp.225-226
    • /
    • 2011
  • IALA Waterway Risk Assesment(IWRAP)에서 선박의 충돌확률은 기하학적인 선박의충돌확률(geomatric probability)에 인과관계 확률(causation probability) 곱한 값으로 해당수역의 양적인 충돌확률 평가에 이용되고 있다. 이를 통해 목포대교부근에 통항하는 선박의 선종별 충돌확률 및 입출항 선박 전체 충돌 확률 값을 분석하고자 한다.

  • PDF

Causal Relation Extraction Using Cue Phrases and Lexical Pair Probabilities (단서 구문과 어휘 쌍 확률을 이용한 인과관계 추출)

  • Chang, Du-Seong;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2003.10d
    • /
    • pp.163-169
    • /
    • 2003
  • 현재의 질의응답 시스템은 TREC(Text Retrieval Conference) 질의집합에 대해 최대 80% 정도의 응답 성공률을 보이고 있다. 하지만 질의 유형에 다라 성능의 많은 차이가 있으며, 인과관계에 대한 질의에 대해서는 매우 낮은 응답 성공률을 보이고 있다. 본 연구는 인접한 두 문장 혹은 두 문장 혹은 두 명사구 사이에 존재하는 인과관계를 추출하고자 한다. 기존의 명사구 간 인과관계 추출 연구에서는 인과관계 단서구문과 두 명사구의 의미를 주요한 정보로 사용하였으나, 사전 미등록어가 사용되었을 때 올바른 선택을 하기 어려웠다. 또한, 학습 코퍼스에 대한 인과관계 부착과정이 선행되어야 하며, 다량의 학습자료를 사용하기가 어려웠다. 본 연구에서는 인과관계 명사구 쌍에서 추출된 어휘 쌍을 기존의 단서구문과 같이 사용하는 방법을 제안한다. 인과관계 분류를 위해 나이브 베이즈 분류기를 사용하였으며, 비지도식 학습과정을 사용하였다. 제안된 분류 모델은 기존의 분류 모델과 달리 사전 미등록어에 의한 성능 저하가 없으며, 학습 코퍼스의 인과관계 분류 작업이 선행될 필요 없다. 문장 내 명사구간의 인과관계 추출 실험 결과 79.07%의 정확도를 얻었다. 이러한 결과는 단서구문과 명사구 의미를 이용한 방법에 비해 6.32% 향상된 결과이며, 지도식 학습방식을 통해 얻은 방법과 유사한 결과이다. 또한 제안된 학습 및 분류 모델은 문장간의 인과관계 추출에도 적용가능하며, 한국어에서 인접한 두 문장간의 인과관계 추출 실험에서 74.68%의 정확도를 보였다.

  • PDF

Term Clustering based on Causal Context Information (인과관계 문맥정보를 사용한 용어 군집화 연구)

  • Chang, Du-Seong;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2004.10d
    • /
    • pp.25-31
    • /
    • 2004
  • 단서구문 및 어휘 쌍 확률 등을 이용하면 일정한 영역의 문서에서 사용된 용어의 원인이 되거나 결과를 나타나는 관련어들을 찾을 수 있다. 본 논문에서는 이러한 각 용어의 선행 원인과 후행 결과를 인과관계 정보라고 정의한다. 인과관계 정보가 유사한 용어들은 서로 유사한 개념에 속한다고 가정한다면, 용어의 직/간접적 인과관계로서 용어 온톨로지에서 그 용어가 속할 집합을 결정하는데 도움을 줄 수 있다. 본 논문에서는 각 용어의 인과관계가 용어 군집화를 위한 유용한 문맥 정보의 하나라는 것을 실험을 통해 증명하였다. 속성으로 사용된 인과관계는 대용량의 코퍼스로부터 비지도식 학습방법을 통해 자동 습득하였으며, 그 정확도는 74.84%를 보였다. 1659개 용어에 대한 군집화 실험 결과 70.02%의 정확도를 보였으며, 어휘 유사도만을 사용한 경우에 비해 32.9%의 적용도 향상을 보였다.

  • PDF

A Test for Nonlinear Causality and Its Application to Money, Production and Prices (통화(通貨)·생산(生産)·물가(物價)의 비선형인과관계(非線型因果關係) 검정(檢定))

  • Baek, Ehung-gi
    • KDI Journal of Economic Policy
    • /
    • v.13 no.4
    • /
    • pp.117-140
    • /
    • 1991
  • The purpose of this paper is primarily to introduce a nonparametric statistical tool developed by Baek and Brock to detect a unidirectional causal ordering between two economic variables and apply it to interesting macroeconomic relationships among money, production and prices. It can be applied to any other causal structure, for instance, defense spending and economic performance, stock market index and market interest rates etc. A key building block of the test for nonlinear Granger causality used in this paper is the correlation. The main emphasis is put on nonlinear causal structure rather than a linear one because the conventional F-test provides high power against the linear causal relationship. Based on asymptotic normality of our test statistic, the nonlinear causality test is finally derived. Size of the test is reported for some parameters. When it is applied to a money, production and prices model, some evidences of nonlinear causality are found by the corrected size of the test. For instance, nonlinear causal relationships between production and prices are demonstrated in both directions, however, these results were ignored by the conventional F-test. A similar results between money and prices are obtained at high lag variables.

  • PDF

Causal Effects Along Transitive Causal Routes: Reconsidering Two Concepts of Effects Founded on Structural Equation Model (이행적 인과 경로를 통한 원인 효과에 대한 해명: 구조 방정식에 토대한 인과 모형의 원인 효과 개념에 대한 평가와 대안)

  • Kim, Joonsung
    • Korean Journal of Logic
    • /
    • v.18 no.1
    • /
    • pp.83-133
    • /
    • 2015
  • In this paper, I pose a problem for Hitchcock's arguments for two concepts of effects that are intended to explicate double causal effects, and put forth a theory that is intended not just to meet the problem but also to accommodate Hitchcock's theory and Eells' theory both. First, I introduce an example of dual causal effects, and examine the accounts of Otte(1985) and Eells(1987) on how to explicate the dual effects. I show that their accounts of the dual effects help us understand the problem of dual effects and see how different it is for Cartwright(1979, 1989, 1995), Eells(1991, 1995), and Hitchcock(2001a) to meet the problem. Second, I introduce two concepts of effects on Hitchcock(2001a), that is, net effect and component effect that are allegedly analogous to two effects of structural equation model. Third, I reveal the significance of homogeneous subpopulation and causal interaction regarding the problem of dual effects while examining Cartwright's theory and Elles' theory. Fourth, I critically examine the two concepts of effects on Hitchcock and argue against Hitchcock's criticism of Eells' theory. Fifth, I take a moderator variable of structural equation model and a moderator effect into the probabilistic theory of causality, and formally generalize causal interaction due to the dual effects in terms of disjunctive relation and counterfactual conditionals. I expect my account of disjunctive relation and counterfactual conditionals to contribute not just to several problems the received theories of causal modelling confront but also to the structural equation models many people exploit as a promising statistical methodology.

  • PDF

Proving Causation With Epidemiological Evidence in Tobacco Lawsuits (담배소송에서 역학적 증거에 의한 인과관계의 증명에 관한 소고)

  • Lee, Sun Goo
    • Journal of Preventive Medicine and Public Health
    • /
    • v.49 no.2
    • /
    • pp.80-96
    • /
    • 2016
  • Recently, a series of lawsuits were filed in Korea claiming tort liability against tobacco companies. The Supreme Court has already issued decisions in some cases, while others are still pending. The primary issue in these cases is whether the epidemiological evidence submitted by the plaintiffs clearly proves the causal relationship between smoking and disease as required by civil law. Proving causation is difficult in tobacco lawsuits because factors other than smoking are involved in the development of a disease, and also because of the lapse of time between smoking and the manifestation of the disease. The Supreme Court (Supreme Court Decision, 2011Da22092, April 10, 2014) has imposed some limitations on using epidemiological evidence to prove causation in tobacco lawsuits filed by smokers and their family members, but these limitations should be reconsidered. First, the Court stated that a disease can be categorized as specific or non-specific, and for each disease type, causation can be proven by different types of evidence. However, the concept of specific diseases is not compatible with multifactor theory, which is generally accepted in the field of public health. Second, when the epidemiological association between the disease and the risk factor is proven to be significant, imposing additional burdens of proof on the plaintiff may considerably limit the plaintiff's right to recovery, but the Court required the plaintiffs to provide additional information such as health condition and lifestyle. Third, the Supreme Court is not giving greater weight to the evidential value of epidemiological study results because the Court focuses on the fact that these studies were group-level, not individual-level. However, group-level studies could still offer valuable information about individual members of the group, e.g., probability of causation.

The Evaluation Of Creditability Of Interest Spread On Business Cycle (금리 스프레드의 경기예측력 평가)

  • Chi, Ho-Joon;Park, Sang-Kyu
    • The Korean Journal of Financial Management
    • /
    • v.19 no.2
    • /
    • pp.233-251
    • /
    • 2002
  • 본 연구는 우리나라를 대상으로 장단기 스프레드와 신용스프레드가 경기변동에 대해 어떠한 예측력을 갖고 있는가를 살펴보았다. 이를 위해 1991년부터 2001년까지를 분석기간으로 하여 Probit 분석을 통해 금리스프레드와 경기변동과의 시차 및 불황확률을 추정하여 평가해 보았으며, 인과관계 검정을 시도해 보았다. 우선 금리스프레드와 경기변동에 대한 불황확률을 알아보기 위해서 Probit 모형을 이용하여 불황확률을 추정하였다. 그 결과 장단기 금리스프레드 중에서는 5년 만기 1종 국민주택채권수익률-콜금리(HCS)는 3개월, 5년 만기 1종 국민주택채권수익률-1년 만기 금융채수익률(HGS)은 7개월, 5년 만기 1종 국민주택채권수익률-1년 만기 통안증권수익률(HMS)은 9개월의 시차를 보이는 경우가 Pseudo $R^2$ 값이 가장 높게 나타났지만 불황확률을 토대로 경기 호황과 불황 국면을 비교해 본 결과 HMS는 Pseudo $R^2$의 값도 상대적으로 높았을 뿐만 아니라 매우 높은 경기변동 예측력을 보여주었다. HCS와 HGS의 경우에는 IMF 체제 전후의 불황기와 그 이후에 도래한 호황기는 예측력이 높게 나타났으나 1990년대 초반에는 제대로 불황확률을 예측하지 못하는 것으로 나타났다. 또한 3년 만기 회사채수익률-5년 만기 국민주택채권수익률(CHS)와 3년 만기회사채수익률 -3년 만기 금융채수익률(CGS)로 나타낸 신용 스프레드에서는 유의적인 결과를 도출하지는 못하였다. 한편 인과관계에서도 HCS, HGS, HMS 등의 장단기 스프레드는 경기변동에 대하여 일방적 원인변수로 작용하는 것으로 나타나 선행결합관계를 보여주었으나 CHS, CGS 등의 신용스프레드는 경기변동과 어떠한 유의적인 결합관계도 보여주지 못하였다. 따라서 장단기 스프레드는 경기변동을 예측하는데 유용한 정보를 제공하지만 신용스프레드는 경기변동을 예측하는데 도움을 주지 못하는 것으로 나타났다.

  • PDF

A Quantitative Collision Probability Analysis in Port Waterway (항만수로의 정량적인 충돌확률 분석)

  • Jeong, Jung-Sik;Kim, Kwang-Il;Park, Gyei-Kark
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.22 no.3
    • /
    • pp.373-378
    • /
    • 2012
  • In terms of the maritime accident prevention, risk analysis at targeted warterways is important for planning safety waterways. This paper analyzes the maritime accidents probability in the Mokpo waterways, South Korea, based on the IWRAP(IALA Waterway Risk Assessment) of the quantitative accident probability tool. Vessel collision probability cate is calculated by vessels meeting direction, using IWRAP. This paper contribute to advance improvement of vessel traffic service by VTS sector providing vessel fairway risk data.