• 제목/요약/키워드: confidence probability

검색결과 314건 처리시간 0.02초

로버스트 회귀추정에 의한 신뢰구간 구축 (On Confidence Intervals of Robust Regression Estimators)

  • 이동희;박유성;김기환
    • 응용통계연구
    • /
    • 제19권1호
    • /
    • pp.97-110
    • /
    • 2006
  • 대부분의 자료는 여러가지 원인으로 인한 특이치로 오염되어 있으며, 이러한 상황에서 신뢰성 있는 추정량을 얻어내고 이에 대한 통계적 추론을 시행하는 것은 중요한 문제이다. 그러나 이제까지 제안된 로버스트 회귀추정량들은 계산상의 어려움과 정규오차모형에서 최소제곱추정량에 비하여 떨어지는 효율성때문에 통계적 추론의 정확성을 확신할 수 없었다. 최근 제안된 Lee(2004)의 가중자기조율회귀추정량(weighted self-tuning estimator, WSTE)은 다른 로버스트 회귀추정량에 비하여 정확한 계산과정과 그에 따른 추정량의 점근적 정규성 및 고붕괴점을 갖는다. 그러나 통계적 추론을 위하여 이제까지 널리 사용해왔던 로버스트 추정량에 기반한 가중최소제곱추정방법(weighted least squares estimator)은 WSTE에서조차 정규오차모형하에서 최소제곱추정량과 동일한 수준의 효율성을 제공해주지 는 못한다. 본 논문에서는 WSTE에 기반한 또다른 통계적 추론 방법을 제안하고, 이 방법을 사용함으로써 정규오차모형 및 대표본에서 보다 정확한 결과를 얻을 수 있음을 몬테칼로 모의실험을 통해 제시하였다.

연관규칙 분석을 통한 ESG 우려사안 키워드 도출에 관한 연구 (A Study on the Keyword Extraction for ESG Controversies Through Association Rule Mining)

  • 안태욱;이희승;이준서
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제30권1호
    • /
    • pp.123-149
    • /
    • 2021
  • Purpose The purpose of this study is to define the anti-ESG activities of companies recognized by media by reflecting ESG recently attracted attention. This study extracts keywords for ESG controversies through association rule mining. Design/methodology/approach A research framework is designed to extract keywords for ESG controversies as follows: 1) From DeepSearch DB, we collect 23,837 articles on anti-ESG activities exposed to 130 media from 2013 to 2018 of 294 listed companies with ESG ratings 2) We set keywords related to environment, social, and governance, and delete or merge them with other keywords based on the support, confidence, and lift derived from association rule mining. 3) We illustrate the importance of keywords and the relevance between keywords through density, degree centrality, and closeness centrality on network analysis. Findings We identify a total of 26 keywords for ESG controversies. 'Gapjil' records the highest frequency, followed by 'corruption', 'bribery', and 'collusion'. Out of the 26 keywords, 16 are related to governance, 8 to social, and 2 to environment. The keywords ranked high are mostly related to the responsibility of shareholders within corporate governance. ESG controversies associated with social issues are often related to unfair trade. As a result of confidence analysis, the keywords related to social and governance are clustered and the probability of mutual occurrence between keywords is high within each group. In particular, in the case of "owner's arrest", it is caused by "bribery" and "misappropriation" with an 80% confidence level. The result of network analysis shows that 'corruption' is located in the center, which is the most likely to occur alone, and is highly related to 'breach of duty', 'embezzlement', and 'bribery'.

통계적 추정에 관한 예비 수학교사들과 고등학생들의 오개념 비교 분석 (A Comparative Study on Misconception about Statistical Estimation that Future Math Teachers and High School Students have)

  • 한가희;전영주
    • 한국학교수학회논문집
    • /
    • 제21권3호
    • /
    • pp.247-266
    • /
    • 2018
  • 본 연구에서는 선행연구를 바탕으로 통계적 추정에서 반드시 알아야 할 개념으로 '신뢰구간 및 신뢰도의 의미, 표본평균의 분포와 모평균 추정의 연결, 신뢰구간을 구성하는 요소간의 관계' 3개를 추출하였다. 이를 바탕으로 예비 수학교사들과 고등학생들의 통계적 추정에 대한 태도는 어떠한지, 예비 수학 교사들과 고등학생들의 통계적 추정에 관한 오개념의 인식에 차이가 있는지에 대한 연구문제를 설정하였다. 그 결과 첫째, 통계적 추정 단원에서는 신뢰구간 등을 계산하는 방법 뿐 아니라 그 결과의 의미를 문맥 안에서 해석하는 것 또한 강조되어야 한다. 둘째, 모평균의 추정 단원에서는 주변에서 흔히 볼 수 있는 뉴스나 신문 자료에 나타난 모평균 추정 결과를 해석하는 방법 또한 지도되어야 한다. 셋째, 통계적 추정 단원에서 학생들이 흔히 갖는 오개념에 관한 지식, 통계적 추정의 개념을 효과적으로 지도할 수 있는 방안 등에 대한 현직교사나 예비교사를 대상으로 한 전문성 신장 프로그램이 요구된다는 결론과 시사점을 얻었다.

가설검정과 신뢰구간의 재현성 (Reproducibility of Hypothesis Testing and Confidence Interval)

  • 허명회
    • 응용통계연구
    • /
    • 제27권4호
    • /
    • pp.645-653
    • /
    • 2014
  • p-값은 관측 표본과 관측 결과보다 심하게 대안가설의 방향으로 영가설을 이탈하는 표본들이 영가설 하에서 갖는 확률이다. p-값이 일정 ${\alpha}$(= 0:05)보다 작게 나타나면 연구자는 대안가설이 지지된 것으로 본다. 그런 경우라고 하더라도 그의 가설이 향후 연구에서 번복될 수 있는데 그 이유는 p-값이 표본에 따라 변동하는 통계량이기 때문이다. Boos와 Stefanski (2011)는 붓스트랩 방법으로 p-값의 예측분포를 구할 수 있음을 보였다. 그들은 그 분포의 상위 10-20% 분위수가 ${\alpha}$보다 작은가를 확인할 필요가 있음을 강조한다. 만약 그렇지 않은 경우에는 "지지"된 가설의 재현성이 문제될 수 있기 때문이다. 가설검정에서 일정 수준의 재현율을 확보하기 위해서는 표본의 증대가 요구된다. 이 연구는 k배 확대 붓스트랩 표본추출(boosted bootstrap sampling)로써 필요한 표본크기를 계산할 수 있음을 두 표본의 비교와 다중선형회귀의 수치 예에서 보인다. k 값을 정하기 위해서는 몇 차례 시행착오를 해야 하지만 계산적 부담은 크지 않다. 95% 신뢰구간은 독립적인 표본들로부터 같은 방식으로 산출되는 구간이 미지의 모수를 포함할 확률이 95%가 되도록 설정된다. 이 연구는 한 관측표본으로부터 얻어진 95% 신뢰구간 내 개별 점이 미래 연구의 신뢰구간에도 포함될 것인지 그 재현성을 붓스트랩 재표본들에서 평가한다. 이 연구는 개별 점에서 산출한 신뢰구간 재현율을 그래프로 보인다.

정규화 신뢰도를 이용한 핵심어 검출 성능향상 (Improvement of Keyword Spotting Performance Using Normalized Confidence Measure)

  • 김철;이경록;김진영;최승호;최승호
    • 한국음향학회지
    • /
    • 제21권4호
    • /
    • pp.380-386
    • /
    • 2002
  • Rahim의 논문 (M.G. Rahim, et al., PROC. of ICASSP96, 1996)과 같은 기존의 후처리 방법은 음소 모델과 반모델 (anti-model)의 유사도를 이용하여 음소 단위 신뢰도를 계산하고, 이들의 평균을 단어 단위 신뢰도로 정의한다. 그런데 음소단위의 신뢰도가 동일한 확률밀도함수를 갖는 것이 아니기 때문에 특정단어의 경우 계산된 신뢰도는 대체로 낮은 값을 갖는다. 이를 극복하기 위한 방법으로서, 본 논문에서는 기존의 신뢰도를 통계적으로 정규화한 신뢰도를 제안한다. 즉 음소단위의 신뢰도가 가우시안 분포를 갖는다고 가정한 후 트라이 폰(sri-phone) 단위로 정규화하여 동일한 정규분포를 갖도록 한다. 본 논문에서는 제안된 방법의 검증을 위하여 문맥종속 핵심어 모델과 문맥독립 필러 모델을 이용한 일반적인 핵심어 검출기를 사용하였다. 실험결과 제안된 정규화 신뢰도 (NCM: Normalized Confidence Measure)가 불검출율 (WDR: Missed Detection Rate) 8%정도에서 오검출율 (PAR: false alarm rate)을 0.44에서 0.33 FA/KW/HR (false alarm/keyword/hour)로 저하시켰다. 이것은 오검출율에서 성능이 25% 향상된 것이다.

소 질병 검출을 위한 혈청학적 검사의 민감도 평가 (Sensitivity analysis of serological tests for detection of disease in cattle)

  • 이상진;문운경;박선일
    • 대한수의학회지
    • /
    • 제50권1호
    • /
    • pp.43-48
    • /
    • 2010
  • Animal disease surveillance system, defined as the continuous investigation of a given population to detect the occurrence of disease or infection for control purposes, has been key roles to assess the health status of an animal population and, more recently, in international trade of animal and animal products with regard to risk assessment. Especially, for a system aiming to determine whether or not a disease is present in a population sensitivity of the system should be maintained high enough not to miss an infected animal. Therefore, when planning the implementation of surveillance system a number of factors that affecting surveillance sensitivity should be taken into account. Of these parameters sample size is of important, and different approaches are used to calculate sample size, usually depending on the objective of surveillance systems. The purpose of this study was to evaluate the sensitivity of the current national serological surveillance programs for four selected bovine diseases assuming a specified sampling plan, to examine factors affecting the probability of detection, and to provide sample sizes required for achieving surveillance goal of detecting at least an infection in a given population. Our results showed that, for example, detecting low level of prevalence (0.2% for bovine tuberculosis) requires selection of all animals per typical Korean cattle farm (n = 17), and thus risk-based target surveillance for high risk groups can be an alternative strategy to increase sensitivity while not increasing overall sampling efforts. The minimum sample size required for detecting at least one positive animal was sharply increased as the disease prevalence is low. More importantly, high reliability of prevalence estimation was expected with increased sampling fraction even when zero-infected animal was identified. The effect of sample size is also discussed in terms of the maximum prevalence when zero-infected animals were identified and on the probability of failure to detect an infection. We suggest that for many serological surveillance systems, diagnostic performance of the testing method, sample size, prevalence, population size, and statistical confidence need to be considered to correctly interpret results of the system.

내진여유도 평가를 위한 부석기준지진동(RLGM) 평가 연구 (A Study on Review-Level Ground Motion For Seismic Margin Assessment)

  • 연관희;이종림
    • 한국지진공학회:학술대회논문집
    • /
    • 한국지진공학회 2000년도 춘계 학술발표회 논문집 Proceedings of EESK Conference-Spring
    • /
    • pp.97-104
    • /
    • 2000
  • Evaluating a Review-Level Ground Motion is a key to efficiently perform Seismic Margin Assessment of nuclear power plants whose purpose is to determine a ground motion level for which a plant has high-confidence-of-a-low-probability of seismic-induced core damage and to identify any weaker-link components. In this study a method to obtain RLGMs is reviewed which is recommended by Electric Power Research Institute and implemented to be applied to Limerick site in eastern and central U. S as a case study. This method provides reasonable and site-specific RLGMs as minimum required plant HCLPF for SMA that meet a target mean seismic core-damage frequency based on seismic hazard results and generic values of uncertainty and randomness parameters of the core-damage fragility curves. In addition high-frequency RLGM is justifiably modified to reflect the increased seismic capacity of high-frequency components and spatial variation and incoherence of input ground motion on a basemat of large structures by establishing a method to obtain high0-frequency reduction factors according to EPRI guidelines.

  • PDF

전이 확률 행렬에 의한 웹 사용 예측 모델 (A Web Usage Prediction Model by Transition Probability Matrix)

  • 김영희;김응모;정명숙;강우준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.31-33
    • /
    • 2004
  • 웹 사용에 대한 다음 요구 사항을 예측하기 위한 마이닝 방법으로 연관규칙이나 순차 패턴 등이 많이 사용되고 있지만, 이러한 방법들은 생성된 규칙들의 지지도(Support)나 신뢰도(Confidence)에 의한 예측만을 고려하기 때문에 정확한 예측을 하기 어려운 단점을 가지고 있다. 따라서, 본 논문에서는 빈도 수에 의한 Markov model을 기반으로 하여 웹 로그 파일에 저장된 사용자들의 행동 패턴에 따라 생성되어지는 여러 형태의 규칙 유형을 찾아내고, 사용 빈도 수를 이용한 전이 확률 행렬에 따른 다음 요구사항을 정확하게 예측할 수 있는 모델을 제시하고자 한다. 그 결과 여러 형태의 규칙 유형을 $K^{th}$ -order Markov 과정에서 효율적으로 발견해 낼 수 있다.

  • PDF

Impact study for multi-girder bridge based on correlated road roughness

  • Liu, Chunhua;Wang, Ton-Lo;Huang, Dongzhou
    • Structural Engineering and Mechanics
    • /
    • 제11권3호
    • /
    • pp.259-272
    • /
    • 2001
  • The impact behavior of a multigirder concrete bridge under single and multiple moving vehicles is studied based on correlated road surface characteristics. The bridge structure is modeled as grillage beam system. A 3D nonlinear vehicle model with eleven degrees of freedom is utilized according to the HS20-44 truck design loading in the American Association of State Highway and Transportation Officials (AASHTO) specifications. A triangle correlation model is introduced to generate four classes of longitudinal road surface roughness as multi-correlated random processes along deck transverse direction. On the basis of a correlation length of approximately half the bridge width, the upper limits of impact factors obtained under confidence level of 95 percent and side-by-side three-truck loading provide probability-based evidence for the evaluation of AASHTO specifications. The analytical results indicate that a better transverse correlation among road surface roughness generally leads to slightly higher impact factors. Suggestions are made for the routine maintenance of this type of highway bridges.

coaxing 효과가 피로한도에 미치는 영향에 관한 연구

  • 이종형;유덕상;송득중
    • 한국산업융합학회 논문집
    • /
    • 제5권1호
    • /
    • pp.3-9
    • /
    • 2002
  • In the field of design of mechanical structure and expectation of life time, characteristic of fatigue limit comes out to he the most important problem. In this paper, in order to get fatigue limit, (I) investigate the aspects of economy, time and confidence comparing two methods: the method by fracture probability introducing statistical conception and the staircase method. And (II) examine the experience approaching fatigue limit and coaxing effect. The value of fatigue limit by staircase method in very effective in view of practical use, and coaxing comes out by the same material effect as restraining crack progress, not as strengthening the tip of crack alone.

  • PDF