• Title/Summary/Keyword: 확률.통계적 분석

Search Result 422, Processing Time 0.032 seconds

Design and Implementation of Static Program Analyzer Finding All Buffer Overrun Errors in C Programs (C 프로그램의 버퍼 오버런(buffer overrun) 오류를 찾아 주는 정적 분석기의 설계와 구현)

  • Yi Kwang-Keun;Kim Jae-Whang;Jung Yung-Bum
    • Journal of KIISE:Software and Applications
    • /
    • v.33 no.5
    • /
    • pp.508-524
    • /
    • 2006
  • We present our experience of combining, in a realistic setting, a static analyzer with a statistical analysis. This combination is in order to reduce the inevitable false alarms from a domain-unaware static analyzer. Our analyzer named Airac(Array Index Range Analyzer for C) collects all the true buffer-overrun points in ANSI C programs. The soundness is maintained, and the analysis' cost-accuracy improvement is achieved by techniques that static analysis community has long accumulated. For still inevitable false alarms (e.g. Airac raised 970 buffer-overrun alarms in commercial C programs of 5.3 million lines and 737 among the 970 alarms were false), which are always apt for particular C programs, we use a statistical post analysis. The statistical analysis, given the analysis results (alarms), sifts out probable false alarms and prioritizes true alarms. It estimates the probability of each alarm being true. The probabilities are used in two ways: 1) only the alarms that have true-alarm probabilities higher than a threshold are reported to the user; 2) the alarms are sorted by the probability before reporting, so that the user can check highly probable errors first. In our experiments with Linux kernel sources, if we set the risk of missing true error is about 3 times greater than false alarming, 74.83% of false alarms could be filtered; only 15.17% of false alarms were mixed up until the user observes 50% of the true alarms.

Rainfall Frequency Analysis Considering Change of Trend Slope in Observed Rainfall Intensity (관측강우강도의 경향성 기울기 변화를 고려한 강우빈도 해석)

  • Jang, Sun-Woo;Seo, Lynn;Choi, Min-Ha;Kim, Tae-Woong
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2011.05a
    • /
    • pp.26-30
    • /
    • 2011
  • 최근 기후변화에 따라 강우의 패턴이 변화하고 있다. 강우일수는 줄어드는 반면, 강우강도는 증가하여, 홍수로 인한 많은 피해에 직면하고 있다. 이러한 기상이변은 홍수방어시스템을 위한 수공구조물에도 많은 영향을 미친다. 수공구조물을 설계할 때, 일반적으로 강우 기록들의 통계적 특성이 정상성을 가진다고 가정한다. 하지만 최근의 강우 자료를 분석하면, 시간에 따라 평균, 분산, 왜곡도와 같은 기본 통계량이 변화하는 것을 알 수 있다. 따라서, 수공구조물의 설계를 위한 확률 강우량은 이러한 기후변화에 따른 자료의 특성을 반영할 필요가 있다. 본 연구의 목적은 강우 자료의 비정상성의 특성을 이용하여 확률강우량을 산정하는 것이다. 최근 비정상성 강우빈도해석에 대한 연구가 활발히 진행되고 있는데, 이들 연구는 대부분 목표연도까지 경향성의 기울기가 증가, 또는 일정하다고 가정한다. 하지만, 현재는 경향성이 있지만, 목표연도에는 경향성이 없을 경우도 있고, 또는 경향성이 있어도 그 기울기가 적어지는 경향을 보일 수도 있다. 본 연구에서는 현시점과 목표연도의 시점에 대한 경향성 기울기의 변화를 고려하여 비정상성 강우빈도해석을 수행하였다. 대상지점 선정은 통계적 경향성 검정, Mann-Kendall test를 이용하여 1994년(현재시점)에 경향성이 있다고 판단되는 관측지점을 대상지점으로 선정하였다. 분석 방법은 24시간 임계지속시간의 연최대강우자료를 구축하였다. 자료를 현시점까지 선형회귀식을 이용하여 잔차 계열을 산정하고, Gumbel 분포를 이용하여 확률 잔차를 산정하였다. 확률강우량을 추정하기 위해 추세요소를 산정하였다. 기울기의 증가 혹은 감소 경향을 회귀모형을 이용하여 추세요소를 산정하였고, 잔차의 확률빈도와 추세요소의 합으로 비정상상 확률강우량을 산정하였다.

  • PDF

A Statistical Method for Predicting Recurrent Congestion Time in Urban Freeway (도시고속도로 반복정체 시점의 통계학적 분석방법)

  • Han, Yeong-Jun;Son, Bong-Su;Kim, Won-Gil
    • Journal of Korean Society of Transportation
    • /
    • v.24 no.3 s.89
    • /
    • pp.29-37
    • /
    • 2006
  • As a recurrent congestion of urban freeway occurs in almost same time and section, it is possible to manage the congestion effectively by the expectation and advance correspondence. In the existing traffic management system. we have used pattern data to manage a recurrent congestion. But it is not applicable to an urban freeway which kas various traffic circumstance. In this study, the probability by travel speed using a statistical distribution method will be used to predict the probability of recurrent congestion. It is expected that we can get the point of time and the duration of recurrent congestion, and we can devise an effective advance correspondence and a transportation operation.

Stochastic Demographic and Population Forecasting (확률적 인구추계)

  • Woo, Hae-Bong
    • Korea journal of population studies
    • /
    • v.33 no.1
    • /
    • pp.161-189
    • /
    • 2010
  • Dealing with uncertainty has been a critical issue in demographic and population forecasting since 1980. This study reviews methodological developments in demographic and population forecasting over the last several decades. First, this study reviews the important issue of the uncertainty surrounding demographic forecasts. Several limitations of the traditional scenario approach to dealing with uncertainty are also discussed. Second, in forecasting demographic processes such as mortality, fertility, and migration, three approaches of stochastic forecasting are identified and discussed: expert judgment, statistical modeling, and analysis of historical forecast errors. Finally, this study discusses the current issues and directions for future research in stochastic demographic forecasting.

A Procedure for Statistical Thermal Margin Analysis Using Response Surface Method and Monte Carlo Technique (반응 표면 및 Monte Carlo 방법을 이용한 통계적 열여유도 분석 방법)

  • Hyun Koon Kim;Young Whan Lee;Tae Woon Kim;Soon Heung Chang
    • Nuclear Engineering and Technology
    • /
    • v.18 no.1
    • /
    • pp.38-47
    • /
    • 1986
  • A statistical procedure, which uses response surface method and Monte Carlo simulation technique, is proposed for analyzing the thermal margin of light water reactor core. The statistical thermal margin analysis method performs the best.estimate thermal margin evaluation by the probabilistic treatment of uncertainties of input parameters. This methodology is applied to KNU-1 core thermal margin analysis under the steady state nominal operating condition. Also discussed are the comparisons with conventional deterministic method and Improved Thermal Design Procedure of Westinghouse. It is deduced from this study that the response surface method is useful for performing the statistical thermal margin analysis and that thermal margin improvement is assured through this procedure.

  • PDF

비례위험모형분석을 위한 한글멀콕스(HMULCOX)

  • Lee, Sang-Bok;Park, Eui-Jun
    • Journal of the Korean Data and Information Science Society
    • /
    • v.7 no.1
    • /
    • pp.145-159
    • /
    • 1996
  • 다변량 발병시간자료는 각 개개 환자에게 있어 합병증이 발생되거나 혹은 유사 환자군(집락) 내의 발병시간이 상관되어진 생의학자료에서 흔히 볼 수 있다. HMULCOX는 그런 자료를 분석하기 위한 한글 통계 패키지 가운데 하나이다. 이 프로그램은 관련된 발병시간들이 독립이 아닐때에도 COX 비례 위험 모형의 주변확률분포를 계산해 준다. 주어진 조건으로는 주변확률모형의 기본위험율은 일정한 상수, 흑은 변수라도 관계없다. 또한 치료실패율의 치료변수들(공변량)의 효과에 대해 다양한 통계적 추론이 가능하다. 기본적으로 주변확률분포접근법으로 설계되었지만 HMULCOX는 여러 가지 추론 방법을 선택하는 데 일반적으로 충분하다. 이 프로그램으로 2개의 예를 들어 실행하겠다.

  • PDF

A data-driven approach for lexicon selection for probabilistic language model (확률적 언어 모델을 위한 자료 기반 어휘 구축)

  • Ryu, Sung-Ho;Kim, Jin-Hyung
    • Annual Conference on Human and Language Technology
    • /
    • 2002.10e
    • /
    • pp.3-8
    • /
    • 2002
  • 한국어를 대상으로 하는 확률적 언어 모델에서는 대부분의 경우 형태소를 기본 어휘로서 사용하고 있다. 그러나, 이러한 모델들은 학습 및 검증을 위하여 사람에 의하여 형태소 분석이 이루어진 말뭉치를 필요로 한다. 또한, 형태소의 자동 분석은 현재 표준말을 중심으로 이루어져 있어 그 적용 분야에도 한계가 있다. 본 논문에서는 한국어의 특징을 고려하여 확률적 언어 모델의 구축에 적합한 어휘의 선택 기준에 대하여 고찰하고, 통계적인 기준을 통하여 확률적 언어 모델의 어휘를 구축하는 방법을 제안한다.

  • PDF

Probability Distribution of Project Completion Times in Simulation based Scheduling (시뮬레이션 일정기법;최종공사기간의 확률 통계적 특성 추정)

  • Lee, Dong-Eun;Kim, Ryul-Hee
    • Proceedings of the Korean Institute Of Construction Engineering and Management
    • /
    • 2007.11a
    • /
    • pp.327-330
    • /
    • 2007
  • This paper verifies that the normality assumption that the simulation output data, Project Completion Times (PCTs), follow normal distribution is not always acceptable and the existing belief may lead to misleading results. A risk quantification method, which measures the effect caused by the assumption, relative to the probability distribution of PCTs is implemented as an algorithm in MATLAB. To validate the reliability of the quantification, several series of simulation experiments have been carried out to analyze a set of simulation output data which are obtained from different type of Probability Distribution Function (PDF) assigned to activities'duration in a network. The method facilitates to find the effect of PDF type and its parameters. The procedure necessary for performing the risk quantification method is described in detail along with the findings. This paper contributes to improving the reliability of simulation based scheduling method, as well as increasing the accuracy of analysis results.

  • PDF

A study on the analysis of Seoul regional precipitation patterns (서울지역 강우 패턴 분석에 관한 연구)

  • Moon, Jang-Won;Moon, Young-Il;Oh, Tae-Suk;Jung, Young-Hwi
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2012.05a
    • /
    • pp.357-357
    • /
    • 2012
  • 우리나라는 기후변화로 추정되는 폭우, 폭설 등과 같은 기존의 강우의 패턴과는 다른 현상들이 잦아지고 있다. 최근 발생하는 기상이변은 예측 할 수 없고 단시간에 많은 양의 강우로 인하여 큰 피해가 발생하며 수공구조물에도 많은 영향을 미친다. 또한 장 단기 수자원계획과 수공구조물의 설계를 위하여 확률강우량의 산정은 매우 중요한 과정 중의 하나이다. 즉, 과거의 여러 수문 사상에 대한 통계적인 분석을 통해서 수공구조물들의 설계빈도를 결정하는 우리나라의 현실에서 사용된 수문 사상의 자료기간에 따라 확률 값은 큰 차이를 보일 수 있기 때문에 관측 자료 기간을 달리하여 빈도 해석한 결과를 비교함으로서 우리나라의 확률강우량의 변화 특성을 파악 할 수 있으며 미래 강우 형태를 파악하는데 기여 할 수 있다. 본 논문에서는 우리나라 기상청 강우자료를 사용하여 기초 통계량의 변화와 강우 발생의 패턴을 분석하고자 한다.

  • PDF

A Parser of Definitions in Korean Dictionary based on Probabilistic Grammar Rules (확률적 문법규칙에 기반한 국어사전의 뜻풀이말 구문분석기)

  • Lee, Su-Gwang;Ok, Cheol-Yeong
    • Journal of KIISE:Software and Applications
    • /
    • v.28 no.5
    • /
    • pp.48-460
    • /
    • 2001
  • 국어사전의 뜻풀이말은 표제어의 의미를 기술할 뿐만 아니라, 상위/하위개념, 부분-전체개념, 다의어, 동형이의어, 동의어, 반의어, 의미속성 등의 많은 의미정보를 내재하고 있다. 본 연구는 뜻풀이말에서 다양한 의미정보를 획득을 위한 기본적인 도구로서 국어사전의 뜻풀이말 구문분석기를 구현하는 것을 목적으로 한다. 이를 위해서 우선 국어사전의 뜻풀이말을 대상으로 일정한 수준의 품사 및 구문 부착 말 뭉치를 구축하고, 이 말뭉치들로부터 품사 태그 중의성 어절의 빈도 정보와 통계적 방법에 기반한 문법규칙과 확률정보를 자동으로 추출한다. 본 연구의 뜻풀이말 구문분석기는 이를 이용한 확률적 차트파서이다. 품사 태그 중의성 어절의 빈도 정보와 문법규칙 및 확률정보는 파싱 과정의 명사구 중의성을 해소한다. 또한, 파싱 과정에서 생성되는 노드의 수를 줄이고 수행 속도를 높이기 위한 방법으로 문법 Factoring, Best-First 탐색 그리고 Viterbi 탐색의 방법을 이용한다. 문법규칙의 확률과 왼쪽 우선 파싱 그리고 왼쪽 우선 탐색 방법을 사용하여 실험한 결과, 왼쪽 우선 탐색 방식과 문법확률을 혼용하는 방식이 가장 정확한 결과를 보였으며 비학습 문장에 대해 51.74%의 재현률과 87.47%의 정확률을 보였다.

  • PDF