• Title/Summary/Keyword: 통계연속성

Search Result 230, Processing Time 0.028 seconds

Detection of local structural chages in time series (시계열에서 국소구조변화의 탐지에 관한 연구)

  • Jae June Lee
    • The Korean Journal of Applied Statistics
    • /
    • v.7 no.2
    • /
    • pp.299-311
    • /
    • 1994
  • In time series data, atypical observations are not rare. Several approaches have been proposed to detect a single outlier, but the effectiveness of those procedures is in doubt when patchy outliers are present. In this paper, the atypicality in patchy outliers is interpreted as a local structural change, and a model is introduced to entertain its effect on the series. Based on this model, a statistic and a procedure are proposed for identifying those local structural changes. The performance of the proposed procedure is evaluated through simulation study and the analysis of real data sets.

  • PDF

부산항 PORT-MIS에 따른 해상교통조사 기간 검토

  • Yu, Yong-Ung;Lee, Yun-Seok
    • Proceedings of the Korean Institute of Navigation and Port Research Conference
    • /
    • 2018.05a
    • /
    • pp.178-180
    • /
    • 2018
  • 해상교통조사는 국내 해상교통안전진단 및 선박 통항과 관련한 안전성 평가에 혼잡도 평가 등 중요한 역할응 한다. 이 연구에서는 해상교통조사 기간에 대한 통계학적 검토를 통한 통계적 적정성과 선박 통항의 특성을 반영하여 부산항 북항의 PORT-MIS를 바탕으로 항만의 입출항 선박 통계를 바탕으로 일별, 월별, 특정 기간에 대하여 분석하고 현재 해상교통안전 진단 등에 규정된 해상교통안전기간에 대한 통계적 검토를 시행하였다. 월별 검토 결과 부산항은 12월에 0.88로 가장 적은 수의 선박이 입출항 하였고 8월에 1.13으로 가장 많은 수의 선박이 입출항 하였으며 약 22%많았다. 요일별로는 일요일에 가장 작은 수의 선박이 입출항 하였으며 관측 시기에 따라 3일에는 약 30%이내에 오차가 발생하였으며 7일에는 20%이내의 오차가 발생하였다.

  • PDF

A Study on the Selection of Optimum Probability Distribution for Rainfall Frequency Analysis (강우빈도해석 시 최적분포형 선정에 관한 연구)

  • Choi, Hong-Geun;Kim, Jin-Young;Kwon, Young-Jun;Kwon, Hyun-Han
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.412-412
    • /
    • 2017
  • 강우빈도해석을 위해서는 확률분포선정이 우선적으로 이루어져야 한다. 우리나라에서는 사용상의 편리상, 기존 해석결과와의 연속성 등을 이유로 Gumbel 확률분포가 가장 일반적으로 활용되고 있다. 그러나, 분포형 선정에 따른 확률강수량의 차이가 크게 발생한다는 점에서 단순히 해석상의 편리성을 기준으로 분포형 선정이 이루어지는 것은 바람직하지 않다. 특히, 우리나라에서 강우빈도해석 시 분포형 선정은 형식적인 수준에 그치고 있으며, 주로 KS검정, 검정 등 적합도 검정을 통해 고려된 분포형의 통계적 유의성만을 평가하고 있다. 그러나, 최적 분포형 선정이라는 관점에서 이러한 유의성 검정보다는 정량적인 지표를 기준으로 확률분포형 선정이 이루어지는 것이 적합할 것으로 판단된다. 즉, 자료의 설명력이 가장 우수한 분포를 정량적 지표를 기준으로 추정하는 것이 수문통계학적으로 적합성을 갖는다. 이러한 점에서 본 연구에서는 우도함수, BIC 및 AIC를 기준으로 우리나라 주요 강수지점에서 대해서 최적 분포형을 선정하고, 기존 Gumbel 분포를 기준으로 산정된 확률강수량과의 양적차이를 평가해보고자 한다.

  • PDF

Application of a Statistical Disclosure Control Techniques Based on Multiplicative Noise (승법잡음모형을 이용한 통계적 노출조절기법의 적용)

  • Kim, Young-Won;Kim, Tae-Yeon;Ki, Kye-Nam
    • The Korean Journal of Applied Statistics
    • /
    • v.24 no.1
    • /
    • pp.127-136
    • /
    • 2011
  • Multiplicative noise model is the one of popular method for masking continuous variables. In this paper, we propose the transformation on the variable to which random noise was multiplied. An advantage of the masking method using proposed transformation is that the masking data users can obtain the unbiased values of mean and variance of original (unmasked) data. We also consider the data utility and correlation structure of variables when we apply the proposed multiplicative noise scheme. To investigate the properties of the method of masking based on multiplicative noise, a simulation study has been conducted using the 2008 Householder Income and Expenditure Survey data.

Analysis of Field Test Data using Robust Linear Mixed-Effects Model (로버스트 선형혼합모형을 이용한 필드시험 데이터 분석)

  • Hong, Eun Hee;Lee, Youngjo;Ok, You Jin;Na, Myung Hwan;Noh, Maengseok;Ha, Il Do
    • The Korean Journal of Applied Statistics
    • /
    • v.28 no.2
    • /
    • pp.361-369
    • /
    • 2015
  • A general linear mixed-effects model is often used to analyze repeated measurement experiment data of a continuous response variable. However, a general linear mixed-effects model can give improper analysis results when simultaneously detecting heteroscedasticity and the non-normality of population distribution. To achieve a more robust estimation, we used a heavy-tailed linear mixed-effects model for a more exact and reliable analysis conclusion than a general linear mixed-effects model. We also provide reliability analysis results for further research.

Validation Comparison of Credit Rating Models for Categorized Financial Data (범주형 재무자료에 대한 신용평가모형 검증 비교)

  • Hong, Chong-Sun;Lee, Chang-Hyuk;Kim, Ji-Hun
    • Communications for Statistical Applications and Methods
    • /
    • v.15 no.4
    • /
    • pp.615-631
    • /
    • 2008
  • Current credit evaluation models based on only financial data except non-financial data are used continuous data and produce credit scores for the ranking. In this work, some problems of the credit evaluation models based on transformed continuous financial data are discussed and we propose improved credit evaluation models based on categorized financial data. After analyzing and comparing goodness-of-fit tests of two models, the availability of the credit evaluation models for categorized financial data is explained.

Uncertainty Analysis of Neyman-Scott Rectangular Pulse Model(NSRPM) Based on Bayesian Modelling (Bayesian 기법을 활용한 Neyman-Scott Rectangular Pulse 모형의 불확실성 분석)

  • Kim, Jang-Gyeong;Ban, Woo-Sik;Kwon, Hyun-Han
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.79-79
    • /
    • 2017
  • 강우 자료는 수공구조물 설계목적에 따라 다양한 시공간적 범주가 필요하다. 그러나 시간단위 이하 시계열 강우자료는 미계측 유역 및 관측연한 등의 제약으로 연속적인 시계열을 확보하는데 어려움이 있다. 이러한 점에서 포아송분포 기반 강우발생모형은 강우시계열의 통계적 특성을 나타내는 5개 매개변수로 다양한 시간 범주의 연속강우시계열을 생성할 수 있다는 장점이 있다. 강우발생모의 핵심은 과거자료의 통계특성을 효과적으로 복원할 수 있어야 하며, 다양한 기상학적 특성들 또한 적절하게 모의될 수 있어야 한다는 점이다. 즉, 다음과 같은 기준으로 모의적합성을 평가할 수 있다. 첫째, 지속기간별 관측시계열과 모의시계열의 통계적 유사성을 평가하고, 둘째, 확률분포를 따르는 각 매개변수의 사후분포를 제시하여 불확실성을 정량화하고, 셋째, 추정된 매개변수의 물리적 범위의 적정성 검토가 필요하다. 본 연구에서는 강우발생모형으로 널리 알려진 Neyman-Scott Rectangular Pulse(NSRP) 모형과 Bayesian 모형을 연계한 Bayesian NSRP 모형 개발을 통해 강우관측소 전지점에 대한 매개변수 지도를 제시하고자 한다. 본 연구결과는 임의 유역에 대한 강우발생 시나리오를 제공하여, 다양한 형태의 유출결과를 도출할 수 있으며, 무엇보다 유출결과를 확률적으로 평가할 수 있다는 장점이 있다.

  • PDF

Analysis of the 'Chukwookee' data using time series model (시계열 모형을 이용한 측우기 자료의 분석)

  • 조신섭;이정형;김병수
    • The Korean Journal of Applied Statistics
    • /
    • v.9 no.2
    • /
    • pp.25-43
    • /
    • 1996
  • One of the main issues related to the precipitation amounts measured by the Korean raingage, Chukwookee, invented by King Sejong is the discontinuity in the time series around 1907 when the modern raingage was first used in Korea. To solve this discontinuity problem Wada(1971) reproduced the Chukwookee data but many authors questioned the validity of Wada's method. In this paper we analyze the precipitation amounts in Seoul from 1771 to 1994 using the intervention model and show that Wada's method results in the overestimation of the precipitation amounts. We also propose a reproduction method by considering monthly constant and including the rainfall of less then 2 mm and the snowfall which were ignored previously.

  • PDF

An Efficient Estimation of Local Area Unemployment Rate Based on Small Area Estimation (소지역 추정법을 이용한 효율적인 지역 실업률 추정)

  • Kim, Soo-Taek
    • The Korean Journal of Applied Statistics
    • /
    • v.24 no.6
    • /
    • pp.1129-1138
    • /
    • 2011
  • Small area estimation has received significant intention in recent years due to a growing demand for reliable local area statistics. Traditional area-specific direct estimates based solely on sample survey data in the areas of interest do not provide adequate small area precision; however, design-based indirect local area estimators borrow strength from sample observations of related areas to increase the effective sample size. Design-based indirect estimation methods such as synthetic and composite estimators are considered to adjust local area unemployment rate estimates in the Korean Economically Active Population Survey. This study suggests an efficient alternative to minimize the cost to construct the unemployment rate of a local area through simulation under the condition that we can maintain a certain level of CV for the estimates. We obtained the results that the composite estimators using a sample size greater than 10 are more stable and significant at the level of CV 25% in our design scheme.

Logistic Regressions with Sensory Evaluation Data about Hanwoo Steer Beef (한우 거세우 고기 관능평가 데이터의 로지스틱 회귀분석)

  • Lee, Hye-Jung;Kim, Jae-Hee
    • The Korean Journal of Applied Statistics
    • /
    • v.23 no.5
    • /
    • pp.857-870
    • /
    • 2010
  • This study was conducted to investigate the relationship between the socio-demographic factors and the Korean consumers palatability evaluation grades with Hanwoo sensory evaluation data from 2006 to 2008 by National Institute of Animal Science. The dichotomy logistic regression model and the multinomial logistic regression model are fitted with the independent variables such as the consumer living location, age, gender occupation, monthly income, beef cut and the the palatability grade as the categorical dependent variable and tenderness, 리avor and juiciness as the continuous dependent variable. Stepwise variable selection procedure is incorporated to find the final model and odds ratios are calculated to nd the associations between categories.