• 제목/요약/키워드: Skewed Distribution

검색결과 228건 처리시간 0.025초

Comprehensive comparison of normality tests: Empirical study using many different types of data

  • Lee, Chanmi;Park, Suhwi;Jeong, Jaesik
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권5호
    • /
    • pp.1399-1412
    • /
    • 2016
  • We compare many normality tests consisting of different sources of information extracted from the given data: Anderson-Darling test, Kolmogorov-Smirnov test, Cramervon Mises test, Shapiro-Wilk test, Shaprio-Francia test, Lilliefors, Jarque-Bera test, D'Agostino' D, Doornik-Hansen test, Energy test and Martinzez-Iglewicz test. For the purpose of comparison, those tests are applied to the various types of data generated from skewed distribution, unsymmetric distribution, and distribution with different length of support. We then summarize comparison results in terms of two things: type I error control and power. The selection of the best test depends on the shape of the distribution of the data, implying that there is no test which is the most powerful for all distributions.

Comparison of the Power of Bootstrap Two-Sample Test and Wilcoxon Rank Sum Test for Positively Skewed Population

  • Heo, Sunyeong
    • 통합자연과학논문집
    • /
    • 제15권1호
    • /
    • pp.9-18
    • /
    • 2022
  • This research examines the power of bootstrap two-sample test, and compares it with the powers of two-sample t-test and Wilcoxon rank sum test, through simulation. For simulation work, a positively skewed and heavy tailed distribution was selected as a population distribution, the chi-square distributions with three degrees of freedom, χ23. For two independent samples, the fist sample was selected from χ23. The second sample was selected independently from the same χ23 as the first sample, and calculated d+ax for each sampled value x, a randomly selected value from χ23. The d in d+ax has from 0 to 5 by 0.5 interval, and the a has from 1.0 to 1.5 by 0.1 interval. The powers of three methods were evaluated for the sample sizes 10,20,30,40,50. The null hypothesis was the two population medians being equal for Bootstrap two-sample test and Wilcoxon rank sum test, and the two population means being equal for the two-sample t-test. The powers were obtained using r program language; wilcox.test() in r base package for Wilcoxon rank sum test, t.test() in r base package for the two-sample t-test, boot.two.bca() in r wBoot pacakge for the bootstrap two-sample test. Simulation results show that the power of Wilcoxon rank sum test is the best for all 330 (n,a,d) combinations and the power of two-sample t-test comes next, and the power of bootstrap two-sample comes last. As the results, it can be recommended to use the classic inference methods if there are widely accepted and used methods, in terms of time, costs, sometimes power.

$F_{2}\; and\; F_{3}$ 세대에서 대두 종자크기에 대한 빈도분포 (Frequency Distribution for Soybean Seed Size in $F_{2}\; and\; F_{3}$ Generation)

  • 정종일
    • 생명과학회지
    • /
    • 제7권4호
    • /
    • pp.355-357
    • /
    • 1997
  • 대립종자와 소립종자의 cross부터 F$_{2}$와 F$_{3}$ 세대에서의 종자크기에 대한 빈도분포의 다음과 같다. 두 세대에서 모본의 크기와 같은 progeny는 나타나지 않았으며 각 세대의 평균치는 양 모본의 평균치 보다 낮았다. 소립종자 크기에 비해 우성적인 유전양상을 나타 내었다.

  • PDF

Fixed-accuracy confidence interval estimation of P(X > c) for a two-parameter gamma population

  • Zhuang, Yan;Hu, Jun;Zou, Yixuan
    • Communications for Statistical Applications and Methods
    • /
    • 제27권6호
    • /
    • pp.625-639
    • /
    • 2020
  • The gamma distribution is a flexible right-skewed distribution widely used in many areas, and it is of great interest to estimate the probability of a random variable exceeding a specified value in survival and reliability analysis. Therefore, the study develops a fixed-accuracy confidence interval for P(X > c) when X follows a gamma distribution, Γ(α, β), and c is a preassigned positive constant through: 1) a purely sequential procedure with known shape parameter α and unknown rate parameter β; and 2) a nonparametric purely sequential procedure with both shape and rate parameters unknown. Both procedures enjoy appealing asymptotic first-order efficiency and asymptotic consistency properties. Extensive simulations validate the theoretical findings. Three real-life data examples from health studies and steel manufacturing study are discussed to illustrate the practical applicability of both procedures.

발달 독성학에서 비대칭 로짓 모형을 사용한 이진수 자료와 연속형 자료에 대한 결합분석 (Joint analysis of binary and continuous data using skewed logit model in developmental toxicity studies)

  • 김영화;황범석
    • 응용통계연구
    • /
    • 제33권2호
    • /
    • pp.123-136
    • /
    • 2020
  • 하나의 개체에서 여러가지 측정치가 동시에 관찰되는 경우는 다양한 연구 분야에서 흔히 나타난다. 발달 독성학 연구에서는 특정 독성 물질의 각기 다른 수준에 노출된 임신한 어미 쥐에 대해 기형인 태아의 존재와 태아의 무게가 동시에 측정된다. 이런 두 변수를 결합하여 모형화하는 것은 각기 독립적인 두 모형으로 분석하는 것보다 더 효율적인 결과를 낸다고 알려져 있다. 대부분의 결합 모형은 정규분포를 랜덤효과로 가정하여 분석한다. 그러나 발달 독성학 연구에서처럼 반응변수들의 분포가 독성 물질이 변함에 따라 불규칙하게 변하는 경우 정규분포의 가정으로는 그 특징을 잡아낼 수 없게 된다. 본 논문에서는 이진수 자료와 연속형 자료에 대해 비대칭 로짓 모형을 사용한 베이지안 결합모형을 제시한다. 본 모형은 비대칭 로짓 모형을 사용함으로써 반응변수의 분포의 형태가 독성 물질의 수준에 따라 대칭/비대칭의 형태를 자유롭게 띨 수 있는 장점을 가지고 있다. 모형의 적합성을 살펴보기 위해 발달 독성학 연구에서 독성 물질 DEHP에 적용하여 그 결과를 확인해본다.

데이터 분포특성을 이용한 다목적함수 최적화 알고리즘 개발 (Development of a Multiobjective Optimization Algorithm Using Data Distribution Characteristics)

  • 황인진;박경진
    • 대한기계학회논문집A
    • /
    • 제34권12호
    • /
    • pp.1793-1803
    • /
    • 2010
  • 가중치법이나 목표계획법을 이용하여 다목적함수 최적화를 수행할 때 설계자는 각 함수에 적절한 가중치나 목표값을 설정해 주어야 한다. 하지만 파라미터를 잘못 설정하게 되면 파레토 최적해를 얻지못하기 때문에 이는 설계자에게 큰 부담이 된다. 최근에 데이터의 분포특성만을 이용하여 데이터의 평균과 함수 사이의 거리를 표현하는 마하라노비스 거리(MD)를 최소화하는 MTS기법이 개발되었다. 이 방법은 파라미터를 설정하지 않아도 되는 장점이 있지만 최적해가 참고데이터의 평균으로 수렴하는 단점이 있다. 따라서 본 연구에서는 방향성이 없는 기존의 MD에 방향성을 부여한 새로운 거리 척도인 SMD를 제안하였다. 그리고 SMD법이 계산과정에서 각 함수의 가중치를 자동으로 반영하고 평균에서 가장 멀리 위치한 한 점을 항상 파레토 최적해로 제공한다는 것을 2개의 단순예제를 통해 검증하였다.

개선된 공간 해쉬 조인 알고리즘을 이용한 편중 데이터 처리 기법 (Skewed Data Handling Technique Using an Enhanced Spatial Hash Join Algorithm)

  • 심영복;이종연
    • 정보처리학회논문지D
    • /
    • 제12D권2호
    • /
    • pp.179-188
    • /
    • 2005
  • 지난 수년 동안 공간 데이터의 조인 연산에 대한 많은 연구가 진행되어 왔다. 본 논문에서는 공간 조인연산 시 인덱스가 존재하지 않을 경우, 후보 객체의 여과 단계 처리에 중점을 둔다. 이 분야에 대한 여러 알고리즘들이 제안되었으며 대부분의 경우 공간 데이터의 조인 연산 시 우수한 성능을 나타내고 있다. 하지만, 조인을 위한 입력 테이블의 객체들이 편중되어 분포할 경우 조인 성능이 급격히 저하되는 문제점을 가지고 있으며 이 문제를 해결하려는 연구는 미흡한 실정이다. 따라서, 본 논문에서는 공간 데이터의 편중 문제를 개선하기 위해 기존의 공간 조인 알고리즘 중 Spatial Hash Join 알고리즘과 SSSJ 알고리즘의 장점을 결합한 Spatial Hash Sip Join 알고리즘을 제안한다. 이 알고리즘을 SHJ 알고리즘의 객체 분포에 기반한 공간 분할 특성과 공간 조인 시 SSSJ 알고리즘의 우수한 I/O 특성을 이용한다. 본 논문에서 제안한 SHSJ 알고리즘의 성능 평가를 위해 Tiger/line 데이터를 사용하여 기존 SHJ 알고리즘과 성능을 비교 평가 하였으며 평가 결과 인덱스가 존재하지 않는 입력 테이블에 대한 공간 조인 연산 시 모든 평가 파라미터에 대해 기존의 SHJ 알고리즘보다 우수함이 검증되었다.

조건이 다른 수직 평형 평판에서 혼합대류 열전달 (Mixed Convection Heat Transfer from Two Vertical Parallel Plates with Different Conditions)

  • 김상영;정한식;권순석
    • 설비공학논문집
    • /
    • 제4권4호
    • /
    • pp.243-252
    • /
    • 1992
  • A mixed convection heat transfer from two vertical parallel plates has been studied numerically by the finite difference method. Effects of the Grashof number, the relative length, $L_2/L_1$. the dimensionless temperature ratio, ${\Phi}_2/{\Phi}_1$ and the dimensionless plate spacing, $b/L_1$ are examined for the heat transfer. Independent of the Grashof numbers and $L_2/L_1$, the dimensionless vertical velocity distributions skewed on the left plate as ${\Phi}_2/{\Phi}_1$ decreased. The dimensionless vertical velocity distribution for $Gr/Re^2=1$ and ${\Phi}_2/{\Phi}_1=1.0$ is skewed to the right plate $L_2/L_1=0.5$, symmetric at $L_2/L_1=1.0$ and skewed to the left plate at $L_2/L_1=1.5$. But for $Gr/Re_2=10.0$ and ${\Phi}_2/{\Phi}_1=1.0$ reversed velocity patterns are obtained. Regardless of the Grashof numbers and $L_2/L_1$, the mean Nusselt nembers on the inside surface of the left plate decreases and those of the right inside surface increases as ${\Phi}_2/{\Phi}_1$ increases. Temperature, velocity and mean Nusselt number distributions are apparently not affected by $L_2/L_1$.

  • PDF

크롬도금 포열의 포구속도 확률분포 특성 분석 (Analysis of Probability Distribution of Muzzle Velocity for Chrome Plated Barrel)

  • 김재갑;김재훈
    • 한국군사과학기술학회지
    • /
    • 제24권4호
    • /
    • pp.401-407
    • /
    • 2021
  • To confirm the change of muzzle velocity and the most suitable probability distribution model of the 155 mm K9 howitzer barrel with chrome plating and changed rifling. Using a statistical program, the muzzle velocity were plotted on a normal distribution, a 2-parameter and 3-parameter Weibull distribution on a probability paper. Also, statistical parameters were estimated and muzzle velocity fitness test and probability of K676 charge were plotted. In both the chrome-plated with standard rifling and changed rifling for K9 barrel, the 2-parameter and 3-parameter Weibull distribution were skewed to the left compared to the normal distribution. It was confirmed that the muzzle velocity of the K9 barrel with chromium-plated is suitable for the normal distribution and 3-parameter Weibull distribution model.

Asymmetric Least Squares Estimation for A Nonlinear Time Series Regression Model

  • Kim, Tae Soo;Kim, Hae Kyoung;Yoon, Jin Hee
    • Communications for Statistical Applications and Methods
    • /
    • 제8권3호
    • /
    • pp.633-641
    • /
    • 2001
  • The least squares method is usually applied when estimating the parameters in the regression models. However the least square estimator is not very efficient when the distribution of the error is skewed. In this paper, we propose the asymmetric least square estimator for a particular nonlinear time series regression model, and give the simple and practical sufficient conditions for the strong consistency of the estimators.

  • PDF