• 제목/요약/키워드: Multivariate Normal Distribution

검색결과 104건 처리시간 0.026초

다변량 경험분포함수와 시각적인 표현방법 (Multivariate empirical distribution functions and descriptive methods)

  • 홍종선;박준;박용호
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권1호
    • /
    • pp.87-98
    • /
    • 2017
  • 일변량 이상의 다변량 경험분포함수의 정의를 새롭게 제안하고, 경험분포함수의 기대값과 분산을 유도하면서 다변량 경험분포함수가 실제의 분포함수로 수렴함을 확인한다. 그리고 다양한 상관계수의 이변량 표준정규분포에서 추출한 확률표본을 바탕으로 이변량 경험분포함수를 구하고 이를 이차원 평면에 시각적으로 표현하는 두 종류의 그래픽적인 방법을 제안한다. 하나는 계단으로 표현하여 계단식 함수와 유사한 성격을 갖고 있는 방법이고, 다른 하나는 이변량 분위벡터로 설명되는 그림 방법이다. 두 종류의 시각적인 표현 방법은 삼차원으로 표현할 수 있으나 이차원 평면으로도 쉽게 구현이 가능하며, 일반적으로 이변량 누적분포함수의 모든 특징을 충분히 설명할 수 있다. 따라서 삼변량 경험분포함수를 시각적 표현이 가능함을 보인다. 이변량과 사변량의 실증 예제를 통하여 본 연구에서 제안한 다변량 경험분포함수와 이차원 평면에 표현하는 시각적인 표현 방법들을 구현하고 탐색한다.

Other approaches to bivariate ranked set sampling

  • Al-Saleh, Mohammad Fraiwan;Alshboul, Hadeel Mohammad
    • Communications for Statistical Applications and Methods
    • /
    • 제25권3호
    • /
    • pp.283-296
    • /
    • 2018
  • Ranked set sampling, as introduced by McIntyre (Australian Journal of Agriculture Research, 3, 385-390, 1952), dealt with the estimation of the mean of one population. To deal with two or more variables, different forms of bivariate and multivariate ranked set sampling were suggested. For a technique to be useful, it should be easy to implement in practice. Bivariate ranked set sampling, as introduced by Al-Saleh and Zheng (Australian & New Zealand Journal of Statistics, 44, 221-232, 2002), is not easy to implement in practice, because it requires the judgment ranking of each of the combination of the order statistics of the two characteristics. This paper investigates two modifications that make the method easier to use. The first modification is based on ranking one variable and noting the rank of the other variable for one cycle, and do the reverse for another cycle. The second approach is based on ranking of one variable and giving the second variable the same rank (Concomitant Order Statistic) for one cycle and do the reverse for the other cycle. The two procedures are investigated for an estimation of the means of some well-known distributions. It is show that the suggested approaches can be used in practice and can be more efficient than using SRS. A real data set is used to illustrate the procedure.

Outlier Impact on the Power of Significance Test for Cronbach Alpha Reliability Coefficient

  • Yonghwan Um
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권5호
    • /
    • pp.179-187
    • /
    • 2023
  • 본 논문은 크론바흐 알파 신뢰계수의 유의성 검정에서 이상치가 검정력에 미치는 영향을 연구한 것이다. 표본 크기, 문항들의 수, 이상치의 수, 모집단의 크론바흐 알파 레벨의 네 개의 변수들에 변화를 주었다. 데이터 시물에이션을 위해 다변량 정규분포를 사용했고 균일분포로부터 이상치를 추출하여 사용했다. 크론바흐 알파 신뢰도의 유의성 검정을 위해 모수적 검정(F 검정)과 퍼뮤테이션 검정을 사용하였다. 결과적으로 퍼뮤테이션 검정의 검정력은 F검정의 검정력 보다 크거나 같았고, 두 검정의 검정력은 모두 이상치의 수가 많아질수록 감소하였으며 이러한 이상치의 영향은 모집단의 알파 레벨이 증가할수록 크게 나타났다.

폐광산지역 토양 중금속원소들에 대한 통계학적 환경오염 특성평가 (Statistical Assessment on the Heavy Metal Variation in the Soils around Abandoned Mine(Case Study for the Samgwang Mine))

  • 조일형;천석영;장순웅
    • 한국환경과학회지
    • /
    • 제16권12호
    • /
    • pp.1451-1462
    • /
    • 2007
  • Heavy metal concentrations in the soil were investigated for the abandoned Samkwang metal mine, Cheongyang-Gun, Chungnam Province, Korea. The concentrations of heavy metal(As, Cd, Cu, Ni, Pb, Zn) were determined in mine soils collected at the abandoned mine sites to obtain a general classification and specification of the pollution in this highly polluted region. The results estimated with the normal test and basis statistic on the central tendency and variation showed that the distribution of heavy metal concentration had significantly different at the range of all locations. The range of spatial distribution on the relationship of heavy metal concentration and pH was $4.8{\sim}8.8$ and heavy metal concentration on the type of land use was highest in forest land, and also Ni and Zn in farm and rice field showed the high concentration. The distribution of heavy metal concentration on the depth of a soil showed that the metal concentrations in subsoil were higher than of those in surface soil, while the concentration of Cu and Ni had no significant difference on the depth of soil. Results from the correlation analysis using the data except the extreme and unusual data revel that Zn-Cd(r=0.867), Zn-As(r=0.797), Zn-Pb(r=0.764), Cu-Cd(r=0.673), Cu-As(r=0.614) and Zn-Ni(r=0.605) were the most important parameters in assessing variations of heavy metal in soil. To discriminate pattern differences and similarities among samples, principal factor analysis(PFA) and cluster analysis(CF) were performed using a correlation matrix. This study suggests that PFA and CF techniques are useful tools for identification of important heavy metal and parameters. This study presents the necessity and usefulness of multivariate statistical assessment of complex databases in order to get better information about the quality of soil and gives the basis information to clean up the abandoned mine sites.

러프집합이론을 중심으로 한 감성 지식 추출 및 통계분석과의 비교 연구 (Knowledge Extraction from Affective Data using Rough Sets Model and Comparison between Rough Sets Theory and Statistical Method)

  • 홍승우;박재규;박성준;정의승
    • 대한인간공학회지
    • /
    • 제29권4호
    • /
    • pp.631-637
    • /
    • 2010
  • The aim of affective engineering is to develop a new product by translating customer affections into design factors. Affective data have so far been analyzed using a multivariate statistical analysis, but the affective data do not always have linear features assumed under normal distribution. Rough sets model is an effective method for knowledge discovery under uncertainty, imprecision and fuzziness. Rough sets model is to deal with any type of data regardless of their linearity characteristics. Therefore, this study utilizes rough sets model to extract affective knowledge from affective data. Four types of scent alternatives and four types of sounds were designed and the experiment was performed to look into affective differences in subject's preference on air conditioner. Finally, the purpose of this study also is to extract knowledge from affective data using rough sets model and to figure out the relationships between rough sets based affective engineering method and statistical one. The result of a case study shows that the proposed approach can effectively extract affective knowledge from affective data and is able to discover the relationships between customer affections and design factors. This study also shows similar results between rough sets model and statistical method, but it can be made more valuable by comparing fuzzy theory, neural network and multivariate statistical methods.

범주형 반복측정자료를 위한 일반화 추정방정식의 소표본 특성 (Small Sample Characteristics of Generalized Estimating Equations for Categorical Repeated Measurements)

  • 김동욱;김재직
    • 응용통계연구
    • /
    • 제15권2호
    • /
    • pp.297-310
    • /
    • 2002
  • Liang과 Zeger는 이산형 혹은 연속형 반복측정자료를 분석하기 위한 일반화 추정방정식 (GEE)을 제안하였다 GEE모형은 범주형 반복측정자료의 모형으로 확장될 수 있으며, 이 GEE추정량은 대표본인 경우 다변량 정규분포를 따른다. 그러나 GEE는 대표본근사이론에 기초한다. 본 논문에서는 소표본인 경우 반복 측정된 순서자료에 대한 GEE추정량의 성질을 연구한다. 우리는 두가지 방법을 사용하여 두그룹의 반복 측정된 순서자료를 생성하며 모의실험을 통하여 소표본인 경우 여러 개 범주를 갖는 순서반응 자료에 대하여 GEE추정량의 1종 오류율, 검정력, 상대효율, 두 그룹의 표본크기가 다를 경우 효과, 그리고 분산 추정량의 성질등을 연구한다.

Empirical Evidence of Dynamic Conditional Correlation Between Asian Stock Markets and US Stock Indexes During COVID-19 Pandemic

  • TANTIPAIBOONWONG, Asidakarn;HONGSAKULVASU, Napon;SAIJAI, Worrawat
    • The Journal of Asian Finance, Economics and Business
    • /
    • 제8권9호
    • /
    • pp.143-154
    • /
    • 2021
  • This study aims to explore the dynamic conditional correlation (DCC) between ten Asian stock indexes, the US stock index, and Bitcoin by using the dynamic conditional correlation model. The time span of the daily data is between January 2015 to May 2021, the total observation is 1,116. DCC(1,1)-EGARCH(1,1) with multivariate t and normal distributions for the DCC and EGARCH models, respectively, outperforms other models by the goodness of fit values. Except for Bitcoin, we discovered that the majority of the securities' volatilities have a very high volatility persistence. Furthermore, the negative shocks/news have more impact on the volatilities than positive shocks/news in most of the cases, except the stock index of China and Bitcoin. Most of the correlation pairs exhibit higher correlation during the COVID-19 pandemic compared to the pre-COVID-19, except Hong Kong-The US and Malaysia-Indonesia. Moreover, the correlation between Asian stock indexes during the COVID-19 pandemic is statistically higher than the pre-COVID-19 pandemic. However, there are a few instances where the Hong Kong stock index and a few countries are identical. The result of correlation size shows the connectedness between Asian stock markets, which are well-connected within the region, especially with South Korea, Singapore, and Hong Kong.

유전자 알고리즘을 이용한 트레이닝 최적화 기법 연구 - 정규분포를 고려한 통계적 영상분류의 경우 - (A Study on the Training Optimization Using Genetic Algorithm -In case of Statistical Classification considering Normal Distribution-)

  • 어양담;조봉환;이용웅;김용일
    • 대한원격탐사학회지
    • /
    • 제15권3호
    • /
    • pp.195-208
    • /
    • 1999
  • 위성영상 분류작업에서 분류클래스에 대한 샘플화소의 대표성은 분류 정확도에 많은 영향을 미친다. 따라서, 통계적 영상분류방법에서는 분류 기법 자체보다 분류 확률을 결정하는 트레이닝 단계, 즉 샘플화소의 최적화가 필요하다. 본 연구에서는 SPOT XS, LANDSAT TM을 이용한 위성영상 화소분류작업에서 분류 이전단계, 즉 샘플화소의 정규성을 계산하여, 정규성에 악영향을 미치는 화소를 객관적 기준으로 조정하였다. 정규화과정을 위한 유전자 알고리즘 적용의 생존확률 평가함수로 다변량 Q-Q plot의 상관계수와 트레이닝의 분산값을 고려하였으며, 5% 유의수준을 적용하였다. 연구결과, 실험대상지역의 경우, 유전자 알고리즘을 이용한 트레이닝 정규화 결과가 대부분의 클래스에 대하여 그 평균과 분산을 모집단에 근사시키고 있다는 것을 입증하였고, 해당 클래스의 모집단 분포를 예측할 수 있는 가능성을 제시하였다.

코플라함수를 이용한 극단치 강풍과 강수 분석 (Analysis of extreme wind speed and precipitation using copula)

  • 권태용;윤상후
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권4호
    • /
    • pp.797-810
    • /
    • 2017
  • 한반도는 매년 태풍의 위험에 노출되어 있다. 태풍은 강풍과 강우가 동반되는 열대성 저기압으로 사회 경제적으로 막대한 피해를 유발한다. 현재의 자연재해 경고 시스템은 풍속과 강우를 구분하여 위험을 감지토록 설계되어 강풍과 폭우를 동반한 태풍의 위험을 경고하는데 한계점이 존재한다. 코플라모형은 확률변수들 사이의 복잡한 의존성 구조를 파악하기 위해 단변량분포의 집합을 다변량분포로 연결하는 모형으로 강우, 홍수, 가뭄 등의 분야에서 활발하게 연구되고 있다. 본 연구에서는 한반도에서 태풍에 가장 많이 노출된 도시인 부산과 제주도의 기상 관측소 (ASOS)에서 수집된 1904년 4월 9일부터 2015년 12월 31일까지 일강수량 (precipitation), 일최대풍속 (maximum wind speed) 자료를 이용하였다. 각 변수의 주변부확률을 추정하기 위해 두꺼운 꼬리 분포인 로그정규분포, 감마분포, 와이블분포를 고려하였다. 주변부 확률분포의 적합성검정은 Kolmogorov-Smirnov와 Cramervon-Mises, Anderson-Darling 검정통계량을 이용하였다. 코플라모형을 위해 순위를 기반으로 한 유사자료 (pseudo observation)를 생성하여 두 변수 간 의존성을 추정하였다. 강풍과 폭우의 의존성을 설명하기 위한 코플라모형으로 타원형, 나선형, 극단치 코플라모형이 고려되었다. 코플라모형의 적합성은 Cramer-von-Mises로 검정하였고, 교차검증을 통해 최적모형을 선택하였다. 연구결과 일강우량과 풍속의 주변부 확률분포로 대부분 로그정규분포가 적합하였다. 부산의 일평균풍속에 따른 일강우량은 t 코플라, 일최대풍속에 따른 일강우량은 Clayton 코플라가 최적모형으로 선정되었다. 제주도의 일최대풍속에 따른 일강우량은 정규코플라, 일강우량에 따른 일평균풍속은 Frank 코플라, 일강우량에 따른 일최대풍속은 Husler-Reiss 코플라가 최적모형으로 선택되었다.

고등학생 변비의 위험요인에 관한 연구 (The Risk Factors Related to Constipation in High School Students)

  • 윤윤수;이석구;김정연
    • 농촌의학ㆍ지역보건
    • /
    • 제30권1호
    • /
    • pp.15-28
    • /
    • 2005
  • 본 연구는 일개 광역시 지역 고등학생 1,882명을 대상으로 변비 유병율과 변비관련 건강 행태 및 변비의 발생에 영향을 미치는 위험요인을 도출하여, 적절한 관리방안 및 중재전략 개발에 필요한 기초자료를 제시하고자 시도된 다면조사연구 이다. 수집된 자료는 연구목적에 따라 빈도분석, Chi-square 검정, 로지스틱 회귀 분석(multivariate logistic regression)으로 분석하였다. 본 연구의 결과를 요약하면 다음과 같다. 첫째, 자가보고에 의한 변비의 유병율은 25.2%로, 성별에 따라서는 남학생이 13.4%, 여학생이 36.5% 이었다. 둘째, 자가보고에 의한 변비군의 치료관련 행태에서는 16.4%가 변비치료를 위해 변비약을 복용한 경험이 있는 것으로 조사되었으며, 배변 형태에 변화가 있을 경우 52.1%는 특별한 상담자가 없으며, 38.9%는 부모님과 상담을 하는 것으로 나타났다. 셋째, 자가보고에 의한 변비의 분류에 의한, 변비군과 정상군간의 배변 관련 증상의 분포에서는 변비군의 73.5%가 자주 또는 가끔 항문통증의 경험이 있었으나, 정상군에서는 48.0%로 나타나 변비군에서 항문통증을 경험한 비율이 높았으며, 두 군간에 통계적으로 유의한 차이를 보였다(p<0.01). 배변 후 항문부위의 출혈 경험에 있어서도 변비군에서 41.6%가 배변 후 항문출혈의 경험이 있었으나, 정상군에서는 23.7%로 두 군간에 통계적으로 유의한 차이를 보였다(p<0.01). 넷째, 식습관 행태와 자가보고에 의한 변비 발생과의 관계에 있어서는 변비군의 45.1%가 다이어트의 경험이 있었으며, 정상군의 28.1%에 비하여 높았다. 아침식사의 규칙성에 있어서는 변비군의 21.2%가 아침식사를 항상 먹지 않는 것으로 조사되어, 정상군의 17.5%에 비하여 높게 나타나 아침식사를 규칙적으로 먹지 않는 군에서 변비발생의 위험이 높은 것으로 나타났다. 다섯째, 변비군과 정상군의 스트레스 분포에서는 변비군의 40.2%는 항상 스트레스를 느끼고 있다고 하였으며, 정상군에서는 25.0%만이 항상 스트레스가 있다고 응답하여 변비군에서 스트레스 정도가 더 높은 것으로 나타났다(p<0.01). 여섯째, 학교에서의 배변여부에서는 자가보고에 의한 변비군에서 학교에서 배변을 하지 않는 비율이 42.2%로 정상군의 37.2%에 비하여 그 비율이 높았으며, 선호하는 화장실의 종류로는 연구대상자의 43.4%가 수세식 형태를 선호하였다. 일곱째, 자가보고에 의해 변비군과 정상군을 구분한 후, 변비여부를 종속변수로 하여 변비 발생에 영향을 미치는 요인을 분석한 결과 남학생보다는 여학생이, 실업계보다는 인문계학생이, 다이어트 경험이 있을수록, 아침식사를 규칙적으로 먹지 않을수록, 주 3회 이상 채소 섭취를 하지 않을수록 변비가 더 많이 발생하는 것으로 나타났다. 본 연구를 통해 변비의 발생을 예방하기 위해서는 식습관의 개선이 필수적임을 재확인하였으며, 다이어트의 절제와 아침식사의 결식예방, 규칙적인 식사, 채소류 섭취의 증대, 스트레스 관리 등에 관심을 기울여 이를 개선하는 노력이 필요하다 하겠다.

  • PDF