• 제목/요약/키워드: 다변량 정규분포

검색결과 57건 처리시간 0.024초

정규성 검정을 위한 다변량 왜도와 첨도의 이용에 대한 고찰 (Remarks on the Use of Multivariate Skewness and Kurtosis for Testing Multivariate Normality)

  • 김남현
    • 응용통계연구
    • /
    • 제17권3호
    • /
    • pp.507-518
    • /
    • 2004
  • Malkovich & Afifi (1973)는 합교원리 (union-intersection principle)를 이용하여 왜도와 첨도를 다변량으로 일반화하였으나 이는 자료의 차원이 클 경우에는 사용이 용이하지 않다. 본 논문에서는 이러한 단점을 보완하는 이들의 근사통계량을 제안한다. 그리고 제안된 근사통계량, Malkovich & Afifi (1973)의 통 계 량, Mardia(1970)의 왜도와 첨도의 검 정력을 모의실험을 통하여 비교한다.

다변량 정규분포에서의 선발효과(I): 유전편차의 비율에 대하여 (Genetic Selection Problems under Multivariate Normal Distribution)

  • 신한풍
    • Journal of the Korean Statistical Society
    • /
    • 제3권1호
    • /
    • pp.59-63
    • /
    • 1974
  • 표현형 변수 Y가 유전변수 X와 환경변수 E로 표시되고 X와 E가 상호독립이며 각각 다음과 같은 정규분포를 한다고 하자. $$X\simN(\mu,\sigma^2), E\simN)0,\omega^2)$$ 대체로 $Y \geq y$이거나 $Y \leq y$인 형태일 때 유전 및 육동적 선발은 Y=X+E의 형태로 나타난다. 롭슨[3]은 선발을 반복하였을 때 유전변수 X의 평균기대치와 유전변수 X의 조건부분포의 영향을 연구하였고 이와같은 일변량분포의 경우 선발의 효과는 전분산에 대한 유전분산의 비에 달려있다 하였다. 이러한 선발모형을 p-차원 공간에 적용하면 유전편차의 비율을 구할 수 있다.

  • PDF

다변량 관리도를 활용한 블로거 정서 변화 탐지 (Detection of the Change in Blogger Sentiment using Multivariate Control Charts)

  • 문정훈;이성임
    • 응용통계연구
    • /
    • 제26권6호
    • /
    • pp.903-913
    • /
    • 2013
  • 최근 소셜 네크워크 서비스의 발달로 인해 개인의 감정이나 의견을 표현하는 소셜 데이터들이 하루에도 수백만 건씩 생산되고 있다. 또한 소셜 데이터는 개인의 의견에 또 다른 생각을 더하는 등 정보의 생산과 소비가 누구나 가능해짐으로써 사회현상을 잘 반영해주는 도구로 성장하고 있다. 본 연구에서는 블로그에 올라온 부정적인 감성어들을 분석하여 블로거의 감성변화를 탐지하기 위해 다변량 관리도를 이용하고자 한다. 이를 위해 2008년 1월 1일부터 2009년 12월 31일 사이에 생성되었던 모든 블로그를 사용하였다. 품질 특성치가 다변량으로 주어지는 경우 호텔링의 $T^2$ 관리도가 널리 사용된다. 그러나 이 관리도는 품질 특성치들의 분포가 다변량 정규분포라는 가정을 하고 있어, 비정규 다변량 자료에 대한 관리도의 성능은 좋지 않다. 이에 본 논문에서는 Sun과 Tsung (2003)이 제안한 써포트 벡터머신에서 단일 집합 분류 기법 중 하나인 SVDD(support vector data description) 알고리즘과 이를 확장한 K-관리도를 소개하고, 실제 데이터 분석에 적용해 보았다.

다변량 경험분포함수와 시각적인 표현방법 (Multivariate empirical distribution functions and descriptive methods)

  • 홍종선;박준;박용호
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권1호
    • /
    • pp.87-98
    • /
    • 2017
  • 일변량 이상의 다변량 경험분포함수의 정의를 새롭게 제안하고, 경험분포함수의 기대값과 분산을 유도하면서 다변량 경험분포함수가 실제의 분포함수로 수렴함을 확인한다. 그리고 다양한 상관계수의 이변량 표준정규분포에서 추출한 확률표본을 바탕으로 이변량 경험분포함수를 구하고 이를 이차원 평면에 시각적으로 표현하는 두 종류의 그래픽적인 방법을 제안한다. 하나는 계단으로 표현하여 계단식 함수와 유사한 성격을 갖고 있는 방법이고, 다른 하나는 이변량 분위벡터로 설명되는 그림 방법이다. 두 종류의 시각적인 표현 방법은 삼차원으로 표현할 수 있으나 이차원 평면으로도 쉽게 구현이 가능하며, 일반적으로 이변량 누적분포함수의 모든 특징을 충분히 설명할 수 있다. 따라서 삼변량 경험분포함수를 시각적 표현이 가능함을 보인다. 이변량과 사변량의 실증 예제를 통하여 본 연구에서 제안한 다변량 경험분포함수와 이차원 평면에 표현하는 시각적인 표현 방법들을 구현하고 탐색한다.

다변량 자료의 분산균일성 검정-피트만 방법의 확장-

  • 허명회;양경숙
    • Communications for Statistical Applications and Methods
    • /
    • 제4권1호
    • /
    • pp.41-47
    • /
    • 1997
  • 본 연구의 목적은 p변량 관측지가 등상관구조를 갖는 경우 주변분산들의 균일성을 검정하는 통계적 절차를 개발하는 것이다. 이를 위하여 2변량의 경우에 적용되는 피트만(Pitman)의 방법을 3변량 이상의 경우로 확장하고 피셔(Fisher)의 임의화 검정을 적용하여 정규분포의 틀에 의존하지 않는 p 값을 산출한다.

  • PDF

한국증권시장(韓國證券市場)에서 대용시장(代用市場)포트폴리오효율성(效率性)의 GMM에 의한 다변량(多變量) 검증(檢證)

  • 구본열
    • 재무관리연구
    • /
    • 제15권1호
    • /
    • pp.1-30
    • /
    • 1998
  • 본(本) 연구(硏究)는 한국증권시장에서 대표적 대용시장(代用市場)포트폴리오인 한국종합주가지수(韓國綜合株價指數)와 동일가중지수(同一加重指數)의 효율성에 대한 검증을 Hansen(1982)의 다변량의 GMM에 의하여 실시하고자 하였다. 이를 위하여 먼저, 주식수익률자료(株式收益率資料)에 근거한 산업별(産業別)포트폴리오수익률과 초과시장수익률모형(超過市場收益率模型)의 오차항(誤差項)이 정규분포(正規分布)를 벗어남을 증명함으로써 GMM검증방법(檢證方法)의 정당성을 찾고자 하였다. 정규분포에 대한 검증방법(檢證方法)으로서 왜도와 첨도의 검증과 이를 결합한 Jarque-Bera(1980)검증(檢證)을 실시하였다. 둘째로, Hansen(1982)의 GMM을 대용시장(代用市場)포트폴리오의 효율성(效率性) 검증(檢證)에 적용하는 방법에 대한 연구들인 Mackinlay-Richardson(1991), Harvey-Zhou(1993)와 Campbell-Lo-Mackilay(1997) 등을 기초로하여 이들의 방법론을 개선한 3가지의 효율성(效率性) 검증방법(檢證方法)을 제시하였다. 셋째로, 이상의 검증방법(檢證方法)들을 토대로 1980년 1월부터 1997년 6월까지 월별주식수익률(月別株式收益率)의 자료(資料)를 11업종으로 분류하여 산업별(産業別)포트폴리오수익률(收益率)과 초과시장수익률모형(超過市場收益率模型)에 의한 오차항(誤差項)이 정규분포(正規分布)를 따르는지와 아울러 대용시장(代用市場)포트폴리오의 효율성을 검증하였다. 검증결과(檢證結果), 산업별(産業別)포트폴리오수익률과 오차항(誤差項)은 대부분 정규성이 기각(棄却)되어 GMM검증방법(檢證方法)의 정당성이 입증되었다. 따라서 GMM에 의한 효율성(效率性)을 검증한 결과, 한국종합주가지수(韓國綜合株價指數)의 경우에는 평균-분산(平均-分散)프론티어(mean-variance frontier)상(上)에서의 대용시장(代用市場)포트폴리오의 효율성(效率性)은 기각(棄却) 할 수 없는 것으로 나타났으나 평균수익률(平均收益率)이 GMVP의 수익률보다 낮았기 때문에 효율적(效率的) 프론티어(efficient frontier)상(上)의 대용시장(代用市場)포트폴리오의 효율성(效率性)은 기각(棄却)되어 대용시장지수로서의 문제점이 있는 것으로 나타났다. 그러나 동일가중지수(同一加重指數)는 평균수익률이 GMVP의 수익률보다 높을 뿐만아니라 효율적(效率的) 프론티어상(上)의 대용시장(代用市場)포트폴리오의 효율성(效率性)도 채택되어 한국종합주가지수(韓國綜合株價指數)보다 우월한 지수(指數)인 것으로 나타났다.

  • PDF

다변량 확률밀도함수와 베이지안 정리를 이용한 교전공간내 공중항적의 격추확률 분포 특성 (Characteristics of Kill Probability Distribution of Air Track Within the Engagement Space Using Multivariate Probability Density Function & Bayesian Theorem)

  • 홍동욱;예승만;김주현
    • 한국항공우주학회지
    • /
    • 제49권6호
    • /
    • pp.521-528
    • /
    • 2021
  • 위협평가가 끝난 공중항적에 대해 적절한 대응무기를 할당하기 위해서는 교전예상지점을 고려하여 교전적합성을 평가하는 것이 필요하다. 논문에서는 공중항적이 교전공간을 통과할 때 공중항적의 상대거리, 접근방위각 및 고도 등 다변량 속성정보를 가지고 베이지안 정리를 적용하여 교전공간내 위치에 따른 격추확률을 계산하는 방법을 제시하였다. 계산결과 교전공간내에서의 각 지점별 격추확률값의 분포형태는 최적의 예상요격지점을 기준으로 다변량 정규분포를 따르고 있음을 확인하였고, 계산된 격추확률값은 교전공간을 통과하는 공중항적의 교전가능성 평가에 적용가능할 것으로 기대된다.

Copula 함수를 이용한 이변량분포의 VaR 추정 (VaR Estimation of Multivariate Distribution Using Copula Functions)

  • 홍종선;이재형
    • 응용통계연구
    • /
    • 제24권3호
    • /
    • pp.523-533
    • /
    • 2011
  • 위험관리수단으로 시장위험을 정확하게 측정하는 방법 중의 하나로 VaR를 선호한다. 현실생활에서는 단일분포가 아닌 두 개 이상의 다변량분포에 대한 VaR를 추정해야 하는 경우가 많다. 이런 경우에는 VaR를 추정하기 위해 다변량분포를 고려해야 한다. 본 연구는 확률변수들의 종속적 구조를 파악하고 비정규성의 특성을 갖는 다변량 분포함수를 생성하기 위하여 Copula 함수를 사용한다. 여러 산업의 수익률분포에 적합한 Clayton, Gumbel, Frank Copula 함수가 포함된 Archimedean Copula 함수를 추정하여 다변량 수익률 분포함수를 결정하고 이에 대응하는 VaR를 유도한다. 국내의 두 산업체의 자료를 실증예제로 하여 세 종류의 Copula 함수의 모수를 추정하고 이에 대응하는 이변량 분포로부터 VaR와 각각의 주변 분포의 VaR를 구한다. 실제의 VaR를 기준으로 기존 방법으로 구한 VaR와 비교 분석하여 추정의 정확성을 토론한다.

조건부 상호정보를 이용한 분류분석에서의 변수선택 (Efficient variable selection method using conditional mutual information)

  • 안치경;김동욱
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권5호
    • /
    • pp.1079-1094
    • /
    • 2014
  • 상호정보 (mutual information)를 이용한 변수 선택법은 반응변수와 설명변수간의 선형적인 연관성뿐만 아니라 비선형적인 연관성을 감지하며, 설명변수 사이의 연관성도 고려하는 좋은 변수선택 방법이다. 하지만 고차원 자료에서 상호정보를 추정하기가 쉽지 않아 이에 대한 연구가 필요하다. Cai 등 (2009)은 조건부 상호정보를 이용한 전진선택법과 가지치기법을 이용하여 이러한 문제를 해결하였으며, 마이크로어레이 자료와 같은 고차원 자료에서 조건부 상호정보를 이용한 변수 선택법으로 선택된 변수들로 구성된 SVM의 분류 성능이 SVM-RFE 및 기존의 필터링 방법으로 선택된 변수들로 구성된 SVM의 분류 성능보다 뛰어남을 보였다. 하지만 조건부 상호정보를 추정할 때 사용된 Parzen window 방법은 변수의 수가 많아질수록 변수 선택 시간이 길어지는 단점으로 인해 이에 대한 보완이 필요하다. 본 논문에서는 조건부 상호정보 계산 시 필요한 설명변수의 분포를 다변량 정규분포로 가정함으로써 변수선택을 위한 계산시간을 단축시키며 동시에 변수선택의 성능을 향상시키고자 한다. 반면, 설명변수의 분포를 다변량 정규분포로 가정한다는 것은 강한 제약이 될 수 있으므로 이를 완화시킨 Edgeworth 근사를 이용한 조건부 상호정보 기반의 변수 선택법을 제안한다. 실증분석을 통해 본 논문에서 제안한 방법의 효율성을 살펴보았으며, 기존의 조건부 상호정보 기반 변수 선택법에 비해 계산 속도나 분류 성능 면에서 우수함을 보였다.

가능도 함수를 기초로 한 다변량 정규성 검정 (A Test of the Multivariate Normality Based on Likelihood Functions)

  • 여인권
    • 응용통계연구
    • /
    • 제15권2호
    • /
    • pp.223-232
    • /
    • 2002
  • 이 논문에서는 비선형 변환과 가능도 함수를 이용하여 다변량 자료의 정규성을 검정하는 방법에 대해 알아본다. 사용된 변환은 변환모수에 따라 여러 가지 형태를 가지는 변환족을 구성하는데 이 변환모수를 검정하여 자료의 정규성을 검정한다. 모수의 검정은 점수함수(score function)을 기초로 이루어지며 표본크기가 적은 경우에도 검정통계량의 분포를 유도하기 위한 모수적 붓스트랩 검정방법이 사용된다. 모의실험 결과 기존의 방법과 검정력을 비교하여 제안된 방법이 검정력이 높은 것으로 나타났다.