• 제목/요약/키워드: 다변량통계분석

검색결과 475건 처리시간 0.022초

다변량 형질의 유전연관성에 대한 주성분을 이용한 회귀방법와 다변량 비모수 추세검정법의 비교 (Comparison of Principal Component Regression and Nonparametric Multivariate Trend Test for Multivariate Linkage)

  • 김수영;송혜향
    • 응용통계연구
    • /
    • 제21권1호
    • /
    • pp.19-33
    • /
    • 2008
  • 연속 형질(quantitative trait)에 영향을 미치는 유전자를 알아내기 위해 형제 쌍의 자료를 수집하여, 주로 이용되는 Haseman과 Elston (1972)의 최소제곱 회귀검정법으로 분석하는데 이는 단일 형질에 대한 분석법이다. 현실적으로 여러 형질들이 복잡하게 단일유전자 좌위(single locus)와 연관되어 있어 함께 수집하게 되는 경우에는, 이러한 연관된 여러 형질을 동시에 분석하는 유전연관성 검정법(linkage test)이 절실히 필요한 실정이다. Amos 등 (1990)은 주성분(principal component) 선형모형을 이용하여 Haseman과 Elston (1972)방법을 둘 이상의 형질의 다변량 분석법으로 확장시켰다. 그러나 이 검정방법은 통계량의 분포를 알 수 없기에 아직 제 1종 오류가 제대로 통제되지 못하는 문제를 가지고 있다. 본 논문에서는 이러한 다변량 형질 자료의 연관성검정에 있어 단일변량에 대한 비모수 추세검정법을 다변량 자료에 대한 분석법으로 확장시킨 통계량을 사용할 것을 제안한다. Amos 등 (1990)이 제안한 방법과 다변량 추세검정 통계량을 모의실험으로 생성한 연속형 형질자료에 적용하였을 때, 다변량 추세검정 통계량은 Amos 등 (1990) 방법에서의 여러 문제점이 발생되지 않을 뿐만 아니라 모의실험에서 제 1종 오류가 정해진 유의수준에 가까운 것을 확인하였고, 검정적이 더 높음을 볼 수 있었다.

다차원척도법과 거리분석을 활용한 그룹화된 비유사성에 대한 비모수적 접근법 (Non-parametric approach for the grouped dissimilarities using the multidimensional scaling and analysis of distance)

  • 남승찬;최용석
    • 응용통계연구
    • /
    • 제30권4호
    • /
    • pp.567-578
    • /
    • 2017
  • 일반적으로 그룹화된 다변량자료는 다변량 분산분석(multivariate analysis of variance; MANOVA)을 사용하여 그룹 간 차이를 검정할 수 있다. 그러나 만약 다변량 분산분석의 기본적인 가정이 위배되면 이 방법은 적절하지 못하다. 이 경우 다양한 거리로부터 그룹화된 비유사성을 계산한 후 다차원척도법(multidimensional scaling; MDS), 거리분석(analysis of distance; AOD) 그리고 비모수적 기법인 순열검정(permutation test)을 적용하여 문제를 해결할 수 있다. 다차원척도법은 비유사성으로부터 개체들의 좌표를 계산해주며 거리분석은 이 좌표를 활용하여 그룹구조를 파악하는데 유용하다. 특히 비유사성의 측도로 유클리드 거리를 사용하면 거리분석은 다변량 분산분석과 수리적으로 매우 밀접한 연관관계를 맺는다. 따라서 본 연구에서는 그룹화된 비유사성에 다차원척도법과 거리분석을 적용하여 그룹 내와 그룹 간의 구조를 파악하고 순열검정을 위한 새로운 검정통계량을 제안하려 한다. 덧붙여 유클리드 거리를 활용한 비유사성을 통해 거리분석과 다변량 분산분석과의 수리적 연관성을 고찰하고자 한다.

단변량 및 다변량 함수 데이터에 대한 분산분석의 활용 (Application of functional ANOVA and functional MANOVA)

  • 김미정
    • 응용통계연구
    • /
    • 제35권5호
    • /
    • pp.579-591
    • /
    • 2022
  • 함수 데이터는 다양한 분야에서 수집되고 있으며, 집단 간의 함수 데이터를 비교해야하는 경우가 종종 발생한다. 이럴 경우 점별 분산분석 방법을 이용하여 설명하기에는 무리가 있으며, 통합된 결과를 제시할 필요가 있다. 이에 대한 다양한 연구가 제안되었으며, 최근에 R 패키지 fdANOVA로 구현되었다. 이 논문에서 우선 분산분석 및 다변량 분산분석을 설명하고, 최근에 제안된 다양한 단변량 및 다변량 함수 데이터 분산분석을 설명하고자 한다. 또한 R 패키지 fdANOVA의 사용 방법을 설명하고, 이 패키지를 이용하여 서울과 부산 지역의 주별 기온을 단변량 함수 데이터 분산분석을 통해 비교하고, 손글씨 이미지를 다변량 함수 데이터로 변환하여 다변량 함수 데이터 분산분석을 이용하여 비교하고자 한다.

다변량 왜정규분포 기반 선형결합통계량에 대한 안장점근사 (Saddlepoint Approximation to the Linear Combination Based on Multivariate Skew-normal Distribution)

  • 나종화
    • 응용통계연구
    • /
    • 제27권5호
    • /
    • pp.809-818
    • /
    • 2014
  • 다변량 왜정규분포는 다변량 정규분포를 포함하는 분포로 최근 많은 응용분야에서 활용되고 있다. 본 논문에서는 다변량 왜정규분포를 기반으로 하는 선형결합통계량의 분포함수에 대한 안장점근사를 다루었다. 이는 단변량 왜정규분포 기반 표본평균에 대한 Na와 Yu (2013)의 결과를 선형결합 및 다변량의 경우로 확장한 것이다. 모의실험과 실제자료분석을 통해 제안된 근사법의 유용성과 정확도를 확인하였다.

Neyman 최적배분의 공분산 행렬에 근거한 다변량 절충배분

  • 김호일
    • Communications for Statistical Applications and Methods
    • /
    • 제3권1호
    • /
    • pp.131-143
    • /
    • 1996
  • 다변량 층화임의추출에서 한 변수의 Neyman 최적배분은 다른 변수에 대한 층화분산을 최소화시키지 못하는 결과를 초래할 수도 있다. 따라서 다변량 자료의 경우 '최적'배분 대신에 '절충'배분이 도입되어 왔다. 이 연구에서는 각 변수별 Neyman 최적배분에 근거해서 얻은 층화표본평균벡터의 공분산 행렬에 가장 잘 적합되는 층별로 동일한 크기의 절충배분을 찾고자 한다. 이에 적절한 기준 다섯가지를 제시하고 예를 통해 비교, 분석하였다.

  • PDF

주성분분석에 의한 결손 자료의 영향값 검출에 대한 연구 (Detecting Influential Observations in Multivariate Statistical Analysis of Incomplete Data by PCA)

  • 김현정;문승호;신재경
    • 응용통계연구
    • /
    • 제13권2호
    • /
    • pp.383-392
    • /
    • 2000
  • 1970년대 후반부터 영향력이 있는 관측값을 검출하기 위해서 회귀분석을 포함한 다양한 다변량 해석법에서의 영향분석 및 감도분석에 대한 연구가 진행되어 왔다. 결손 값이 포함된 불완전한 자료에 관해서도 이러한 연구가 필요하다. 이와 관련하여 Kim et al.(1998)등은 평균벡터와 분산공분산행렬에 대한 최우추정값에 초점을 두고 불완전한 자료에 대한 다변량 해석법에서의 감도분석에 관한 방법적 연구를 다루었다. Kim et al.(1998)에서는 Cook’s D 통계량을 이용하였으나, 본 논문에서는 결손값이 있는 다변량 자료에 대해서 주성분을 이용하여 영향력이 있는 관측값을 검출하는 방법에 대해서 살펴보았다. 이 때, 결손값은 EM알고리즘에 의해 대치하여 PCA 통계량을 유도하였다.

  • PDF

금융시계열 분석을 위한 다변량-GARCH 모형에서 비대칭-CCC의 도입 및 응용 (Asymmetric CCC Modelling in Multivariate-GARCH with Illustrations of Multivariate Financial Data)

  • 박란희;최문선;황선
    • 응용통계연구
    • /
    • 제24권5호
    • /
    • pp.821-831
    • /
    • 2011
  • 다변량-GARCH 분야에서 비대칭모형에 대한 연구는 상대적으로 미진하다 (McAleer 등, 2009). 본 논문에서는 다변량-GARCH 시계열에서 비대칭 모형과 상수 조건부 상관모형(CCC)을 도입하여 모델링하는 방법론에 대해 연구하고 있다. 다변량 비대칭 변동성 모형 적합 방법을 실용적으로 소개하고 있으며 이를 이용하여 국내 다변량 시계열 분석을 상세히 예시하였다.

군집방법의 역사와 응용사례에 관한 고찰

  • 이승우
    • 한국수학사학회지
    • /
    • 제10권2호
    • /
    • pp.48-52
    • /
    • 1997
  • 통계학이란 미래에 대한 예측을 하고 이에 대비하여 합리적인 의사결정을 내리는데 도움을 받을 수 있는 학문이다. 최근 다변량 통계분석은 관찰이나 실험의 대상이 되는 하나 이상의 변수들을 동시에 분석할 수 있는 매우 실제성이 높은 분석방법으로 통계학, 경영학, 사회학, 심리학, 생물학 등 여러 전공 분야에서 복잡하고 다양한 자료 분석에 폭넓게 활용되고 있다. 이 논문에서는 다변량 분석 방법 중 컴퓨터와 통계 분석 소프트웨어의 발전으로 인하여 최근에 활발히 연구되고 있는 군집방법의 역사와 여러 연구분야의 실제자료분석에 응용할 수 있도록 군집분석을 6가지로 나누어서 분류하였고 그 방법론을 제시하였다.

  • PDF

다변량 분산분석을 이용한 포장 재질에 따른 쌀의 신선도 분석 (Analysis of freshness of rice depending on packing materials using MANOVA)

  • 김성주
    • 응용통계연구
    • /
    • 제29권7호
    • /
    • pp.1421-1428
    • /
    • 2016
  • 본 논문에서는 포장 재질에 따라 쌀의 신선도가 어떻게 달라지는지 알아보기 위해 다변량 분산분석을 적용해 보았다. 쌀의 신선도는 쌀의 수분 함량과 식미치로 측정하였다. 포장 재질은 일반 종이와 종이 뒷면에 숯을 코팅한 종이를 비교하였다. 쌀을 보관하는 장소를 블록으로 간주하였다. 쌀의 수분 함량과 식미치를 나타내는 이변량 관측값에 대하여 완전 확률화 블록 설계에 의한 다변량 분산분석을 적용해 본 결과 포장 재질에 따라 유의한 차이를 보였다. 따라서 쌀의 수분 함량과 식미치 각각을 단일변량 관측값으로 간주하고 분산분석을 적용해 보았다. 그 결과 쌀의 수분 함량에 대해서는 포장 재질에 따라 유의한 차이를 보였으나 식미치에 대해서 유의한 차이 관측할 수 없었다.