• 제목/요약/키워드: 다변량 통계분석

검색결과 477건 처리시간 0.022초

매립물 특성 조사를 위한 다변량 통계분석 기법의 응용 (Application of Multivariate Statistical Analysis Technique in Landfill Investigation)

  • 권병두;김차섭
    • 한국지구과학회지
    • /
    • 제18권6호
    • /
    • pp.515-521
    • /
    • 1997
  • 난지도 매립장 매립물의 특성을 조사하기 위해서 중력, 자력, LandSat TM 열적외선 밴드 자료, 매립장의 표면에서 측정한 침하량 자료 등을 다변량 통계분석기법을 응용하여 분석하였다. 분석에 이용한 자료들은 각기 상이한 깊이에 관한 정보를 제공하기 때문에 측정된 총 자력자료와 중력자료는 자극화변환된 자력이상과 매립장의 3차원 밀도분포로 각기 전환하였으며, 본 연구에서는 이 중 매립장의 상부층에 관한 정보를 이용하였다. 통계분석은 침하량 측정 지점들을 대상으로 수행하였으며, 이들 지점에서의 자극화변환 자력이상, 매립물의 밀도, LandSat TM 열적외선 밴드 값들은 내삽방법을 이용하여 구하였다. 자료분석에 사용한 다변량 통계분석 기법은 개체간의 기하학적인 거리를 이용하여 군집화하는 집락분석으로, 개체간의 거리 계산시 각 자료간의 상이한 측정단위가 주는 효과를 제거하기 위해서 사전에 표준화를 실시하였다. 군집화는 체계적 군집화 방법을 이용하여 수행하였다. 물리적 특성을 바탕으로 분류된 최적의 군집수는 수상도에서 나타난 결과에 따르면 총 6개의 군집으로 나타났다. 본 연구의 결과는 통합된 지구물리자료에 다변량 통계분석 기법을 적용함으로써 복합적 인 쓰레기 매립장의 특성 규명이 가능함을 시사한다.

  • PDF

Microsoft Excel의 Macro와 VBA를 이용한 다변량자료분석 시스템 개발

  • 한상태;강현철;이성건;한정훈
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2002년도 추계 학술발표회 논문집
    • /
    • pp.243-248
    • /
    • 2002
  • 최근 다변량자료분석과 관련하여 이를 시스템으로 구현하려는 연구가 다양한 각도로 이루어지고 있다. 이러한 연구들의 공통적인 특징은 일반 사용자들에게 고급 통계분석기법을 편리하게 활용할 수 있도록 GUI(Graphical User Interface) 환경의 시스템을 제공해 준 것이다. 이런 연구의 연장선상에서 본 연구에서는 다변량자료분석 시스템을 구현하는데 있어 사회 각 분야에서 가장 널리 활용되고 있는 사무용 프로그램인 마이크로소프트(Microsoft) Excel을 활용하여 일반 사용자들도 다변량분석을 쉽게 활용할 수 있도록 대화식 시스템을 개발하였다.

  • PDF

다변량 지수평활모형을 이용한 환율 분석 (Multivariate exponential smoothing models with application to exchange rates)

  • 이연하;성병찬
    • 응용통계연구
    • /
    • 제33권3호
    • /
    • pp.257-267
    • /
    • 2020
  • 본 논문은 단변량 지수평활법의 확장된 형태인 다변량 지수평활법을 소개하고 다변량 시계열 분석에 활용한다. 다변량 지수평활법은 한 개의 오차를 기반으로 하는 상태공간모형을 이용하여 추정의 편리성을 제고하며, 다변량 시계열간의 잠재적인 상호연관성을 활용하여 적합도 및 예측력을 향상시킨다. 다변량 지수평활법의 성능을 평가하기 위하여 월별 원/달러 및 원/파운드 환율자료를 분석하고 예측한다. 대안 모형의 예측 결과와 비교하여 다변량 지수평활법의 우수성을 확인한다.

다차원척도법과 거리분석을 활용한 그룹화된 비유사성에 대한 비모수적 접근법 (Non-parametric approach for the grouped dissimilarities using the multidimensional scaling and analysis of distance)

  • 남승찬;최용석
    • 응용통계연구
    • /
    • 제30권4호
    • /
    • pp.567-578
    • /
    • 2017
  • 일반적으로 그룹화된 다변량자료는 다변량 분산분석(multivariate analysis of variance; MANOVA)을 사용하여 그룹 간 차이를 검정할 수 있다. 그러나 만약 다변량 분산분석의 기본적인 가정이 위배되면 이 방법은 적절하지 못하다. 이 경우 다양한 거리로부터 그룹화된 비유사성을 계산한 후 다차원척도법(multidimensional scaling; MDS), 거리분석(analysis of distance; AOD) 그리고 비모수적 기법인 순열검정(permutation test)을 적용하여 문제를 해결할 수 있다. 다차원척도법은 비유사성으로부터 개체들의 좌표를 계산해주며 거리분석은 이 좌표를 활용하여 그룹구조를 파악하는데 유용하다. 특히 비유사성의 측도로 유클리드 거리를 사용하면 거리분석은 다변량 분산분석과 수리적으로 매우 밀접한 연관관계를 맺는다. 따라서 본 연구에서는 그룹화된 비유사성에 다차원척도법과 거리분석을 적용하여 그룹 내와 그룹 간의 구조를 파악하고 순열검정을 위한 새로운 검정통계량을 제안하려 한다. 덧붙여 유클리드 거리를 활용한 비유사성을 통해 거리분석과 다변량 분산분석과의 수리적 연관성을 고찰하고자 한다.

주성분분석에 의한 결손 자료의 영향값 검출에 대한 연구 (Detecting Influential Observations in Multivariate Statistical Analysis of Incomplete Data by PCA)

  • 김현정;문승호;신재경
    • 응용통계연구
    • /
    • 제13권2호
    • /
    • pp.383-392
    • /
    • 2000
  • 1970년대 후반부터 영향력이 있는 관측값을 검출하기 위해서 회귀분석을 포함한 다양한 다변량 해석법에서의 영향분석 및 감도분석에 대한 연구가 진행되어 왔다. 결손 값이 포함된 불완전한 자료에 관해서도 이러한 연구가 필요하다. 이와 관련하여 Kim et al.(1998)등은 평균벡터와 분산공분산행렬에 대한 최우추정값에 초점을 두고 불완전한 자료에 대한 다변량 해석법에서의 감도분석에 관한 방법적 연구를 다루었다. Kim et al.(1998)에서는 Cook’s D 통계량을 이용하였으나, 본 논문에서는 결손값이 있는 다변량 자료에 대해서 주성분을 이용하여 영향력이 있는 관측값을 검출하는 방법에 대해서 살펴보았다. 이 때, 결손값은 EM알고리즘에 의해 대치하여 PCA 통계량을 유도하였다.

  • PDF

다변량 통계분석을 이용한 저수지증발량 영향인자에 관한 연구 (A Study of Influence Factors for Reservoir Evaporation Using Multivariate Statistical Analysis)

  • 이경수;곽성현;서용재;류시완
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.237-240
    • /
    • 2017
  • 지구온난화로 인해 세계 곳곳에서 기온상승이 관측되고 있으며, 이는 전지구적 기후시스템의 변화를 보여주는 대표적인 예이다. 온도를 비롯한 강수량, 풍속, 증발량 등의 기상학적, 수문학적 인자들이 각각 서로에게 영향을 주고 받으며 복잡하게 변화할 것이고, 그 변화폭도 점점 커질 것이다. 증발에 영향을 미치는 인자들은 크게 세 가지로 나뉘는데, 태양복사에너지, 온도, 바람, 기압, 습도와 같은 기상학적인자, 증발표면의 특성인자 그리고 수질인자로 분류할 수 있다. 증발에 영향을 주는 인자들은 예전부터 알려져 있지만 이들 간의 복잡한 상호작용에 대해 정확히 이해하기는 쉽지 않다. 본 연구에서는 댐유역의 증발량에 영향을 미치는 기상인자 파악을 위해 2008부터 2016년까지 관측된 낙동강수계 내 안동댐과 남강댐의 기상자료(기온, 강수량, 풍속, 상대습도, 기압, 일사량, 일조시간, 전운량)를 이용한 변화를 분석하였으며, 다변량 통계기법인요인분석을 통해 증발량과 상관성이 높은 인자들을 분류하였다. 안동댐과 남강댐 공통적으로 증발량과 기온, 기압이 같은 요인으로 분류되고 높은 상관성을 보였으며, 강수량, 일조시간, 일사량, 전운량이 같은 요인으로 분류되었다. 국내의 증발량 측정지점에 대한 추가적인 분석과 영향인자를 이용한 다변량회귀식과 인공신경망 통해 증발량 미측정 지점의 증발량 산정이 가능할 것으로 판단된다.

  • PDF

단변량 및 다변량 함수 데이터에 대한 분산분석의 활용 (Application of functional ANOVA and functional MANOVA)

  • 김미정
    • 응용통계연구
    • /
    • 제35권5호
    • /
    • pp.579-591
    • /
    • 2022
  • 함수 데이터는 다양한 분야에서 수집되고 있으며, 집단 간의 함수 데이터를 비교해야하는 경우가 종종 발생한다. 이럴 경우 점별 분산분석 방법을 이용하여 설명하기에는 무리가 있으며, 통합된 결과를 제시할 필요가 있다. 이에 대한 다양한 연구가 제안되었으며, 최근에 R 패키지 fdANOVA로 구현되었다. 이 논문에서 우선 분산분석 및 다변량 분산분석을 설명하고, 최근에 제안된 다양한 단변량 및 다변량 함수 데이터 분산분석을 설명하고자 한다. 또한 R 패키지 fdANOVA의 사용 방법을 설명하고, 이 패키지를 이용하여 서울과 부산 지역의 주별 기온을 단변량 함수 데이터 분산분석을 통해 비교하고, 손글씨 이미지를 다변량 함수 데이터로 변환하여 다변량 함수 데이터 분산분석을 이용하여 비교하고자 한다.

다변량 왜정규분포 기반 선형결합통계량에 대한 안장점근사 (Saddlepoint Approximation to the Linear Combination Based on Multivariate Skew-normal Distribution)

  • 나종화
    • 응용통계연구
    • /
    • 제27권5호
    • /
    • pp.809-818
    • /
    • 2014
  • 다변량 왜정규분포는 다변량 정규분포를 포함하는 분포로 최근 많은 응용분야에서 활용되고 있다. 본 논문에서는 다변량 왜정규분포를 기반으로 하는 선형결합통계량의 분포함수에 대한 안장점근사를 다루었다. 이는 단변량 왜정규분포 기반 표본평균에 대한 Na와 Yu (2013)의 결과를 선형결합 및 다변량의 경우로 확장한 것이다. 모의실험과 실제자료분석을 통해 제안된 근사법의 유용성과 정확도를 확인하였다.

Hotelling의 T$^{2}$ 통계량을 이용한 cDNA 마이크로어레이 분석

  • 김병수;이선호;김인영;김상철;라선영;정현철
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2003년도 춘계 학술발표회 논문집
    • /
    • pp.295-297
    • /
    • 2003
  • 본 논의에서는 cDNA 마이크로어레이 분석에서 다변량 분석의 한 방법인 Hotelling의 T제곱 통계량을 이용하여 유의적 유전자군을 검색하고, 이 유전자군을 사용하여 검사자료를 두군으로 분류하는데 단변량 t통계량에 기초한 접근보다 얼마나 효율적인지를 평가하고자 한다.

  • PDF

지진유발 변형률 데이터의 분포 특성 분석을 위한 응용통계기법의 적용 (Application of Statistical Analysis to Analyze the Spatial Distribution of Earthquake-induced Strain Data)

  • 김보람;채병곤;김용제;서용석
    • 지질공학
    • /
    • 제23권4호
    • /
    • pp.353-361
    • /
    • 2013
  • 본 연구에서는 ${\bigcirc}{\bigcirc}$지역 토목용 계측기에서 측정된 지진유발 변형률 데이터의 분포 특성을 분석하기 위한 기법으로 응용통계기법에 대한 적용성을 평가하였다. 2011년 도호쿠 대지진과 같은 해에 발생한 규모 7.0 이상의 여진을 계측한 4방향의 변형률 데이터를 활용하였다. 데이터의 미세한 변동을 감지하기 위하여 단변량 분석기법인 x-MR 분석을 실시하였으며 분석결과 계측 데이터 간의 분산시점에 차이가 발생하는 것을 확인하였다. 이러한 분산시점의 차이를 해결하기 위하여 변형률 데이터 간의 상관성을 고려한 다변량 통계분석을 실시하였다. 다변량 분석기법 가운데 하나인 주성분 분석결과를 $T_2$과 Q-통계량 분석에 적용하여 신뢰구간 99.9%, 99.0%, 95.0%로 실시간 분석을 수행하였다. 분석결과 $T_2$과 Q-통계량 값이 신뢰구간 99.9%를 초과하는 시점은 x-MR 분석의 분산시점과 일치하거나 이른 시간으로 나타났다. 또한, 신뢰구간 95.0%와 99.0%를 초과하는 시점은 99.9%를 초과하는 시점 이전에 타점되어 지진발생 전에 이상 분포 발생을 예측할 수 있었다. 이러한 결과는 변형률 데이터의 비정상적인 분포 특성을 다변량 통계분석법으로 인지할 수 있다는 것을 의미한다. 따라서 다변량 통계분석은 변형률 데이터의 분포 특성을 분석하여 지진을 예지하는 방법으로 이용가능하다고 판단된다.