• Title/Summary/Keyword: 평균 분산 분석

Search Result 947, Processing Time 0.047 seconds

데이터 마이닝에서의 군집분석 알고리즘 비교 연구

  • Lee, Yeong-Seop;An, Mi-Yeong
    • 한국데이터정보과학회:학술대회논문집
    • /
    • 2003.05a
    • /
    • pp.19-25
    • /
    • 2003
  • 데이터베이스에 내재된 패턴이나 관계를 묘사한 것만으로도 의사결정에 필요한 정보를 제공할 수 있는데 이 데이터들의 변수들을 비슷한 특징을 가지는 소그룹으로 나누어 패턴을 찾는 것을 군집분석이라 한다. 이러한 군집 분석에는 분리군집방법과 계층적군집방법이 있는데, 재할당이 가능한 분리군집방법의 여러 알고리즘에 대해 비교해보자. 분리군집알고리즘에는 중심을 평균으로 하는 k-평균 알고리즘과, 중심을 메도이드로하는 PAM, CLARA, CLARANS 알고리즘이 있다. 이러한 알고리즘에 대한 이론과, 장단점을 설명하고, 분산과 중심들간의 평균 거리로 비교해 본다.

  • PDF

시간의 흐름에 따른 무조건부 주가분산과 주가형성

  • Lee, Il-Gyun
    • The Korean Journal of Financial Studies
    • /
    • v.14 no.1
    • /
    • pp.41-56
    • /
    • 2008
  • 주식 수익률이 정상적 과정이 아니라 비정상적 과정에 의해서 생성되고 있다는 사실이 여러 실증 분석에서 제시되고 있다. 시계열의 평균이 시간의 흐름에 따라 변하면 이 시계열은 비정상적 과정에 의하여 생성된다. 시간의 흐름에 따라 평균이 변하는 비정상 시계열은 단위근과 공적분에 의하여 시계열의 운동을 모형화하고 있다. 한편 시계열의 비정상성은 분산이 시간의 흐름에 따라 변할 때에도 발생한다. 시간의 흐름에 따라 무조건부 분산은 변하지 않고 있지만 이용 가능한 정보 집합을 조건으로 하는 조건부 분산이 변하는 경우도 있다. 이 같은 성질을 가진 주가 시계열은 자기회귀 조건부 이분산(ARCH) 계통의 과정으로 모형화하고 있다. 그러나 무조건부 분산이 시간의 흐름에 따라 변하면 ARCH 계통은 중대한 모형정립과오(misspecification)에 직면하게 된다. 따라서 본 논문은 무조건부 분산이 시간의 흐름에 따라 변할 때 자기 회귀 과정의 모수를 추정하는 방법을 검토하고, 이 방법을 한국 종합주가 지수에 적용하여 자기회귀 과정의 모수를 추정하였다. 이 방법에 의하여 추정된 2계 자기회귀 과정의 모수값 중 상수항과 제1계 항의 계수는 통상 최소자승법에 의한 값과 유사하다. 그러나 제2계 항 모수의 값은 양자가 상당히 다르다. 최소자승에 의한 제2계 값이 과대 추정되고 있다.

  • PDF

A Graphical Method for Evaluating the Effect of Outliers in One- and Two-Variate Data (일변량 및 이변량 자료에 대하여 특이값의 영향을 평가하기 위한 그래픽 방법)

  • Jang, Dae-Heung
    • The Korean Journal of Applied Statistics
    • /
    • v.20 no.2
    • /
    • pp.395-407
    • /
    • 2007
  • Outliers distort many measures for data analysis. We can propose dandelion seed plot as a graphical tool for evaluating the effect of outliers in one-and two-variate data. We can draw mean-variance dandelion seed plots using linked curves which are made by changing weights from 1 to 0 for each datum. Similarly we can also draw covariance-correlation-coefficient dandelion seed plots. This graphical method can be a useful tool for elementary statistics education in college.

Change and Trend Analyses of Rainfall Data (강수자료에 대한 변동성 및 경향성 해석)

  • Lee, Sang Bok;Kim, Kyung Duk;Heo, Jun-Haeng
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2004.05b
    • /
    • pp.696-700
    • /
    • 2004
  • 본 연구에서는 우리나라 주요 관측소의 연최대강수량과 연강수량을 내상으로 변동 및 경향을 분석하여 그 결과를 비교하였다. 강수 자료의 변화분석을 수행함에 있어 양질의 강수 자료를 수집하기 위하여 기상청 보유 관측소 중 30년 이상 강우 기록을 가지고 있는 관측소를 내상으로 연최대강수량과 연강수량 자료를 추출하였다. 강수 자료의 변화분석은 크게 2가지로 변동분석과 경향분석을 수행하였다. 변동분석은 강수 자료의 평균과 분산의 편차에 따른 변동점 가정을 이용하여 변동점 전${\cdot}$후 강수 자료의 평균과 분산 변화에 내하여 통계적 유의성을 검정하는 방법이다. 경향분석은 강수 자료의 증가 또는 감소의 경향을 매개변수적, 비매개변수적 방법으로 통계적 유의성을 검정하는 방법이다. 본 연구에서 수행한 변동 및 경향분석 결과 어떤 기후적 요인에 의하여 강수량이 변화했다는 길과는 통계적 유의성에서 확인되지 않았다. 그러나 강수량 도시(plot)를 통한 강수량의 변동 및 경향은 존재하는 것으로 나타났으며, 이는 빈도 해석에 의한 확률강수량 산정시 고려 대상이 된다.

  • PDF

공간통계모형에서 Box-Cox 변환에 대한 영향력 분석연구

  • Lee, Jin-Hui;Sin, Gi-Il
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2002.05a
    • /
    • pp.153-158
    • /
    • 2002
  • 시계열 자료의 분석에서 분산이 일정하지 않을 경우 이에 대한 해결방법으로 변환이 사용된다. 그러나 이러한 변환은 분산을 안정화시킴으로서 추정 및 검정에 타당성을 주는 반면 새로운 편의를 생성하거나(Granger & Newbold,1976) 모형을 복잡하게 만듦으로써 해석의 어려움도 수반한다. 신과 강(2001)은 평균이 크고 그에 비해 분산이 작을 경우 Box-Cox 멱 변환이 시계열 자료에 대하여 별 영향을 미치지 않음을 연구하였다. 본 논문은 이에 대한 확장으로 공간자료에서도 이 이론이 성립함을 밝혔다.

  • PDF

Bootstrap estimation of long-run variance under strong dependence (장기간 의존 시계열에서 붓스트랩을 이용한 장기적 분산 추정)

  • Baek, Changryong;Kwon, Yong
    • The Korean Journal of Applied Statistics
    • /
    • v.29 no.3
    • /
    • pp.449-462
    • /
    • 2016
  • This paper considers a long-run variance estimation using a block bootstrap method under strong dependence also known as long range dependence. We extend currently available methods in two ways. First, it extends bootstrap methods under short range dependence to long range dependence. Second, to accommodate the observation that strong dependence may come from deterministic trend plus noise models, we propose to utilize residuals obtained from the nonparametric kernel estimation with the bimodal kernel. The simulation study shows that our method works well; in addition, a data illustration is presented for practitioners.

K-Means Clustering in the PCA Subspace using an Unified Measure (통합 측도를 사용한 주성분해석 부공간에서의 k-평균 군집화 방법)

  • Yoo, Jae-Hung
    • The Journal of the Korea institute of electronic communication sciences
    • /
    • v.17 no.4
    • /
    • pp.703-708
    • /
    • 2022
  • K-means clustering is a representative clustering technique. However, there is a limitation in not being able to integrate the performance evaluation scale and the method of determining the minimum number of clusters. In this paper, a method for numerically determining the minimum number of clusters is introduced. The explained variance is presented as an integrated measure. We propose that the k-means clustering method should be performed in the subspace of the PCA in order to simultaneously satisfy the minimum number of clusters and the threshold of the explained variance. It aims to present an explanation in principle why principal component analysis and k-means clustering are sequentially performed in pattern recognition and machine learning.

Application of Drone for Analysis of 2D Pollutant Mixing in River (하천에 유입된 오염물질의 2차원 혼합 분석을 위한 드론의 활용)

  • Seo, Il Won;Baek, Donghae
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.100-100
    • /
    • 2017
  • 하천에 유입된 오염물질의 2차원 혼합거동은 하천 주흐름에 의한 이송현상과 유속 성분의 수심평균 값에 대한 공간적 편차로부터 야기되는 분산현상으로 설명 할 수 있다. 이는 3차원 이송확산 방정식으로부터 수심 적분된 2차원 이송-분산 방정식으로 수학적 유도가 가능하며, 수심방향으로 적분하는 과정에서 발생되는 농도의 분산항은 Taylor Dispersion 개념에 기초하여 종방향 및 횡방향의 2차원 분산계수로 표현된다. Fischer(1978)는 연직방향 유속분포로부터 2차원 분산계수를 추정하는 해석해를 수학적으로 유도하였으나, 실제 하천에서 정밀한 연직방향 유속분포를 계측하는 것은 많은 비용 및 노동력을 초래한다. 따라서 선행 연구자들은 2차원 혼합모형의 분산계수를 산정하고자 실험적 방법으로써 추적자실험을 수행하였다. 추적자실험은 추적자 물질을 수체에 주입한 후 농도의 변화를 관측함으로써 추적자물질이 하천에서 이송 및 분산되는 과정을 이해하는데 유용하다. 기존의 추적자실험은 고정된 위치에서 농도를 계측하여 시계열적인 농도의 변화를 관측한 후, 오염운 동결가정을 통해 종,횡방향 분산계수의 산정이 가능하지만, 오염물질 농도의 공간적 분포를 얻기에는 한계가 있다. 본 연구에서는 기존의 추적자실험법의 한계를 극복하고자 형광물질을 이용한 추적자실험을 수행함과 동시에 드론에 장착된 디지털카메라를 이용하여 항공영상을 취득 및 분석하여, 하천에 주입된 형광물질의 농도분포를 시공간적으로 추출하는 기법을 개발하고, 이를 바탕으로 오염물질의 2차원 혼합거동을 분석하였다. 본 실험은 한국건설기술연구원의 안동하천실험센터의 A3실험수로에서 수행되었으며, 실험수로는 평균 하폭 5 m, 평균 수심 0.44 m, 유량 $0.96m^3/s$의 실제 소규모 하천과 유사한 축척을 가지고 있다. 추적자물질은 Rhodamine WT 용액이 사용되었으며, 실험수로 내 설치된 15개의 형광광도계(YSI-600OMS)를 이용하여 농도를 측정하였다. 항공영상의 취득을 위해 이용된 드론은 DJI-Phantom 3 Professional 이며, 3840x2160의 해상도로 초당 30 frame의 동영상으로 취득되었다. 영상의 정합 및 좌표화를 위해 RTK-GPS를 이용하여 12개의 지상 기준점의 좌표를 취득한 후, 사영변환을 통해 영상좌표를 지상좌표로 변환하였다. 영상의 픽셀값을 농도장으로 변환하기 위해 각 RGB 밴드의 픽셀값을 통계적으로 분석하여 농도장으로 변환하였으며, 영상으로부터 얻은 농도장은 형광광도계에 의해 실측된 농도와 결정계수 0.9이상의 수준으로 정확도를 나타냈다.

  • PDF

Compensation of Distorted WDM Channels Depending on Averaged RDPS in Dispersion-managed Link with Random Distribution of SMF Lengths and RDPS (SMF 길이와 RDPS가 랜덤하게 분포하는 분산 제어 링크에서 평균 RDPS 값에 따른 왜곡된 WDM 채널의 보상)

  • Lee, Seong-Real
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2018.10a
    • /
    • pp.351-353
    • /
    • 2018
  • The compensation characteristics are investigated as a function of the averaged residual dispersion per span (RDPS), which is different in each half transmission section, in dispersion-managed optical transmission links with a randomly distributed single mode fiber lengths and RDPS.

  • PDF

Test for reliability of MS Excel statistical analysis output and modification of macros (Focused on an Analysis of Variance menu) (MS 엑셀 프로그램의 통계분석결과 신뢰성 검증 및 매크로 보완 (분산분석 메뉴를 중심으로))

  • Kim, Sook-Young
    • Journal of the Korea Computer Industry Society
    • /
    • v.9 no.5
    • /
    • pp.207-216
    • /
    • 2008
  • Statistical analysis menus of MS Excel software, with powerful spreadsheet functions has not been modified since Excel 2000 Edition and its utilization is very low. To improve utilization of Excel menu for statistical analysis, this research compared outputs of Excel statistical menus and computed test statistics, and developed high-level macros. Outputs of Excel menus, both oneway layout and twoway layout, on real data are exactly same as the computed test statistics, and therefore, Excel menus for statistical analysis are reliable. Macros to provide results for Analysis of Variance with a block and multiple comparison of means are developed using Excel functions.

  • PDF