• Title/Summary/Keyword: 분산 분석

Search Result 6,968, Processing Time 0.045 seconds

Application of functional ANOVA and functional MANOVA (단변량 및 다변량 함수 데이터에 대한 분산분석의 활용)

  • Kim, Mijeong
    • The Korean Journal of Applied Statistics
    • /
    • v.35 no.5
    • /
    • pp.579-591
    • /
    • 2022
  • Functional data is collected in various fields. It is often necessary to test whether there are differences among groups of functional data. In this case, it is not appropriate to explain using the point-wise ANOVA method, and we should present not the point-wise result but the integrated result. Various studies on functional data analysis of variance have been proposed, and recently implemented those methods in the package fdANOVA of R. In this paper, I first explain ANOVA and multivariate ANOVA, then I will introduce various methods of analysis of variance for univariate and multivariate functional data recently proposed. I also describe how to use the R package fdANOVA. This package is used to test equality of weekly temperatures in Seoul and Busan through univariate functional data ANOVA, and to test equality of multivariate functional data corresponding to handwritten images using multivariate function data ANOVA.

Analyses of Replica Placement Schemes in Distributed File Systems (대용량 분산 파일 시스템의 복제 배치 기법 분석)

  • Choi, Dae-Soon;Kim, Jee-Hong;Eom, Young-Ik
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06a
    • /
    • pp.373-375
    • /
    • 2012
  • 정보의 양이 늘어나고 그 크기가 커짐에 따라 많은 분야에서 대규모 분산 파일 시스템을 제안하고 사용하고 있다. 현재 제안된 분산 파일 시스템은 대부분 확장가능하며 장애에 견딜 수 있고 신뢰성이 있는 시스템을 기본으로 하여 구성되었다. 따라서 분산 파일 시스템은 장애에 효과적으로 견질 수 있고 높은 신뢰성을 보장하기 위해서 데이터의 복제를 만들어 서로 다른 스토리지에 배치한다. 본 논문에서는 대규모 분산 파일 시스템의 복제 배치 기법에 관하여 비교 분석 하였다. 먼저 분산 파일 시스템의 동작 구조를 확인하고 분산 파일 시스템에서 보편적으로 중요시 되는 특성을 파악하였다. 그리고 복제 배치 기법이 효과적인 분산 파일 시스템 구성 시 고려해야 할 것들을 부하 분산, 디스크 분산, 장애 분산으로 나누었다. 이 세 가지 요소를 기준으로 하여 분산 파일 시스템인 GFS, HDFS, Ceph, MooseFS의 복제 배치 기법을 분석하고 각각의 특성 파악하였다.

Performance Evaluation of Multilinear Regression Empirical Formula and Machine Learning Model for Prediction of Two-dimensional Transverse Dispersion Coefficient (다중선형회귀경험식과 머신러닝모델의 2차원 횡 분산계수 예측성능 평가)

  • Lee, Sun Mi;Park, Inhwan
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2022.05a
    • /
    • pp.172-172
    • /
    • 2022
  • 분산계수는 하천에서 오염물질의 혼합능을 파악할 수 있는 대표적인 인자이다. 특히 하수처리장 방류수 혼합예측과 같이 횡 방향 혼합에 대한 예측이 중요한 경우, 하천의 지형적, 수리학적 특성을 고려한 2차원 횡 분산계수의 결정이 필요하다. 2차원 횡 분산계수의 결정을 위해 기존 연구에서는 추적자실험결과로부터 경험식을 만들어 횡 분산계수 산정에 사용해왔다. 회귀분석을 통한 경험식 산정을 위해서는 충분한 데이터가 필요하지만, 2차원 추적자 실험 건수가 충분치 않아 신뢰성 높은 경험식 산정이 어려운 상황이다. 따라서 본 연구에서는 SMOTE기법을 이용하여 횡분산계수 실험데이터를 증폭시켜 이로부터 횡 분산계수 경험식을 산정하고자 한다. 또한 다중선형회귀분석을 통해 도출된 경험식의 한계를 보완하기 위해 다양한 머신러닝 기법을 적용하고, 횡 분산계수 산정에 적합한 머신러닝 기법을 제안하고자 한다. 기존 추적자실험 데이터로부터 하폭 대 수심비, 유속 대 마찰유속비, 횡 분산계수 데이터 셋을 수집하였으며, SMOTE 알고리즘의 적용을 통해 회귀분석과 머신러닝 기법 적용에 필요한 데이터그룹을 생성했다. 새롭게 생성된 데이터 셋을 포함하여 다중선형회귀분석을 통해 횡 분산계수 경험식을 결정하였으며, 새로 제안한 경험식과 기존 경험식에 대한 정확도를 비교했다. 또한 다중선형회귀분석을 통해 결정된 경험식은 횡 분산계수 예측범위에 한계를 보였기 때문에 머신러닝기법을 적용하여 다중선형회귀분석에 대한 예측성능을 평가했다. 이를 위해 머신러닝 기법으로서 서포트 벡터 머신 회귀(SVR), K근접이웃 회귀(KNN-R), 랜덤 포레스트 회귀(RFR)를 활용했다. 세 가지 머신러닝 기법을 통해 도출된 횡 분산계수와 경험식으로부터 결정된 횡 분산계수를 비교하여 예측 성능을 비교했다. 이를 통해 제한된 실험데이터 셋으로부터 2차원 횡 분산계수 산정을 위한 데이터 전처리 기법 및 횡 분산계수 산정에 적합한 머신러닝 절차와 최적 학습기법을 도출했다.

  • PDF

Performance Evaluation of Distributed Heterogeneous Integration System Using Web Service (웹 서비스를 이용한 분산 이 기종 통합 시스템 성능분석)

  • 안영헌;박성준;김영국
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10c
    • /
    • pp.166-168
    • /
    • 2004
  • 본 논문에서는 분산 이기종 환경에서 웹 서비스를 이용한 데이터 처리 방식과 기존의 분산 처리 기술들과의 성능을 비교 분석하였다. 성능분석을 위한 시스템으로 분산 이기종 환경으로 825 e-Marketplace를 설계 구현하였다 본 논문에서 테스트한 성능분석은 B2B e-Marketplace에서 JWSDP 기반의 웹 서비스와 Java-RMI, CORBA를 대상으로 한다 성능분석 결과 분산 이기종 시스템에서 대량의 데이터를 처리하는 경우 웹 서비스를 이용하는 방법이 효과적적임을 보여준다.

  • PDF

On a robust analysis of variance based on winsorization (윈저화를 이용한 로버스트 분산분석)

  • 성내경
    • The Korean Journal of Applied Statistics
    • /
    • v.8 no.1
    • /
    • pp.119-131
    • /
    • 1995
  • Based on Monte-Carlo simulation results we propose a robust analysis of variance procedure by utilizing trimmed mean and Winsorized variance. We deal with mainly the one-way classification case. We evaluate the empirical distribution of a pseudo-F statistic based on symmetrically Winsorized sum of squares when the population is normally distributed.

  • PDF

Bayesian Analysis for the Error Variance in a Two-Way Mixed-Effects ANOVA Model Using Noninformative Priors (무정보 사전분포를 이용한 이원배치 혼합효과 분산분석모형에서 오차분산에 대한 베이지안 분석)

  • 장인홍;김병휘
    • The Korean Journal of Applied Statistics
    • /
    • v.15 no.2
    • /
    • pp.405-414
    • /
    • 2002
  • We consider the problem of estimating the error variance of in a two-way mixed-effects ANOVA model using noninformative priors. First, we derive Jeffreys' prior, a reference prior, and matching priors. We then provide marginal posterior distributions under those noninformative priors. Finally, we provide graphs of marginal posterior densities of the error variance and credible intervals for the error variance in two real data set and compare these credible intervals.

Quantitative Analysis of Initial Dispersion Condition Effects on Randomness of Magnus Rotor Bomblet (Magnus Rotor 자탄의 초기 방출조건이 분산도에 미치는 영향에 대한 정량적 분석)

  • Bai, Ikhyun
    • Journal of the Korea Society for Simulation
    • /
    • v.28 no.3
    • /
    • pp.83-89
    • /
    • 2019
  • This research describes quantitative effects of initial dispersion conditions upon the dispersion randomness of Magnus rotor bomblets. Ratios of the missile spin rate to the missile velocity, a, flight path angles, ${\gamma}$ and altitudes, h, were changed to investigate their effects on dispersion randomness. Dispersion was analyzed through calculation of 6 degree of freedom motion equation with aerodynamic coefficients from wind tunnel experiments. In order to analyze the randomness, regression analysis is adopted to calculate the coefficient of determination. The optimized ratio of the missile spin rate to the missile velocity and flight path angle were obtained and the dispersion altitudes had more effect on the dispersion diameter and had less effect on dispersion than other parameters.

Dispersion Map Optimization and Dispersion Slope Mismatch Effect on optical long-haul transmission (장거리 광신호 전송에서 분산 맵 최적화와 분산 기울기 불일치의 영향)

  • 김민성;최보훈
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2004.05a
    • /
    • pp.802-805
    • /
    • 2004
  • 표준 단일모드 광섬유를 전송선으로 사용하고, Raman 중폭기 없이 EDFA 증폭기 만을 사용하여, 각 채 널당 10Gb/s 의 파장다중화된 40 개 채널신호들을 3,000km 전송하는 경제적인 광 링크를 구성 한 뒤, 이 링크의 전송 성능 최적화를 위해 분산 맵 구조의 차이 에 따른 성능 차이를 분석하였다. 이 링크의 분산 맵은 전치분산보상, 구간분산보상 그리고 후치분산보상으로 나누어 지는데 이 들의 다양한 조합을 통해 15 가지의 다양한 분산 맵들을 구성한 뒤 각각의 경우를 분석하여 링크 성능을 크게 향상시키는 최적화된 분산맵 구조를 구하였다. 이 최적화된 분산 조건이, 단일 모드 광섬유와 분산보상 광섬유가 가지 는 파장에 따른 분산 기울기의 불일치로 인해 받게 되는 영향이 조사되었고 이 영향이 링크의 성능에 미치는 효과가 무시될 수 있는 분산 기울기의 허용 가능한불일치 범위를 구하였다.

  • PDF

통화선물을 이용한 최소분산 헤지비율 분석

  • Oh, Se-Yeol
    • The Korean Journal of Financial Management
    • /
    • v.13 no.1
    • /
    • pp.261-284
    • /
    • 1996
  • 본 논문에서는 통화선물(일본 엔화와 독일 마르크화)에 대한 듀레이션 효과와 만기효과를 검증 하였다. 두 통화에 대한 1990-1994년까지의 현물과 선물의 주별자료를 가지고 분석한 결과 엔화와 마르크화의 통화선물계약에 대한 최소분산 헤지비율은 헤지기간(hedge duration)이 1주부터 5주까지 변함에 따라 증가하고 있으며 이러한 듀레이션효과는 계약만기가 가까워짐에 따라 헤지가 점점 제거되는 현상, 즉 만기효과에 의해서 영향을 받는 것으로 나타났다. 그리고 선형추세분석을 통해서 최소분산헤지비율이 베타헤지비율에 어떠한 추세로 접근하는 지를 알아보았다. 그 결과 듀레이션이 길어질수록 최소분산헤지비율이 증가하고, 계약만기에 가까워짐에 따라 최소분산헤지비율이 베타헤지비율, 1에 가까워지는 현상이 나타났다.

  • PDF

Performance Analysis of Distributed Parallel Processing Schemes for Large Data in Cloud Computing (클라우드 컴퓨팅에서의 대규모 데이터를 위한 분산 병렬 처리 기법의 성능분석)

  • Hong, Seung-Tae;Chang, Jae-Woo
    • Proceedings of the Korean Association of Geographic Inforamtion Studies Conference
    • /
    • 2010.09a
    • /
    • pp.111-118
    • /
    • 2010
  • 최근 IT 분야에서 인터넷을 기반으로 IT 자원들을 서비스 형태로 제공하는 클라우드 컴퓨팅에 대한 연구가 활발히 진행되고 있다. 한편, 효율적인 클라우드 컴퓨팅을 제공하기 위해서는, 막대한 양의 데이터를 수많은 서버들에 분산 처장하고 관리하기 위한 분산 데이터 처장 기법 빛 분산 병렬 처리 기법에 대한 연구가 필수적이다. 이를 위해 본 논문에서는 대표적인 분산 병렬 처리 기법에 대해 살펴보고, 이를 비교 분석한다. 마지막으로 Hadoop 기반 클러스터를 구축하고 이를 통해서 대규모 데이터를 위한 분산 병렬 처리 기법에 대한 성능평가를 수행한다.

  • PDF