• 제목/요약/키워드: 분산 분석

검색결과 6,972건 처리시간 0.034초

단변량 및 다변량 함수 데이터에 대한 분산분석의 활용 (Application of functional ANOVA and functional MANOVA)

  • 김미정
    • 응용통계연구
    • /
    • 제35권5호
    • /
    • pp.579-591
    • /
    • 2022
  • 함수 데이터는 다양한 분야에서 수집되고 있으며, 집단 간의 함수 데이터를 비교해야하는 경우가 종종 발생한다. 이럴 경우 점별 분산분석 방법을 이용하여 설명하기에는 무리가 있으며, 통합된 결과를 제시할 필요가 있다. 이에 대한 다양한 연구가 제안되었으며, 최근에 R 패키지 fdANOVA로 구현되었다. 이 논문에서 우선 분산분석 및 다변량 분산분석을 설명하고, 최근에 제안된 다양한 단변량 및 다변량 함수 데이터 분산분석을 설명하고자 한다. 또한 R 패키지 fdANOVA의 사용 방법을 설명하고, 이 패키지를 이용하여 서울과 부산 지역의 주별 기온을 단변량 함수 데이터 분산분석을 통해 비교하고, 손글씨 이미지를 다변량 함수 데이터로 변환하여 다변량 함수 데이터 분산분석을 이용하여 비교하고자 한다.

대용량 분산 파일 시스템의 복제 배치 기법 분석 (Analyses of Replica Placement Schemes in Distributed File Systems)

  • 최대순;김지홍;엄영익
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(A)
    • /
    • pp.373-375
    • /
    • 2012
  • 정보의 양이 늘어나고 그 크기가 커짐에 따라 많은 분야에서 대규모 분산 파일 시스템을 제안하고 사용하고 있다. 현재 제안된 분산 파일 시스템은 대부분 확장가능하며 장애에 견딜 수 있고 신뢰성이 있는 시스템을 기본으로 하여 구성되었다. 따라서 분산 파일 시스템은 장애에 효과적으로 견질 수 있고 높은 신뢰성을 보장하기 위해서 데이터의 복제를 만들어 서로 다른 스토리지에 배치한다. 본 논문에서는 대규모 분산 파일 시스템의 복제 배치 기법에 관하여 비교 분석 하였다. 먼저 분산 파일 시스템의 동작 구조를 확인하고 분산 파일 시스템에서 보편적으로 중요시 되는 특성을 파악하였다. 그리고 복제 배치 기법이 효과적인 분산 파일 시스템 구성 시 고려해야 할 것들을 부하 분산, 디스크 분산, 장애 분산으로 나누었다. 이 세 가지 요소를 기준으로 하여 분산 파일 시스템인 GFS, HDFS, Ceph, MooseFS의 복제 배치 기법을 분석하고 각각의 특성 파악하였다.

다중선형회귀경험식과 머신러닝모델의 2차원 횡 분산계수 예측성능 평가 (Performance Evaluation of Multilinear Regression Empirical Formula and Machine Learning Model for Prediction of Two-dimensional Transverse Dispersion Coefficient)

  • 이선미;박인환
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.172-172
    • /
    • 2022
  • 분산계수는 하천에서 오염물질의 혼합능을 파악할 수 있는 대표적인 인자이다. 특히 하수처리장 방류수 혼합예측과 같이 횡 방향 혼합에 대한 예측이 중요한 경우, 하천의 지형적, 수리학적 특성을 고려한 2차원 횡 분산계수의 결정이 필요하다. 2차원 횡 분산계수의 결정을 위해 기존 연구에서는 추적자실험결과로부터 경험식을 만들어 횡 분산계수 산정에 사용해왔다. 회귀분석을 통한 경험식 산정을 위해서는 충분한 데이터가 필요하지만, 2차원 추적자 실험 건수가 충분치 않아 신뢰성 높은 경험식 산정이 어려운 상황이다. 따라서 본 연구에서는 SMOTE기법을 이용하여 횡분산계수 실험데이터를 증폭시켜 이로부터 횡 분산계수 경험식을 산정하고자 한다. 또한 다중선형회귀분석을 통해 도출된 경험식의 한계를 보완하기 위해 다양한 머신러닝 기법을 적용하고, 횡 분산계수 산정에 적합한 머신러닝 기법을 제안하고자 한다. 기존 추적자실험 데이터로부터 하폭 대 수심비, 유속 대 마찰유속비, 횡 분산계수 데이터 셋을 수집하였으며, SMOTE 알고리즘의 적용을 통해 회귀분석과 머신러닝 기법 적용에 필요한 데이터그룹을 생성했다. 새롭게 생성된 데이터 셋을 포함하여 다중선형회귀분석을 통해 횡 분산계수 경험식을 결정하였으며, 새로 제안한 경험식과 기존 경험식에 대한 정확도를 비교했다. 또한 다중선형회귀분석을 통해 결정된 경험식은 횡 분산계수 예측범위에 한계를 보였기 때문에 머신러닝기법을 적용하여 다중선형회귀분석에 대한 예측성능을 평가했다. 이를 위해 머신러닝 기법으로서 서포트 벡터 머신 회귀(SVR), K근접이웃 회귀(KNN-R), 랜덤 포레스트 회귀(RFR)를 활용했다. 세 가지 머신러닝 기법을 통해 도출된 횡 분산계수와 경험식으로부터 결정된 횡 분산계수를 비교하여 예측 성능을 비교했다. 이를 통해 제한된 실험데이터 셋으로부터 2차원 횡 분산계수 산정을 위한 데이터 전처리 기법 및 횡 분산계수 산정에 적합한 머신러닝 절차와 최적 학습기법을 도출했다.

  • PDF

웹 서비스를 이용한 분산 이 기종 통합 시스템 성능분석 (Performance Evaluation of Distributed Heterogeneous Integration System Using Web Service)

  • 안영헌;박성준;김영국
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (3)
    • /
    • pp.166-168
    • /
    • 2004
  • 본 논문에서는 분산 이기종 환경에서 웹 서비스를 이용한 데이터 처리 방식과 기존의 분산 처리 기술들과의 성능을 비교 분석하였다. 성능분석을 위한 시스템으로 분산 이기종 환경으로 825 e-Marketplace를 설계 구현하였다 본 논문에서 테스트한 성능분석은 B2B e-Marketplace에서 JWSDP 기반의 웹 서비스와 Java-RMI, CORBA를 대상으로 한다 성능분석 결과 분산 이기종 시스템에서 대량의 데이터를 처리하는 경우 웹 서비스를 이용하는 방법이 효과적적임을 보여준다.

  • PDF

윈저화를 이용한 로버스트 분산분석 (On a robust analysis of variance based on winsorization)

  • 성내경
    • 응용통계연구
    • /
    • 제8권1호
    • /
    • pp.119-131
    • /
    • 1995
  • 윈저화 자료에 기초한 분산분석법 개발의 일차시도로 고정효과 일원 분산분석 모형에 대한 윈저화 분산분석을 제시한다. 몬테 칼로 모의실험 기법을 사용하여 각 요인 수준마다 g-g 대칭 윈저화를 적용시켰을 때 윈저화 자료에 기초한 제곱합들의 비의 경험적 분포가 통상의 F 분포로 근사됨을 보인다. 이 근사 F 분포의 자유도는 윈저화 카이제곱 통계량의 경험적 분포가 자유도 (n-3g-1)의 통상적인 카이제곱 분포에 만족할만하게 근사되어진다는 성내경(1994)의 연구 성과를 토대로 결정된다. 여기서 n은 표본 크기, g는 한쪽 꼬리 부분에서 윈저화가 적용되는 양이다. 산출된 분산비의 경험적 분위수의 일부를 수록하였다. 이 연구는 non-adaptive 로버스트 분산분석법을 제안하는 것으로 이상점이 존재하는 분산분석 자료에 적용하면 자료 해석이 단순화되는 실용성을 위주로 한다.

  • PDF

무정보 사전분포를 이용한 이원배치 혼합효과 분산분석모형에서 오차분산에 대한 베이지안 분석 (Bayesian Analysis for the Error Variance in a Two-Way Mixed-Effects ANOVA Model Using Noninformative Priors)

  • 장인홍;김병휘
    • 응용통계연구
    • /
    • 제15권2호
    • /
    • pp.405-414
    • /
    • 2002
  • 반복이 같은 이원배치 혼합효과 분산분석모형에서 무정보 사전분포를 이용하여 오차분산을 추정하는 문제를 생각하고자 한다. 먼저 무정보 사전분포로 제프리스사전분포, 준거 사전분포 그리고 확률일치 사전분포를 유도하고 이들 각각의 사전분포들에 대하여 주변사후분포를 제시하였다. 끝으로 실제 자료를 근거로 오차분산의 주변사후밀도함수에 대한 그래프와 오차분산에 대한 신용구간들을 구하고 이 구간들을 비교한다.

Magnus Rotor 자탄의 초기 방출조건이 분산도에 미치는 영향에 대한 정량적 분석 (Quantitative Analysis of Initial Dispersion Condition Effects on Randomness of Magnus Rotor Bomblet)

  • 배익현
    • 한국시뮬레이션학회논문지
    • /
    • 제28권3호
    • /
    • pp.83-89
    • /
    • 2019
  • 본 연구는 회전 비행체(Magnus rotor)를 탑재한 분산탄두의 분산 균일도에 미치는 요인 분석과 성능지표를 도출하기 위해 모탄의 속도 V와 회전속도 ${\omega}$, 비행경로각(flight path angle) ${\gamma}$ 그리고 고도 h의 변화에 따른 해석 결과를 기술했으며, 이때 모탄의 회전속도와 속도의 비를 새로운 변수로 정의했다. 자탄의 분산 해석에는 풍동실험을 통해 획득한 공력계수를 사용한 6 자유도 운동방정식을 이용했으며, 분산도 분석을 위해 회귀분석과 결정계수를 구해 분산도를 평가했다. 해석결과 최적의 회전속도와 낙하속도의 비, 비행경로각(flight path angle)을 구할 수 있었으며, 방출고도는 분산도에 회전속도와 낙하속도의 비, 비행경로각(flight path angle)의 영향에 비해 영향은 크지 않고, 자탄의 분산반경에 영향이 큰 것을 확인했다.

장거리 광신호 전송에서 분산 맵 최적화와 분산 기울기 불일치의 영향 (Dispersion Map Optimization and Dispersion Slope Mismatch Effect on optical long-haul transmission)

  • 김민성;최보훈
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2004년도 춘계학술발표대회논문집
    • /
    • pp.802-805
    • /
    • 2004
  • 표준 단일모드 광섬유를 전송선으로 사용하고, Raman 중폭기 없이 EDFA 증폭기 만을 사용하여, 각 채 널당 10Gb/s 의 파장다중화된 40 개 채널신호들을 3,000km 전송하는 경제적인 광 링크를 구성 한 뒤, 이 링크의 전송 성능 최적화를 위해 분산 맵 구조의 차이 에 따른 성능 차이를 분석하였다. 이 링크의 분산 맵은 전치분산보상, 구간분산보상 그리고 후치분산보상으로 나누어 지는데 이 들의 다양한 조합을 통해 15 가지의 다양한 분산 맵들을 구성한 뒤 각각의 경우를 분석하여 링크 성능을 크게 향상시키는 최적화된 분산맵 구조를 구하였다. 이 최적화된 분산 조건이, 단일 모드 광섬유와 분산보상 광섬유가 가지 는 파장에 따른 분산 기울기의 불일치로 인해 받게 되는 영향이 조사되었고 이 영향이 링크의 성능에 미치는 효과가 무시될 수 있는 분산 기울기의 허용 가능한불일치 범위를 구하였다.

  • PDF

통화선물을 이용한 최소분산 헤지비율 분석

  • 오세열
    • 재무관리연구
    • /
    • 제13권1호
    • /
    • pp.261-284
    • /
    • 1996
  • 본 논문에서는 통화선물(일본 엔화와 독일 마르크화)에 대한 듀레이션 효과와 만기효과를 검증 하였다. 두 통화에 대한 1990-1994년까지의 현물과 선물의 주별자료를 가지고 분석한 결과 엔화와 마르크화의 통화선물계약에 대한 최소분산 헤지비율은 헤지기간(hedge duration)이 1주부터 5주까지 변함에 따라 증가하고 있으며 이러한 듀레이션효과는 계약만기가 가까워짐에 따라 헤지가 점점 제거되는 현상, 즉 만기효과에 의해서 영향을 받는 것으로 나타났다. 그리고 선형추세분석을 통해서 최소분산헤지비율이 베타헤지비율에 어떠한 추세로 접근하는 지를 알아보았다. 그 결과 듀레이션이 길어질수록 최소분산헤지비율이 증가하고, 계약만기에 가까워짐에 따라 최소분산헤지비율이 베타헤지비율, 1에 가까워지는 현상이 나타났다.

  • PDF

클라우드 컴퓨팅에서의 대규모 데이터를 위한 분산 병렬 처리 기법의 성능분석 (Performance Analysis of Distributed Parallel Processing Schemes for Large Data in Cloud Computing)

  • 홍승태;장재우
    • 한국GIS학회:학술대회논문집
    • /
    • 한국GIS학회 2010년도 추계학술대회
    • /
    • pp.111-118
    • /
    • 2010
  • 최근 IT 분야에서 인터넷을 기반으로 IT 자원들을 서비스 형태로 제공하는 클라우드 컴퓨팅에 대한 연구가 활발히 진행되고 있다. 한편, 효율적인 클라우드 컴퓨팅을 제공하기 위해서는, 막대한 양의 데이터를 수많은 서버들에 분산 처장하고 관리하기 위한 분산 데이터 처장 기법 빛 분산 병렬 처리 기법에 대한 연구가 필수적이다. 이를 위해 본 논문에서는 대표적인 분산 병렬 처리 기법에 대해 살펴보고, 이를 비교 분석한다. 마지막으로 Hadoop 기반 클러스터를 구축하고 이를 통해서 대규모 데이터를 위한 분산 병렬 처리 기법에 대한 성능평가를 수행한다.

  • PDF