• 제목/요약/키워드: synthetic data

검색결과 1,444건 처리시간 0.03초

분포형 합성환경자료의 군사시뮬레이션 적용 (The Application of Distributed Synthetic Environment Data to a Military Simulation)

  • 조내현;박종철;김만규
    • 한국시뮬레이션학회논문지
    • /
    • 제19권4호
    • /
    • pp.235-247
    • /
    • 2010
  • 군사훈련을 지원하는 워게임 모델은 환경요소가 매우 중요하다. 한국군의 대부분 워게임 모델들은 동일한 기상을 모든 작전지역에 적용하고 있다. 이에 따라 충실도가 높은 모의결과를 도출하지 못하고 있다. 이러한 실정에 비추어 본 연구는 분포형 합성환경 모델링 자료를 군사시뮬레이션에 적용할 수 있는 충실도 높은 워게임을 위한 요소기술을 개발 하는 것이다. 그것은 본 연구를 위해 개발한 2D GIS기반의 "단순 탐지확률 모델"과 이 모델에 지역별로 상이한 분포형 강수량 자료의 적용 기술이다. 이로써 군사시뮬레이션 수행 시 모델 해상도(전구급~공학급), 용도(훈련용, 분석용), 묘사 수준(군단급~대대급)에 따라 다양하게 작전지역별 상이한 국지기상을 반영하는 분포형 합성환경의 제공과 사용이 가능해졌다.

Disaggregation 모형에 의한 월유량의 추계학적 모의발생 (A Stochastic Generation of Synthetic Monthly Flow by Disaggregation Model)

  • 박찬영;서병하
    • 물과 미래
    • /
    • 제19권2호
    • /
    • pp.167-180
    • /
    • 1986
  • 추계 수문학 분야에서 중요한 기법으로 인정이 되어져 가고 있으며 점차 이용도가 높아져 가고 있는 분해모형(Disaggregation Model)을 국내 하천유량의 모의발생에 적용가능성을 파악하기 위해서 이 모형의 구조와 매개변수 산정 방법과 년유량을 월유량으로 분해시키고 발생유량 계열의 통계학적 분석을 실시하였으며 타모형과의 비교를 위해서 Thomas-Fiering 모형을 사용하여 그 결과들을 비교 검토하여 실무에 적용시킬 수 있는 가능성을 평가하였다.

  • PDF

불균형 자료에서 MCD를 활용한 마할라노비스 거리에 의한 SMOTE (SMOTE by Mahalanobis distance using MCD in imbalanced data)

  • 정지은;최용석
    • 응용통계연구
    • /
    • 제37권4호
    • /
    • pp.455 -465
    • /
    • 2024
  • 불균형 자료 문제에 대한 해결책으로 SMOTE (synthetic minority over-sampling technique)가 가장 많이 사용되고 있다. SMOTE는 유클리드 거리를 기반으로 가장 가까운 이웃을 선택한다. 그러나 유클리드 거리의 단점 중 하나는 변수들 간의 상관관계를 고려하지 않는다는 것이다. 이에 대한 대안으로 변수 간의 공분산을 고려하는 마할라노비스 거리가 제안되었다. 그러나 이상치가 존재하는 경우, 대개 마할라노비스 거리를 계산하는 데 영향을 미친다. 이 문제를 해결하기 위해 최소 공분산 행렬 MCD (minimum covariance determinant)를 사용하여 공분산 행렬을 추정하여 마할라노비스 거리를 사용한다. 이후 MCD를 활용한 마할라노비스 거리를 SMOTE에 적용하여 새로운 관측치를 생성한다. 대부분의 경우 이 방법이 불균형 자료를 분류하는 데 높은 성능 지표를 제공함을 보여주었다.

산림의 지역적 특성을 고려한 시군구 임목축적량 통계 산출 기법 개발 (Estimations of Forest Growing Stocks in Small-area Level Considering Local Forest Characteristics)

  • 김은숙;김철민
    • 한국산림과학회지
    • /
    • 제104권1호
    • /
    • pp.117-126
    • /
    • 2015
  • 시군구 단위 산림통계의 사회적 필요성에도 불구하고 자료의 부족으로 인하여 현실을 반영한 산림통계 산출이 어려운 상황에 있다. 따라서, 시군구 산림 통계 산출을 위하여 해당 시군구의 국가산림자원조사 자료와 주변 지역의 자료를 함께 활용하여 통계량의 오차 수준을 감소시키고 소면적 통계량이 해당 지역 산림의 지역적 특수성을 반영할 수 있는 새로운 소면적 통계산출 방법의 개발이 필요하다. 본 연구에서는 소면적 지역과 특성 구조가 유사하다는 가정을 만족하면서 통계산출을 위한 최소한의 표본점 개수를 확보하기에 적정한 공간 단위에 대한 연구를 수행하였다. 그리고 산림의 지역적 특성을 결정하는 주요 요인인 기후, 토양, 수종 구성 등의 동질성을 기준으로 구획된 확장시군구 기반의 합성추정법, 시 도 단위 자료를 이용하는 기본계획구 합성추정법, 인접 시군구 자료를 이용하는 이웃시군 합성추정법을 비교하고, 이 방법들을 통해 산출된 임목축적 통계의 지역적 특성 설명력과 상위 통계와의 관계에 대한 평가를 수행했다. 그 결과, 확장시군구 합성추정법이 기본계획구 합성추정과 이웃시군 합성추정보다 지역적 특성을 보다 잘 반영하는 통계를 산출하는 것으로 평가되었다. 또한 확장시군구 합성추정법을 통해 산출된 통계량은 시도 단위로 산출된 통계량의 95% 신뢰구간 내에 포함되었으며, 이웃시군 합성추정법에 의해 산출된 결과보다 시도단위 통계량과의 차이가 적게 발생하였다.

Development of a method of the data generation with maintaining quantile of the sample data

  • Joohyung Lee;Young-Oh Kim
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.244-244
    • /
    • 2023
  • Both the frequency and the magnitude of hydrometeorological extreme events such as severe floods and droughts are increasing. In order to prevent a damage from the climatic disaster, hydrological models are often simulated under various meteorological conditions. While performing the simulations, a synthetic data generated through time series models which maintains the key statistical characteristics of the sample data are widely applied. However, the synthetic data can easily maintains both the average and the variance of the sample data, but the quantile is not maintained well. In this study, we proposes a data generation method which maintains the quantile of the sample data well. The equations of the former maintenance of variance extension (MOVE) are expanded to maintain quantile rather than the average or the variance of the sample data. The equations are derived and the coefficients are determined based on the characteristics of the sample data that we aim to preserve. Monte Carlo simulation is utilized to assess the performance of the proposed data generation method. A time series data (data length of 500) is regarded as the sample data and selected randomly from the sample data to create the data set (data length of 30) for simulation. Data length of the selected data set is expanded from 30 to 500 by using the proposed method. Then, the average, the variance, and the quantile difference between the sample data, and the expanded data are evaluated with relative root mean square error for each simulation. As a result of the simulation, each equation which is designed to maintain the characteristic of data performs well. Moreover, expanded data can preserve the quantile of sample data more precisely than that those expanded through the conventional time series model.

  • PDF

Comparison of Various Criteria for Designing ECOC

  • Seok, Kyeong-Ha;Lee, Seung-Chul;Jeon, Gab-Dong
    • Journal of the Korean Data and Information Science Society
    • /
    • 제17권2호
    • /
    • pp.437-447
    • /
    • 2006
  • Error Correcting Output Coding(ECOC) is used to solve multi-class problem. It is known that it improves the classification accuracy. In this paper, we compared various criteria to design code matrix while encoding. In addition. we prorpose an ensemble which uses the ability of each classifier while decoding. We investigate the justification of the proposed method through real data and synthetic data.

  • PDF

Binary classification on compositional data

  • Joo, Jae Yun;Lee, Seokho
    • Communications for Statistical Applications and Methods
    • /
    • 제28권1호
    • /
    • pp.89-97
    • /
    • 2021
  • Due to boundedness and sum constraint, compositional data are often transformed by logratio transformation and their transformed data are put into traditional binary classification or discriminant analysis. However, it may be problematic to directly apply traditional multivariate approaches to the transformed data because class distributions are not Gaussian and Bayes decision boundary are not polynomial on the transformed space. In this study, we propose to use flexible classification approaches to transformed data for compositional data classification. Empirical studies using synthetic and real examples demonstrate that flexible approaches outperform traditional multivariate classification or discriminant analysis.

영상코드화 기법을 이용한 PIV 알고리듬에 대한 연구 (A Research on the PIV Algorithm Using Image Coding)

  • 김성균
    • 대한기계학회논문집B
    • /
    • 제24권2호
    • /
    • pp.153-160
    • /
    • 2000
  • A Particle Image Velocimetry(PIV) algorithm is developed to analyze whole flow field both qualitatively and quantitatively. The practical use of PIV requires the use of fast, reliable, computer-based methods for tracking numerous particles suspended in a flow field. The TSS, NTSS, FFT-Hybrid, which are developed in the area of image compression and coding, are introduced to develop fast vector search algorithm. The numerical solution of the lid-driven cavity flow by the ADI algorithm with the Wachspress Formula is introduced to produce synthetic data for the validation of the tracking algorithms. The algorithms are applied to image data of real flow experiments. The comparisons in CPU time and mean error show, with a small loss of accuracy, CPU time for tracking is reduced considerably.

WAVENUMBER CORRELATION ANALYSIS OF RADAR INTERFEROGRAM

  • Won, Joong-Sun;Kim, Jeong-Woo
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 1999년도 Proceedings of International Symposium on Remote Sensing
    • /
    • pp.425-428
    • /
    • 1999
  • The radar interferogram represents phase differences between the two synthetic aperture radar observations acquired in slightly different angle. The success of the radar interferometric application largely depends on the quality of the interferogram generated from two or more synthetic aperture radar data sets. We propose here to apply the wavenumber correlation analysis to the in-phase and quadrature phase of the radar interferogram. The wavenumber correlation analysis is to resolve the highly correlated components from the low correlation components by estimating correlation coefficients for each wavenumber component. Through this approach, one can easily distinguish the signal components from the noise components in the wavenumber domain. Therefore, the wavenumber correlation analysis of the radar interferogram can be utilized to design post filter and to estimate the quality of interferogram. We have tested the wavenumber correlation analysis using a Radarsat SAR data pair to demonstrated the effectiveness of

  • PDF

BIVARIATE ANALYSIS에 의한 월류량에 모의발생에 관한 연구 (A STUDY ON SYNTHETIC GENERATION OF MONTHLY STREAMFLOW BY BIVARIATE ANALYSIS)

  • 서병하;윤용남;강관원
    • 물과 미래
    • /
    • 제12권2호
    • /
    • pp.63-69
    • /
    • 1979
  • The sequences of monthly streamflows constitute a non-statonary time series. The purely stochastic model has been applied to data generation of non-stationary time series. Tow different mothods--single site and multisite generation--have been used on the hydrologic time series. In this study the synthetic generation method by bivariate analysis, studied by Thomas Fiering, one of multi-site models, has been applied to the historical data on monthly streamflows at two sites in Nakdong River, and also for validity of this model the single site Thomas Fiering model applied. Through statistical analysis it has been shown that the performance of bivariate Thomas Fiering model was better than that of the other. By comparison of mean and standard deviaion between the historical and the generated, and cross correlogram interpretation, it has been known that the model used herein has good performance to simultaneously generate the monthly streamflows at two sites in a river hasin.

  • PDF