• Title/Summary/Keyword: 과소적합

Search Result 104, Processing Time 0.025 seconds

클라우드컴퓨팅 기반의 HW용량 산정방법에 관한 연구

  • Choi, Kook-Hyun;Kang, Yong-Suk;Shin, Yong-Tae;Kim, Jong-Bae
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2014.10a
    • /
    • pp.878-881
    • /
    • 2014
  • 정보시스템은 메인프레임(Mainframe)에서 클라이언트/서버시스템(C/S System), 인터넷 및 인트라넷 시스템을 지나 최근에는 클라우드 컴퓨팅환경으로 발전하고 있다. 이러한 복잡성과 컴퓨팅 환경의 다변함에 따라 시스템 성능 및 용량 산정에 관한 중요성은 점점 부각되고 있다. 이는 기존의 H/W(하드웨어규모산정지침 등)의 방식이 체계적이지 못하고, 다양한 컴퓨팅 환경의 특징을 반영하지 못하기 때문이며 이는 하드웨어 구축비용의 증가 혹은 감소로 실제 요구되는 정보시스템 자원이 과다 또는 과소 산정되는 경우가 발생할 수 있다. 특히 클라우드 컴퓨팅은 막대한 서버자원이 필요하기 때문에 보다 체계적이고 정확하게 HW를 산정하는 것은 사업성공 중요한 요소라 할 수 있다. 클라우드 컴퓨팅의 하드웨어의 용량 산정을 위해서는 우선 IT자원의 성격에 따른 3가지 서비스모델(서비스형소프트웨어, 플랫폼형서비스, 인프라형서비스)에 적합한 용량산정모델을 제시해야 한다. IaaS는 사용자에게 인프라기반의 서비스를 제공하며, PaaS의 경우에는 플랫폼과 OS 등의 개발환경을 제공의 목적이 있기 때문에 HW용량산정을 위해서는 다양한 측면에서의 접근이 요구된다. SaaS는 WEB/WAS의 서비스와 유사한 형태의 서비스 특징을 가지고 있기 때문에 기존 서비스 특징과 클라우드 특징을 도출하기에 적합하다 할 수 있다. 본 연구에서는 SaaS기반의 하드웨어 용량산정에 대한 방법과 기준을 제시하였다. 본 연구결과는 클라우드 컴퓨팅 환경구축 시 HW용량산정에 대한 가이드라인으로 활용 가능하다.

  • PDF

A layered-wise data augmenting algorithm for small sampling data (적은 양의 데이터에 적용 가능한 계층별 데이터 증강 알고리즘)

  • Cho, Hee-chan;Moon, Jong-sub
    • Journal of Internet Computing and Services
    • /
    • v.20 no.6
    • /
    • pp.65-72
    • /
    • 2019
  • Data augmentation is a method that increases the amount of data through various algorithms based on a small amount of sample data. When machine learning and deep learning techniques are used to solve real-world problems, there is often a lack of data sets. The lack of data is at greater risk of underfitting and overfitting, in addition to the poor reflection of the characteristics of the set of data when learning a model. Thus, in this paper, through the layer-wise data augmenting method at each layer of deep neural network, the proposed method produces augmented data that is substantially meaningful and shows that the method presented by the paper through experimentation is effective in the learning of the model by measuring whether the method presented by the paper improves classification accuracy.

A Study on Characteristics of Neural Network Model for Reservoir Inflow Forecasting (저수지 유입량 예측을 위한 신경망 모형의 특성 연구)

  • Kim, Jae-Hvung;Yoon, Yong-Nam
    • Journal of the Korean Society of Hazard Mitigation
    • /
    • v.2 no.4 s.7
    • /
    • pp.123-129
    • /
    • 2002
  • In this study the results of Chungju reservoir inflow forecasting using 3 layered neural network model were analyzed in order to investigate the characteristics of neural network model for reservoir inflow forecasting. The proper neuron numbers of input and hidden layer were proposed after examining the variations of forecasted values according to neuron number and training epoch changes, and the probability of underestimation was judged by deliberating the variation characteristics of forecasting according to the differences between training and forecasting peak inflow magnitudes. In addition, necessary minimum training data size for precise forecasting was proposed. As a result, We confirmed the probability that excessive neuron number and training epoch cause over-fitting and judged that applying $8{\sim}10$ neurons, $1500{\sim}3000$ training epochs might be suitable in the case of Chungju reservoir inflow forecasting. When the peak inflow of training data set was larger than the forecasted one, it was confirmed that the forecasted values could be underestimated. And when the comparative short period training data was applied to neural networks, relatively inaccurate forecasting outputs were resulted and applying more than 600 training data was recommended for more precise forecasting in Chungju reservoir.

A Methodology for Realty Time-series Generation Using Generative Adversarial Network (적대적 생성망을 이용한 부동산 시계열 데이터 생성 방안)

  • Ryu, Jae-Pil;Hahn, Chang-Hoon;Shin, Hyun-Joon
    • Journal of the Korea Convergence Society
    • /
    • v.12 no.10
    • /
    • pp.9-17
    • /
    • 2021
  • With the advancement of big data analysis, artificial intelligence, machine learning, etc., data analytics technology has developed to help with optimal decision-making. However, in certain areas, the lack of data restricts the use of these techniques. For example, real estate related data often have a long release cycle because of its recent release or being a non-liquid asset. In order to overcome these limitations, we studied the scalability of the existing time series through the TimeGAN model. A total of 45 time series related to weekly real estate data were collected within the period of 2012 to 2021, and a total of 15 final time series were selected by considering the correlation between the time series. As a result of data expansion through the TimeGAN model for the 15 time series, it was found that the statistical distribution between the real data and the extended data was similar through the PCA and t-SNE visualization algorithms.

3D Medical Image Data Augmentation for CT Image Segmentation (CT 이미지 세그멘테이션을 위한 3D 의료 영상 데이터 증강 기법)

  • Seonghyeon Ko;Huigyu Yang;Moonseong Kim;Hyunseung Choo
    • Journal of Internet Computing and Services
    • /
    • v.24 no.4
    • /
    • pp.85-92
    • /
    • 2023
  • Deep learning applications are increasingly being leveraged for disease detection tasks in medical imaging modalities such as X-ray, Computed Tomography (CT), and Magnetic Resonance Imaging (MRI). Most data-centric deep learning challenges necessitate the use of supervised learning methodologies to attain high accuracy and to facilitate performance evaluation through comparison with the ground truth. Supervised learning mandates a substantial amount of image and label sets, however, procuring an adequate volume of medical imaging data for training is a formidable task. Various data augmentation strategies can mitigate the underfitting issue inherent in supervised learning-based models that are trained on limited medical image and label sets. This research investigates the enhancement of a deep learning-based rib fracture segmentation model and the efficacy of data augmentation techniques such as left-right flipping, rotation, and scaling. Augmented dataset with L/R flipping and rotations(30°, 60°) increased model performance, however, dataset with rotation(90°) and ⨯0.5 rescaling decreased model performance. This indicates the usage of appropriate data augmentation methods depending on datasets and tasks.

Urban flood prediction through the linkage between the statistical characteristics of rainfall and the AI model (강우의 통계적 특성과 AI 모형의 연계를 통한 도시침수예측)

  • Lee, Yeonsu;Yoo, Jaehwan;Kim, Hyun-il;Kim, Byunghyun
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2022.05a
    • /
    • pp.97-97
    • /
    • 2022
  • AI 모형을 적용한 도시지역 침수예측에 대한 연구는 꾸준히 수행되어 왔다. AI 모형을 이용해 도시침수예측을 하기 위해서는 모형에 강우자료를 학습시키게 되는데, 시계열 강우분포 자료를AI 모형의 학습자료로 사용하기에 자료의 양이 너무 많기 때문에 총 강우량만을 이용하여 도시침수예측을 수행한 바 있다(Kim et al., 2021). 하지만 총 강우량만을 AI 모형에 학습시킬 경우, 지속기간 동안 강우가 고르게 분포하는지 불규칙적으로 분포하는지에 대한 정보가 포함되지 않았기 때문에 침수예측력이 떨어질 수 있다. 따라서 본 연구에서는 시계열 강우자료의 통계치를 산정하여 AI 모형에 학습시킴으로써 강우분포특성을 고려한 침수예측을 통해 예측력을 높이고자 한다. 총 강우량만을 학습시킬 경우, 같은 지속시간에 같은 양의 강우가 내리더라도 고른 분포를 가진 강우에 의해서는 실제 침수는 작게 일어나므로 과대예측을, 전체 지속시간 중 특정 시간대에 편향된 분포를 가진 강우에 의해서는 실제 침수가 크게 일어나므로 과소예측을 하는 문제가 발생할 수 있다. 따라서 표준편차를 평균 강우량으로 나눈 값인 변동계수, 강우분포의 뾰족한 정도를 나타내는 첨도, 평균값에 대해 어느 방향으로 비대칭인지를 나타내는 왜도 값을 추가로 학습시킴으로써 시계열 강우자료 전체를 학습시키지 않고도 강우분포를 학습시키지 않았을 때 발생하는 과소·과대예측 문제를 해결할 수 있다. 또한 변동계수 대신 표준편차를 학습시키는 모형, 변동계수와 표준편차를 모두 학습시키지 않는 모형, 변동계수와 표준편차를 모두 학습시키는 모형과의 침수예측 결과 비교를 통해 표준편차와 변동계수 중 어떤 통계치를 학습시키는 것이 적합한지와 비슷한 통계치 자료를 모두 학습시켰을 때의 과적합 문제 등에 대한 결론를 얻을 수 있다.

  • PDF

Study on Mapping of Liquefaction Hazared Potential at Port and harbor in Korea (국내 연안지역의 액상화 구역도 작성에 관한 연구)

  • 강규진;박인준;박인준;김수일
    • Journal of the Earthquake Engineering Society of Korea
    • /
    • v.4 no.2
    • /
    • pp.57-64
    • /
    • 2000
  • 본 연구에서는 항만 및 어항시설의 내진설?준서에서 채택하고 있는 수정 Seed와 Idriss 방법을 이용하여 액상화 평가를 수행하고 액상화 가능지수(liquefaction potential index, LPI)와 등가 액상화 안전율(FE)을 이용하여 액상화 가능성에 대한 구역도를 작성하였다. 이 두결과가 유사한 것으로 나타나 등가 액상화 안전율의 적합성을 확인하였다 국내 연안의 두지역에 대하여 Hachinohe 지진기록과 Ofunato 지진기록을 이용한 액상화 가능성 구역도를 FE를 이용하여 작성한 후 비교한 결과 Hachinohe 지진기록에 의한 액상화 가능성 구역도가 더 과소평가되는 경향을 보이는 것으로 나타났다 또한 FE는 안전율의 형태로 표현되었기 때문에 구역도 작성과 해석에 편의 성을 제공하였다.

  • PDF

An Experimental Study on Creep of the High Strength Concrete for Practical Use (실용 고강도 콘크리트의 크리프에 관한 실험적 연구)

  • 김생빈;김성욱
    • Magazine of the Korea Concrete Institute
    • /
    • v.9 no.6
    • /
    • pp.147-156
    • /
    • 1997
  • 지금까지 국내에서는 콘크리트의 크리프에 관한 실험적 연구가 많이 진행되지 못하여 해당 구조물의 설계기술 도입국의 규준에 따라 크리프를 예측해왔다. 그러나 예측된 크리프 모델이 국내 콘크리트 재료의 특성에 적합한지에 대한 실험적 검증은 제대로 이루어지지 않고 있는 실정이다. 본 연구에서는 국내에서 프리스트레스 콘크리트 구조물에 적용하는 실용 고강도 콘크리트의 크리프 값을 예측하기 위해 동일한 설계기준강도를 갖는 세 가지 배합에 대하여 재령별로 크리프 시험을 수행하고 이 실험결과를 ACI, CEB/FIB, KSCE, JSCE규준들의 크리프 예측식과 비교 분석하였다.시험결과와 이들규준들에 대한 비교분석에 의하면 CEB/FIB-90 크리프 예측식은 비교적 과대 평가되고 ACI 209-92와 JSCE-96의 경우는 과소 평가되었으나 콘크리트 표준시방서 KSCE -96 크리프 예측식은 비교적 시험결과에 근접하는 것으로 평가되었다. 그러나 구성재료의 양적 변동에 '따른 배합별 시험결과의 차이를 반영할 수 있는 점이 보완되어야 할 것으로 보며 향후 많은 실험결과를 바탕으로 국내에서 생산되는 콘크리트에 대하여 보다 정확히 크리프를 예측할 수 있는 연구가 필요하다.

Similarity between the dispersion parameter in zero-altered model and the two goodness-of-fit statistics (영 변환 모형 산포형태모수와 두 적합도 검정통계량 사이의 유사성 비교)

  • Yun, Yujeong;Kim, Honggie
    • Journal of the Korean Data and Information Science Society
    • /
    • v.28 no.3
    • /
    • pp.493-504
    • /
    • 2017
  • We often observe count data that exhibit over-dispersion, originating from too many zeros, and under-dispersion, originating from too few zeros. To handle this types of problems, the zero-altered distribution model is designed by Ghosh and Kim in 2007. Their model can control both over-dispersion and under-dispersion with a single parameter, which had been impossible ever. The dispersion type depends on the sign of the parameter ${\delta}$ in zero-altered distribution. In this study, we demonstrate the role of the dispersion type parameter ${\delta}$ through the data of the number of births in Korea. Employing both the chi-square statistic and the Kolmogorov statistic for goodness-of-fit, we also explained any difference between the theoretical distribution and the observed one that exhibits either over-dispersion or under-dispersion. Finally this study shows whether the test statistics for goodness-of-fit show any similarity with the role of the dispersion type parameter ${\delta}$ or not.

Preliminary Study on the Reproduction of Dissolved Oxygen Concentration in Jinhae Bay Based on Deep Learning Model (딥러닝 모형 기반 진해만 용존산소농도 재현을 위한 기초연구)

  • Park, Seongsik;Kim, Kyunghoi
    • Journal of the Korean Society of Marine Environment & Safety
    • /
    • v.28 no.2
    • /
    • pp.193-200
    • /
    • 2022
  • We conducted a case study to determine the optimal model parameters and predictors of Long Short-Term Memory (LSTM) for the reproduction of dissolved oxygen (DO) concentration in Jinhae Bay. The model parameter case study indicated the lowest accuracy when the Hidden node=10, Epoch=100. This was caused by underfitting of machine learning. The accuracy increased as the Hidden node and Epoch increased. The accuracy was the highest when the Hidden node=80 and Epoch=100 with R2=0.99. In the bottom DO reproduction of Step 1 of the predictors case study, accuracy was highest when the water temperature was used as a predictor with R2=0.81. In Step 2, The R2 value increased up to 0.92 when the water temperature and SiO2 were used as a predictor. This was caused by a high correlation between the bottom DO and SiO2 concentrations. Consequently, we determined the optimal model parameters and predictors of LSTM for the reproduction of DO concentration in Jinhae Bay.