• Title/Summary/Keyword: 과소적합

Search Result 104, Processing Time 0.025 seconds

A Study on the Analysis of Characteristics of the Catchment Response Time in Midsize Catchment (중규모유역에서의 유역응답시간 특성 분석)

  • Park, Jong Young;Lee, Jung Sik
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2004.05b
    • /
    • pp.1042-1046
    • /
    • 2004
  • 본 연구는 국내 실무에서 사용되고 있는 유역응답시간 산정식의 적용성을 검토하기 위하여 기존의 8개의 도달시간 산정식과 6개의 지체시간 산정식을 유역면적이 $50\~500km^2$인 중규모유역에 적용하였으며, 실측수문 자료로부터 두가지 정의에 의해 산정한 도달시간과 지체시간을 비교, 검토하였다. 기존의 도달시간 산정식에 의한 도달시간은 실측 도달시간에 비해 모든 대상유역에서 과소한 값을 나타내었으며, 지체시간 산정식의 경우 Clark 공식과 SCS 공식은 모든 대상유역에서 과소한 값을 나타내었고 Snyder 공식, Linsley 공식, Eagleson 공식, Rao와 Delleur 공식은 대상유역에 따라 과다 또는 과소한 경향을 나타내었다. 따라서 실측수문자료에서 산정된 유역응답시간과 기존의 산정식에서 결정된 값들이 상이하게 나타나 중규모유역에서 기존의 유역응답 시간 산정식의 적용성이 떨어진다고 판단되었다. 대상유역에서 적합한 유역응답시간 공식을 유도하기 위하여 유역응답시간과 유역특성인자간의 회귀분석을 실시하였으며, 국내 중규모유역에서 적용할 수 있는 도달시간과 지체시간 산정식을 제안하였다.

  • PDF

Time Series Data Processing Deep Learning system for Prediction of Hospital Outpatient Number (병원 외래환자수의 예측을 위한 시계열 데이터처리 딥러닝 시스템)

  • Jo, Jun-Mo
    • The Journal of the Korea institute of electronic communication sciences
    • /
    • v.16 no.2
    • /
    • pp.313-318
    • /
    • 2021
  • The advent of the Deep Learning has applied to many industrial and general applications having an impact on our lives these days. Certain type of machine learning model is needed to be designed for a specific problem of field. Recently, there are many instances to solve the various COVID-19 related problems using deep learning model. Therefore, in this paper, a deep learning model for predicting number of outpatients of a hospital in advance is suggested. The suggested deep learning model is designed by using the Keras in Jupyter Notebook. The prediction result is being analyzed with the real data in graph, as well as the loss rate with some validation data to verify either for the underfitting or the overfitting.

한.중 출판교류 본격화 물꼬 튼다

  • Jeong, Hye-Ok
    • The Korean Publising Journal, Monthly
    • /
    • s.134
    • /
    • pp.20-21
    • /
    • 1993
  • 이번 모임이 우리출판계에 던져준 교훈은 중국 출판인들이 자신들의 절박한 사정으로 인해 한국출판계를 '공략'해 들어온다는 표현이 적합할 만큼 '무리한' 요구를 해오는 점과, 단순히 중국의 현재 출판 제작.인쇄 수준이 우리보다 낮다 하여 과소평가하여 소홀히 대응할 경우 예기치못한 상황까지 도래할 수 있다는 점이다.

  • PDF

Variable Selection Theorem for the Analysis of Covariance Model (공분산분석 모형에서의 변수선택 정리)

  • Yoon, Sang-Hoo;Park, Jeong-Soo
    • Communications for Statistical Applications and Methods
    • /
    • v.15 no.3
    • /
    • pp.333-342
    • /
    • 2008
  • Variable selection theorem in the linear regression model is extended to the analysis of covariance model. When some of regression variables are omitted from the model, it reduces the variance of the estimators but introduces bias. Thus an appropriate balance between a biased model and one with large variances is recommended.

Predicting Early Retirees Using Personality Data (인성 데이터를 활용한 조기 퇴사자 예측)

  • Kim, Young Park;Kim, Hyoung Joong
    • Journal of Digital Contents Society
    • /
    • v.19 no.1
    • /
    • pp.141-147
    • /
    • 2018
  • This study analyzed the early retired employees who stayed in company no longer than 3 years based on a certain company's personality evaluation result data. The predicted model was analyzed by dividing into two categories; the manufacture group and the R&D group. Independent variables were selected according to the stepwise method. A logistic regression model was selected as a prediction model among various supervised learning methods, and trained through cross-validation to prevent over-fitting or under-fitting. The accuracy of the two groups were confirmed by the confusion matrix. The most influential factor for early retirement in the manufacture group was revealed as "immersion," and for the R&D group appeared as "antisocial." In the past, people concentrated on collecting data by questionnaire and identifying factors that are highly related to the retirement, but this study suggests a sustainable early retirement prediction model in the future by analyzing the tangible outcome of the recruitment process.

기업평가모형의 적합성에 관한 실증적 연구

  • Kim, Cheol-Jung
    • The Korean Journal of Financial Studies
    • /
    • v.5 no.1
    • /
    • pp.19-47
    • /
    • 1999
  • 본 연구는 기업가치 추정모형인 EVA모형과 FCFF모형의 적합성을 한국주식시장을 대상으로 검증하는데 목적을 두고 있다. 1992년$\sim$1996년의 5년간 상장기업을 대상으로 분석한 결과는 다음과 같다. 실제주가와 이론주가간에 음(-)의 괴리율을 갖는 집단의 누적평균초과수익률은 EVA 모형 기준인 경우 40일$\sim$60일간에 유의적으로 상승하고 있으며, FCFF모형의 경우 1일$\sim$20일간에 유의적으로 상승하고 있다. 그리고 실제주가와 이론주가간에 양(+)의 괴리율을 갖는 집단의 누적평균초과수익률은 EVA모형 기준인 경우 21일$\sim$40일간에 유의적으로 하락하고 있으며, FCFF모형 기준인 경우 1일$\sim$20일간에 유의적으로 하락하고 있다. 또한 EVA모형과 FCFF모형 모두에서 음(-)의 괴리율집단과 양(+)의 괴리율집단간의 누적평균초과수익률은 기준일 이후 유의적 차이를 보이고 있다. EVA모형과 FCFF모형으로 평가한 결과는 반영시점이 다소 차이가 난다는 점을 제외하고는 상대적으로 과소평가된 주식은 기준일 이후 가격이 상승하고 상대적으로 과대 평가된 주식은 기준일 이후 하락한다는 사실을 보여주고 있다. 이런 사실은 제한적이지만 절대가치평가모형이 한국주식시장에서 어느 정도 적합성을 가질 수 있는 가능성을 보여주고 있다.

  • PDF

Virtual Samples Generation Based on the Distriburion of Input Data (입력 데이터의 분포를 고려한 가상 샘플 생성)

  • 이봉기;임용업;조성준
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.302-304
    • /
    • 2000
  • 본 논문에서는 잡음 추가와 네트웍 앙상블을 이용하는 기법으로 최근에 제안된 가상 샘플 생성 방법(VSG:Virtual Sample Generation)을 개선하는 방법을 제안하고, 이를 대표적인 앙상블학습 알고리즘인 Bagging, Boosting과 비교한다. 기존의 가상 샘플 생성 방법에 기초하여 입력 데이터의 분포를 고려하여 가상 샘플을 생성하는 방법을 제안한다. 이 방법은 입력 분포의 밀도가 높은 곳에서 가장 샘플로 인한 과소 적합을 방지하고 밀도가 낮은 곳에서 가상 샘플로 인한 과도 적합을 방지하기 위한 것이다. 본 논문은 입력 데이터의 밀도를 추정하는 새로운 과정을 정리하고 입력 분포에 따라 적합한 가상 샘플을 생성하는 방법을 고안했다. 그리고 제안하는 방법의 일반화 성능 향상을 보이기 위해 여러 가지의 합성 데이터를 사용하여 실험을 하였고 이를 Bagging, Boosting, VSG의 성능과 비교하였다.

  • PDF

Comparison of Loss Function for Multi-Class Classification of Collision Events in Imbalanced Black-Box Video Data (불균형 블랙박스 동영상 데이터에서 충돌 상황의 다중 분류를 위한 손실 함수 비교)

  • Euisang Lee;Seokmin Han
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • /
    • v.24 no.1
    • /
    • pp.49-54
    • /
    • 2024
  • Data imbalance is a common issue encountered in classification problems, stemming from a significant disparity in the number of samples between classes within the dataset. Such data imbalance typically leads to problems in classification models, including overfitting, underfitting, and misinterpretation of performance metrics. Methods to address this issue include resampling, augmentation, regularization techniques, and adjustment of loss functions. In this paper, we focus on loss function adjustment, particularly comparing the performance of various configurations of loss functions (Cross Entropy, Balanced Cross Entropy, two settings of Focal Loss: 𝛼 = 1 and 𝛼 = Balanced, Asymmetric Loss) on Multi-Class black-box video data with imbalance issues. The comparison is conducted using the I3D, and R3D_18 models.

Analysis of Lateral Behavior of Offshore Wind Turbine Monopile Foundation in Sandy Soil (사질토에 근입된 해상풍력 모노파일 기초의 횡방향 거동 분석)

  • Jang, Hwa Sup;Kim, Ho Sun;Kwak, Yeon Min;Park, Jae Hyun
    • Journal of Korean Society of Steel Construction
    • /
    • v.25 no.4
    • /
    • pp.421-430
    • /
    • 2013
  • To predict behaviors of offshore wind turbines which are highly laterally loaded structures and to design them rationally, evaluating the soil-foundation interaction is important. Nowadays, there are many soil modeling methods for structural analysis of general structures subjected to vertical loads, but using the methods without any consideration for design of a monopile foundation is eschewed because it might cause wrong structural design due to the deferent loading state. In this paper, we identify the differences of the member forces and displacements by design methods. The results show that fixed end method is barely suitable for monopile design in terms of checking the serviceability because it underestimate the lateral displacement. Fixed end method and stiffness matrix method underestimate the member forces, whereas virtual fixed end method overestimates them. The results of p-y curve method and coefficient of subgrade reaction method are similar to the results of 3D soil modeling method, and 2D soil modeling method overestimates the displacement and member forces as compared with other methods.

Evaluation of the Site Specific Ground Response in Korean Urban Site (국내 도시지역의 지반응답특성 거동 평가)

  • Shin, Dea-Sub;Kim, Hu-Seung
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.18 no.6
    • /
    • pp.250-255
    • /
    • 2017
  • When an earthquake occurs, it is necessary to evaluate the site-specific ground response while considering ground characteristics in seismic design. The design seismic force of Korean seismic design criteria is borrowed from the Uniform Building Code(UBC-1997). However, the criteria are based on the ground characteristics of the United States, which are different from the ground characteristics in Korea, and using them could cause over-or under-designing. Therefore, it is important to develop a proper design response spectrum for Korean ground characteristics. In this study, 158 ground sites in Korean urban areas were selected and compared to those in the western part of the United States, and their site-specific ground responses were analyzed. The classification standard in the seismic design criteria classifies the 158 sites into 37 sites, 107 sites, and 14 sites. Using 7 earthquake inputs, the criteria were compared for each group.The Korean design response spectrum underestimates the amplification of the short-period range and overestimates the amplification in the long-period range. There were large differences in the results of the and sites,which account for 77 percent of the 158 sites. Therefore, there is a need to modify the amplification factor in the Korean seismic criteria to properly reflect Korean ground characteristics.