• 제목/요약/키워드: 과소적합

검색결과 104건 처리시간 0.023초

중규모유역에서의 유역응답시간 특성 분석 (A Study on the Analysis of Characteristics of the Catchment Response Time in Midsize Catchment)

  • 박종영;이정식
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2004년도 학술발표회
    • /
    • pp.1042-1046
    • /
    • 2004
  • 본 연구는 국내 실무에서 사용되고 있는 유역응답시간 산정식의 적용성을 검토하기 위하여 기존의 8개의 도달시간 산정식과 6개의 지체시간 산정식을 유역면적이 $50\~500km^2$인 중규모유역에 적용하였으며, 실측수문 자료로부터 두가지 정의에 의해 산정한 도달시간과 지체시간을 비교, 검토하였다. 기존의 도달시간 산정식에 의한 도달시간은 실측 도달시간에 비해 모든 대상유역에서 과소한 값을 나타내었으며, 지체시간 산정식의 경우 Clark 공식과 SCS 공식은 모든 대상유역에서 과소한 값을 나타내었고 Snyder 공식, Linsley 공식, Eagleson 공식, Rao와 Delleur 공식은 대상유역에 따라 과다 또는 과소한 경향을 나타내었다. 따라서 실측수문자료에서 산정된 유역응답시간과 기존의 산정식에서 결정된 값들이 상이하게 나타나 중규모유역에서 기존의 유역응답 시간 산정식의 적용성이 떨어진다고 판단되었다. 대상유역에서 적합한 유역응답시간 공식을 유도하기 위하여 유역응답시간과 유역특성인자간의 회귀분석을 실시하였으며, 국내 중규모유역에서 적용할 수 있는 도달시간과 지체시간 산정식을 제안하였다.

  • PDF

병원 외래환자수의 예측을 위한 시계열 데이터처리 딥러닝 시스템 (Time Series Data Processing Deep Learning system for Prediction of Hospital Outpatient Number)

  • 조준모
    • 한국전자통신학회논문지
    • /
    • 제16권2호
    • /
    • pp.313-318
    • /
    • 2021
  • 딥러닝 기술의 도래로 인하여 수많은 산업과 일반적인 응용에 적용됨으로써 우리의 생활에 큰 영향을 발휘하고 있다. 특정한 분야의 문제를 해결하기 위해서는 그 문제에 적합한 딥러닝 모델을 작성해야 한다. 근래에는 COVID-19 사태로 인하여 다양한 문제들을 딥러닝으로 해결하고자 하는 사례들이 늘고 있다. 이러한 일환으로 본 논문에서는 갑자기 급증할 수 있는 병원의 외래환자들을 미리 예측을 위한 시계열의 딥러닝 모델을 제시하고자 한다. 제시하는 딥러닝 모델은 주피터 노트북에서 케라스로 작성하였다. 예측결과는 실제 데이터와 그래프로 비교하며 유효성 데이터를 활용하여 과소적합과 과대적합의 여부를 손실률로 분석할 수 있도록 하였다.

한.중 출판교류 본격화 물꼬 튼다

  • 정혜옥
    • 출판저널
    • /
    • 통권134호
    • /
    • pp.20-21
    • /
    • 1993
  • 이번 모임이 우리출판계에 던져준 교훈은 중국 출판인들이 자신들의 절박한 사정으로 인해 한국출판계를 '공략'해 들어온다는 표현이 적합할 만큼 '무리한' 요구를 해오는 점과, 단순히 중국의 현재 출판 제작.인쇄 수준이 우리보다 낮다 하여 과소평가하여 소홀히 대응할 경우 예기치못한 상황까지 도래할 수 있다는 점이다.

  • PDF

공분산분석 모형에서의 변수선택 정리 (Variable Selection Theorem for the Analysis of Covariance Model)

  • 윤상후;박정수
    • Communications for Statistical Applications and Methods
    • /
    • 제15권3호
    • /
    • pp.333-342
    • /
    • 2008
  • 회귀모형에서의 변수선택에 관한 정리를 공분산분석 모형으로 확장하였다. 공분산분석 모형에서 몇개의 회귀변수를 제거한 축소모형을 세우는 경우에 추정량의 변화를 알아본 결과, 회귀계수 뿐만아니라 분산분석계수도 추정량의 편차는 증가하지만 분산은 감소하며, 어떤 경우에는 평균제곱오차도 감소한다는 결론을 얻었다.

인성 데이터를 활용한 조기 퇴사자 예측 (Predicting Early Retirees Using Personality Data)

  • 김영박;김형중
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권1호
    • /
    • pp.141-147
    • /
    • 2018
  • 본 연구는 기업에서 채용 전형 시 진행되는 인성시험 결과 데이터를 기반으로, 입사 3년 미만의 조기 퇴사자를 분석하였다. 예측 모형은 적합성 및 향후 활용성을 고려하여 제조(manufacture)직군과 R&D직군 2개 그룹으로 구분하여 분석하였으며, 독립변수 선택은 전진(stepwise)선택법에 따라 직군별로 유의미한 독립변수를 선택하였다. 예측 모형은 지도학습(supervised learning) 방법 중 로지스틱 회귀분석 알고리즘을 선택하였으며, 과잉적합(overfitting) 또는 과소적합(underfitting)을 방지하고자 교차 검증(cross validation)을 통해 예측 모형을 훈련시켰다. 혼동행렬(confusion matrix)을 통해 2개 그룹의 정확도(accuracy)를 확인하였으며, 조기 퇴직에 가장 영향을 많이 미치는 요인으로 제조직군에서는 '몰입', R&D직군에서는 '반사회성' 항목으로 확인되었다. 기존 퇴직 관련 연구는 설문 방식으로 데이터를 수집하고, 퇴직과 관련성이 높은 요인을 확인하는데 집중하였다면, 본 연구는 채용 전형 시 진행되는 인성 결과 분석을 통해 향후에도 지속 가능한 조기 퇴직 예측 모형을 제시했다는 면에서 의의를 갖는다.

기업평가모형의 적합성에 관한 실증적 연구

  • 김철중
    • 재무관리논총
    • /
    • 제5권1호
    • /
    • pp.19-47
    • /
    • 1999
  • 본 연구는 기업가치 추정모형인 EVA모형과 FCFF모형의 적합성을 한국주식시장을 대상으로 검증하는데 목적을 두고 있다. 1992년$\sim$1996년의 5년간 상장기업을 대상으로 분석한 결과는 다음과 같다. 실제주가와 이론주가간에 음(-)의 괴리율을 갖는 집단의 누적평균초과수익률은 EVA 모형 기준인 경우 40일$\sim$60일간에 유의적으로 상승하고 있으며, FCFF모형의 경우 1일$\sim$20일간에 유의적으로 상승하고 있다. 그리고 실제주가와 이론주가간에 양(+)의 괴리율을 갖는 집단의 누적평균초과수익률은 EVA모형 기준인 경우 21일$\sim$40일간에 유의적으로 하락하고 있으며, FCFF모형 기준인 경우 1일$\sim$20일간에 유의적으로 하락하고 있다. 또한 EVA모형과 FCFF모형 모두에서 음(-)의 괴리율집단과 양(+)의 괴리율집단간의 누적평균초과수익률은 기준일 이후 유의적 차이를 보이고 있다. EVA모형과 FCFF모형으로 평가한 결과는 반영시점이 다소 차이가 난다는 점을 제외하고는 상대적으로 과소평가된 주식은 기준일 이후 가격이 상승하고 상대적으로 과대 평가된 주식은 기준일 이후 하락한다는 사실을 보여주고 있다. 이런 사실은 제한적이지만 절대가치평가모형이 한국주식시장에서 어느 정도 적합성을 가질 수 있는 가능성을 보여주고 있다.

  • PDF

입력 데이터의 분포를 고려한 가상 샘플 생성 (Virtual Samples Generation Based on the Distriburion of Input Data)

  • 이봉기;임용업;조성준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.302-304
    • /
    • 2000
  • 본 논문에서는 잡음 추가와 네트웍 앙상블을 이용하는 기법으로 최근에 제안된 가상 샘플 생성 방법(VSG:Virtual Sample Generation)을 개선하는 방법을 제안하고, 이를 대표적인 앙상블학습 알고리즘인 Bagging, Boosting과 비교한다. 기존의 가상 샘플 생성 방법에 기초하여 입력 데이터의 분포를 고려하여 가상 샘플을 생성하는 방법을 제안한다. 이 방법은 입력 분포의 밀도가 높은 곳에서 가장 샘플로 인한 과소 적합을 방지하고 밀도가 낮은 곳에서 가상 샘플로 인한 과도 적합을 방지하기 위한 것이다. 본 논문은 입력 데이터의 밀도를 추정하는 새로운 과정을 정리하고 입력 분포에 따라 적합한 가상 샘플을 생성하는 방법을 고안했다. 그리고 제안하는 방법의 일반화 성능 향상을 보이기 위해 여러 가지의 합성 데이터를 사용하여 실험을 하였고 이를 Bagging, Boosting, VSG의 성능과 비교하였다.

  • PDF

불균형 블랙박스 동영상 데이터에서 충돌 상황의 다중 분류를 위한 손실 함수 비교 (Comparison of Loss Function for Multi-Class Classification of Collision Events in Imbalanced Black-Box Video Data)

  • 이의상;한석민
    • 한국인터넷방송통신학회논문지
    • /
    • 제24권1호
    • /
    • pp.49-54
    • /
    • 2024
  • 데이터 불균형은 분류 문제에서 흔히 마주치는 문제로, 데이터셋 내의 클래스간 샘플 수의 현저한 차이에서 기인한다. 이러한 데이터 불균형은 일반적으로 분류 모델에서 과적합, 과소적합, 성능 지표의 오해 등의 문제를 야기한다. 이를 해결하기 위한 방법으로는 Resampling, Augmentation, 규제 기법, 손실 함수 조정 등이 있다. 본 논문에서는 손실 함수 조정에 대해 다루며 특히, 불균형 문제를 가진 Multi-Class 블랙박스 동영상 데이터에서 여러 구성의 손실 함수(Cross Entropy, Balanced Cross Entropy, 두 가지 Focal Loss 설정: 𝛼 = 1 및 𝛼 = Balanced, Asymmetric Loss)의 성능을 I3D, R3D_18 모델을 활용하여 비교하였다.

사질토에 근입된 해상풍력 모노파일 기초의 횡방향 거동 분석 (Analysis of Lateral Behavior of Offshore Wind Turbine Monopile Foundation in Sandy Soil)

  • 장화섭;김호선;곽연민;박재현
    • 한국강구조학회 논문집
    • /
    • 제25권4호
    • /
    • pp.421-430
    • /
    • 2013
  • 수평하중이 지배적인 해상 풍력발전기 설계 시에는 지반-기초구조물 거동을 정확히 모사하여야 상부구조물에 대한 정확한 거동예측이 가능하며, 합리적 설계가 이루어질 수 있다. 현재 다양한 지반 모델링 기법이 존재하나, 모노파일 기초 설계 시, 각 해석 기법에 대한 충분한 검증 절차 없이 해석 결과를 그대로 사용할 경우 구조물을 과다 및 과소하게 설계할 우려가 있다. 이에 본 연구에서는 지반 모델링 기법 차에 따른 모노파일의 부재력 및 수평변위 차를 비교 분석하였다. 검토 결과 고정단 모델은 최대 수평변위를 과소평가 하여 사용성 검토 측면에서 적합하지 않은 것으로 나타났으며, 고정단 모델, 지반강성행렬 모델은 모노파일의 부재력을 과소평가하는 것으로 나타났다. 반면 가상고정점 모델은 모노파일의 부재력을 과대평가하여 경제성 측면에서 적합하지 않은 것으로 나타났다. 지반반력계수 모델과 p-y곡선 모델의 경우 3D 지반 모델링 해석 결과와 비교적 유사한 수평변위 및 부재력을 나타냈으며, 지반을 2D로 모델링한 경우 타 모델링 기법에 비해 과대한 수평변위와 부재력을 산정했다.

국내 도시지역의 지반응답특성 거동 평가 (Evaluation of the Site Specific Ground Response in Korean Urban Site)

  • 신대섭;김후승
    • 한국산학기술학회논문지
    • /
    • 제18권6호
    • /
    • pp.250-255
    • /
    • 2017
  • 지진 발생시 지반조건에 의하여 지반운동에 영향을 받으며 내진설계시 지반특성을 고려한 부지응답특성 평가를 수행해야한다. 국내 내진설계기준의 설계지진력을 결정하는 부분은 미국내진설계기준(UBC-1997)을 차용하여 사용하고 있다. 국내 지반특성과 다른 미국의 지반특성에 적합하게 만들어진 기준을 그대로 사용하는 경우 과다 또는 과소 설계의 원인이 될 수 있다. 따라서 국내지반특성에 적합한 설계응답스펙트럼의 개선이 중요하다. 그래서 본 연구에서는 국내 도시지역의 158개 지반을 선정하여 미국 서부지역의 지반 특성과 비교하고 부지응답을 수행하였다. 158개의 지반을 내진설계기준에서 제시하는 분류방법을 이용하여 분류하였을 때 $S_B$에 해당하는 지반이 37개, $S_C$은 107개, 지반 $S_D$은 14개로 분류되었다. 각 분류된 지반과 7개의 입력지진파를 토대로 해석을 수행하였으며, 내진설계기준과 비교 분석 결과, 국내 설계응답스펙트럼은 국내의 도시지역의 지반특성에 비하여 단주기 영역의 증폭을 과소평가하고 장주기 영역의 증폭을 과대평가하는 것으로 나타났다. 158개의 해석대상부지 중에서 77%정도를 차지하는 지반 $S_C$, $S_D$의 결과에서 설계응답스펙트럼과 큰 차이가 발생한다는 것은 국내 내진설계기준에 제시되어있는 증폭계수를 국내 지반특성에 적합하도록 재산정 할 필요성이 있다는 것을 보여준다.