• 제목/요약/키워드: non-parametric regression model

검색결과 38건 처리시간 0.022초

Transitional Dark Energy - A solution to the H0 tension

  • Keeley, Ryan
    • 천문학회보
    • /
    • 제44권2호
    • /
    • pp.59.2-59.2
    • /
    • 2019
  • In this talk, I will explain the implications of a rapid appearance of dark energy between the redshifts ($z$) of one and two on the expansion rate and growth of perturbations. Using both Gaussian process regression and a parametric model, I show that this is the preferred solution to the current set of low-redshift ($z<3$) distance measurements if $H_0=73~\rm km\,s^{-1}\,Mpc^{-1}$ to within 1\% and the high-redshift expansion history is unchanged from the $\Lambda$CDM inference by the Planck satellite. Dark energy was effectively non-existent around $z=2$, but its density is close to the $\Lambda$CDM model value today, with an equation of state greater than $-1$ at $z<0.5$. If sources of clustering other than matter are negligible, we show that this expansion history leads to slower growth of perturbations at $z<1$, compared to $\Lambda$CDM, that is measurable by upcoming surveys and can alleviate the $\sigma_8$ tension between the Planck CMB temperature and low-redshift probes of the large-scale structure.

  • PDF

데이터 증가를 통한 선형 모델의 일반화 성능 개량 (중심극한정리를 기반으로) (Improvement of generalization of linear model through data augmentation based on Central Limit Theorem)

  • 황두환
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.19-31
    • /
    • 2022
  • 기계학습 모델 구축 간 트레이닝 데이터를 활용하며, 훈련 간 사용되지 않은 테스트 데이터를 활용하여 모델의 정확도와 일반화 성능을 판단한다. 일반화 성능이 낮은 모델의 경우 새롭게 받아들이게 되는 데이터에 대한 예측 정확도가 현저히 감소하게 되며 이러한 현상을 두고 모델이 과적합 되었다고 한다. 본 연구는 중심극한정리를 기반으로 데이터를 생성 및 기존의 훈련용 데이터와 결합하여 새로운 훈련용 데이터를 구성하고 데이터의 정규성을 증가시킴과 동시에 이를 활용하여 모델의 일반화 성능을 증가시키는 방법에 대한 것이다. 이를 위해 중심극한정리의 성질을 활용해 데이터의 각 특성별로 표본평균 및 표준편차를 활용하여 데이터를 생성하였고, 새로운 훈련용 데이터의 정규성 증가 정도를 파악하기 위하여 Kolmogorov-Smirnov 정규성 검정을 진행한 결과, 새로운 훈련용 데이터가 기존의 데이터에 비해 정규성이 증가하였음을 확인할 수 있었다. 일반화 성능은 훈련용 데이터와 테스트용 데이터에 대한 예측 정확도의 차이를 통해 측정하였다. 새롭게 생성된 데이터를 K-Nearest Neighbors(KNN), Logistic Regression, Linear Discriminant Analysis(LDA)에 적용하여 훈련시키고 일반화 성능 증가정도를 파악한 결과, 비모수(non-parametric) 기법인 KNN과 모델 구성 간 정규성을 가정으로 갖는 LDA의 경우에 대하여 일반화 성능이 향상되었음을 확인할 수 있었다.

THREE-STAGED RISK EVALUATION MODEL FOR BIDDING ON INTERNATIONAL CONSTRUCTION PROJECTS

  • Wooyong Jung;Seung Heon Han
    • 국제학술발표논문집
    • /
    • The 4th International Conference on Construction Engineering and Project Management Organized by the University of New South Wales
    • /
    • pp.534-541
    • /
    • 2011
  • Risk evaluation approaches for bidding on international construction projects are typically partitioned into three stages: country selection, project classification, and bid-cost evaluation. However, previous studies are frequently under attack in that they have several crucial limitations: 1) a dearth of studies about country selection risk tailored for the overseas construction market at a corporate level; 2) no consideration of uncertainties for input variable per se; 3) less probabilistic approaches in estimating a range of cost variance; and 4) less inclusion of covariance impacts. This study thus suggests a three-staged risk evaluation model to resolve these inherent problems. In the first stage, a country portfolio model that maximizes the expected construction market growth rate and profit rate while decreasing market uncertainty is formulated using multi-objective genetic analysis. Following this, probabilistic approaches for screening bad projects are suggested through applying various data mining methods such as discriminant logistic regression, neural network, C5.0, and support vector machine. For the last stage, the cost overrun prediction model is simulated for determining a reasonable bid cost, while considering non-parametric distribution, effects of systematic risks, and the firm's specific capability accrued in a given country. Through the three consecutive models, this study verifies that international construction risk can be allocated, reduced, and projected to some degree, thereby contributing to sustaining stable profits and revenues in both the short-term and the long-term perspective.

  • PDF

평활화된 무차원 단위핵함수를 이용한 단위도의 유도 (A Derivation of a Hydrograph by Using Smoothed Dimensionless Unit Kernel Function)

  • 성기원
    • 한국수자원학회논문집
    • /
    • 제41권6호
    • /
    • pp.559-564
    • /
    • 2008
  • 본 연구에서는 복합 강우사상으로부터 단위도와 S-곡선을 도출하는 실용적인 방법을 강구하였다. 이 연구에서 이용된 단위핵함수는 단위도와 S-곡선을 유도하는데 있어서 기존의 방법보다 편리하다. 그러나 실제 자료를 분석할 때 단위핵함수는 진동을 보이고 불안정하기 때문에 단위도와 S-곡선 도출에 있어서 장애가 있다. 그런데 단위핵함수의 요소인 Nash 의 순간단위도를 추정함에 있어서 Laplacian 행렬을 이용한 능형회귀분석을 이용하면 사상에 대한 평균적인 단위핵함수를 구하는데 유익함을 발견하였다. 또한 이를 이용하여 단위도의 지속기간 변경도 가능하였다. 이 연구에서 제시된 방법론은 단위도 제작에 적지 않은 도움이 될 것으로 기대한다.

식품용수 수질자료를 이용한 지하수 오염 예측 모델 개발 및 소규모 유역에서의 검증 (Development of Prediction Model of Groundwater Pollution based on Food Available Water and Validation in Small Watersheds)

  • 남성우;박은규;이명재;전선금;정혜민;김정우
    • 한국지하수토양환경학회지:지하수토양환경
    • /
    • 제26권6호
    • /
    • pp.165-175
    • /
    • 2021
  • Groundwater is used in many areas in food industry such as food manufacturing, food processing, cooking, and liquor industry etc. in Korea. As groundwater occupies a large portion of food industry, it is necessary to predict deterioration of water quality to ensure the safety of food water since using undrinkable groundwater has a ripple effect that can cause great harm or anxiety to food users. In this study, spatiotemporal data aggregation method was used in order to obtain spatially representative data, which enable prediction of groundwater quality change in a small watershed. In addition, a highly reliable predictive model was developed to estimate long-term changes in groundwater quality by applying a non-parametric segmented regression technique. Two pilot watersheds were selected where a large number of companies use groundwater for food water, and the appropriateness of the model was assessed by comparing the model-produced values with those obtained by actual measurements. The result of this study can contribute to establishing a customized food water management system utilizing big data that respond quickly, accurately, and preemptively to changes in groundwater quality and pollution. It is also expected to contribute to the improvement of food safety management.

인공신경망과 가우시안 과정 회귀에 의한 규칙파의 조파기 입력파고 추정 (Estimation of the Input Wave Height of the Wave Generator for Regular Waves by Using Artificial Neural Networks and Gaussian Process Regression)

  • 오정은;오상호
    • 한국해안·해양공학회논문집
    • /
    • 제34권6호
    • /
    • pp.315-324
    • /
    • 2022
  • 2차원 조파수조 내에서 취득된 규칙파 실험데이터를 머신러닝 기법으로 분석하여 천수 변형을 경험한 파랑으로부터 조파기의 입력파고를 예측하는 모델을 수립하고 그 성능을 검증하였다. 이를 위해 가장 대표적인 머신러닝 기법인 인공신경망(NN)과 비모수 회귀분석 방법 중 하나인 가우시안 과정 회귀(GPR) 모델을 각각 수립하고 두 모델의 예측 성능을 비교하였다. 전체 실험자료를 모두 한꺼번에 활용한 경우와 쇄파 발생 여부에 따라 자료를 구분한 경우에 대해 독립적으로 분석을 수행하였다. 데이터를 구분하지 않은 경우에는 NN 및 GPR 모델 모두 조파기 입력파고 값과 계측값 사이의 오차가 비교적 크게 나타났다. 반면에 데이터를 비쇄파 및 쇄파 조건으로 구분하면 조파기 입력파고의 예측 정확도가 크게 향상되었다. 두 모델 중에서는 NN 모델보다 GPR 모델의 성능이 전반적으로 더 우수한 것으로 나타났다.

Risk indicators related to periimplant disease: an observational retrospective cohort study

  • Poli, Pier Paolo;Beretta, Mario;Grossi, Giovanni Battista;Maiorana, Carlo
    • Journal of Periodontal and Implant Science
    • /
    • 제46권4호
    • /
    • pp.266-276
    • /
    • 2016
  • Purpose: The aim of the present study was to retrospectively investigate the influence of potential risk indicators on the development of peri-implant disease. Methods: Overall, 103 patients referred for implant treatment from 2000 to 2012 were randomly enrolled. The study sample consisted of 421 conventional-length (>6 mm) non-turned titanium implants that were evaluated clinically and radiographically according to preestablished clinical and patient-related parameters by a single investigator. A non-parametric Mann-Whitney U test or Kruskal-Wallis rank test and a logistic regression model were used for the statistical analysis of the recorded data at the implant level. Results: The diagnosis of peri-implant mucositis and peri-implantitis was made for 173 (41.1%) and 19 (4.5%) implants, respectively. Age (${\geq}65$ years), patient adherence (professional hygiene recalls <2/year) and the presence of plaque were associated with higher peri-implant probing-depth values and bleeding-on-probing scores. The logistic regression analysis indicated that age (P=0.001), patient adherence (P=0.03), the absence of keratinized tissue (P=0.03), implants placed in pristine bone (P=0.04), and the presence of peri-implant soft-tissue recession (P=0.000) were strongly associated with the event of peri-implantitis. Conclusions: Within the limitations of this study, patients aged ${\geq}65$ years and non-adherent subjects were more prone to develop peri-implant disease. Therefore, early diagnosis and a systematic maintenance-care program are essential for maintaining peri-implant tissue health, especially in older patients.

Influence of spacers on ultimate strength of intermediate length thin walled columns

  • Anbarasu, M.;Sukumar, S.
    • Steel and Composite Structures
    • /
    • 제16권4호
    • /
    • pp.437-454
    • /
    • 2014
  • The influence of spacers on the behaviour and ultimate capacity of intermediate length CFS open section columns under axial compression is investigated in this paper. The focus of the research lies in the cross- section predominantly, failed by distortional buckling. This paper made an attempt to either delay or eliminate the distortional buckling mode by the introduction of transverse elements referred herein as spacers. The cross-sections investigated have been selected by performing the elastic buckling analysis using CUFSM software. The test program considered three different columns having slenderness ratios of 35, 50 & 60. The test program consisted of 14 pure axial compression tests under hinged-hinged end condition. Models have been analysed using finite element simulations and the obtained results are compared with the experimental tests. The finite element package ABAQUS has been used to carry out non-linear analyses of the columns. The finite element model incorporates material, geometric non-linearities and initial geometric imperfection of the specimens. The work involves a wide parametric study in the column with spacers of varying depth and number of spacers. The results obtained from the study shows that the depth and number of spacers have significant influence on the behaviour and strength of the columns. Based on the nonlinear regression analysis the design equation is proposed for the selected section.

2007 한국 소아청소년 성장곡선 및 정상혈압 분포 개발 방법론 (The methodology for developing the 2007 Korean growth charts and blood pressure nomogram in Korean children and adolescents)

  • 이순영;김윤남;강연지;장명진;김진흠;문진수;이종국;오경원;김영택;남정모
    • Clinical and Experimental Pediatrics
    • /
    • 제51권1호
    • /
    • pp.26-32
    • /
    • 2008
  • 목 적 : 1998년과 2005년 신체발육표준 제정사업 자료를 이용하여 2007년 소아청소년 성장곡선의 개발과정에서에 이용된 성장곡선 및 혈압분포 개발 방법론을 제시하고자 하였다. 방 법 : 성장곡선은 1998년과 2005년 자료를 이용해서 각 백분위수의 성장곡선 모형을 추정하고 LMS를 방법을 이용하여 최종 성장곡선을 생산하였다. 연령과 신장별 혈압 성장곡선은 2005년 자료를 이용하여 남녀별로 고정효과 회귀모형을 적용하여 산출하였다. 결 과 : 2007 소아청소년 성장곡선 및 혈압분포 표를 제시할 수 있었다. 결 론 : 2007년 성장곡선과 혈압분포 표는 현재 가용한 자료와 최신의 통계적 방법을 최대한 활용한 국내 최초의 결과로서 향후 지속적인 발전을 위한 논의와 연구가 필요하다.

시계열 이용기간에 따른 사망률 예측 비교 (A comparison of mortality projection by different time period in time series)

  • 김순영;오진호;김기환
    • 응용통계연구
    • /
    • 제31권1호
    • /
    • pp.41-65
    • /
    • 2018
  • 우리나라의 경우 선진국에 비해 짧은 기간 동안 사망률 개선이 급속히 이루어짐에 따라 사망률 예측에 있어 모형의 선택뿐만 아니라 시계열 이용기간의 선정 또한 중요한 고려사항이 될 수 있다. 따라서 본 연구에서는 시계열 이용기간의 선택 관점에서 회귀모형을 이용하는 방법을 제안하였다. 또한 Lee-Carter (LC) 모형, LC류 (Lee-Miller (LM), Booth-Maindonald-Smith (BMS)) 그리고 비모수 모형(functional data model (FDM), Coherent FDM)을 토대로 시계열 이용기간을 다르게 적용할 경우 어떠한 문제가 발생되며, 연령별 사망률과 기대수명 예측력에 어떠한 차이를 보이는지 살펴보았다. 분석결과를 바탕으로 5개의 모형별 2030년까지 남녀의 연령별 사망률과 예측기대수명을 작성하고 통계청(Korean Statistical Information Service; KOSIS)에서 제공하는 장래 연령별 사망률과 기대수명과 비교하였다.