• Title/Summary/Keyword: mean-squared error

검색결과 711건 처리시간 0.029초

Different penalty methods for assessing interval from first to successful insemination in Japanese Black heifers

  • Setiaji, Asep;Oikawa, Takuro
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제32권9호
    • /
    • pp.1349-1354
    • /
    • 2019
  • Objective: The objective of this study was to determine the best approach for handling missing records of first to successful insemination (FS) in Japanese Black heifers. Methods: Of a total of 2,367 records of heifers born between 2003 and 2015 used, 206 (8.7%) of open heifers were missing. Four penalty methods based on the number of inseminations were set as follows: C1, FS average according to the number of inseminations; C2, constant number of days, 359; C3, maximum number of FS days to each insemination; and C4, average of FS at the last insemination and FS of C2. C5 was generated by adding a constant number (21 d) to the highest number of FS days in each contemporary group. The bootstrap method was used to compare among the 5 methods in terms of bias, mean squared error (MSE) and coefficient of correlation between estimated breeding value (EBV) of non-censored data and censored data. Three percentages (5%, 10%, and 15%) were investigated using the random censoring scheme. The univariate animal model was used to conduct genetic analysis. Results: Heritability of FS in non-censored data was $0.012{\pm}0.016$, slightly lower than the average estimate from the five penalty methods. C1, C2, and C3 showed lower standard errors of estimated heritability but demonstrated inconsistent results for different percentages of missing records. C4 showed moderate standard errors but more stable ones for all percentages of the missing records, whereas C5 showed the highest standard errors compared with noncensored data. The MSE in C4 heritability was $0.633{\times}10^{-4}$, $0.879{\times}10^{-4}$, $0.876{\times}10^{-4}$ and $0.866{\times}10^{-4}$ for 5%, 8.7%, 10%, and 15%, respectively, of the missing records. Thus, C4 showed the lowest and the most stable MSE of heritability; the coefficient of correlation for EBV was 0.88; 0.93 and 0.90 for heifer, sire and dam, respectively. Conclusion: C4 demonstrated the highest positive correlation with the non-censored data set and was consistent within different percentages of the missing records. We concluded that C4 was the best penalty method for missing records due to the stable value of estimated parameters and the highest coefficient of correlation.

The Korean Repeatable Battery for the Assessment of Neuropsychological Status-Update : Psychiatric and Neurosurgery Patient Sample Validity

  • Park, Jong-Ok;Koo, Bon-Hoon;Kim, Ji-Yean;Bai, Dai-Seg;Chang, Mun-Seon;Kim, Oh-Lyong
    • Journal of Korean Neurosurgical Society
    • /
    • 제64권1호
    • /
    • pp.125-135
    • /
    • 2021
  • Objective : This study aimed to validate the Korean version of the Repeatable Battery for the Assessment of Neuropsychological Status Update (K-RBANS). Methods : We performed a retrospective analysis of 283 psychiatric and neurosurgery patients. To investigate the convergent validity of the K-RBANS, correlation analyses were performed for other intelligence and neuropsychological test results. Confirmatory factor analysis was used to test a series of alternative plausible models of the K-RBANS. To analyze the various capabilities of the K-RBANS, we compared the area under the receiver operating characteristic (ROC) curves (AUC). Results : Significant correlations were observed, confirming the convergent validity of the K-RBANS among the Total Scale Index (TSI) and indices of the K-RBANS and indices of intelligence (r=0.47-0.81; p<0.001) and other neuropsychological tests at moderate and above significance (r=0.41-0.63; p<0.001). Additionally, the results testing the construct validity of the K-RBANS showed that the second-order factor structure model (model 2, similar to an original factor structure of RBANS), which includes a first-order factor comprising five index scores (immediate memory, visuospatial capacity, language, attention, delayed memory) and one higher-order factor (TSI), was statistically acceptable. The comparative fit index (CFI) (CFI, 0.949) values and the goodness of fit index (GFI) (GFI, 0.942) values higher than 0.90 indicated an excellent fit. The root mean squared error of approximation (RMSEA) (RMSEA, 0.082) was considered an acceptable fit. Additionally, the factor structure of model 2 was found to be better and more valid than the other model in χ2 values (Δχ2=7.69, p<0.05). In the ROC analysis, the AUCs of the TSI and five indices were 0.716-0.837, and the AUC of TSI (AUC, 0.837; 95% confidence interval, 0.760-0.896) was higher than the AUCs of the other indices. The sensitivity and specificity of TSI were 77.66% and 78.12%, respectively. Conclusion : The overall results of this study suggest that the K-RBANS may be used as a valid tool for the brief screening of neuropsychological patients in Korea.

경기육괴 중부 의암 편마암 복합체 호상편마암의 저어콘 U-Pb 연령과 미량원소: 경기육괴 기반암의 퇴적 시기와 변성작용에 대한 고찰 (Zircon U-Pb and Rare Earth Elements Analyses on Banded Gneiss in Euiam Gneiss Complex, Central Gyeonggi Massif: Consideration for the Timing of Depositional Event and Metamorphism of the Basement Rocks in the Gyeonggi Massif)

  • 이병춘;조등룡
    • 광물과 암석
    • /
    • 제35권3호
    • /
    • pp.215-233
    • /
    • 2022
  • 경기육괴 중부 의암 편마암 복합체에 분포하는 호상편마암에 대해 저어콘 연대 및 희유원소 분석을 진행했으며 분석 결과를 토대로 경기육괴 기반암류 모암의 퇴적시기와 이들의 변성작용 및 변성시기에 대해 검토하였다. 호상편마암의 쇄설성 저어콘은 신시생대와 고원생대 경계 부근(2500-2480 Ma)에서 가장 두드러진 연령 피크를 보이며 이들과 함께 고원생대 중기 시데로스기부터 라이악스기에 해당하는 다수의 연령이 확인되었다. 쇄설성 저어콘의 가장 젊은 연령 피크는 2070 Ma로 확인되었으며 이는 호상편마암 모암의 퇴적 시기가 적어도 2070 Ma 이후였음을 의미한다. 한편, 저어콘 외연부에서 1966 ± 39 Ma ~ 1918 ± 13 Ma에 해당하는 변성작용 연령이 확인되었으며 오차범위, 불일치도 그리고 평균 제곱 가중편차 값을 고려할 때 1918 ± 13 Ma가 가장 합리적인 변성작용 시기를 지시하는 것으로 보인다. 이들 저어콘 외연부의 결정화 온도는 690-740℃로 확인되었다. 따라서 경기육괴에서는 1880-1860 Ma에 일어난 광역변성작용 이전에도 고도의 변성작용이 있었던 것으로 판단된다.

다변량 지구과학 데이터와 가우시안 혼합 모델을 이용한 공간 분포 추정 (Estimation of Spatial Distribution Using the Gaussian Mixture Model with Multivariate Geoscience Data)

  • 김호림;유순영;윤성택;김경호;이군택;이정호;허철호;류동우
    • 자원환경지질
    • /
    • 제55권4호
    • /
    • pp.353-366
    • /
    • 2022
  • 지구과학 데이터(지오데이터)의 공간 이질성, 희소성 및 고차원성으로 인해 공간 분포 추정에 어려움이 있다. 따라서 지구과학의 많은 응용 분야에서 지오데이터의 고유 특성을 고려할 수 있는 공간 추정 기법이 필요하다. 본 연구에서는 기계 학습 알고리즘 중 하나인 가우시안 혼합 모델(Gaussian Mixture Model; GMM)을 이용하여 공간 예측 방법을 제공하고자 하였다. 제안된 기법의 성능을 검증하기 위해, 옛 제련소 부지에서 휴대용 X선 형광분석기(PXRF) 및 유도결합플라즈마-원자방출분광법(ICP-AES)을 이용하여 분석된 토양 농도 자료를 활용하였다. ICP-AES를 이용해 분석된 As와 Pb를 주변수로 하고, 나머지 자료는 보조변수로 활용하였다. 다차원의 보조변수 중 중요 변수를 선별하기 위해 랜덤포레스트 기반의 변수선택법을 적용하였다. ICP-AES 및 PXRF를 통해 구축된 다변량 데이터를 사용한 GMM의 결과를 단변량 및 이변량 데이터를 사용한 정규 크리깅(Ordinary Kriging; OK) 및 정규 공동크리깅(Ordinary Co-Kriging; OCK)의 결과와 비교하였다. GMM의 결과는 OK 및 OCK의 결과보다 낮은 평균 제곱근 편차(RMSE; 비소는 최대 0.11 및 납은 0.33까지 향상)와 높은 상관관계(r; 비소는 최대 0.31 및 납은 0.46까지 향상)를 제공하였다. 이는 GMM을 사용할 경우 토양 오염의 범위 해석의 성능을 향상시킬 수 있음을 지시한다. 본 연구는 다 변량 공간추정 접근법이 복잡하고 이질적인 지질 및 지구 화학자료의 특징을 이해하는 데 효과적으로 적용될 수 있음을 증명하였다.

누가분포함수를 활용한 강우강도식의 국내 적용성 평가 (Application of Intensity-Duration-Frequency Curve to Korea Derived by Cumulative Distribution Function)

  • 김규태;김태순;김수영;허준행
    • 대한토목학회논문집
    • /
    • 제28권4B호
    • /
    • pp.363-374
    • /
    • 2008
  • 국내에서 수공구조물의 설계를 위한 확률강우량을 산정하기 위해서 널리 사용되는 강우강도식은 주로 회귀분석을 적용한 형태가 일반적이지만, 본 연구에서는 각 지점별 적정확률분포형의 누가분포함수를 활용하여 강우강도식의 형태를 결정하고, 매개변수는 유전자알고리즘을 적용하여 추정하는 강우강도식을 제안하고자 한다. 기존에 사용하던 강우강도식과의 정확도 비교를 위하여 기상청 22개 지점에 대한 재현기간, 지속기간별 평균제곱근오차, 평균제곱근 상대오차를 검토한 결과 누가분포함수를 활용한 강우강도식이 더 높은 정확도를 가짐을 보였으며, 또한, 최근의 집중호우에 대한 영향을 살펴보기 위하여 2006년 까지의 강우자료를 이용하여 기존의 회귀식에 의한 방법과 누가분포함수를 활용한 경우의 결과값을 비교한 결과 이 경우에도 누가분포함수를 활용한 강우강도식의 정확도가 더 높음을 알 수 있었다. 결과적으로 본 연구에서 제안된 누가분포함수를 활용한 강우강도식은 기존의 회귀분석을 활용한 강우강도식보다 정확도면에서 우수하다고 할 수 있으며, 국내에 충분히 적용가능한 형태의 강우강도식이라고 판단된다.

Prediction of Postoperative Lung Function in Lung Cancer Patients Using Machine Learning Models

  • Oh Beom Kwon;Solji Han;Hwa Young Lee;Hye Seon Kang;Sung Kyoung Kim;Ju Sang Kim;Chan Kwon Park;Sang Haak Lee;Seung Joon Kim;Jin Woo Kim;Chang Dong Yeo
    • Tuberculosis and Respiratory Diseases
    • /
    • 제86권3호
    • /
    • pp.203-215
    • /
    • 2023
  • Background: Surgical resection is the standard treatment for early-stage lung cancer. Since postoperative lung function is related to mortality, predicted postoperative lung function is used to determine the treatment modality. The aim of this study was to evaluate the predictive performance of linear regression and machine learning models. Methods: We extracted data from the Clinical Data Warehouse and developed three sets: set I, the linear regression model; set II, machine learning models omitting the missing data: and set III, machine learning models imputing the missing data. Six machine learning models, the least absolute shrinkage and selection operator (LASSO), Ridge regression, ElasticNet, Random Forest, eXtreme gradient boosting (XGBoost), and the light gradient boosting machine (LightGBM) were implemented. The forced expiratory volume in 1 second measured 6 months after surgery was defined as the outcome. Five-fold cross-validation was performed for hyperparameter tuning of the machine learning models. The dataset was split into training and test datasets at a 70:30 ratio. Implementation was done after dataset splitting in set III. Predictive performance was evaluated by R2 and mean squared error (MSE) in the three sets. Results: A total of 1,487 patients were included in sets I and III and 896 patients were included in set II. In set I, the R2 value was 0.27 and in set II, LightGBM was the best model with the highest R2 value of 0.5 and the lowest MSE of 154.95. In set III, LightGBM was the best model with the highest R2 value of 0.56 and the lowest MSE of 174.07. Conclusion: The LightGBM model showed the best performance in predicting postoperative lung function.

임상에서 발생할 수 있는 문제 상황에서의 성향 점수 가중치 방법에 대한 비교 모의실험 연구 (A simulation study for various propensity score weighting methods in clinical problematic situations)

  • 정시성;민은정
    • 응용통계연구
    • /
    • 제36권5호
    • /
    • pp.381-397
    • /
    • 2023
  • 대부분의 임상시험에서 가장 대표적으로 사용되는 실험설계는 무작위화로, 치료 효과를 정확하게 추정하기 위해 이용된다. 그러나 무작위화가 이루어지지 않은 관찰연구의 경우 치료군과 대조군의 비교로 얻는 치료효과에는 환자 간의 특성 등 여러 조정되지 않은 차이로 인해 편향이 발생한다. 성향 점수 가중치는 이러한 문제점을 해결하기 위해 널리쓰이는 방법으로 치료 효과를 추정하는데에 있어 교란요인을 조정하여 편향을 최소화하도록 하는 방법이다. 성향 점수를 이용한 가중치 방법 중 가장 널리 알려진 역확률 가중치는 관찰된 공변량이 주어졌을 때 특정 치료에 할당될 조건부 확률의 역에 비례하는 가중치를 할당한다. 그러나 이 방법은 극단적인 성향 점수에 의해 종종 방해 받아 편향된 추정치와 과도한 분산을 초래한다는 점이 알려져있어 이러한 문제를 완화하기 위해 절사 역확률 가중치, 중복 가중치, 일치 가중치를 포함한 여러 가지 대안 방법이 제안되었다. 본 논문에서는 제한된 중복, 잘못 지정된 성향 점수 모델 및 예측과 반대되는 치료 등 다양한 문제상황에서 여러 성향 점수 가중치 방법의 성능을 비교하는 시뮬레이션 비교연구를 수행하였다. 비교연구의 결과 중복 가중치와 일치 가중치는 편향, 제곱근평균제곱오차 및 포함 확률 측면에서 역확률 가중치와 절사역확률 가중치에 비에 우월한 성능을 보임을 확인하였다.

Prediction accuracy of incisal points in determining occlusal plane of digital complete dentures

  • Kenta Kashiwazaki;Yuriko Komagamine;Sahaprom Namano;Ji-Man Park;Maiko Iwaki;Shunsuke Minakuchi;Manabu, Kanazawa
    • The Journal of Advanced Prosthodontics
    • /
    • 제15권6호
    • /
    • pp.281-289
    • /
    • 2023
  • PURPOSE. This study aimed to predict the positional coordinates of incisor points from the scan data of conventional complete dentures and verify their accuracy. MATERIALS AND METHODS. The standard triangulated language (STL) data of the scanned 100 pairs of complete upper and lower dentures were imported into the computer-aided design software from which the position coordinates of the points corresponding to each landmark of the jaw were obtained. The x, y, and z coordinates of the incisor point (XP, YP, and ZP) were obtained from the maxillary and mandibular landmark coordinates using regression or calculation formulas, and the accuracy was verified to determine the deviation between the measured and predicted coordinate values. YP was obtained in two ways using the hamularincisive-papilla plane (HIP) and facial measurements. Multiple regression analysis was used to predict ZP. The root mean squared error (RMSE) values were used to verify the accuracy of the XP and YP. The RMSE value was obtained after crossvalidation using the remaining 30 cases of denture STL data to verify the accuracy of ZP. RESULTS. The RMSE was 2.22 for predicting XP. When predicting YP, the RMSE of the method using the HIP plane and facial measurements was 3.18 and 0.73, respectively. Cross-validation revealed the RMSE to be 1.53. CONCLUSION. YP and ZP could be predicted from anatomical landmarks of the maxillary and mandibular edentulous jaw, suggesting that YP could be predicted with better accuracy with the addition of the position of the lower border of the upper lip.

3차원 Arbitrary Lagrangian-Eulerian 기법을 사용한 자유 대기 중 폭발 해석의 최적 격자망 크기 산정 (Optimal Mesh Size in Three-Dimensional Arbitrary Lagrangian-Eulerian Method of Free-air Explosions)

  • 이예나;이태희;박다원;최영준;홍정욱
    • 한국전산구조공학회논문집
    • /
    • 제36권6호
    • /
    • pp.355-364
    • /
    • 2023
  • 폭발 수치해석 기법 중 Arbitrary Lagrangian-Eulerian(ALE)는 구조물의 파괴뿐만 아니라 폭발 이후 충격파의 전파 과정까지 관찰할 수 있는 장점이 있다. 그러나 동적 해석 시 유한요소 모델의 격자망 크기가 일정 수준 이하로 감소하게 되면 해석 결과의 신뢰도가 부정확해진다. 본 연구에서는 ALE 수치해석 기법을 활용하여 대기의 격자망 크기가 해석의 정확도에 미치는 영향을 조사한다. 다양한 조건의 격자망 크기와 폭발 중량을 갖는 대기 중 폭발모델을 구축하고, 폭발 중심으로부터 거리에 따른 폭발압력을 관찰한다. 수치해석과 실험에서 얻은 최대 폭발압력 결과에 대해 평균 제곱 오차를 계산하여 최적의 격자망 크기를 제안하고, 제안된 크기를 바탕으로 폭발물 중량과 대기의 최적 격자망 크기에 대한 상관관계를 분석한다. 본 연구는 다양한 중량을 가진 폭발물 해석에서 최적의 격자망 크기를 제공함으로써 신뢰성이 향상된 폭발 수치해석 모델 개발에 도움이 될 것으로 기대한다.

머신 러닝을 이용한 밸브 사이즈 및 종류 예측 모델 개발 (Data-driven Modeling for Valve Size and Type Prediction Using Machine Learning)

  • 김찬호;최민식;주종효;이아름;윤건;조성호;김정환
    • Korean Chemical Engineering Research
    • /
    • 제62권3호
    • /
    • pp.214-224
    • /
    • 2024
  • 밸브는 유량과 압력 조절 등의 중요한 역할을 수행하며, 적절한 밸브 사이즈와 유형 선택이 필요하다. Engineering Procurement Construction (EPC) 산업에선 밸브 사이즈 계수(Cv)의 수식적 계산을 바탕으로 사이즈와 유형을 선정해왔으나 이러한 방식은 전문가의 많은 시간과 비용이 요구되어 비효율적이다. 본 연구는 이를 해결하기위해 머신 러닝기법을 이용한 밸브 사이즈 및 유형 예측 모델을 개발하였다. Artificial neural network (ANN), Random Forest, XGBoost, Catboost의알고리즘을 적용하여 모델들을 개발하였으며, 평가 지표로는 사이즈 예측에는 Normalized root mean squared error (NRMSE)와 R2를, 종류 예측에는 F1 score를 적용하였다. 또한, 유체 상에 따른 영향을 확인하고자 유체 전체, 액체, 기체, 스팀의 4개의 데이터 세트로 사례 연구를 진행하였다. 연구 결과, 사이즈의 경우 전체, 액체, 기체에선 Catboost(R2기준, 전체: 0.99216, 액체: 0.98602, 기체: 0.99300. NRMSE 기준, 전체: 0.04072, 액체: 0.04886, 기체: 0.03619)가, 스팀에선 Random Forest가(R2: 0.99028, NRMSE: 0.03493) 가장 뛰어난 모델임을 확인하였다. 종류의 경우 Catboost가 모든 데이터에서 가장 높은 성과를 제시하였다(F1 score 기준, 전체: 0.95766, 액체: 0.96264, 기체: 0.95770, 스팀: 1.0000). 본 연구에서 제안한 모델들을 적용할 경우, 주어진 조건에 따른 밸브 선택을 도와 의사결정 속도를 높여줄 것으로 기대된다.