• 제목/요약/키워드: random coefficient models

검색결과 98건 처리시간 0.025초

Automated Detection and Segmentation of Bone Metastases on Spine MRI Using U-Net: A Multicenter Study

  • Dong Hyun Kim;Jiwoon Seo;Ji Hyun Lee;Eun-Tae Jeon;DongYoung Jeong;Hee Dong Chae;Eugene Lee;Ji Hee Kang;Yoon-Hee Choi;Hyo Jin Kim;Jee Won Chai
    • Korean Journal of Radiology
    • /
    • 제25권4호
    • /
    • pp.363-373
    • /
    • 2024
  • Objective: To develop and evaluate a deep learning model for automated segmentation and detection of bone metastasis on spinal MRI. Materials and Methods: We included whole spine MRI scans of adult patients with bone metastasis: 662 MRI series from 302 patients (63.5 ± 11.5 years; male:female, 151:151) from three study centers obtained between January 2015 and August 2021 for training and internal testing (random split into 536 and 126 series, respectively) and 49 MRI series from 20 patients (65.9 ± 11.5 years; male:female, 11:9) from another center obtained between January 2018 and August 2020 for external testing. Three sagittal MRI sequences, including non-contrast T1-weighted image (T1), contrast-enhanced T1-weighted Dixon fat-only image (FO), and contrast-enhanced fat-suppressed T1-weighted image (CE), were used. Seven models trained using the 2D and 3D U-Nets were developed with different combinations (T1, FO, CE, T1 + FO, T1 + CE, FO + CE, and T1 + FO + CE). The segmentation performance was evaluated using Dice coefficient, pixel-wise recall, and pixel-wise precision. The detection performance was analyzed using per-lesion sensitivity and a free-response receiver operating characteristic curve. The performance of the model was compared with that of five radiologists using the external test set. Results: The 2D U-Net T1 + CE model exhibited superior segmentation performance in the external test compared to the other models, with a Dice coefficient of 0.699 and pixel-wise recall of 0.653. The T1 + CE model achieved per-lesion sensitivities of 0.828 (497/600) and 0.857 (150/175) for metastases in the internal and external tests, respectively. The radiologists demonstrated a mean per-lesion sensitivity of 0.746 and a mean per-lesion positive predictive value of 0.701 in the external test. Conclusion: The deep learning models proposed for automated segmentation and detection of bone metastases on spinal MRI demonstrated high diagnostic performance.

Prognosis of aerodynamic coefficients of butterfly plan shaped tall building by surrogate modelling

  • Sanyal, Prasenjit;Banerjee, Sayantan;Dalui, Sujit Kumar
    • Wind and Structures
    • /
    • 제34권4호
    • /
    • pp.321-334
    • /
    • 2022
  • Irregularity in plan shape is very common for any type of building as it enhances better air ventilation for the inhabitants. Systematic opening at the middle of the facades makes the appearance of the building plan as a butterfly one. The primary focus of this study is to forecast the force, moment and torsional coefficient of a butterfly plan shaped tall building. Initially, Computational Fluid Dynamics (CFD) study is done on the building model based on Reynolds averaged Navier Stokes (RANS) k-epsilon turbulence model. Fifty random cases of irregularity and angle of attack (AOA) are selected, and the results from these cases are utilised for developing the surrogate models. Parametric equations are predicted for all these aerodynamic coefficients, and the training of these outcomes are also done for developing Artificial Neural Networks (ANN). After achieving the target acceptance criteria, the observed results are compared with the primary CFD data. Both parametric equations and ANN matched very well with the obtained data. The results are further utilised for discussing the effects of irregularity on the most critical wind condition.

머신 러닝을 이용한 밸브 사이즈 및 종류 예측 모델 개발 (Data-driven Modeling for Valve Size and Type Prediction Using Machine Learning)

  • 김찬호;최민식;주종효;이아름;윤건;조성호;김정환
    • Korean Chemical Engineering Research
    • /
    • 제62권3호
    • /
    • pp.214-224
    • /
    • 2024
  • 밸브는 유량과 압력 조절 등의 중요한 역할을 수행하며, 적절한 밸브 사이즈와 유형 선택이 필요하다. Engineering Procurement Construction (EPC) 산업에선 밸브 사이즈 계수(Cv)의 수식적 계산을 바탕으로 사이즈와 유형을 선정해왔으나 이러한 방식은 전문가의 많은 시간과 비용이 요구되어 비효율적이다. 본 연구는 이를 해결하기위해 머신 러닝기법을 이용한 밸브 사이즈 및 유형 예측 모델을 개발하였다. Artificial neural network (ANN), Random Forest, XGBoost, Catboost의알고리즘을 적용하여 모델들을 개발하였으며, 평가 지표로는 사이즈 예측에는 Normalized root mean squared error (NRMSE)와 R2를, 종류 예측에는 F1 score를 적용하였다. 또한, 유체 상에 따른 영향을 확인하고자 유체 전체, 액체, 기체, 스팀의 4개의 데이터 세트로 사례 연구를 진행하였다. 연구 결과, 사이즈의 경우 전체, 액체, 기체에선 Catboost(R2기준, 전체: 0.99216, 액체: 0.98602, 기체: 0.99300. NRMSE 기준, 전체: 0.04072, 액체: 0.04886, 기체: 0.03619)가, 스팀에선 Random Forest가(R2: 0.99028, NRMSE: 0.03493) 가장 뛰어난 모델임을 확인하였다. 종류의 경우 Catboost가 모든 데이터에서 가장 높은 성과를 제시하였다(F1 score 기준, 전체: 0.95766, 액체: 0.96264, 기체: 0.95770, 스팀: 1.0000). 본 연구에서 제안한 모델들을 적용할 경우, 주어진 조건에 따른 밸브 선택을 도와 의사결정 속도를 높여줄 것으로 기대된다.

확률론적 해석기법을 이용한 보은지역의 사면재해 안정성분석 (Stability Analysis of Landslides using a Probabilistic Analysis Method in the Boeun Area)

  • 정남수;유광호;박혁진
    • 지질공학
    • /
    • 제21권3호
    • /
    • pp.247-257
    • /
    • 2011
  • 본 연구는 사면재해 취약성 평가를 위해 사면모델 중 하나인 무한사면 해석모델을 적용하였다. 그러나 무한사면 해석모델은 광역적인 연구지역에 적용하는데 있어서 데이터획득 및 처리과정에 어려움이 있고 데이터 획득과정에서 불가피하게 불확실성이 개입되는 문제가 있다. 이러한 불확실성을 최소화하기 위해 확률론적 해석기법인 몬테카를로 시뮬레이션을 적용하였으며, 광역적인 연구지역에 무한사면 해석모델을 적용하기 위하여 GIS를 활용한 무한사면 안정해석법으로 파괴확률을 획득하였다. 연구지역으로는 사면재해가 집중적으로 발생한 보은지역을 선정하였고 사면의 기하학적인 특성과 점착력 및 내부마찰각 등의 강도정수를 획득하였다. 또한 불확실성의 효과를 평가하기 위해 강도정수의 변동계수를 10%에서 30%로 고려하였고 이러한 과정을 통하여 확률론적 해석기법은 자료의 불확실성을 감쇠시킬 수 있다는 결과를 도출하였다.

프레임 신뢰도 가중에 의한 강인한 음성인식 (Frame Reliability Weighting for Robust Speech Recognition)

  • 조훈영;김락용;오영환
    • 한국음향학회지
    • /
    • 제21권3호
    • /
    • pp.323-329
    • /
    • 2002
  • 본 논문에서는 임의의 시점에서 발생하여 음성 신호의 일부분을 심하게 손상시키는 시간선택 잡음 (time-selective noise)을 보상하기 위한 프레임 신뢰도 가중 방법을 제안한다. 음성 프레임들은 서로 다른 정도의 신뢰도를 갖으며, 신뢰도는 프레임의 신호대잡음비 (signal-to-noise ratio)에 비례한다. 잡음이 일정한 경우에는 무음구간에서 획득한 잡음 정보를 이용하여 프레임의 신호대잡음비 추정이 용이하나, 시간선택 잡음은 잡음추정이 어렵다. 따라서, 본 연구에서는 프레임 신뢰도를 추정하기 위해 깨끗한 음성의 통계적 모델을 사용하였다. 제안한 MFR (model-based frame reliability) 방법은 탐조 모델의 평균 벡터열과 입력 MFCC (mel-frequency cepstral coefficient) 특징 벡터 열의 역변환에 의해 얻은 필터뱅크 에너지를 이용하여 프레임 신호대잡음비를 근사한다. 다양한 버스트 (burst) 잡음에 대한 인식 실험 결과, 제안한 방법은 프레임의 신뢰도를 효과적으로 나타낼 수 있었으며, 이 신뢰도를 우도 계산에서 가중치로 적용하여 인식 성능을 향상시킬 수 있었다.

Estimation of Genetic Parameters for Somatic Cell Scores of Holsteins Using Multi-trait Lactation Models in Korea

  • Alam, M.;Cho, C.I.;Choi, T.J.;Park, B.;Choi, J.G.;Choy, Y.H.;Lee, S.S.;Cho, K.H.
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제28권3호
    • /
    • pp.303-310
    • /
    • 2015
  • The study was conducted to analyze the genetic parameters of somatic cell score (SCS) of Holstein cows, which is an important indicator to udder health. Test-day records of somatic cell counts (SCC) of 305-day lactation design from first to fifth lactations were collected on Holsteins in Korea during 2000 to 2012. Records of animals within 18 to 42 months, 30 to 54 months, 42 to 66 months, 54 to 78 months, and 66 to 90 months of age at the first, second, third, fourth and fifth parities were analyzed, respectively. Somatic cell scores were calculated, and adjusted for lactation production stages by Wilmink's function. Lactation averages of SCS ($LSCS_1$ through $LSCS_5$) were derived by further adjustments of each test-day SCS for five age groups in particular lactations. Two datasets were prepared through restrictions on number of sires/herd and dams/herd, progenies/sire, and number of parities/cow to reduce data size and attain better relationships among animals. All LSCS traits were treated as individual trait and, analyzed through multiple-trait sire models and single trait animal models via VCE 6.0 software package. Herd-year was fitted as a random effect. Age at calving was regressed as a fixed covariate. The mean LSCS of five lactations were between 3.507 and 4.322 that corresponded to a SCC range between 71,000 and 125,000 cells/mL; with coefficient of variation from 28.2% to 29.9%. Heritability estimates from sire models were within the range of 0.10 to 0.16 for all LSCS. Heritability was the highest at lactation 2 from both datasets (0.14/0.16) and lowest at lactation 5 (0.11/0.10) using sire model. Heritabilities from single trait animal model analyses were slightly higher than sire models. Genetic correlations between LSCS traits were strong (0.62 to 0.99). Very strong associations (0.96 to 0.99) were present between successive records of later lactations. Phenotypic correlations were relatively weaker (<0.55). All correlations became weaker at distant lactations. The estimated breeding values (EBVs) of LSCS traits were somewhat similar over the years for a particular lactation, but increased with lactation number increment. The lowest EBV in first lactation indicated that selection for SCS (mastitis resistance) might be better with later lactation records. It is expected that results obtained from these multi-trait lactation model analyses, being the first large scale SCS data analysis in Korea, would create a good starting step for application of advanced statistical tools for future genomic studies focusing on selection for mastitis resistance in Holsteins of Korea.

머신러닝 기법의 산림 총일차생산성 예측 모델 비교 (Predicting Forest Gross Primary Production Using Machine Learning Algorithms)

  • 이보라;장근창;김은숙;강민석;천정화;임종환
    • 한국농림기상학회지
    • /
    • 제21권1호
    • /
    • pp.29-41
    • /
    • 2019
  • 산림생태계에서 총일차생산성(Gross Primary Production, GPP)은 기후변화에 따른 산림의 생산성과 그에 영향을 미치는 식물계절, 건강성, 탄소 순환 등을 대표하는 지표이다. 총일차생산성을 추정하기 위해서는 에디공분산 타워 자료나 위성영상관측자료를 이용하기도 하고 물리지형적 한계나 기후변화 등을 고려하기 위해 기작기반모델링을 활용하기도 한다. 그러나 총일차생산성을 포함한 산림 탄소 순환의 기작기반 모델링은 식물의 생물, 생리, 화학적 기작들의 반응과 지형, 기후 및 시간 등과 같은 환경 조건들이 복잡하게 얽혀 있어 비선형적이고 유연성이 떨어져 반응에 영향을 주는 조건들을 모두 적용하기가 어렵다. 본 연구에서는 산림 생산성 추정 모델을 에디공분산 자료와 인공위성영상 정보를 사용하여 기계학습 알고리즘을 사용한 모델들로 구축해 보고 그 사용 및 확장 가능성을 검토해 보고자 하였다. 설명변수들로는 에디공분산자료와 인공위성자료에서 나온 대기기상인자들을 사용하였고 검증자료로 에디공분산 타워에서 관측된 총일차생산성을 사용하였다. 산림생산성 추정 모델은 1) 에디공분산 관측 기온($T_{air}$), 태양복사($R_d$), 상대습도(RH), 강수(PPT), 증발산(ET) 자료, 2) MODIS 관측 기온(T), 일사량($R_{sd}$), VPD 자료(개량식생지수 제외), 3) MODIS 관측 기온(T), 일사량($R_{sd}$), VPD, 개량식생지수(EVI) 자료를 사용하는 세 가지 경우로 나누어 구축하여 2006 - 2013년 자료로 훈련시키고 2014, 2015년 자료로 검증하였다. 기계학습 알고리즘은 support vector machine (SVM), random forest (RF), artificial neural network (ANN)를 사용하였고 단순 비교를 위해 고전적 방법인 multiple linear regression model (LM)을 사용하였다. 그 결과, 에디공분산 입력자료로 훈련시킨 모델의 예측력은 피어슨 상관계수 0.89 - 0.92 (MSE = 1.24 - 1.62), MODIS 입력자료로 훈련시킨 모델의 예측력은 개량식생지수 제외된 모델은 0.82 - 0.86 (MSE = 1.99 - 2.45), 개량식생지수가 포함된 모델은 0.92 - 0.93(MSE = 1.00 - 1.24)을 보였다. 이러한 결과는 산림총일차생산성 추정 모델 구축에 있어 MODIS인공위성 영상 정보 기반으로 기계학습 알고리즘을 사용하는 것에 대한 높은 활용가능성을 보여주었다.

밤의 칼날식 박피공정에 따른 머신 러닝 기반 중량감모율 예측 모델 개발 (Development of machine learning prediction model for weight loss rate of chestnut (Castanea crenata) according to knife peeling process)

  • 김태형;김아나;권기현
    • 한국정보전자통신기술학회논문지
    • /
    • 제17권4호
    • /
    • pp.236-244
    • /
    • 2024
  • 국내 밤 산업은 박피율을 높이기 위한 목적으로 과도한 칼날박피로 인해 과육 손실이 높아 생산 효율성이 저하되는 문제가 있다. 이에 본 연구에서는 밤 박피 공정의 구동 조건 최적화를 위한 기초 연구로 머신러닝 알고리즘 기반 박피공정 단계별 밤의 중량감모율을 예측할 수 있는 모델을 도출하였다. 6개의 제어조건을 바탕으로 51가지 2단 칼날박피기 실험 세팅 조합을 도출하고 이를 3번씩 반복하여 총 153가지의 데이터를 획득하였다. 인공신경망과 랜덤 포레스트 머신러닝 모델을 이용하여 밤 박피 단계별(1단 박피 후, 2단 박피 후, 최종 배출 후) 중량감모율을 예측하는 머신러닝 모델을 도출하였고, R(coefficient of determiantion), nRMSE(normalized root mean square error), MAE(mean absolute error) 값을 통해 모델의 성능을 평가하였다. 모든 박피 단계에서 인공신경망 모델보다 랜덤 포레스트 모델이 높은 R값으로 우수한 예측 정확도를 가지는 것으로 나타났고, 낮은 nRMSE와 MAE값으로 낮은 예측 오차를 가지는 것으로 나타났다. 최종적으로 랜덤 포래스트 예측 모델이 도출되었으며, 실제로 계측된 중량감모율과 예측한 중량감모율의 오차가 미미함을 확인할 수 있었다. 결과적으로, 도출된 모델은 밤 과육의 중량감모율을 최소화하는 동시에 최대 박피율을 도출할 수 있는 최적 박피공정의 구동 조건을 설정하는 데 활용함으로써, 이를 바탕으로 국내 밤 산업에 이바지 할 수 있을 것으로 예상된다.

기계학습 기반의 산불위험 중기예보 모델 개발 (Development of Mid-range Forecast Models of Forest Fire Risk Using Machine Learning)

  • 박수민;손보경;임정호;강유진;권춘근;김성용
    • 대한원격탐사학회지
    • /
    • 제38권5_2호
    • /
    • pp.781-791
    • /
    • 2022
  • 산불로 인한 피해를 최소화하기 위해서 산불위험 예보 정보를 제공하는 것은 필수적이다. 따라서 본 연구에서는 우리나라를 대상으로 기계학습 기반의 산불위험 중기예보(1일 후부터 7일 후까지) 모델을 개발하였다. Global Data Assimilation and Prediction System (GDAPS)의 기상예보 자료와 기 개발된 산불위험지수(Fire Risk Index, FRI)의 과거 및 현재 정보, 그리고 기타 환경요소(i.e., 고도, 산불다발지수, 가뭄지수)의 현재 정보를 반영하여 모델을 개발하였다. 본 연구에서는 실시간 학습을 통해 모델을 개발하였으며, 효율적인 모델 개발을 목적으로 과거 산불위험지수와 가뭄지수의 유무를 고려하여 세가지 경우(Scheme 1: 과거 산불위험지수 및 가뭄지수, Scheme 2: 과거 산불위험지수, Scheme 3: 과거 산불위험지수 변화 추세 및 가뭄지수)로 연구를 수행하였다. 본 연구에서 개발된 산불위험예보모델은 예보기간에 상관없이 높은 정확도(피어슨 상관계수(Pearson correlation) >0.8, relative root mean square error <10%)를 나타냈으며, 실제 산불 발생 건에 대해서도 유의미한 결과를 보였다. 과거 산불위험지수의 추세보다는 산불위험지수 값 자체를 입력변수로 사용하는 것이 높은 정확도를 보였으며, 가뭄지수 사용과 관계없이 좋은 결과를 나타냈다.

신뢰도 연구에서 급내상관계수와 관련한 표본수 결정 방법 비교 (A Comparison of Sample Size Requirements for Intraclass Correlation Coefficient(ICC))

  • 한수연;남정모;명성민;송기준
    • 응용통계연구
    • /
    • 제23권3호
    • /
    • pp.497-510
    • /
    • 2010
  • 신뢰도 연구는 한 명의 평가자가 연구 대상을 반복 측정하거나 여러 명의 평가자가 한 대상을 평가할 때 평가자 내, 평가자 간 일치도를 알아보는 연구로 임상 의학 분야에서 빈번하게 쓰이고 있다. 이 같은 신뢰도 연구에서 적절한 표본수, 평가자수 및 반복수를 결정하는 것은 비용과 시간 측면에서 보다 더 효율적인 연구를 할 수 있게 해주는 중요한 요인이다. 본 연구의 목적은 신뢰도 연구에서 측정치가 정량적일 때 쓰이는 신뢰도 계수인 급내상관계수(ICC)와 관련한 기존의 표본수 산출 방법들을 비교분석하여 적절한 표본수나 반복수를 결정할 때 그 지침을 제공하는데 있다. 기존 논문에서 제시한 Walter 등 (1998), Giraudeau와 Mary (2001), Saito 등 (2006) 그리고 Bonett (2002)의 방법들을 비교하였다. 임의효과 일원배치 모형일 때 같은 조건에서 가장 적은 양의 정보를 필요로 하는 방법을 찾는 목적으로 요인을 변화시켜 가면서 표본수, 반복수, 신뢰구간 폭을 비교한다. 비교해 본 결과, 가장 작은 수의 표본을 필요로 하는 방법은 Giraudeau의 방법, 가장 작은 수의 반복을 필요로 하는 방법은 Saito의 방법으로 나타났다. 가장 많은 수의 표본과 반복을 필요로 한 방법은 Bonett의 방법이었다. 정도는 Giraudeau의 방법이 가장 높았고 Walter, Saito, Bonett 순으로 정도가 떨어졌다.