• 제목/요약/키워드: Random-coefficient model

검색결과 198건 처리시간 0.03초

Association between Taql polymorphism of vitamin D receptor gene and vertical growth of the mandible: A cross-sectional study

  • Baris Can Telatar;Gul Yildiz Telatar;Faruk Saydam
    • 대한치과교정학회지
    • /
    • 제53권5호
    • /
    • pp.336-342
    • /
    • 2023
  • Objective: To determine whether the gonial angle on digital panoramic radiographs is associated with vitamin D receptor (VDR) Taql polymorphism. Methods: Genomic DNA samples were collected from the buccal mucosa of patients aged 26-43 years. TaqMan assay for single nucleotide polymorphism genotyping was used to detect the genotype of Taql polymorphism. The gonial angle was measured bilaterally on panoramic radiography. The normal gonial angle was fixed as 121.8°, and it represented the cutoff value for the high gonial angle (HGA) and low gonial angle (LGA) groups. Various genetic models were analyzed, namely dominant (homozygous [AA] vs. heterozygous [AG] + polymorphic [GG]), recessive (AA + AG vs. GG), and additive (AA + GG vs. AG), using the chi-squared test. Results: The reliability of the gonial angle measurement was analyzed using a random sample (26%) of the tests, with the intra-examiner correlation showing an intra-class correlation coefficient of 0.99. The frequencies of the AA, AG, and GG genotypes of rs731236 polymorphism were 40.5%, 41.9%, and 17.6% in the HGA group and 21.8%, 51.0%, and 27.2% in the LGA group, respectively (P = 0.042). A statistically significant difference was observed in the allele frequencies between the two groups (P = 0.011). Moreover, a significant correlation was observed in the dominant genetic model. Conclusions: Taql polymorphism in the VDR gene plays a critical role in the vertical growth of the mandible and decreased gonial angle.

농림위성을 위한 기계학습을 활용한 복사전달모델기반 대기보정 모사 알고리즘 개발 및 검증: 식생 지역을 위주로 (Machine Learning-Based Atmospheric Correction Based on Radiative Transfer Modeling Using Sentinel-2 MSI Data and ItsValidation Focusing on Forest)

  • 강유진;김예진;임정호;임중빈
    • 대한원격탐사학회지
    • /
    • 제39권5_3호
    • /
    • pp.891-907
    • /
    • 2023
  • Compact Advanced Satellite 500-4 (CAS500-4) is scheduled to be launched to collect high spatial resolution data focusing on vegetation applications. To achieve this goal, accurate surface reflectance retrieval through atmospheric correction is crucial. Therefore, a machine learning-based atmospheric correction algorithm was developed to simulate atmospheric correction from a radiative transfer model using Sentinel-2 data that have similarspectral characteristics as CAS500-4. The algorithm was then evaluated mainly for forest areas. Utilizing the atmospheric correction parameters extracted from Sentinel-2 and GEOKOMPSAT-2A (GK-2A), the atmospheric correction algorithm was developed based on Random Forest and Light Gradient Boosting Machine (LGBM). Between the two machine learning techniques, LGBM performed better when considering both accuracy and efficiency. Except for one station, the results had a correlation coefficient of more than 0.91 and well-reflected temporal variations of the Normalized Difference Vegetation Index (i.e., vegetation phenology). GK-2A provides Aerosol Optical Depth (AOD) and water vapor, which are essential parameters for atmospheric correction, but additional processing should be required in the future to mitigate the problem caused by their many missing values. This study provided the basis for the atmospheric correction of CAS500-4 by developing a machine learning-based atmospheric correction simulation algorithm.

빅데이터 기반 2형 당뇨 예측 알고리즘 개발 (Development of Type 2 Prediction Prediction Based on Big Data)

  • 심현;김현욱
    • 한국전자통신학회논문지
    • /
    • 제18권5호
    • /
    • pp.999-1008
    • /
    • 2023
  • 당뇨병과 같은 만성 질환의 조기 예측은 중요한 이슈이며, 그중에서도 당뇨 예측의 정확도 향상은 매우 중요하다. 당뇨 예측을 위한 다양한 기계 학습 및 딥 러닝 기반 방법론을 도입하고 있으나, 이러한 기술들은 다른 방법론보다 더 우수한 성능을 위해 대량의 데이터를 필요로 하며, 복잡한 데이터 모델 때문에 학습 비용이 높다. 본 연구에서는 pima 데이터셋과 k-fold 교차 검증을 사용한 DNN이 당뇨 진단 모델의 효율성을 감소시킨다는 주장을 검증하고자 한다. 의사 결정 트리, SVM, 랜덤 포레스트, 로지스틱 회귀, KNN 및 다양한 앙상블 기법과 같은 기계 학습 분류 방법을 사용하여 어떤 알고리즘이 최상의 예측 결과를 내는지 결정하였다. 모든 분류 모델에 대한 훈련 및 테스트 후 제안된 시스템은 ADASYN 방법과 함께 XGBoost 분류기에서 최상의 결과를 제공하였으며, 정확도는 81%, F1 계수는 0.81, AUC는 0.84였다. 또한 도메인 적응 방법이 제안된 시스템의 다양성을 보여주기 위해 구현되었다. LIME 및 SHAP 프레임워크를 사용한 설명 가능한 AI 접근 방식이 모델이 최종 결과를 어떻게 예측하는지 이해하기 위해 구현되었다.

Technical Performance of Two-Dimensional Shear Wave Elastography for Measuring Liver Stiffness: A Systematic Review and Meta-Analysis

  • Dong Wook Kim;Chong Hyun Suh;Kyung Won Kim;Junhee Pyo;Chan Park;Seung Chai Jung
    • Korean Journal of Radiology
    • /
    • 제20권6호
    • /
    • pp.880-893
    • /
    • 2019
  • Objective: To assess the technical performance of two-dimensional shear wave elastography (2D-SWE) for measuring liver stiffness. Materials and Methods: The Ovid-MEDLINE and EMBASE databases were searched for studies reporting the technical performance of 2D-SWE, including concerns with technical failures, unreliable measurements, interobserver reliability, and/or intraobserver reliability, published until June 30, 2018. The pooled proportion of technical failure and unreliable measurements was calculated using meta-analytic pooling via the random-effects model and inverse variance method for calculating weights. Subgroup analyses were performed to explore potential causes of heterogeneity. The pooled intraclass correlation coefficients (ICCs) for interobserver and intraobserver reliability were calculated using the Hedges-Olkin method with Fisher's Z transformation of the correlation coefficient. Results: The search yielded 34 articles. From 20 2D-SWE studies including 6196 patients, the pooled proportion of technical failure was 2.3% (95% confidence interval [CI], 1.3-3.9%). The pooled proportion of unreliable measurements from 20 studies including 6961 patients was 7.5% (95% CI, 4.7-11.7%). In the subgroup analyses, studies conducting more than three measurements showed fewer unreliable measurements than did those with three measurements or less, but no intergroup difference was found in technical failure. The pooled ICCs for interobserver reliability (from 10 studies including 517 patients) and intraobserver reliability (from 7 studies including 679 patients) were 0.87 (95% CI, 0.82-0.90) and 0.93 (95% CI, 0.89-0.95), respectively, suggesting good to excellent reliability. Conclusion: 2D-SWE shows good technical performance for assessing liver stiffness, with high technical success and reliability. Future studies should establish the quality criteria and optimal number of measurements.

3D 프린팅 소재 화학물질의 독성 예측을 위한 Data-centric XAI 기반 분자 구조 Data Imputation과 QSAR 모델 개발 (Data-centric XAI-driven Data Imputation of Molecular Structure and QSAR Model for Toxicity Prediction of 3D Printing Chemicals)

  • 정찬혁;김상윤;허성구;;신민혁;유창규
    • Korean Chemical Engineering Research
    • /
    • 제61권4호
    • /
    • pp.523-541
    • /
    • 2023
  • 3D 프린터의 활용이 높아짐에 따라 발생하는 화학물질에 대한 노출 빈도가 증가하고 있다. 그러나 3D 프린팅 발생 화학물질의 독성 및 유해성에 대한 연구는 미비하며, 분자 구조 데이터의 결측치로 인해 in silico 기법을 사용한 독성예측 연구는 저조한 실정이다. 본 연구에서는 화학물질의 분자구조 정보를 나타내는 주요 분자표현자의 결측치를 보간하여 3D 프린팅의 독성 및 유해성을 예측한 Data-centric QSAR 모델을 개발하였다. 먼저 MissForest 알고리즘을 사용해 3D 프린팅으로 발생되는 유해물질의 분자표현자 결측치를 보완하였으며, 서로 다른 4가지 기계학습 모델(결정트리, 랜덤포레스트, XGBoost, SVM)을 기반으로 Data-centric QSAR 모델을 개발하여 생물 농축 계수(Log BCF)와 옥탄올-공기분배계수(Log Koa), 분배계수(Log P)를 예측하였다. 또한, 설명 가능한 인공지능(XAI) 방법론 중 TreeSHAP (SHapley Additive exPlanations) 기법을 활용하여 Data-centric QSAR 모델의 신뢰성을 입증하였다. MissForest 알고리즘 기반 결측지 보간 기법은, 기존 분자구조 데이터에 비하여 약 2.5배 많은 분자구조 데이터를 확보할 수 있었다. 이를 바탕으로 개발된 Data-centric QSAR 모델의 성능은 Log BCF, Log Koa와 Log P를 각각 73%, 76%, 92% 의 예측 성능으로 예측할 수 있었다. 마지막으로 Tree-SHAP 분석결과 개발된 Data-centric QSAR 모델은 각 독성치와 물리적으로 상관성이 높은 분자표현자를 통하여 선택함을 설명할 수 있었고 독성 정보에 대한 높은 예측 성능을 확보할 수 있었다. 본 연구에서 개발한 방법론은 다른 프린팅 소재나 화학공정, 그리고 반도체/디스플레이 공정에서 발생 가능한 오염물질의 독성 및 인체 위해성 평가에 활용될 수 있을 것으로 사료된다.

위성 자료와 수치모델 자료를 활용한 스태킹 앙상블 기반 SO2 지상농도 추정 (Monitoring Ground-level SO2 Concentrations Based on a Stacking Ensemble Approach Using Satellite Data and Numerical Models)

  • 최현영;강유진;임정호;신민소;박서희;김상민
    • 대한원격탐사학회지
    • /
    • 제36권5_3호
    • /
    • pp.1053-1066
    • /
    • 2020
  • 이산화황(SO2)은 대기 중 화학 반응을 통해 2차 대기오염물질을 생성하는 전구체로, 주로 산업활동이나 주거 및 교통 활동 등을 통해 배출된다. 장기간 노출 시 호흡기 질환이나 심혈관 질환 등을 유발하여 인체 건강에 부정적인 영향을 미칠 수 있기 때문에 이에 대한 지속적인 모니터링이 필요하다. 우리나라에서는 SO2에 대해 관측소 기반의 모니터링이 수행되고 있으나 이는 공간적으로 연속적인 정보를 제공하는 데에 한계가 있다. 따라서, 본 연구에서는 위성자료와 수치모델 자료를 융합하여 일별 13시를 타겟으로 하는 1 km의 고해상도로 공간적으로 연속적인 SO2 지상농도를 산출하였다. 2015년 1월부터 2019년 4월까지의 기간 동안 남한 지역에 대하여 스태킹 앙상블 기법을 이용하여 SO2 지상농도 추정 모델을 개발하였다. 스태킹 앙상블 기법이란 여러가지 기계학습 기법을 두 단계로 쌓는 방식으로 융합하여 단일 모델 대비 더 향상된 성능을 도출하는 방법이다. 본 연구에서는 베이스 모델로는 RF (Random Forest)와 XGB (eXtreme Gradient BOOSTing) 기법이, 메타 모델로는 MLR (Multiple Linear Regression) 기법이 사용되었다. 구축된 모델의 교차검증 결과 메타 모델은 상관계수(R) = 0.69와 root-mean-squared-error(RMSE) = 0.0032 ppm의 결과를 보였으며 이는 베이스 모델의 평균 대비 약 25% 향상된 안정성을 보였다. 또한 모델 구축에 사용되지 않은 기간에 대한 예측 검증을 수행하여 모델의 일반화 가능성을 평가하였다. 구축된 모델을 이용하여 남한 지역의 SO2 지상농도 공간분포를 분석한 결과 일반적인 계절성과 배출원의 변화를 잘 반영하는 패턴을 보임을 확인하였다.

머신러닝 기법의 산림 총일차생산성 예측 모델 비교 (Predicting Forest Gross Primary Production Using Machine Learning Algorithms)

  • 이보라;장근창;김은숙;강민석;천정화;임종환
    • 한국농림기상학회지
    • /
    • 제21권1호
    • /
    • pp.29-41
    • /
    • 2019
  • 산림생태계에서 총일차생산성(Gross Primary Production, GPP)은 기후변화에 따른 산림의 생산성과 그에 영향을 미치는 식물계절, 건강성, 탄소 순환 등을 대표하는 지표이다. 총일차생산성을 추정하기 위해서는 에디공분산 타워 자료나 위성영상관측자료를 이용하기도 하고 물리지형적 한계나 기후변화 등을 고려하기 위해 기작기반모델링을 활용하기도 한다. 그러나 총일차생산성을 포함한 산림 탄소 순환의 기작기반 모델링은 식물의 생물, 생리, 화학적 기작들의 반응과 지형, 기후 및 시간 등과 같은 환경 조건들이 복잡하게 얽혀 있어 비선형적이고 유연성이 떨어져 반응에 영향을 주는 조건들을 모두 적용하기가 어렵다. 본 연구에서는 산림 생산성 추정 모델을 에디공분산 자료와 인공위성영상 정보를 사용하여 기계학습 알고리즘을 사용한 모델들로 구축해 보고 그 사용 및 확장 가능성을 검토해 보고자 하였다. 설명변수들로는 에디공분산자료와 인공위성자료에서 나온 대기기상인자들을 사용하였고 검증자료로 에디공분산 타워에서 관측된 총일차생산성을 사용하였다. 산림생산성 추정 모델은 1) 에디공분산 관측 기온($T_{air}$), 태양복사($R_d$), 상대습도(RH), 강수(PPT), 증발산(ET) 자료, 2) MODIS 관측 기온(T), 일사량($R_{sd}$), VPD 자료(개량식생지수 제외), 3) MODIS 관측 기온(T), 일사량($R_{sd}$), VPD, 개량식생지수(EVI) 자료를 사용하는 세 가지 경우로 나누어 구축하여 2006 - 2013년 자료로 훈련시키고 2014, 2015년 자료로 검증하였다. 기계학습 알고리즘은 support vector machine (SVM), random forest (RF), artificial neural network (ANN)를 사용하였고 단순 비교를 위해 고전적 방법인 multiple linear regression model (LM)을 사용하였다. 그 결과, 에디공분산 입력자료로 훈련시킨 모델의 예측력은 피어슨 상관계수 0.89 - 0.92 (MSE = 1.24 - 1.62), MODIS 입력자료로 훈련시킨 모델의 예측력은 개량식생지수 제외된 모델은 0.82 - 0.86 (MSE = 1.99 - 2.45), 개량식생지수가 포함된 모델은 0.92 - 0.93(MSE = 1.00 - 1.24)을 보였다. 이러한 결과는 산림총일차생산성 추정 모델 구축에 있어 MODIS인공위성 영상 정보 기반으로 기계학습 알고리즘을 사용하는 것에 대한 높은 활용가능성을 보여주었다.

MODIS와 ASOS 자료를 이용한 식물계절 모델링 (Modeling of Vegetation Phenology Using MODIS and ASOS Data)

  • 김근아;윤유정;강종구;최소연;박강현;천정화;장근창;원명수;이양원
    • 대한원격탐사학회지
    • /
    • 제38권5_1호
    • /
    • pp.627-646
    • /
    • 2022
  • 최근 지구 온난화로 인한 기후 변화와 관련된 문제의 심각성이 커지고 있으며 평균 기온 또한 상승하고 있다. 이로 인해 온도에 민감한 다양한 생물과 생물이 살아가는 환경에 영향을 미치고 있으며, 생태계의 변화 역시 감지되고 있다. 계절은 그 지역에 사는 생물의 종류, 분포, 생육 특성 등에 영향을 미치는 중요한 요인의 하나이다. 기후 변화 영향 평가의 지표 중 가장 대중적이고 쉽게 인식될 수 있는 식물 계절 중 개화일과 단풍나무 절정일의 모델링을 수행하였다. 모델링에 사용된 식물의 종류에는 봄을 대표하는 식물로 볼 수 있는 개나리와 벚나무, 가을을 대표하는 식물로 볼 수 있는 단풍 나무와 은행 나무를 사용하였다. 모델링을 수행할 때 사용된 기상 자료로는 기상청의 Automated Surface Observing System (ASOS) 관측소를 통해서 관측된 기온, 강수, 일사 자료를 사용하였으며, 개나리, 벚나무의 개화일과 약 -0.2, 은행나무, 단풍나무의 단풍 절정일과 약 0.3 정도의 상관 계수를 가지는 Moderate Resolution Imaging Spectroradiometer (MODIS) 식생지수를 사용하여 모델링을 수행하였다. 사용된 모델로는 선형 모델인 다중 회귀 모형과, 비선형 모델인 Random Forest (RF)를 사용하여 모델을 수립하였다. 또한 각 모형으로 추정된 예측 값을 공간 내삽 기법을 이용하여 등치 선도로 2003~2020년의 식물 계절 변화 경향 성을 표현하였다. 향후에 높은 시공간 해상도를 가지는 식생지수를 사용한다면 더 높은 식물 계절 모델링의 정확도를 높일 수 있을 것으로 판단된다.

반응표면분석법을 이용한 설파메톡사졸의 액체크로마토그래프-텐덤형 질량분석 최적화 (Optimization of LC-MS/MS for the Analysis of Sulfamethoxazole by using Response Surface Analysis)

  • 배효관;정진영
    • 대한환경공학회지
    • /
    • 제31권9호
    • /
    • pp.825-830
    • /
    • 2009
  • 의약물질은 다양한 경로를 통해 수질환경으로 유입된다. 수계에 의약물질은 ppt에서 ppb 단위의 낮은 농도로 종종 검출되고 있으므로 적절한 관리방안과 기술적 대안을 찾기 위해 최적화된 미량분석기술을 개발하는 것이 필요하다. LC-MS/MS 최적화에 있어서 단변수 변화분석이 선호되어 왔다. 그러나 분석기기의 독립변수들은 서로 영향을 주고받기 때문에 여러 독립변수를 동시에 변화시키는 방법을 통해 최적조건을 탐색해야 한다. 본 연구에서는 반응표면 분석법을 최근 문제가 되고 있는 항생제 설파메톡사졸의 LC-MS/MS 분석에 활용하였다. 먼저 선별실험을 통해 최적화 대상 독립변수를 조각화에너지(Fragmentation Energy)와 충돌전압(Collision Voltage)으로 선정하였다. 조각화에너지와 충돌전압을 동시변화시키고 각 조건의 반응을 다항식으로 모사하였다. 회귀분석결과 상관계수 $R^2$값은 0.9947를 나타내어 높은 정확도를 보였으며, 무작위 조건에서 반응의 예측값과 관측값 사이의 오차율이 3.41%로 작은 차이를 보였다. 따라서 RSA에 의해 도출된 모델이 조각화에너지와 충돌전압의 변화에 의한 LC-MS/MS의 반응을 성공적으로 모사하는 것으로 사료되었다. 이때 모델을 통해 확인된 최적조건은 조각화에너지 116.6과 충돌전압 10.9 eV이다. 이러한 반응표면분석법은 고체상 추출조건 및 액체크로마토그래피 조건의 최적화에 확장되어 활용될 수 있다.

만성적 소음노출과 혈압의 상관성에 관한 메타분석 (A Meta-analysis on the Association between Chronic Noise Exposure and Blood Pressure)

  • 김춘배;김재용;차봉석;최홍렬;이종태;남정모;이상윤;왕승준;박기호;김대열;고상백
    • Journal of Preventive Medicine and Public Health
    • /
    • 제33권3호
    • /
    • pp.343-348
    • /
    • 2000
  • Objectives : This study was conducted to integrate the results of studies assessing the association between chronic noise exposure and blood pressure. Methods : Using a MEDLINE search with noise exposure, blood pressure and hypertension as key words, we retrieved articles from the literature that were published from 1980 to December 1999. The criteria for quality evaluation were as follows: 1) the study subjects must have been workers employed at a high noise level area 2) The paper should use average and cumulative noise exposure as method for exposure evaluation. 3) Blood pressure in each article should be reported in a continuous scale Among the 77 retrieved articles, six studies were selected for quantitative meta-analysis. Before the integration of the regression coefficients for the association between blood pressure and noise level, homogeneity tests were conducted. Results : All studies were a cross-sectional design and the study subjects were industrial workers. Five papers used a time-weighted average for noise exposure and only one paper calculated the cumulative noise exposure level. The measurement of blood pressure in the majority of studios were accomplished in a resting stale, and used an average of two or more readings. The homogeneity of studies was rejected in a fixed effect model, so we used the results in a random effect model. The results of the quantitative meta-analysis, the weighted regression coefficient of noise associated with systolic blood pressure and diastolic blood pressure were 0.05 (95% confidence interval [CI]: -0.03, 0.13) and 0.06 (95% CI: -0.01, 0.13), respectively. Conclusions : Our results suggested that chronic exposure to industrial noise does not cause elevated blood pressure.

  • PDF