• 제목/요약/키워드: lasso

검색결과 170건 처리시간 0.028초

Prediction of Venous Trans-Stenotic Pressure Gradient Using Shape Features Derived From Magnetic Resonance Venography in Idiopathic Intracranial Hypertension Patients

  • Chao Ma;Haoyu Zhu;Shikai Liang;Yuzhou Chang;Dapeng Mo;Chuhan Jiang;Yupeng Zhang
    • Korean Journal of Radiology
    • /
    • 제25권1호
    • /
    • pp.74-85
    • /
    • 2024
  • Objective: Idiopathic intracranial hypertension (IIH) is a condition of unknown etiology associated with venous sinus stenosis. This study aimed to develop a magnetic resonance venography (MRV)-based radiomics model for predicting a high trans-stenotic pressure gradient (TPG) in IIH patients diagnosed with venous sinus stenosis. Materials and Methods: This retrospective study included 105 IIH patients (median age [interquartile range], 35 years [27-42 years]; female:male, 82:23) who underwent MRV and catheter venography complemented by venous manometry. Contrast enhanced-MRV was conducted under 1.5 Tesla system, and the images were reconstructed using a standard algorithm. Shape features were derived from MRV images via the PyRadiomics package and selected by utilizing the least absolute shrinkage and selection operator (LASSO) method. A radiomics score for predicting high TPG (≥ 8 mmHg) in IIH patients was formulated using multivariable logistic regression; its discrimination performance was assessed using the area under the receiver operating characteristic curve (AUROC). A nomogram was constructed by incorporating the radiomics scores and clinical features. Results: Data from 105 patients were randomly divided into two distinct datasets for model training (n = 73; 50 and 23 with and without high TPG, respectively) and testing (n = 32; 22 and 10 with and without high TPG, respectively). Three informative shape features were identified in the training datasets: least axis length, sphericity, and maximum three-dimensional diameter. The radiomics score for predicting high TPG in IIH patients demonstrated an AUROC of 0.906 (95% confidence interval, 0.836-0.976) in the training dataset and 0.877 (95% confidence interval, 0.755-0.999) in the test dataset. The nomogram showed good calibration. Conclusion: Our study presents the feasibility of a novel model for predicting high TPG in IIH patients using radiomics analysis of noninvasive MRV-based shape features. This information may aid clinicians in identifying patients who may benefit from stenting.

A Hybrid Multi-Level Feature Selection Framework for prediction of Chronic Disease

  • G.S. Raghavendra;Shanthi Mahesh;M.V.P. Chandrasekhara Rao
    • International Journal of Computer Science & Network Security
    • /
    • 제23권12호
    • /
    • pp.101-106
    • /
    • 2023
  • Chronic illnesses are among the most common serious problems affecting human health. Early diagnosis of chronic diseases can assist to avoid or mitigate their consequences, potentially decreasing mortality rates. Using machine learning algorithms to identify risk factors is an exciting strategy. The issue with existing feature selection approaches is that each method provides a distinct set of properties that affect model correctness, and present methods cannot perform well on huge multidimensional datasets. We would like to introduce a novel model that contains a feature selection approach that selects optimal characteristics from big multidimensional data sets to provide reliable predictions of chronic illnesses without sacrificing data uniqueness.[1] To ensure the success of our proposed model, we employed balanced classes by employing hybrid balanced class sampling methods on the original dataset, as well as methods for data pre-processing and data transformation, to provide credible data for the training model. We ran and assessed our model on datasets with binary and multivalued classifications. We have used multiple datasets (Parkinson, arrythmia, breast cancer, kidney, diabetes). Suitable features are selected by using the Hybrid feature model consists of Lassocv, decision tree, random forest, gradient boosting,Adaboost, stochastic gradient descent and done voting of attributes which are common output from these methods.Accuracy of original dataset before applying framework is recorded and evaluated against reduced data set of attributes accuracy. The results are shown separately to provide comparisons. Based on the result analysis, we can conclude that our proposed model produced the highest accuracy on multi valued class datasets than on binary class attributes.[1]

평점과 리뷰 텍스트 감성분석을 결합한 추천시스템 향상 방안 연구 (How to improve the accuracy of recommendation systems: Combining ratings and review texts sentiment scores)

  • 현지연;유상이;이상용
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.219-239
    • /
    • 2019
  • 개인에게 맞춤형 서비스를 제공하는 것이 중요해지면서 개인화 추천 시스템 관련 연구들이 끊임없이 이루어지고 있다. 추천 시스템 중 협업 필터링은 학계 및 산업계에서 가장 많이 사용되고 있다. 다만 사용자들의 평점 혹은 사용 여부와 같은 정량적인 정보에 국한하여 추천이 이루어져 정확도가 떨어진다는 문제가 제기되고 있다. 이와 같은 문제를 해결하기 위해 현재까지 많은 연구에서 정량적 정보 외에 다른 정보들을 활용하여 추천 시스템의 성능을 개선하려는 시도가 활발하게 이루어지고 있다. 리뷰를 이용한 감성 분석이 대표적이지만, 기존의 연구에서는 감성 분석의 결과를 추천 시스템에 직접적으로 반영하지 못한다는 한계가 있다. 이에 본 연구는 리뷰에 나타난 감성을 수치화하여 평점에 반영하는 것을 목표로 한다. 즉, 사용자가 직접 작성한 리뷰를 감성 수치화하여 정량적인 정보로 변환해 추천 시스템에 직접 반영할 수 있는 새로운 알고리즘을 제안한다. 이를 위해서는 정성적인 정보인 사용자들의 리뷰를 정량화 시켜야 하므로, 본 연구에서는 텍스트 마이닝의 감성 분석 기법을 통해 감성 수치를 산출하였다. 데이터는 영화 리뷰를 대상으로 하여 도메인 맞춤형 감성 사전을 구축하고, 이를 기반으로 리뷰의 감성점수를 산출한다. 본 논문에서 사용자 리뷰의 감성 수치를 반영한 협업 필터링이 평점만을 고려하는 전통적인 방식의 협업 필터링과 비교하여 우수한 정확도를 나타내는 것을 확인하였다. 이후 제안된 모델이 더 개선된 방식이라고 할 근거를 확보하기 위해 paired t-test 검증을 시도했고, 제안된 모델이 더 우수하다는 결론을 도출하였다. 본 연구에서는 평점만으로 사용자의 감성을 판단한 기존의 선행연구들이 가지는 한계를 극복하고자 리뷰를 수치화하여 기존의 평점 시스템보다 사용자의 의견을 더 정교하게 추천 시스템에 반영시켜 정확도를 향상시켰다. 이를 기반으로 추가적으로 다양한 분석을 시행한다면 추천의 정확도가 더 높아질 것으로 기대된다.

Elucidation of the Biosynthetic Pathway of Vitamin B Groups and Potential Secondary Metabolite Gene Clusters Via Genome Analysis of a Marine Bacterium Pseudoruegeria sp. M32A2M

  • Cho, Sang-Hyeok;Lee, Eunju;Ko, So-Ra;Jin, Sangrak;Song, Yoseb;Ahn, Chi-Yong;Oh, Hee-Mock;Cho, Byung-Kwan;Cho, Suhyung
    • Journal of Microbiology and Biotechnology
    • /
    • 제30권4호
    • /
    • pp.505-514
    • /
    • 2020
  • The symbiotic nature of the relationship between algae and marine bacteria is well-studied among the complex microbial interactions. The mutual profit between algae and bacteria occurs via nutrient and vitamin exchange. It is necessary to analyze the genome sequence of a bacterium to predict its symbiotic relationships. In this study, the genome of a marine bacterium, Pseudoruegeria sp. M32A2M, isolated from the south-eastern isles (GeoJe-Do) of South Korea, was sequenced and analyzed. A draft genome (91 scaffolds) of 5.5 Mb with a DNA G+C content of 62.4% was obtained. In total, 5,101 features were identified from gene annotation, and 4,927 genes were assigned to functional proteins. We also identified transcription core proteins, RNA polymerase subunits, and sigma factors. In addition, full flagella-related gene clusters involving the flagellar body, motor, regulator, and other accessory compartments were detected even though the genus Pseudoruegeria is known to comprise non-motile bacteria. Examination of annotated KEGG pathways revealed that Pseudoruegeria sp. M32A2M has the metabolic pathways for all seven vitamin Bs, including thiamin (vitamin B1), biotin (vitamin B7), and cobalamin (vitamin B12), which are necessary for symbiosis with vitamin B auxotroph algae. We also identified gene clusters for seven secondary metabolites including ectoine, homoserine lactone, beta-lactone, terpene, lasso peptide, bacteriocin, and non-ribosomal proteins.

제초제 처리가 콩의 생육 및 근류형성에 미치는 영향 (Effects of Herbicide Application on Growth and the Nodulation in Soybean)

  • 한인수;오정행
    • 한국작물학회지
    • /
    • 제34권3호
    • /
    • pp.303-309
    • /
    • 1989
  • 콩밭에 사용하는 제초제가 콩의 생육 및 근류형성에 미치는 여향을 조사하기 위하여 밭제초제인 랏소와 데브리놀을 올콩, 장엽콩 및 팔달콩에 농도별로 처리하여 출현율, 초장, 생체중, 주당절수, 분지수, 협수, 입수, 백입중 및 근류수를 조사한 결과를 요약하면 다음과 같다. 1. 출현율은 제초제의 종류에 따른 차이는 없으나 처리농도가 증가함에 따라 정비례적으로 감소하였으며 사용권장농도에서도 무처리에 비해 유의적인 감소를 보였고 초기생육단계에서 심함 기형묘가 관찰되었다. 2. 초장은 제초제의 종류에 무관하게 농도의 증가에 비례하여 감소하였으며 사용권장농도에서는 무처리에 비해 통계적 유의차가 없었으나 배농농구에서는 고도의 유의차가 인정되었고 감소현상은 파종 3주후부터 뚜렷하게 나타났다. 3. 주당입수는 백입중은 제초제의 종류에 무관하였으나 주당분지수와 주당협수는 종류에 따라 차이가 있었으며 처리농도가 증가함에 따라 유의성 있게 감소하였고 품종간에도 차이가 있었다. 4. 근 수는 제초제의 처리농도가 증가함에 따라 정비례적으로 감소하였고 그 정도는 제초제의 종류에 따라 품종간에도 차이가 있었다. 4. 근류수는 제초제의 처리농도가 증가함에 따라 정비례적으로 감소하였고 그 정도는 제초제의 종류에 따라 품종간에 현저한 차이가 있었다. 5. 콩의 생육 및 수량에 감소는 근 형성력의 감소와 유의적 상관을 보였으며 제초제의 과다사용에 의한 근류형성력의 저하는 콩 수량 감소의 중요 원인이 되는 것으로 생각되었다.

  • PDF

바이오폴리머-흙 처리(BPST) 기술의 강도 발현 거동에 대한 주요 영향인자 분석에 관한 연구 (Investigation on the Key Parameters for the Strengthening Behavior of Biopolymer-based Soil Treatment (BPST) Technology)

  • 이해진;조계춘;장일한
    • 토지주택연구
    • /
    • 제12권3호
    • /
    • pp.109-119
    • /
    • 2021
  • 최근 지구 온난화로 인한 이상 기후로 인해 과거보다 더 많은 지반공학 재해들이 발생하고 있으며, 재해들의 규모도 더욱 증대되고 있다. 최근 토목 및 건설분야에 소개된 바이오폴리머 기반 흙 처리(BPST; Biopolymer-based soil treatment) 기술은 효율적으로 흙의 강도를 증진시키면서 탄소배출이 거의 없는 친환경 지반보강법으로 알려져 있다. 특히, 아가검, 젤란검, 잔탄검과 같은 열적젤화 특성을 지닌 바이오폴리머들의 강도 증진 효과가 매우 우수함이 여러 연구를 통해 밝혀지고 있다. 하지만 바이오폴리머 함량 외에는 바이오폴리머 기반 흙 처리에서 흙의 강도 증진을 제어하는 주요 영향인자 규명에 대한 연구는 많이 부족한 실정이다. 본 연구에서는 기존 발표된 열적젤화 바이오 폴리머 처리 흙의 불구속일축압축강도(UCS; Unconfined compressive strength) 자료에 대한 기계학습 기반 선형회귀 분석을 통해 젤란검 바이오폴리머로 처리된 흙의 강도 발현을 결정하는 주요 인자들을 분석하였다. 해석 결과, 바이오폴리머 함량과 더불어 흙 속 점토 함량이 강도 발현에 가장 중요한 인자임을 확인할 수 있었다.

수도권 아파트 매매가격 변동의 확산효과 (The Spillover Effects of Fluctuations in Apartment Sales Prices in the Capital Region)

  • 정준호
    • 한국경제지리학회지
    • /
    • 제25권1호
    • /
    • pp.147-170
    • /
    • 2022
  • 이 논문은 70개 수도권 시군구 아파트 매매가격의 주간 수익률을 대상으로 그 변동 순환과 현 정부의 집권 시기 등을 고려하여 전체기간(2008년 4월~2021년 8월), 가격 급등기 이전(2008월 4월~2018년 10월), 그리고 가격 급등기(2018년 11월~2021년 8월)로 나누어 확산효과를 분석한다. 이러한 분석으로부터 얻어진 분석 결과를 요약하면 다음과 같다. 첫째, 확산효과에 대한 분석은 시기에 따라 기존의 연구 결과와 유사하기도 하지만 다르기도 하다. 전체기간과 가격 급등기 이전 시기에 대한 확산효과 분석은 수도권 아파트시장에서 '강남' 효과가 실재한다는 것을 보여준다. 반면에 가격 급등기에 대한 확산효과 분석은 이전과는 상이한 결과를 나타낸다. 순환 표본의 분석을 통해 계산된 확산효과 지수는 수도권 아파트 매매가격 순환의 하강기에는 확산효과 지수가 낮아지고, 반면에 상승기에는 그 반대의 추세를 보여준다. 확산효과 지수의 정점과 정책 개입 간의 타이밍을 보면 대체로 2017년에는 확산효과 지수의 정점 이후, 2018년과 2019년에는 정점 이전, 2020년 이후 정점 무렵이나 정점 이후에서 정부의 정책 개입이 이루어진 것으로 나타난다.

머신러닝을 활용한 브랜드별 국내 중고차 가격 예측 모델에 관한 연구 (A Study on the Prediction Models of Used Car Prices for Domestic Brands Using Machine Learning)

  • 임승준;이정호;류춘호
    • 서비스연구
    • /
    • 제13권3호
    • /
    • pp.105-126
    • /
    • 2023
  • 국내 중고차 시장은 지속적으로 성장하고 있으며, 이와 동시에 중고차 온라인 플랫폼 서비스 역시 함께 매년 시장 점유율을 확대하고 있다. 중고차 온라인 플랫폼 서비스는 차량의 제원, 점검 이력, 사고 내역, 그리고 세부 옵션 등을 서비스 이용자에게 제공하고 있다. 대부분의 기존 연구는 차량의 제원과 차량의 일부 옵션을 활용한 중고차 가격의 예측이었으며, 중고차 가격과 일부 제원 변수 간 비선형 관계임을 확인하였다. 이에 따라 연구자들은 이러한 비선형 문제를 해결하기 위해 머신러닝(Machine Learning) 모델의 실행을 제안하였으며, 그 결과 회귀(Regression) 기반 머신러닝 모델은 변수의 실질적인 영향력과 방향성을 알 수 있는 장점이 존재하였으나, 트리(Decision Tree) 기반 머신러닝 모델에 비해 비용함수 수치가 저조한 단점이 존재하였다. 본 연구는 국내 브랜드를 대상으로 차량의 제원과 차량의 옵션, 총 70여 개의 변수를 모두 활용하여 회귀 기반 머신러닝 모델과 트리 기반 머신러닝 모델을 순차적으로 실행하여 두 유형의 머신러닝 모델의 장점을 취합하고자 하였다. 이를 통해 브랜드별 변수의 실질적 영향력과 방향성을 확인한 후 브랜드별 가장 우수한 트리 기반 머신러닝 모델을 선정하였다. 본 연구의 시사점은 다음과 같다. 중고차 온라인 플랫폼 서비스를 이용하는 구매자와 판매자가 전반적인 중고차 가격 예측을 지원할 수 있다. 이에 따라 중고차 온라인 플랫폼 서비스 이용자 간 정보의 비대칭으로 인한 문제 해결 역시 지원이 가능할 것으로 기대한다.

Prediction of Postoperative Lung Function in Lung Cancer Patients Using Machine Learning Models

  • Oh Beom Kwon;Solji Han;Hwa Young Lee;Hye Seon Kang;Sung Kyoung Kim;Ju Sang Kim;Chan Kwon Park;Sang Haak Lee;Seung Joon Kim;Jin Woo Kim;Chang Dong Yeo
    • Tuberculosis and Respiratory Diseases
    • /
    • 제86권3호
    • /
    • pp.203-215
    • /
    • 2023
  • Background: Surgical resection is the standard treatment for early-stage lung cancer. Since postoperative lung function is related to mortality, predicted postoperative lung function is used to determine the treatment modality. The aim of this study was to evaluate the predictive performance of linear regression and machine learning models. Methods: We extracted data from the Clinical Data Warehouse and developed three sets: set I, the linear regression model; set II, machine learning models omitting the missing data: and set III, machine learning models imputing the missing data. Six machine learning models, the least absolute shrinkage and selection operator (LASSO), Ridge regression, ElasticNet, Random Forest, eXtreme gradient boosting (XGBoost), and the light gradient boosting machine (LightGBM) were implemented. The forced expiratory volume in 1 second measured 6 months after surgery was defined as the outcome. Five-fold cross-validation was performed for hyperparameter tuning of the machine learning models. The dataset was split into training and test datasets at a 70:30 ratio. Implementation was done after dataset splitting in set III. Predictive performance was evaluated by R2 and mean squared error (MSE) in the three sets. Results: A total of 1,487 patients were included in sets I and III and 896 patients were included in set II. In set I, the R2 value was 0.27 and in set II, LightGBM was the best model with the highest R2 value of 0.5 and the lowest MSE of 154.95. In set III, LightGBM was the best model with the highest R2 value of 0.56 and the lowest MSE of 174.07. Conclusion: The LightGBM model showed the best performance in predicting postoperative lung function.

빅데이터와 딥러닝을 활용한 동물 감염병 확산 차단 (Animal Infectious Diseases Prevention through Big Data and Deep Learning)

  • 김성현;최준기;김재석;장아름;이재호;차경진;이상원
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.137-154
    • /
    • 2018
  • 조류인플루엔자와 구제역 같은 동물감염병은 거의 매년 발생하며 국가에 막대한 경제적 사회적 손실을 일으키고 있다. 이를 예방하기 위해서 그간 방역당국은 다양한 인적, 물적 노력을 기울였지만 감염병은 지속적으로 발생해 왔다. 최근 빅데이터와 딥러닝 기술을 활용하여 감염병의 예측모델을 개발하고자 하는 시도가 시작되고 있지만, 실제로 활용가능한 모델구축 연구와 사례보고는 활발히 진행되고 있지 않은 실정이다. KT와 과학기술정보통신부는 2014년부터 국가 R&D사업의 일환으로 축산관련 차량의 이동경로를 분석하여 예측하는 빅데이터 사업을 수행하고 있다. 동물감염병 예방을 위하여 연구진은 최초에는 차량이동 데이터를 활용한 회귀분석모델을 기반으로 한 예측모델을 개발하였다. 이후에는 기계학습을 활용하여 좀 더 정확한 예측 모델을 구성하였다. 특히, 2017년 예측모델에서는 시설물에 대한 확산 위험도를 추가하였고 모델링의 하이퍼 파라미터를 다양하게 고려하여 모델의 성능을 높였다. 정오분류표와 ROC 커브를 확인한 결과, 기계 학습 모델보다 2017년 구성된 모형이 우수함을 확인 할 수 있었다. 또한 2017에는 결과에 대한 설명을 추가하여 방역당국의 의사결정을 돕고 이해관계자를 설득할 수 있는 근거를 확보하였다. 본 연구는 빅데이터를 활용하여 동물감염병예방시스템을 구축한 사례연구로 모델주요변수값, 이에따른 실제예측성능결과, 그리고 상세하게 기술된 시스템구축 프로세스는 향후 감염병예방 영역의 지속적인 빅데이터활용 및 분석 모델 개발에 기여할 수 있을 것이다. 또한 본 연구에서 구축한 시스템을 통해 보다 사전적이고 효과적인 방역을 할 수 있을 것으로 기대한다.