• 제목/요약/키워드: Support vector machine (SVR)

검색결과 63건 처리시간 0.029초

생체 신호 기반 음주량 예측 및 음주량에 따른 운전 능력 평가 (Prediction of Alcohol Consumption Based on Biosignals and Assessment of Driving Ability According to Alcohol Consumption)

  • 박승원;최준원;김태현;서정훈;정면규;이강인;김한성
    • 대한의용생체공학회:의공학회지
    • /
    • 제43권1호
    • /
    • pp.27-34
    • /
    • 2022
  • Drunk driving defines a driver as unable to drive a vehicle safely due to drinking. To crack down on drunk driving, alcohol concentration evaluates through breathing and crack down on drinking using S-shaped courses. A method for assessing drunk driving without using BAC or BrAC is measurement via biosignal. Depending on the individual specificity of drinking, alcohol evaluation studies through various biosignals need to be conducted. In this study, we measure biosignals that are related to alcohol concentration, predict BrAC through SVM, and verify the effectiveness of the S-shaped course. Participants were 8 men who have a driving license. Subjects conducted a d2 test and a scenario evaluation of driving an S-shaped course when they attained BrAC's certain criteria. We utilized SVR to predict BrAC via biosignals. Statistical analysis used a one-way Anova test. Depending on the amount of drinking, there was a tendency to increase pupil size, HR, normLF, skin conductivity, body temperature, SE, and speed, while normHF tended to decrease. There was no apparent change in the respiratory rate and TN-E. The result of the D2 test tended to increase from 0.03% and decrease from 0.08%. Measured biosignals have enabled BrAC predictions using SVR models to obtain high Figs in primary and secondary cross-validations. In this study, we were able to predict BrAC through changes in biosignals and SVMs depending on alcohol concentration and verified the effectiveness of the S-shaped course drinking control method.

댐 일유입량 예측을 위한 데이터 전처리와 머신러닝&딥러닝 모델 조합의 비교연구 (Comparative Study of Data Preprocessing and ML&DL Model Combination for Daily Dam Inflow Prediction)

  • 조영식;정관수
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.358-358
    • /
    • 2023
  • 본 연구에서는 그동안 수자원분야 강우유출 해석분야에 활용되었던 대표적인 머신러닝&딥러닝(ML&DL) 모델을 활용하여 모델의 하이퍼파라미터 튜닝뿐만 아니라 모델의 특성을 고려한 기상 및 수문데이터의 조합과 전처리(lag-time, 이동평균 등)를 통하여 데이터 특성과 ML&DL모델의 조합시나리오에 따른 일 유입량 예측성능을 비교 검토하는 연구를 수행하였다. 이를 위해 소양강댐 유역을 대상으로 1974년에서 2021년까지 축적된 기상 및 수문데이터를 활용하여 1) 강우, 2) 유입량, 3) 기상자료를 주요 영향변수(독립변수)로 고려하고, 이에 a) 지체시간(lag-time), b) 이동평균, c) 유입량의 성분분리조건을 적용하여 총 36가지 시나리오 조합을 ML&DL의 입력자료로 활용하였다. ML&DL 모델은 1) Linear Regression(LR), 2) Lasso, 3) Ridge, 4) SVR(Support Vector Regression), 5) Random Forest(RF), 6) LGBM(Light Gradient Boosting Model), 7) XGBoost의 7가지 ML방법과 8) LSTM(Long Short-Term Memory models), 9) TCN(Temporal Convolutional Network), 10) LSTM-TCN의 3가지 DL 방법, 총 10가지 ML&DL모델을 비교 검토하여 일유입량 예측을 위한 가장 적합한 데이터 조합 특성과 ML&DL모델을 성능평가와 함께 제시하였다. 학습된 모형의 유입량 예측 결과를 비교·분석한 결과, 소양강댐 유역에서는 딥러닝 중에서는 TCN모형이 가장 우수한 성능을 보였고(TCN>TCN-LSTM>LSTM), 트리기반 머신러닝중에서는 Random Forest와 LGBM이 우수한 성능을 보였으며(RF, LGBM>XGB), SVR도 LGBM수준의 우수한 성능을 나타내었다. LR, Lasso, Ridge 세가지 Regression모형은 상대적으로 낮은 성능을 보였다. 또한 소양강댐 댐유입량 예측에 대하여 강우, 유입량, 기상계열을 36가지로 조합한 결과, 입력자료에 lag-time이 적용된 강우계열의 조합 분석에서 세가지 Regression모델을 제외한 모든 모형에서 NSE(Nash-Sutcliffe Efficiency) 0.8이상(최대 0.867)의 성능을 보였으며, lag-time이 적용된 강우와 유입량계열을 조합했을 경우 NSE 0.85이상(최대 0.901)의 더 우수한 성능을 보였다.

  • PDF

스태킹 앙상블 모델을 이용한 시간별 지상 오존 공간내삽 정확도 향상 (Improved Estimation of Hourly Surface Ozone Concentrations using Stacking Ensemble-based Spatial Interpolation)

  • 김예진;강은진;조동진;이시우;임정호
    • 한국지리정보학회지
    • /
    • 제25권3호
    • /
    • pp.74-99
    • /
    • 2022
  • 지상 오존은 차량 및 산업 현장에서 배출된 질소화합물(Nitrogen oxides; NOx)과 휘발성 유기화합물(Volatile Organic Compounds; VOCs)의 광화학 반응을 통해 생성되어 식생 및 인체에 악영향을 끼친다. 국내에서는 실시간 오존 모니터링을 수행하고 있지만 관측소 기반으로, 미관측 지역의 공간 분포 분석에 어려움이 있다. 본 연구에서는 스태킹 앙상블 기법을 활용하여 매시간 남한 지역의 지상 오존 농도를 1.5km의 공간해상도로 공간내삽하였고, 5-fold 교차검증을 수행하였다. 스태킹 앙상블의 베이스 모델로는 코크리깅(Cokriging), 다중 선형 회귀(Multi-Linear Regression; MLR), 랜덤 포레스트(Random Forest; RF), 서포트 벡터 회귀(Support Vector Regression; SVR)를 사용하였다. 각 모델의 정확도 비교 평가 결과, 스태킹 앙상블 모델이 연구 기간 내 시간별 평균 R 및 RMSE이 0.76, 0.0065ppm으로 가장 높은 성능을 보여주었다. 스태킹 앙상블 모델의 지상 오존 농도 지도는 복잡한 지형 및 도시화 변수의 특징이 잘 드러나며 더 넓은 농도 범위를 보여주었다. 개발된 모델은 매시간 공간적으로 연속적인 공간 지도를 산출할 수 있을 뿐만 아니라 8시간 평균치 산출 및 시계열 분석에 있어서도 활용 가능성이 클 것으로 기대된다.

머신러닝기법을 이용한 WRF-Hydro 하천수 흐름 예측 개선 (Improvement of WRF-Hydro streamflow prediction using Machine Learning Methods)

  • 조경우;김연주
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2019년도 학술발표회
    • /
    • pp.115-115
    • /
    • 2019
  • 하천수 흐름예측에 대한 연구는 대부분 WRF-Hydro와 같은 과정기반 모델링 시스템을 이용한다. 과정기반 모델링 시스템은 물리적 현상을 일반화한 수식으로 구성되어있다. 일반화된 수식은 불확실성을 내포하고 있으며 지역적 특성도 반영하지 못한다. 특히 수식에 사용되는 입력자료는 측정값으로 오차가 존재한다. 따라서 과정기반 모델링 시스템 예측결과는 계통오차와 우연오차가 존재한다. 현재 매개변수 보정을 통해 예측결과를 개선하는 방법을 사용하고 있으나 한계가 있다. 본 연구는 이러한 한계를 극복하기 위해 상호보완적인 Data-driven 모델을 구축하여 과정기반 모델링 시스템 결과를 개선하고자 하였다. Data-driven 모델 구축을 위해 머신러닝 기법인 instance-based weighting(IBW)과 support vector regression(SVR)을 사용하였다. 구축된 Data-driven 모델은 한반도 지역 주요 저수지 및 호수의 하천수 흐름예측을 통해 검증하였다. 검증을 위해 과정기반 모델링 시스템으로 WRF-Hydro를 구동하였다. 입력자료는 기상청의 국지수치예측모델자료(LDAPS), HydroSHEDS의 수치표고모델자료(DEM), 국가지리정보원의 저수지 및 호수 연속수치지형도를 사용하였다. 본 연구를 통해 구축된 Data-driven모델은 기존 과정기반 모델링 시스템의 오류수정 한계를 머신러닝을 이용하여 개선할 수 있는 가능성을 제시하였다.

  • PDF

Predicting the Young's modulus of frozen sand using machine learning approaches: State-of-the-art review

  • Reza Sarkhani Benemaran;Mahzad Esmaeili-Falak
    • Geomechanics and Engineering
    • /
    • 제34권5호
    • /
    • pp.507-527
    • /
    • 2023
  • Accurately estimation of the geo-mechanical parameters in Artificial Ground Freezing (AGF) is a most important scientific topic in soil improvement and geotechnical engineering. In order for this, one way is using classical and conventional constitutive models based on different theories like critical state theory, Hooke's law, and so on, which are time-consuming, costly, and troublous. The others are the application of artificial intelligence (AI) techniques to predict considered parameters and behaviors accurately. This study presents a comprehensive data-mining-based model for predicting the Young's Modulus of frozen sand under the triaxial test. For this aim, several single and hybrid models were considered including additive regression, bagging, M5-Rules, M5P, random forests (RF), support vector regression (SVR), locally weighted linear (LWL), gaussian process regression (GPR), and multi-layered perceptron neural network (MLP). In the present study, cell pressure, strain rate, temperature, time, and strain were considered as the input variables, where the Young's Modulus was recognized as target. The results showed that all selected single and hybrid predicting models have acceptable agreement with measured experimental results. Especially, hybrid Additive Regression-Gaussian Process Regression and Bagging-Gaussian Process Regression have the best accuracy based on Model performance assessment criteria.

Estimation of the mechanical properties of oil palm shell aggregate concrete by novel AO-XGB model

  • Yipeng Feng;Jiang Jie;Amir Toulabi
    • Steel and Composite Structures
    • /
    • 제49권6호
    • /
    • pp.645-666
    • /
    • 2023
  • Due to the steadily declining supply of natural coarse aggregates, the concrete industry has shifted to substituting coarse aggregates generated from byproducts and industrial waste. Oil palm shell is a substantial waste product created during the production of palm oil (OPS). When considering the usage of OPSC, building engineers must consider its uniaxial compressive strength (UCS). Obtaining UCS is expensive and time-consuming, machine learning may help. This research established five innovative hybrid AI algorithms to predict UCS. Aquila optimizer (AO) is used with methods to discover optimum model parameters. Considered models are artificial neural network (AO - ANN), adaptive neuro-fuzzy inference system (AO - ANFIS), support vector regression (AO - SVR), random forest (AO - RF), and extreme gradient boosting (AO - XGB). To achieve this goal, a dataset of OPS-produced concrete specimens was compiled. The outputs depict that all five developed models have justifiable accuracy in UCS estimation process, showing the remarkable correlation between measured and estimated UCS and models' usefulness. All in all, findings depict that the proposed AO - XGB model performed more suitable than others in predicting UCS of OPSC (with R2, RMSE, MAE, VAF and A15-index at 0.9678, 1.4595, 1.1527, 97.6469, and 0.9077). The proposed model could be utilized in construction engineering to ensure enough mechanical workability of lightweight concrete and permit its safe usage for construction aims.

GOCI 위성영상과 기계학습을 이용한 한반도 연안 수질평가지수 추정 (Estimation of Water Quality Index for Coastal Areas in Korea Using GOCI Satellite Data Based on Machine Learning Approaches)

  • 장은나;임정호;하성현;이상균;박영규
    • 대한원격탐사학회지
    • /
    • 제32권3호
    • /
    • pp.221-234
    • /
    • 2016
  • 우리나라는 대규모 산업단지와 대도시들이 연안에 집중되면서 연안의 오염이 날로 심각해지고 있다. 이러한 연안 오염을 모니터링하기 위해서 위성 영상을 이용한 연안 수질평가지수 모니터링 연구가 수행될 필요가 있다. 수질평가지수란 저층 산소포화도, 엽록소 농도, 투명도, 용존무기질소 및 용존무기인 농도를 수질평가 항목으로 구성하여 해양환경관리법에 따른 해양환경기준을 통해 해역별로 기준을 설정하여 산출하는 지수이다. 이 연구는 한반도 주변의 연안지역을 대상으로 2011년부터 2013년까지의 현장관측 자료 및 Geostationary Ocean Color Imager (GOCI) 위성 영상을 이용하여 연안 표층 해수에 대한 기계학습 기반의 두 가지 수질평가지수 추정 기법을 개발하였다. 첫 번째 방법으로는 GOCI 반사도를 이용하여 추정된 수질평가 항목들로 수질평가지수를 계산하였고, 두 번째 방법은 GOCI 반사도 및 산출물(엽록소 농도, 총 부유물질, 용존유기물)을 이용하여 수질평가지수를 추정하였다. 기계학습으로는 Random Forest(RF), Support Vector Regression (SVR), Cubist를 사용하였다. 수질평가 항목 추정에서 투명도의 정확도가 가장 높게 나타났으며, 모든 수질평가 항목 추정에서 세 가지 기계학습 중 RF의 정확도가 가장 높았다. 하지만 추정된 수질평가 항목들로 계산한 수질평가지수는 추정된 수질평가 항목들의 오차와 저층 산소포화도의 불확실성으로 인해 정확도가 높지는 않았다. 반면 GOCI 반사도와 산출물을 이용하여 추정한 수질평가지수는 현장 관측 기반 수질평가지수와 비교했을 때 첫 번째 방법보다 정확도가 높게 나타났다. 또한 엽록소 농도가 수질평가지수 추정에 가장 중요한 변수로 나타났다.

농업용 난방기의 사용 연식에 따른 이산화탄소 배출농도 비교 (Comparison of Carbon Dioxide Emission Concentration according to the Age of Agricultural Heating Machine)

  • 김나은;김대현;김연중;김현태
    • 생물환경조절학회지
    • /
    • 제32권3호
    • /
    • pp.190-196
    • /
    • 2023
  • 본 연구는 등유를 사용하는 농업용 난방기에서 배출되는 가스를 포집하고, 농업용 난방기의 사용 연식에 따른 이산화탄소의 배출농도를 파악하고자 수행되었다. 선형 회귀분석의 결과로 농업용 난방기의 연식에 따른 이산화탄소의 배출량은 R2 = 0.84로 y = 26.99x+721.98의 식을 따른다고 나타났다. 농업용 난방기의 사용 연식에 따라 세 그룹으로 분류하여 분산분석을 수행하였다. 분산분석을 수행한 결과, 분석을 위해 설정한 유의확률0.05보다 작은 2.1961×10-13으로 나타났으며 이는 적어도 한 그룹에서 차이가 나타난다는 것을 의미한다. 본 연구에서는 농업용 난방기의 기본적인 배출농도의 차이를 분석하고자 기기의 제작사와 상관없이 농업용 난방기의 기기 연식만을 고려하여 배출가스 데이터를 수집하였다. 기기의 연소 방식에는 제작사에 따라 연소 방식에 차이가 미미하게 있었을 것으로 판단되며 데이터 변수의 개수가 늘어난다면, SVR(support vector regression) 기반의 선형회귀 분석 등을 실시하여 농업용 난방기의 이산화탄소 데이터가 온실가스발생량 파악에 더욱 활용도가 높아질 것으로 판단된다. 추후 연구에서는 더욱 세분화된 데이터의 수집 방식을 따라 더욱 높은 정확도를 가진 결과값을 도출할 수 있다고 판단된다. 이처럼 우리나라의 농업 분야에서 용도별 온실가스 발생량을 조사하기 위하여 고정형 농기계인 농업용 난방기의 이산화탄소 발생량을 정확히 파악하여 온실가스 배출량 조사에 활용할 수 있을 것으로 판단된다.

컨볼루션 신경망을 이용한 도시 환경에서의 안전도 점수 예측 모델 연구 (A Safety Score Prediction Model in Urban Environment Using Convolutional Neural Network)

  • 강현우;강행봉
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권8호
    • /
    • pp.393-400
    • /
    • 2016
  • 최근, 컴퓨터 비전과 기계 학습 기술의 도움을 받아 효율적이고 자동적인 도시 환경에 대한 분석 방법의 개발에 대한 연구가 이루어지고 있다. 많은 분석들 중에서도 도시의 안전도 분석은 지역 사회의 많은 관심을 받고 있다. 더욱 정확한 안전도 점수 예측과 인간의 시각적 인지를 반영하기 위해서, 인간의 시각적 인지에서 가장 중요한 전역 정보와 지역 정보의 고려가 필요하다. 이를 위해 우리는 전역 칼럼과 지역 칼럼으로 구성된 Double-column Convolutional Neural Network를 사용한다. 전역 칼럼과 지역 칼럼 각각은 입력은 크기가 변환된 원 영상과 원 영상에서 무작위로 크로핑을 사용한다. 또한, 학습 과정에서 특정 칼럼에 오버피팅되는 문제를 해결하기 위한 새로운 학습방법을 제안한다. 우리의 DCNN 모델의 성능 비교를 위해 2개의 SVR 모델과 3개의 CNN 모델의 평균 제곱근 오차와 상관관계 분석을 측정하였다. 성능 비교 실험 결과 우리의 모델이 0.7432의 평균 제곱근 오차와 0.853/0.840 피어슨/스피어맨 상관 계수로 가장 좋은 성능을 보여주었다.

AREA 활용 전력수요 단기 예측 (Short-term Forecasting of Power Demand based on AREA)

  • 권세혁;오현승
    • 산업경영시스템학회지
    • /
    • 제39권1호
    • /
    • pp.25-30
    • /
    • 2016
  • It is critical to forecast the maximum daily and monthly demand for power with as little error as possible for our industry and national economy. In general, long-term forecasting of power demand has been studied from both the consumer's perspective and an econometrics model in the form of a generalized linear model with predictors. Time series techniques are used for short-term forecasting with no predictors as predictors must be predicted prior to forecasting response variables and containing estimation errors during this process is inevitable. In previous researches, seasonal exponential smoothing method, SARMA (Seasonal Auto Regressive Moving Average) with consideration to weekly pattern Neuron-Fuzzy model, SVR (Support Vector Regression) model with predictors explored through machine learning, and K-means clustering technique in the various approaches have been applied to short-term power supply forecasting. In this paper, SARMA and intervention model are fitted to forecast the maximum power load daily, weekly, and monthly by using the empirical data from 2011 through 2013. $ARMA(2,\;1,\;2)(1,\;1,\;1)_7$ and $ARMA(0,\;1,\;1)(1,\;1,\;0)_{12}$ are fitted respectively to the daily and monthly power demand, but the weekly power demand is not fitted by AREA because of unit root series. In our fitted intervention model, the factors of long holidays, summer and winter are significant in the form of indicator function. The SARMA with MAPE (Mean Absolute Percentage Error) of 2.45% and intervention model with MAPE of 2.44% are more efficient than the present seasonal exponential smoothing with MAPE of about 4%. Although the dynamic repression model with the predictors of humidity, temperature, and seasonal dummies was applied to foretaste the daily power demand, it lead to a high MAPE of 3.5% even though it has estimation error of predictors.