• 제목/요약/키워드: support vector regression (SVR)

검색결과 153건 처리시간 0.031초

Two-step LS-SVR for censored regression

  • Bae, Jong-Sig;Hwang, Chang-Ha;Shim, Joo-Yong
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권2호
    • /
    • pp.393-401
    • /
    • 2012
  • This paper deals with the estimations of the least squares support vector regression when the responses are subject to randomly right censoring. The estimation is performed via two steps - the ordinary least squares support vector regression and the least squares support vector regression with censored data. We use the empirical fact that the estimated regression functions subject to randomly right censoring are close to the true regression functions than the observed failure times subject to randomly right censoring. The hyper-parameters of model which affect the performance of the proposed procedure are selected by a generalized cross validation function. Experimental results are then presented which indicate the performance of the proposed procedure.

Fluency Scoring of English Speaking Tests for Nonnative Speakers Using a Native English Phone Recognizer

  • Jang, Byeong-Yong;Kwon, Oh-Wook
    • 말소리와 음성과학
    • /
    • 제7권2호
    • /
    • pp.149-156
    • /
    • 2015
  • We propose a new method for automatic fluency scoring of English speaking tests spoken by nonnative speakers in a free-talking style. The proposed method is different from the previous methods in that it does not require the transcribed texts for spoken utterances. At first, an input utterance is segmented into a phone sequence by using a phone recognizer trained by using native speech databases. For each utterance, a feature vector with 6 features is extracted by processing the segmentation results of the phone recognizer. Then, fluency score is computed by applying support vector regression (SVR) to the feature vector. The parameters of SVR are learned by using the rater scores for the utterances. In computer experiments with 3 tests taken by 48 Korean adults, we show that speech rate, phonation time ratio, and smoothed unfilled pause rate are best for fluency scoring. The correlation of between the rater score and the SVR score is shown to be 0.84, which is higher than the correlation of 0.78 among raters. Although the correlation is slightly lower than the correlation of 0.90 when the transcribed texts are given, it implies that the proposed method can be used as a preprocessing tool for fluency evaluation of speaking tests.

A Comparative Study Between Linear Regression and Support Vector Regression Model Based on Environmental Factors of a Smart Bee Farm

  • Rahman, A. B. M. Salman;Lee, MyeongBae;Venkatesan, Saravanakumar;Lim, JongHyun;Shin, ChangSun
    • 스마트미디어저널
    • /
    • 제11권5호
    • /
    • pp.38-47
    • /
    • 2022
  • Honey is one of the most significant ingredients in conventional food production in different regions of the world. Honey is commonly used as an ingredient in ethnic food. Beekeeping is performed in various locations as part of the local food culture and an occupation related to pollinator production. It is important to conduct beekeeping so that it generates food culture and helps regulate the regional environment in an integrated manner in preserving and improving local food culture. This study analyzes different types of environmental factors of a smart bee farm. The major goal of this study is to determine the best prediction model between the linear regression model (LM) and the support vector regression model (SVR) based on the environmental factors of a smart bee farm. The performance of prediction models is measured by R2 value, root mean squared error (RMSE), and mean absolute error (MAE). From all analysis reports, the best prediction model is the support vector regression model (SVR) with a low coefficient of variation, and the R2 values for Farm inside temperature, bee box inside temperature, and Farm inside humidity are 0.97, 0.96, and 0.44.

머신러닝 모델을 이용한 석산 개발 발파진동 예측 (Prediction of Blast Vibration in Quarry Using Machine Learning Models)

  • 정다희;최요순
    • 터널과지하공간
    • /
    • 제31권6호
    • /
    • pp.508-519
    • /
    • 2021
  • 본 연구에서는 발파 시 사람과 주변 환경에 영향을 끼치는 발파진동(peak particle velocity, PPV)을 예측하는 모델을 개발하였다. PPV를 예측하기 위해 kNN(k-nearest neighbors), CART(classification and regression tree), SVR(support vector regression), PSO(particle swarm optimization)-SVR 알고리즘을 이용한 4가지 머신러닝 모델을 개발하고 상호 비교하였다. 머신러닝 모델을 훈련하기 위해 경상남도 창원시에 있는 욕망산을 연구지역으로 선정하고 1048개의 발파 데이터를 획득하였다. 발파 데이터는 천공장, 저항선, 공간격, 최대지발장약량, 비장약량, 총공수, 에멀전비율, 이격거리, PPV로 구성되었다. 훈련된 모델들의 성능을 평가하기 위한 지표 값으로 MAE(mean absolute error), MSE(mean squared error), RMSE(root mean squared error)를 사용하였다. 평가결과 PSO-SVR 모델이 MAE, MSE, RMSE가 각각 0.0348, 0.0021, 0.0458으로 가장 우수한 예측 성능을 나타냈다. 마지막으로 개발된 머신러닝 모델을 이용하여 주변 환경에 영향을 끼치는 정도를 예측하는 방법을 제시하였다.

감정예측모형의 성과개선을 위한 Support Vector Regression 응용 (Application of Support Vector Regression for Improving the Performance of the Emotion Prediction Model)

  • 김성진;유은정;정민규;김재경;안현철
    • 지능정보연구
    • /
    • 제18권3호
    • /
    • pp.185-202
    • /
    • 2012
  • 오늘날 정보사회에서는 정보에 대한 가치를 인식하고, 이를 위한 정보의 활용과 수집이 중요해지고 있다. 얼굴 표정은 그림 하나가 수천개의 단어를 표현할 수 있듯이 수천 개의 정보를 지니고 있다. 이에 주목하여 최근 얼굴 표정을 통해 사람의 감정을 판단하여 지능형 서비스를 제공하기 위한 시도가 MIT Media Lab을 필두로 활발하게 이루어지고 있다. 전통적으로 기존 연구에서는 인공신경망, 중회귀분석 등의 기법을 통해 사람의 감정을 판단하는 연구가 이루어져 왔다. 하지만 중회귀모형은 예측 정확도가 떨어지고, 인공신경망은 성능은 뛰어나지만 기법 자체가 지닌 과적합화 문제로 인해 한계를 지닌다. 본 연구는 사람들의 자극에 대한 반응으로서 나타나는 얼굴 표정을 통해 감정을 추론해내는 지능형 모형을 개발하는 것을 목표로 한다. 기존 얼굴 표정을 통한 지능형 감정판단모형을 개선하기 위하여, Support Vector Regression(이하 SVR) 기법을 적용하는 새로운 모형을 제시한다. SVR은 기존 Support Vector Machine이 가진 뛰어난 예측 능력을 바탕으로, 회귀문제 영역을 해결하기 위해 확장된 것이다. 본 연구의 제안 모형의 목적은 사람의 얼굴 표정으로부터 쾌/불쾌 수준 그리고 몰입도를 판단할 수 있도록 설계되는 것이다. 모형 구축을 위해 사람들에게 적절한 자극영상을 제공했을 때 나타나는 얼굴 반응들을 수집했고, 이를 기반으로 얼굴 특징점을 도출 및 보정하였다. 이후 전처리 과정을 통해 통계적 유의변수를 추출 후 학습용과 검증용 데이터로 구분하여 SVR 모형을 통해 학습시키고, 평가되도록 하였다. 다수의 일반인들을 대상으로 수집된 실제 데이터셋을 기반으로 제안모형을 적용해 본 결과, 매우 우수한 예측 정확도를 보임을 확인할 수 있었다. 아울러, 중회귀분석이나 인공신경망 기법과 비교했을 때에도 본 연구에서 제안한 SVR 모형이 쾌/불쾌 수준 및 몰입도 모두에서 더 우수한 예측성과를 보임을 확인할 수 있었다. 이는 얼굴 표정에 기반한 감정판단모형으로서 SVR이 상당히 효과적인 수단이 될 수 있다는 점을 알 수 있었다.

단백질 서열정렬 정확도 예측을 위한 새로운 방법 (A new method to predict the protein sequence alignment quality)

  • 이민호;정찬석;김동섭
    • Bioinformatics and Biosystems
    • /
    • 제1권1호
    • /
    • pp.82-87
    • /
    • 2006
  • 현재 가장 많이 사용되는 단백질 구조 예측 방법은 비교 모델링 (comparative modeling) 방법이다. 비교 모델링 방법에서의 정확도를 높이기 위해서는 alignment의 정확도 역시 매우 필수적으로 필요하다. 비교 모델링 과정 중의 fold-recognition 단계에서 alignment의 정확도에 의해 template을 고르는 방법은 단지 가장 비슷한 template을 선택하는 방법에 비해 주목을 받지 못하고 있다. 최근에는 두 가지의 alignment에 사이의 shift 정보를 바탕으로 한 shift score라는 수치가 alignment의 성능을 표현하기 위해서 개발되었다. 우리는 더 정확한 구조 예측의 첫걸음이 될 수 있는 shift score를 예측하는 방법을 개발하였다. Shift score를 예측하기 위해 support vector regression (SVR)이 사용되었다. 사전에 구축된 라이브러리 안의 길이가 n 인 template과 구조를 알고 싶은 query 단백질 사이의 alignment는 n+2 차원의 input 벡터로 변환된다. Structural alignment가 가장 좋은 alignment로 가정되었고 SVR은 query 단백질과 template 단백질의 structural alignment과 profile-profile alignment 사이의 shift score를 예측하도록 training 되었다. 예측 정확도는 Pearson 상관계수로 측정되었다. Training 된 SVR은 실제의 shift score와 예측된 shift score 사이에 0.80의 Pearson 상관계수를 갖는 정도로 예측하였다.

  • PDF

Runoff Prediction from Machine Learning Models Coupled with Empirical Mode Decomposition: A case Study of the Grand River Basin in Canada

  • Parisouj, Peiman;Jun, Changhyun;Nezhad, Somayeh Moghimi;Narimani, Roya
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.136-136
    • /
    • 2022
  • This study investigates the possibility of coupling empirical mode decomposition (EMD) for runoff prediction from machine learning (ML) models. Here, support vector regression (SVR) and convolutional neural network (CNN) were considered for ML algorithms. Precipitation (P), minimum temperature (Tmin), maximum temperature (Tmax) and their intrinsic mode functions (IMF) values were used for input variables at a monthly scale from Jan. 1973 to Dec. 2020 in the Grand river basin, Canada. The support vector machine-recursive feature elimination (SVM-RFE) technique was applied for finding the best combination of predictors among input variables. The results show that the proposed method outperformed the individual performance of SVR and CNN during the training and testing periods in the study area. According to the correlation coefficient (R), the EMD-SVR model outperformed the EMD-CNN model in both training and testing even though the CNN indicated a better performance than the SVR before using IMF values. The EMD-SVR model showed higher improvement in R value (38.7%) than that from the EMD-CNN model (7.1%). It should be noted that the coupled models of EMD-SVR and EMD-CNN represented much higher accuracy in runoff prediction with respect to the considered evaluation indicators, including root mean square error (RMSE) and R values.

  • PDF

Multioutput LS-SVR based residual MCUSUM control chart for autocorrelated process

  • Hwang, Changha
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권2호
    • /
    • pp.523-530
    • /
    • 2016
  • Most classical control charts assume that processes are serially independent, and autocorrelation among variables makes them unreliable. To address this issue, a variety of statistical approaches has been employed to estimate the serial structure of the process. In this paper, we propose a multioutput least squares support vector regression and apply it to construct a residual multivariate cumulative sum control chart for detecting changes in the process mean vector. Numerical studies demonstrate that the proposed multioutput least squares support vector regression based control chart provides more satisfying results in detecting small shifts in the process mean vector.

Support vector regression을 응용한 barbaralane의 global potential energy surface 재구성

  • 류성옥;최성환;김우연
    • EDISON SW 활용 경진대회 논문집
    • /
    • 제3회(2014년)
    • /
    • pp.1-13
    • /
    • 2014
  • Potential Energy Surface(PES)를 양자 계산을 통해 알아내는 것은 화학 반응을 이해하는 데에 큰 도움이 된다. 이를테면 Transition State(TS)의 configuration을 알 수 있고, 따라서 reaction path와 활성화 에너지 값을 예측하여, 진행시키고자 하는 화학반응의 이해를 도울 수 있다. 하지만 PES를 그리기 위해서는 해당 분자의 다양한 configuration에 대한 singlet point energy 계산이 필요하기 때문에, 계산적인 측면에서 많은 비용을 요구한다. 따라서 product와 reactant의 구조와 같은 critical point의 정보를 이용하여 최소한의 configuration을 sampling하여 전체 PES를 재구성하는 기계학습 알고리즘을 개발하여 다차원 PES 상에서의 화학반응의 예측을 가능하게 하고자 한다. 본 연구에서는 Barbaralane의 두 안정화 된 구조의 critical point로 하여 이 주변을 random normal distribution하여, B3LYP/6-31G(d) level의 DFT 계산을 통해 relaxed scanning하여 구조와 에너지를 구하였으며, 이 정보를 Support Vector Regression(SVR) 알고리즘을 적용하여 PES를 재구현하였으며, 반응경로와 TS의 구조 그리고 활성화 에너지를 구하였다. 또한 본 기계학습 알고리즘을 바닥상태에서 일어나는 반응이 아닌, 들뜬 상태와 전자 구조가 변하는 화학반응, avoid crossing, conical intersection과 같은 Non-adiabatic frame에서 일어나는 현상에 적용 가능성을 논하고자 한다.

  • PDF

Estimation of residual stress in welding of dissimilar metals at nuclear power plants using cascaded support vector regression

  • Koo, Young Do;Yoo, Kwae Hwan;Na, Man Gyun
    • Nuclear Engineering and Technology
    • /
    • 제49권4호
    • /
    • pp.817-824
    • /
    • 2017
  • Residual stress is a critical element in determining the integrity of parts and the lifetime of welded structures. It is necessary to estimate the residual stress of a welding zone because residual stress is a major reason for the generation of primary water stress corrosion cracking in nuclear power plants. That is, it is necessary to estimate the distribution of the residual stress in welding of dissimilar metals under manifold welding conditions. In this study, a cascaded support vector regression (CSVR) model was presented to estimate the residual stress of a welding zone. The CSVR model was serially and consecutively structured in terms of SVR modules. Using numerical data obtained from finite element analysis by a subtractive clustering method, learning data that explained the characteristic behavior of the residual stress of a welding zone were selected to optimize the proposed model. The results suggest that the CSVR model yielded a better estimation performance when compared with a classic SVR model.