• 제목/요약/키워드: regression algorithm

검색결과 1,044건 처리시간 0.021초

퍼지 최소 자승 선형회귀분석 알고리즘을 이용한 특수일 전력수요예측 (Load Forecasting for Holidays Using a Fuzzy Least Squares Linear Regression Algorithm)

  • 송경빈;구본석;백영식
    • 대한전기학회논문지:시스템및제어부문D
    • /
    • 제52권4호
    • /
    • pp.233-237
    • /
    • 2003
  • An accurate load forecasting is essential for economics and stability power system operation. Due to high relationship between the electric power load and the electric power price, the participants of the competitive power market are very interested in load forecasting. The percentage errors of load forecasting for holidays is relatively large. In order to improve the accuarcy of load forecasting for holidays, this paper proposed load forecasting method for holidays using a fuzzy least squares linear regression algorithm. The proposed algorithm is tested for load forecasting for holidays in 1996, 1997, and 2000. The test results show that the proposed algorithm is better than the algorithm using fuzzy linear regression.

다중선형회귀모형에서의 변수선택기법 평가 (Evaluating Variable Selection Techniques for Multivariate Linear Regression)

  • 류나현;김형석;강필성
    • 대한산업공학회지
    • /
    • 제42권5호
    • /
    • pp.314-326
    • /
    • 2016
  • The purpose of variable selection techniques is to select a subset of relevant variables for a particular learning algorithm in order to improve the accuracy of prediction model and improve the efficiency of the model. We conduct an empirical analysis to evaluate and compare seven well-known variable selection techniques for multiple linear regression model, which is one of the most commonly used regression model in practice. The variable selection techniques we apply are forward selection, backward elimination, stepwise selection, genetic algorithm (GA), ridge regression, lasso (Least Absolute Shrinkage and Selection Operator) and elastic net. Based on the experiment with 49 regression data sets, it is found that GA resulted in the lowest error rates while lasso most significantly reduces the number of variables. In terms of computational efficiency, forward/backward elimination and lasso requires less time than the other techniques.

유전알고리즘과 커널 부분최소제곱회귀를 이용한 반도체 공정의 가상계측 모델 개발 (Development of Virtual Metrology Models in Semiconductor Manufacturing Using Genetic Algorithm and Kernel Partial Least Squares Regression)

  • 김보건;염봉진
    • 산업공학
    • /
    • 제23권3호
    • /
    • pp.229-238
    • /
    • 2010
  • Virtual metrology (VM), a critical component of semiconductor manufacturing, is an efficient way of assessing the quality of wafers not actually measured. This is done based on a model between equipment sensor data (obtained for all wafers) and the quality characteristics of wafers actually measured. This paper considers principal component regression (PCR), partial least squares regression (PLSR), kernel PCR (KPCR), and kernel PLSR (KPLSR) as VM models. For each regression model, two cases are considered. One utilizes all explanatory variables in developing a model, and the other selects significant variables using the genetic algorithm (GA). The prediction performances of 8 regression models are compared for the short- and long-term etch process data. It is found among others that the GA-KPLSR model performs best for both types of data. Especially, its prediction ability is within the requirement for the short-term data implying that it can be used to implement VM for real etch processes.

다차원 평면 클러스터를 이용한 자기 구성 퍼지 모델링 (Self-Organizing Fuzzy Modeling Based on Hyperplane-Shaped Clusters)

  • 고택범
    • 제어로봇시스템학회논문지
    • /
    • 제7권12호
    • /
    • pp.985-992
    • /
    • 2001
  • This paper proposes a self-organizing fuzzy modeling(SOFUM)which an create a new hyperplane shaped cluster and adjust parameters of the fuzzy model in repetition. The suggested algorithm SOFUM is composed of four steps: coarse tuning. fine tuning cluster creation and optimization of learning rates. In the coarse tuning fuzzy C-regression model(FCRM) clustering and weighted recursive least squared (WRLS) algorithm are used and in the fine tuning gradient descent algorithm is used to adjust parameters of the fuzzy model precisely. In the cluster creation, a new hyperplane shaped cluster is created by applying multiple regression to input/output data with relatively large fuzzy entropy based on parameter tunings of fuzzy model. And learning rates are optimized by utilizing meiosis-genetic algorithm in the optimization of learning rates To check the effectiveness of the suggested algorithm two examples are examined and the performance of the identified fuzzy model is demonstrated via computer simulation.

  • PDF

Application of an Optimized Support Vector Regression Algorithm in Short-Term Traffic Flow Prediction

  • Ruibo, Ai;Cheng, Li;Na, Li
    • Journal of Information Processing Systems
    • /
    • 제18권6호
    • /
    • pp.719-728
    • /
    • 2022
  • The prediction of short-term traffic flow is the theoretical basis of intelligent transportation as well as the key technology in traffic flow induction systems. The research on short-term traffic flow prediction has showed the considerable social value. At present, the support vector regression (SVR) intelligent prediction model that is suitable for small samples has been applied in this domain. Aiming at parameter selection difficulty and prediction accuracy improvement, the artificial bee colony (ABC) is adopted in optimizing SVR parameters, which is referred to as the ABC-SVR algorithm in the paper. The simulation experiments are carried out by comparing the ABC-SVR algorithm with SVR algorithm, and the feasibility of the proposed ABC-SVR algorithm is verified by result analysis. Continuously, the simulation experiments are carried out by comparing the ABC-SVR algorithm with particle swarm optimization SVR (PSO-SVR) algorithm and genetic optimization SVR (GA-SVR) algorithm, and a better optimization effect has been attained by simulation experiments and verified by statistical test. Simultaneously, the simulation experiments are carried out by comparing the ABC-SVR algorithm and wavelet neural network time series (WNN-TS) algorithm, and the prediction accuracy of the proposed ABC-SVR algorithm is improved and satisfactory prediction effects have been obtained.

소프트웨어 비용산정을 위한 면역 알고리즘 기반의 서포트 벡터 회귀 (Support Vector Regression based on Immune Algorithm for Software Cost Estimation)

  • 권기태;이준길
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권7호
    • /
    • pp.17-24
    • /
    • 2009
  • 정보시스템에 대한 이용이 늘어남에 따라 소프트웨어 개발 요구와 개발 비용이 증가하게 되었다. 기존에는 통계적 알고리즘 기반의 회귀분석을 이용하여 소프트웨어 개발비용을 산정하였으나 오늘날은 기계학습 방법들이 많이 연구되고 있다. 본 논문에서는 기계학습 기술의 하나인 SVR를 사용하여 소프트웨어 비용을 산정하였고, 이 때 SVR에서 사용하는 파라미터들의 최적 조합을 면역계의 동작원리를 적용한 면역 알고리즘을 적용하여 최적 조합을 찾았다. 소프트웨어 비용산정을 위해 세대수, 기억세포수, 대립유전자수를 변경해 가면서 면역 알고리즘 기반의 SVR을 적용하였고, 그 실험 결과를 기존 연구된 다른 기계학습 방법과 비교 분석하였다.

병렬 유전자 프로그래밍을 이용한 Symbolic Regression (Symbolic regression based on parallel Genetic Programming)

  • 김찬수;한근희
    • 디지털융복합연구
    • /
    • 제18권12호
    • /
    • pp.481-488
    • /
    • 2020
  • 기호적 회귀분석 (Symbolic Regression)은 회귀분석에서 주어진 데이터에 대하여 종속변수와 독립변수들 사이의 관계를 설명할 수 있는 함수를 직접 생성하는 분석방법으로서 Genetic Programming 이 본 분야의 연구에 가장 선도적으로 적용되고 있으며, 고정된 모델로부터 매개변수들의 최적화를 추구하는 다른 회귀분석 알고리즘들에 비하여 해석이 가능한 모델을 직접 도출할 수 있다는 장점을 갖는다. 본 연구에서는 Coarse grained 병렬 모델에 기반한 Parellel Genetic Programming 을 이용한 symbolic regression 알고리즘을 제시하고 제시된 알고리즘을 PMLB 데이타에 적용하여 해당 알고리즘의 효용성을 분석하고자 한다.

유전알고리즘을 이용한 능형회귀모형의 검정 : 빈도별 홍수량의 지역분석을 대상으로 (Calibration of the Ridge Regression Model with the Genetic Algorithm:Study on the Regional Flood Frequency Analysis)

  • 성기원
    • 한국수자원학회논문집
    • /
    • 제31권1호
    • /
    • pp.59-69
    • /
    • 1998
  • 빈도별 홍수량의 지역분석을 위하여 유역의 지형특성을 독립변수로 이용하는 회귀모형을 검정하였다. 그런데 이들 독립변수들간의 상관관계가 존재할 경우 능형회귀모형이 이용되기도 하는 이 방법은 다중공선성 문제를 극복하는데 적합한 방법으로 알려져 있다. 능형회귀모형을 최적화하기 위해서는 조정변수가 포함되는 비용함수를 최소화하여야 한다. 본 연구에서는 이 최적화를 위하여 유전알고리즘을 이용하였다. 유전알고리즘은 자연 생물의 유전 및 진화과정을 모방한 추계학적 탐색방법을 말한다. 이러한 유전알고리즘을 이용하여 지역분석 모형을 검정한 결과 안정된 매개변수의 가중치를 얻을 수 있었다.

  • PDF

유전 알고리즘 기반의 서포트 벡터 회귀를 이용한 소프트웨어 비용산정 (Estimation of software project effort with genetic algorithm and support vector regression)

  • 권기태;박수권
    • 정보처리학회논문지D
    • /
    • 제16D권5호
    • /
    • pp.729-736
    • /
    • 2009
  • 소프트웨어 공학에서 정확한 개발 비용 예측은 성공적인 개발 프로젝트를 위한 필수적인 요소로, 현재까지 많은 소프트웨어 비용산정을 위한 모델들이 개발되어 왔다. 전통적인 통계적 기법부터 기계학습을 적용한 알고리즘까지 다양한 분야의 아이디어를 접목하고 있다. 본 논문에서는 소프트웨어 개발 비용 예측을 위한 방법으로 유전 알고리즘과 서포트 벡터 머신의 회귀모델인 서포트 벡터 회귀를 결합한 GA-SVR 모델을 제안한다. 제안된 모델은 기존의 연구에 비해 향상된 결과를 보이고 있다.

선형회귀모델의 변수선택을 위한 다중목적 유전 알고리즘과 응용 (Multi-objective Genetic Algorithm for Variable Selection in Linear Regression Model and Application)

  • 김동일;박정술;백준걸;김성식
    • 한국시뮬레이션학회논문지
    • /
    • 제18권4호
    • /
    • pp.137-148
    • /
    • 2009
  • 본 논문의 목적은 신뢰성 있는 선형회귀모델을 구축하기 위하여 후보독립변수 중 유효변수를 선택하는 알고리즘을 구현하는 것이다. 선형회귀모델을 구축하는데 있어서 데이터 상의 모든 후보독립변수를 포함하는 것은 모델의 통계적 유의성을 감소시킬 수 있으며, 차원의 저주(Curse of dimensionality)를 유발할 수 있고, 데이터의 개수보다 변수의 개수가 많을 경우 모델의 구축이 불가능한 문제점 등이 있다. 이와 같은 문제점을 해결하기 위하여 변수선택의 문제를 조합최적화의 문제로 보고 유전 알고리즘(Genetic Algorithm)을 활용하였다. 일반적으로 선형회귀모델의 통계적 유의성을 평가하는 대표적인 통계량으로는 종속변수에 대한 독립변수의 설명력을 나타내는 결정계수($R^2$), 회귀식의 통계적 유의성을 검정하는 F통계량, 회귀계수의 통계적 유의성을 검정하는 t통계량, 잔차의 표준오차 등이 있다. 모델의 통계적 유의성은 하나의 통계량으로 표현될 수 없으므로 다양한 기준을 고려한 다중목적식(Multi-objective function)을 가지는 유전 알고리즘을 설계하였다. 설계한 알고리즘의 성능평가를 위하여 다양한 조건을 가정한 시뮬레이션 데이터에 적용하였다. 그 결과 구축한 알고리즘이 유효변수를 판단함에 있어 기존의 대표적인 변수선택 알고리즘인 LARS(Least Angle Regression)에 비해 우수한 성능을 보임을 확인할 수 있었다. 또한, 주가 데이터를 이용한 포트폴리오 선택에 적용해 본 결과 우수한 응용문제 해결 능력이 있음을 확인할 수 있었다.