• 제목/요약/키워드: 서포트 벡터 머신 회귀

검색결과 62건 처리시간 0.034초

머신러닝 기법을 이용한 대설피해 예측 및 적합성 검토 (Prediction of Snow Damage Using Machine Learning Technique)

  • 이형주;정건희
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2020년도 학술발표회
    • /
    • pp.192-192
    • /
    • 2020
  • 취약성 분석의 결과로 폭설에 의한 기후노출은 현재에는 강원권이 가장 취약한 것으로 나타났다. 그러나 미래에는 강원권, 충청권, 호남권을 연결하는 축으로 취약지역이 확대될 것으로 전망된다. 본 연구에서는 다양한 머신러닝 기법을 이용하여 대설피해 예측을 실시하였다. 머신러닝 기법으로는 로지스틱회귀모형, 서포트벡터 머신, 의사결정트리 모형을 적용하였다. 종속변수로 대설피해액 자료를 이용하였고, 독립변수로 기상관측자료, 사회·경제적 요소를 사용하였다. 결과적으로 기존에 사용했던 다중회귀모형과 머신러닝 기법으로 예측한 예측력을 비교 및 분석하였고, 예측력이 가장 높은 머신러닝 기법을 제시하였다. 본 연구에서 대설피해 예측을 위해 사용된 예측력이 가장 높은 기법을 활용하여 대설피해를 예측한다면, 미래에 전국적으로 확대될 대설피해에 대해 효과적으로 대비할 수 있을 것으로 기대된다.

  • PDF

유전 알고리즘 기반의 서포트 벡터 회귀를 이용한 소프트웨어 비용산정 (Estimation of software project effort with genetic algorithm and support vector regression)

  • 권기태;박수권
    • 정보처리학회논문지D
    • /
    • 제16D권5호
    • /
    • pp.729-736
    • /
    • 2009
  • 소프트웨어 공학에서 정확한 개발 비용 예측은 성공적인 개발 프로젝트를 위한 필수적인 요소로, 현재까지 많은 소프트웨어 비용산정을 위한 모델들이 개발되어 왔다. 전통적인 통계적 기법부터 기계학습을 적용한 알고리즘까지 다양한 분야의 아이디어를 접목하고 있다. 본 논문에서는 소프트웨어 개발 비용 예측을 위한 방법으로 유전 알고리즘과 서포트 벡터 머신의 회귀모델인 서포트 벡터 회귀를 결합한 GA-SVR 모델을 제안한다. 제안된 모델은 기존의 연구에 비해 향상된 결과를 보이고 있다.

다중선형회귀경험식과 머신러닝모델의 2차원 횡 분산계수 예측성능 평가 (Performance Evaluation of Multilinear Regression Empirical Formula and Machine Learning Model for Prediction of Two-dimensional Transverse Dispersion Coefficient)

  • 이선미;박인환
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.172-172
    • /
    • 2022
  • 분산계수는 하천에서 오염물질의 혼합능을 파악할 수 있는 대표적인 인자이다. 특히 하수처리장 방류수 혼합예측과 같이 횡 방향 혼합에 대한 예측이 중요한 경우, 하천의 지형적, 수리학적 특성을 고려한 2차원 횡 분산계수의 결정이 필요하다. 2차원 횡 분산계수의 결정을 위해 기존 연구에서는 추적자실험결과로부터 경험식을 만들어 횡 분산계수 산정에 사용해왔다. 회귀분석을 통한 경험식 산정을 위해서는 충분한 데이터가 필요하지만, 2차원 추적자 실험 건수가 충분치 않아 신뢰성 높은 경험식 산정이 어려운 상황이다. 따라서 본 연구에서는 SMOTE기법을 이용하여 횡분산계수 실험데이터를 증폭시켜 이로부터 횡 분산계수 경험식을 산정하고자 한다. 또한 다중선형회귀분석을 통해 도출된 경험식의 한계를 보완하기 위해 다양한 머신러닝 기법을 적용하고, 횡 분산계수 산정에 적합한 머신러닝 기법을 제안하고자 한다. 기존 추적자실험 데이터로부터 하폭 대 수심비, 유속 대 마찰유속비, 횡 분산계수 데이터 셋을 수집하였으며, SMOTE 알고리즘의 적용을 통해 회귀분석과 머신러닝 기법 적용에 필요한 데이터그룹을 생성했다. 새롭게 생성된 데이터 셋을 포함하여 다중선형회귀분석을 통해 횡 분산계수 경험식을 결정하였으며, 새로 제안한 경험식과 기존 경험식에 대한 정확도를 비교했다. 또한 다중선형회귀분석을 통해 결정된 경험식은 횡 분산계수 예측범위에 한계를 보였기 때문에 머신러닝기법을 적용하여 다중선형회귀분석에 대한 예측성능을 평가했다. 이를 위해 머신러닝 기법으로서 서포트 벡터 머신 회귀(SVR), K근접이웃 회귀(KNN-R), 랜덤 포레스트 회귀(RFR)를 활용했다. 세 가지 머신러닝 기법을 통해 도출된 횡 분산계수와 경험식으로부터 결정된 횡 분산계수를 비교하여 예측 성능을 비교했다. 이를 통해 제한된 실험데이터 셋으로부터 2차원 횡 분산계수 산정을 위한 데이터 전처리 기법 및 횡 분산계수 산정에 적합한 머신러닝 절차와 최적 학습기법을 도출했다.

  • PDF

Support Vector Machines를 이용한 교각주위 국부세굴 예측 (Prediction of Local Scour around Bridge Piers using Support Vector Machines)

  • 최성욱;최성욱
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2016년도 학술발표회
    • /
    • pp.57-61
    • /
    • 2016
  • 교각 주위에서의 국부세굴은 교각을 지나는 유체의 복잡한 흐름에 의해 발생한다. 이를 해석하기 위하여 많은 난류모형을 이용한 실내실험 및 수치실험을 수행하였으나 발생하는 와류를 하천 규모에서 전부 계산하기는 매우 어려운 문제다. 따라서 국부세굴 관련으로 최대 관심사인 최대 세굴심은 인공지능 기술에 근거한 다양한 기법을 적용해 계산하여 예측하기도 한다. 본 연구에서는 기계학습 분야 중 하나인 서포트 벡터 머신 (Support Vector Machines)을 이용하여 교각주위 국부세굴을 예측하였다. SVM은 본래 초평면을 이용하여 데이터를 분류시키는 기법이나 Vapnik(1995)이 제안한 ${\varepsilon}$ 서포트 벡터 회귀 (${\varepsilon}$-support vector regression)방법을 통해 회귀분석에도 활용할 수 있게 되었다. 학습을 위해 Charbert and Engeldinger (1956), Shen et al. (1969), Jain and Fischer (1979), 그리고 Dey et al. (1995)의 실험 자료를 이용하였고 검증을 위해 Yanmaz and Altinbilek (1991)의 실험 자료를 이용하였다. 커널함수로는 다항식 함수와 방사 기저 함수를 이용하였고 각 계수는 적합한 값을 찾기 위해 시행착오법을 사용하였다. 민감도 분석을 통해 각 계수들 중 ${\varepsilon}$의 변화가 결과에 가장 민감하게 변화를 일으키는 것을 확인하였고 검증 결과 SVM가 충분히 국부세굴을 잘 예측하는 것을 확인하였다.

  • PDF

딥러닝을 이용한 대설피해액 예측 및 개선방안 제안 (Predicting Snow Damage and Suggesting Improvement Plans Using Deep Learning)

  • 이형주;정건희
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.485-485
    • /
    • 2021
  • 최근 세계적인 기상이변으로 자연재해의 발생빈도 증가는 물론 이로 인한 피해가 점차 다양화 및 대형화되어 가고 있는 추세이다. 재난으로 인한 피해는 발생지역 피해뿐만 아니라 국가 경제 전반에 큰 영향을 미치는 특징이 있다. 우리나라의 자연재해 중 대설은 다른 자연재해에 비해 발생빈도는 낮지만 광역적인 피해를 유발하며, 피해 면적에 비해 피해액 규모가 크다. 또한 현재에는 강원권이 가장 취약한 것으로 취약성 분석 결과에서 보여주지만, 미래에는 강원권, 충청권, 호남권을 연결하는 축으로 취약지역이 확대될 것으로 전망된다. 본 연구에서는 현재 사회 전반에서 다양하게 활용되고 있는 머신러닝 기법을 이용하여 우리나라 대설피해액을 예측하는 대설피해 예측모형을 개발하고자 하였다. 머신러닝 기법으로는 랜덤포레스트, 서포트 벡터 머신, 인공신경망 기법을 이용하였고, 모형에 사용한 변수는 기상관측자료, 사회·경제적 요소 등을 활용하여 모형을 개발하였다. 결과적으로 기존연구에서 다중회귀모형을 이용하여 개발된 예측모형과 본 연구에서 3개의 머신러닝 기법으로 개발된 예측모형의 예측력을 비교 분석하였고, 예측력이 가장 높은 모형을 제시하였다. 본 연구결과를 활용하여 모형의 개선 및 데이터 품질 개선이 이루어진다면 향후 대설피해에 대한 개략적인 대비가 가능할 것으로 기대된다.

  • PDF

서포트벡터머신을 이용한 교육시설 초기 공사비 예측에 관한 연구 (A Study on Predicting Construction Cost of Educational Building Project at early stage Using Support Vector Machine Technique)

  • 신재민;김광희
    • 교육녹색환경연구
    • /
    • 제11권3호
    • /
    • pp.46-54
    • /
    • 2012
  • The accuracy of cost estimation at an early stage in school building project is one of the critical factors for successful completion. So various of techniques are developed to predict the construction cost accurately and expeditely. Among the techniques, Support Vector Machine(SVM) has an excellent ability for generalization performance. Therefore, the purpose of this study is to construct the prediction model for construction cost of educational building project using support vector machine technique. And to verify the accuracy of prediction model for construction cost. The performance data used in this study are 217 school building project cost which have been completed from 2004 to 2007 in Gyeonggi-Do, Korea. The result shows that average error rate was 7.48% for SVM prediction model. So using SVM model on predicting construction cost of educational building project will be a considerably effective way at the early project stage.

마케팅 데이터를 대상으로 중요 통계 예측 기법의 정확성에 대한 비교 연구 (A Comparative Study on the Accuracy of Important Statistical Prediction Techniques for Marketing Data)

  • 조민호
    • 한국전자통신학회논문지
    • /
    • 제14권4호
    • /
    • pp.775-780
    • /
    • 2019
  • 미래를 예측하는 기법은 통계에 기반을 둔 것과 딥러닝에 기반을 둔 기술로 분류할 수 있다. 그중 통계에 기반을 둔 것이 간단하고 정확성이 높아서 많이 사용된다. 하지만 실무자들은 많은 분석기법의 올바른 사용에 어려움이 많다. 이번 연구에서는 마케팅에 관련된 데이터에 다항로지스틱회귀, 의사결정나무, 랜덤포레스트, 서포트벡터머신, 베이지안 추론을 적용하여 예측의 정확성을 비교하였다. 동일한 마케팅 데이터를 대상으로 하였고, R을 활용하여 분석을 진행하였다. 마케팅 분야의 데이터 특성을 반영한 다양한 기법의 예측 결과가 실무자들에게 좋은 참고가 될 것으로 생각한다.

통계기법 및 기계학습 기법을 이용한 우리나라 대설피해액 예측 및 적용성 검토 (Predicting and Reviewing the Amount of Snow Damage in Korea using Statistical and Machine Learning Techniques)

  • 이형주;이근우;장현빈;정건희
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.384-384
    • /
    • 2022
  • 과거의 우리나라 대설피해 양상을 살펴보면 지역적으로 집중되어 피해가 발생하는 것이 특징이다. 그러나 현재는 전국적으로 대설피해가 가중되는 추세이며, 이에 따라 대설피해에 대비 가능한 대책의 강구가 필요한 실정이다. 그러나 피해 발생 시 정확한 피해 예측으로 사전에 재난을 대비가 가능한 수준의 연구는 미흡한 실정이다. 따라서 본 연구에서는 다양한 통계기법과 기계학습 기법을 이용하여 대설로 인해 발생한 피해액을 개략적으로 예측이 가능한 모형을 개발하고자 하였다. 대설피해액 예측 모형은 다중회귀분석, 서포트 벡터 머신, 인공신경망 기법, 랜덤포레스트 기법을 이용하여 총 4가지 기법으로 개발하였으며, 독립변수로 사회·경제적 요소, 기상요소를 사용하였고, 종속변수로는 1994년부터 2020년까지 발생한 대설피해 이력의 대설피해액을 사용하였다. 결과적으로 4가지 예측 모형의 예측력 검증 및 기법 간의 예측력을 비교하여 개발한 모형의 적용성을 검토하였다. 본 연구 결과에서 제시한 모형의 개선방안 및 업데이트 방안을 참고하여 후속 연구가 진행된다면 미래에 전국적으로 확대될 대설피해에 대한 대비가 가능할 것으로 기대되며 복구비 및 예방비 투자의 지역적 우선순위를 분석하여 선제적인 대비가 가능할 것으로 판단된다.

  • PDF

머신러닝을 사용한 탄성파 자료 보간법 기술 연구 동향 분석 (Research Trend analysis for Seismic Data Interpolation Methods using Machine Learning)

  • 배우람;권예지;하완수
    • 지구물리와물리탐사
    • /
    • 제23권3호
    • /
    • pp.192-207
    • /
    • 2020
  • 탄성파 탐사를 수행할 때 경제적, 환경적 제약 또는 탐사 장비의 문제 등에 의해 탄성파 자료의 일부가 규칙적 또는 불규칙적으로 손실되는 경우가 발생하게 된다. 이러한 자료 손실은 탄성파 자료 처리와 해석 결과에 부정적인 영향을 주기 때문에 사라진 탄성파 자료를 복원할 필요가 있다. 탄성파 자료 복원을 위해 재탐사 또는 추가적인 탐사를 진행하는 경우 시간적, 경제적 비용이 발생하기 때문에, 많은 연구자들이 사라진 탄성파 자료를 정확히 복원하기 위한 보간 기법 연구를 진행해왔다. 최근에는 머신러닝 기술 발달에 따라 머신러닝 기법을 활용한 연구들이 진행되고 있고, 다양한 머신러닝 기술들 중에서도 서포트 벡터 회귀, 오토인코더, 유넷, 잔차넷, 생성적 적대 신경망 등의 알고리즘을 활용한 탄성파 자료의 보간 연구가 활발하게 진행되고 있다. 이 논문에서는 이러한 연구들을 조사하고 분석하여 복잡한 신경망 모델뿐 아니라 상대적으로 구조가 간단한 서포트 벡터 회귀 모델을 통해서도 뛰어난 보간 결과를 얻을 수 있다는 것을 확인했다. 추후 머신러닝 기법들을 사용하는 탄성파 자료 보간 연구들에서 오픈소스로 공개된 실제 자료를 이용하며 데이터 증식, 전이학습, 기존 기법을 이용한 규제 등의 기술을 활용하면 탄성파 자료 보간 성능을 향상시킬 수 있을 것으로 기대된다.

비선형 반복 패턴과 스펙트럼 분석을 이용한 집중-비집중 분류기의 성능 평가 (Performance Evaluation of Attention-inattetion Classifiers using Non-linear Recurrence Pattern and Spectrum Analysis)

  • 이지은;유선국;이병채
    • 감성과학
    • /
    • 제16권3호
    • /
    • pp.409-416
    • /
    • 2013
  • 집중은 관련된 사건을 선택적으로 주의하고, 관련 없는 사건을 무시하는 인간의 중요한 인지 기능중의 하나이다. 인간의 집중 능력을 관리 이용하는 컴퓨터 기반 장치에 있어서 집중과 비집중 상태를 구분하는 것은 필수적으로 요구되는 조건이다. 본 논문에서는, 뇌파신호로부터 분류기의 입력으로 사용되는 특징을 효율적으로 추출하기 위하여 비선형 반복 패턴 분석기법과 스펙트럼 분석 기법을 새로이 결합하였고(13개 특징 추출), 서포트벡터머신, 역전파 알고리즘, 선형분리, 로지스틱 회귀 분류 기반 분류기들을 포함하는 집중-비집중 분류기들의 성능을 분석하였다. 그중에서 81 %의 정확도를 보이는 서포트벡터머신 분류기가 가장 좋은 성능을 보였다. 또한 스펙트럼 분석으로 추출한 특징만을 사용하였을 경우(76 % 정확도)가 비선형 분석 방법으로 추출한 특징만을 사용했을 경우(67 % 정확도)보다 좀 더 우수한 성능을 보였다. 비선형-스펙트럼 분석법을 복합 적용한 서포트벡터머신 분류기가 추후 집중 관련 장비 설계에 있어서 효율적으로 적용될 수 있을 것이다.

  • PDF