• 제목/요약/키워드: 서포트 벡터기계

검색결과 107건 처리시간 0.026초

배깅 및 스태킹 기반 앙상블 기계학습법을 이용한 고성능 콘크리트 압축강도 예측모델 개발 (Development of a High-Performance Concrete Compressive-Strength Prediction Model Using an Ensemble Machine-Learning Method Based on Bagging and Stacking)

  • 곽윤지;고채연;곽신영;임승현
    • 한국전산구조공학회논문집
    • /
    • 제36권1호
    • /
    • pp.9-18
    • /
    • 2023
  • 고성능 콘크리트(HPC) 압축강도는 추가적인 시멘트질 재료의 사용으로 인해 예측하기 어렵고, 개선된 예측 모델의 개발이 필수적이다. 따라서, 본 연구의 목적은 배깅과 스태킹을 결합한 앙상블 기법을 사용하여 HPC 압축강도 예측 모델을 개발하는 것이다. 이 논문의 핵심적 기여는 기존 앙상블 기법인 배깅과 스태킹을 통합하여 새로운 앙상블 기법을 제시하고, 단일 기계학습 모델의 문제점을 해결하여 모델 예측 성능을 높이고자 한다. 단일 기계학습법으로 비선형 회귀분석, 서포트 벡터 머신, 인공신경망, 가우시안 프로세스 회귀를 사용하고, 앙상블 기법으로 배깅, 스태킹을 이용하였다. 결과적으로 본 연구에서 제안된 모델이 단일 기계학습 모델, 배깅 및 스태킹 모델보다 높은 정확도를 보였다. 이는 대표적인 4가지 성능 지표 비교를 통해 확인하였고, 제안된 방법의 유효성을 검증하였다.

부도 예측을 위한 앙상블 분류기 개발 (Developing an Ensemble Classifier for Bankruptcy Prediction)

  • 민성환
    • 한국산업정보학회논문지
    • /
    • 제17권7호
    • /
    • pp.139-148
    • /
    • 2012
  • 분류기의 앙상블 학습은 여러 개의 서로 다른 분류기들의 조합을 통해 만들어진다. 앙상블 학습은 기계학습 분야에서 많은 관심을 끌고 있는 중요한 연구주제이며 대부분의 경우에 있어서 앙상블 모형은 개별 기저 분류기보다 더 좋은 성과를 내는 것으로 알려져 있다. 본 연구는 부도 예측 모형의 성능개선에 관한 연구이다. 이를 위해 본 연구에서는 단일 모형으로 그 우수성을 인정받고 있는 SVM을 기저 분류기로 사용하는 앙상블 모형에 대해 고찰하였다. SVM 모형의 성능 개선을 위해 bagging과 random subspace 모형을 부도 예측 문제에 적용해 보았으며 bagging 모형과 random subspace 모형의 성과 개선을 위해 bagging과 random subspace의 통합 모형을 제안하였다. 제안한 모형의 성과를 검증하기 위해 실제 기업의 부도 예측 데이터를 사용하여 실험하였고, 실험 결과 본 연구에서 제안한 새로운 형태의 통합 모형이 가장 좋은 성과를 보임을 알 수 있었다.

일기 예보와 예측 일사 및 일조를 이용한 태양광 발전 예측 (Photovoltaic Generation Forecasting Using Weather Forecast and Predictive Sunshine and Radiation)

  • 신동하;박준호;김창복
    • 한국항행학회논문지
    • /
    • 제21권6호
    • /
    • pp.643-650
    • /
    • 2017
  • 무한한 에너지원을 가진 태양광 발전은 기상 에 의존하기 때문에 발전량이 매우 간헐적이다. 따라서 태양광 발전량의 불확실성을 줄이고 경제성을 향상시키기 위하여 정확한 발전량 예측기술이 필요하다. 기상청은 3일간 기상정보를 예보하지만 태양광 발전 예측에 높은 상관관계가 있는 일조량과 일사량은 예보하지 않는다. 본 연구에서는 기상청에서 3일간 예보하는 기상요소인 기온, 강수량, 풍향, 풍속, 습도, 운량 등을 이용하여, 일조 및 일사량을 예측하였으며, 예측된 일사 및 일조량을 이용하여, 실시간 태양광 발전량을 예측하는 딥러닝 모델을 제안하였다. 결과로서 예측된 기상요소로 발전량을 예측하는 모델보다 제안 모델이 MAE, RMSE, MAPE 등의 오차율 지표에서 더 좋은 결과를 보여주었다. 또한, 기계 학습의 한 종류인 서포트 벡터 머신을 사용하는 것보다 DNN을 사용하는 것이 더 낮은 오차율 지표를 보여주었다.

이산 월시 변환이 메타모델을 사용한 유전 알고리즘에 미치는 영향 (Effect of Discrete Walsh Transform in Metamodel-assisted Genetic Algorithms)

  • 유동필;김용혁
    • 한국융합학회논문지
    • /
    • 제10권12호
    • /
    • pp.29-34
    • /
    • 2019
  • 유전 알고리즘에서 해의 적합도를 계산하는 시간이 오래 걸린다면 메타모델을 만드는 것은 필수적이다. 이에 메타모델의 성능을 높여 유전 알고리즘이 더 좋을 해를 찾게 하기 위한 연구가 진행되어 왔다. 본 연구에서 우리는 이산적인 도메인에서 이산 월시 변환을 사용해 메타모텔의 성능을 높이고자 하였다. 이산 월시 변환을 통해 해의 기저를 변환했고 변환된 해를 사용해 메타모델을 만들었다. 의사-불리언 함수의 대표적인 함수인 NK 모형을 대상으로 실험했고 제안된 모델의 성능에 대한 실증적인 증거를 제공했다. 제안된 모델을 사용해 유전 알고리즘을 수행했을 때, 유전알고리즘이 더 좋은 해를 찾음을 확인했다. 특히, 선행 연구인 유사도 함수를 이산적인 도메인에 적합하게 수정한 방사기저 함수 네트워크보다 좋은 성능을 보였다.

N-Gram 증강 나이브 베이스를 이용한 정확한 침입 탐지 (Accurate Intrusion Detection using n-Gram Augmented Naive Bayes)

  • 강대기
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2008년도 추계종합학술대회 B
    • /
    • pp.285-288
    • /
    • 2008
  • 기계 학습을 응용한 많은 침입 탐지 시스템들은 n-그램 접근 방법을 주로 쓰고 있다. 그러나, n-그램 접근 방법은 주어진 시퀀스에서 획득한 n-그램들이 서로 겹치는 문제들을 가지고 있다. 본 연구에서는 이러한 문제들을 해결하기 위해, n-그램 증강 나이브 베이스 (n-gram augmented naive Bayes) 알고리즘을 침입 시퀀스의 분류에 적용하였다. 제안된 시스템의 성능을 평가하기 위해 n-그램 특징들을 사용하는 일반 나이브 베이스 (naive Bayes) 알고리즘과 서포트 벡터 머신 (support vector machines) 알고리즘과 본 연구에서 제안한 n-그램 증강 나이브 베이스 알고리즘을 비교하였다. 뉴 멕시코 대학의 벤치마크 데이터에 적용해 본 결과에 따르면, n-그램 증강 방법이, n-그램이 나이브 베이스에 직접 적용되는 경우(예: n-그램 특징을 사용하는 일반 나이브 베이스), 생기는 독립성 가정에 대한 위배 문제도 해결하면서, 동시에 n-그램 특징을 사용하는 일반 나이브 베이스보다 더 정확하며, n-그램 특징을 사용하는 SVM과 필적할만한 수준의 침입 탐지기를 생성해 내었다.

  • PDF

SVM 워크로드 분류기를 통한 자동화된 데이터베이스 워크로드 식별 (Automatic Identification of Database Workloads by using SVM Workload Classifier)

  • 김소연;노홍찬;박상현
    • 한국콘텐츠학회논문지
    • /
    • 제10권4호
    • /
    • pp.84-90
    • /
    • 2010
  • 데이터베이스 시스템의 응용분야가 데이터웨어하우징에서 전자상거래에 이르기까지 광범위해지면서 데이터베이스 시스템이 대형화되었다. 이로 인해 데이터베이스 시스템의 성능 향상을 위한 튜닝이 중요한 논점이 되었다. 데이터베이스 시스템의 튜닝은 워크로드 특성을 고려하여 수행할 필요가 있다. 그러나 복합적인 데이터베이스 환경에서 워크로드를 식별하기는 어려우므로 자동적인 식별 방법이 요구된다. 본 논문에서는 데이터베이스 워크로드를 자동적으로 식별하는 SVM 워크로드 분류기를 제안한다. TPC-C와 TPC-W 성능 평가에서 자원할당 파라미터 변경에 따른 워크로드 데이터를 수집하여 SVM을 통해 분류 한다. SVM의 커널별 커널 파라미터와 오류 허용 임계치 값인 C의 조정을 통하여 최적의 SVM 워크로드 분류기를 선택한다. 제안한 SVM 워크로드 분류기와 Decision Tree, Naive Bayes, Multilayer Perceptron, K-NN 분류기의 분류 성능을 비교한 결과, SVM 워크로드 분류기가 다른 기계 학습 분류기보다 9% 이상 향상된 분류 성능을 보였다.

불균형적인 이항 자료 분석을 위한 샘플링 알고리즘들: 성능비교 및 주의점 (On sampling algorithms for imbalanced binary data: performance comparison and some caveats)

  • 김한용;이우주
    • 응용통계연구
    • /
    • 제30권5호
    • /
    • pp.681-690
    • /
    • 2017
  • 파산감지, 스팸메일 감지, 불량품 감지 등 일상생활에서 불균형적인 이항 분류 문제를 다양하게 접할 수 있다. 반응변수의 클래스의 비율이 상당히 불균형한 경우 이항 분류 모형의 예측 성능이 좋지 않다는 점은 이미 잘 알려진 사실이다. 이러한 문제점을 해결하기 위해 그 동안 오버 샘플링, 언더 샘플링, SMOTE와 같은 여러 샘플링 기법이 개발되어 왔다. 본 연구에서는 분류 모형으로 많이 사용되는 기계학습모형으로 로지스틱 회귀모형, Lasso, 랜덤포레스트, 부스팅, 서포트 벡터 머신을 위의 샘플링 기법들과 결합하여 사용했을 때의 예측 성능을 살펴보았다. 실질적인 예측 성능의 개선 여부를 확인하기 위해 네 개의 실제 자료를 분석하였다. 이와 더불어, 샘플링 방법이 사용될 때 주의해야 할 점에 대해서 강조하였다.

Support Vector Machines을 이용한 다중 클래스 문제 해결 (Solving Multi-class Problem using Support Vector Machines)

  • 고재필
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권12호
    • /
    • pp.1260-1270
    • /
    • 2005
  • 최근 기계학습 분야에서 커널머신을 이용한 대표적 학습기로 Support Vector Machines (SVM)이 주목 받고 있다. SVM은 통계적 학습이론에 기반하여 뛰어난 일반화 성능을 보여주며, 다양한 패턴인식 문제에 적용되고 있다. 그러나. SVM은 이진 분류기이므로 일반적인 다중 클래스 문제에 곧바로 적용할 수 없다. SVM을 다중 클래스 문제의 하나인 얼굴인식에 도입하기 위한 방법으로는, One-Per-Class와 All-Pairs가 대표적이다. 상기 두 방법은 다중 클래스 문제를 여러 개의 이진 클래스 문제로 분할하고, 이들을 다시 종합하여 최종 결정을 내리는 출력코딩이라는 일반적인 방법에 속한다. 본 논문에서는 이진 분류기인 SVM의 다중 클래스 분류기 확장 방안으로 출력코딩 방법론을 설명한다. 또한 출력코딩 방법론의 대표적인 이론적 기반인 ECOC(Ewor-Correcting Output Codes)를 근간으로 하는 새로운 출력코딩 방법들을 제안하고, 얼굴인식 실험을 통해 SVM을 기반 분류기로 사용할 경우의, 출력코딩 방법의 특성을 비교$\cdot$분석한다.

다중 클래스 SVM을 이용한 스마트폰 중독 자가진단 시스템 (Self-diagnostic system for smartphone addiction using multiclass SVM)

  • 피수영
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권1호
    • /
    • pp.13-22
    • /
    • 2013
  • 무선으로 응용 프로그램을 다운받아 실행하고 수많은 응용 프로그램들을 통신 접속이 없어도 실행이 가능하다는 점으로 인해 스마트폰 중독이 인터넷 중독보다 심각한 상태이지만 아직까지 스마트폰 중독과 관련된 연구가 부족한 상태이다. 한국정보화진흥원에서 개발한 스마트폰 중독 검사 척도인 S-척도는 문항수가 많아 응답자들이 진단 자체를 회피할 수도 있으며 인구통계학적 변인도 고려하지 않은 상태에서 체크한 문항들에 대한 총점만으로 중독여부를 진단하므로 정확하게 진단하는데 어려움이 있다. 따라서 본 논문에서는 인구통계학적 변인을 포함한 여러 문항들을 추가한 자료들을 대상으로 먼저 스마트폰 중독에 영향을 미치는 중요한 요인들을 추출해 보았다. 추출한 축소문항을 대상으로 데이터마이닝기법 중 하나인 신경망을 이용하여 분류를 하였다. 신경망 학습알고리즘 중에서 BP학습 알고리즘과 다중 SVM을 이용하여 학습을 시켜 비교, 분석 해 본 결과 다중 SVM의 학습율이 조금 더 높게 나타났다. 본 논문에서 제안한 다중 SVM을 이용하여 학습을 한 자가진단 시스템을 이용하면 자료들의 급격한 변화에 대해 뛰어난 적응성을 가지므로 빠른 시간 내에 자신의 중독여부를 정확하게 자가진단 할 수 있다.

조건부 상호정보를 이용한 분류분석에서의 변수선택 (Efficient variable selection method using conditional mutual information)

  • 안치경;김동욱
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권5호
    • /
    • pp.1079-1094
    • /
    • 2014
  • 상호정보 (mutual information)를 이용한 변수 선택법은 반응변수와 설명변수간의 선형적인 연관성뿐만 아니라 비선형적인 연관성을 감지하며, 설명변수 사이의 연관성도 고려하는 좋은 변수선택 방법이다. 하지만 고차원 자료에서 상호정보를 추정하기가 쉽지 않아 이에 대한 연구가 필요하다. Cai 등 (2009)은 조건부 상호정보를 이용한 전진선택법과 가지치기법을 이용하여 이러한 문제를 해결하였으며, 마이크로어레이 자료와 같은 고차원 자료에서 조건부 상호정보를 이용한 변수 선택법으로 선택된 변수들로 구성된 SVM의 분류 성능이 SVM-RFE 및 기존의 필터링 방법으로 선택된 변수들로 구성된 SVM의 분류 성능보다 뛰어남을 보였다. 하지만 조건부 상호정보를 추정할 때 사용된 Parzen window 방법은 변수의 수가 많아질수록 변수 선택 시간이 길어지는 단점으로 인해 이에 대한 보완이 필요하다. 본 논문에서는 조건부 상호정보 계산 시 필요한 설명변수의 분포를 다변량 정규분포로 가정함으로써 변수선택을 위한 계산시간을 단축시키며 동시에 변수선택의 성능을 향상시키고자 한다. 반면, 설명변수의 분포를 다변량 정규분포로 가정한다는 것은 강한 제약이 될 수 있으므로 이를 완화시킨 Edgeworth 근사를 이용한 조건부 상호정보 기반의 변수 선택법을 제안한다. 실증분석을 통해 본 논문에서 제안한 방법의 효율성을 살펴보았으며, 기존의 조건부 상호정보 기반 변수 선택법에 비해 계산 속도나 분류 성능 면에서 우수함을 보였다.