• 제목/요약/키워드: support vector machine(SVM)

검색결과 1,254건 처리시간 0.033초

대출심사의 예측 정확도 향상을 위한 방법 제안 (Proposing the Method for Improving the Forecast Accuracy of Loan Underwriting)

  • 양유영;박상성;신영근;장동식
    • 한국산학기술학회논문지
    • /
    • 제11권4호
    • /
    • pp.1419-1429
    • /
    • 2010
  • 외환위기 이후 본격적으로 시작된 외국계 대형 은행의 국내 진출 및 선진 금융상품의 수입은 국내 은행 산업 구조와 환경을 변화시키고 경쟁을 가속화시켰다. 앞으로 일어날 변화 및 추세에 대한 정확한 예측은 경쟁이 치열한 환경에서 국내의 은행이 생존하고 발전하기 위해 필수적인 요소이며 그 중에서도 대출 신청 고객에 대한 승인 여부에 대한 예측은 대출 상품이 은행 경영에 있어 가장 큰 비중을 차지하는 수익의 원천이자 신용 리스크 관리의 중심이 된다는 점에서 큰 의미가 있다. 따라서 본 논문에서는 대출 심사 결과의 예측 정확성을 높이기 위한 방법을 제시하고자 한다. 수행 단계로는 상관관계 분석과 특징선택 기법을 통해 대출승인 결과에 유의한 영향을 주는 예측변수들을 선별하고 선별된 변수로 2-Step 군집화 기법을 통해 고객을 군집화 하였다. 이후 각 군집에 LR, NN, SVM 기법을 활용하여 구축한 예측 모형을 적용하여 정확도가 가장 높은 모형을 찾아보았다. 최종적으로 기존 방식의 대출 심사 모형에 LR, NN, SVM 예측 모형을 적용했을 때 산출된 결과와 제안한 모형의 결과를 비교하여 예측의 정확도를 평가하였다.

복부생체전기신호를 이용한 운동 분석 시스템 개발 (Development of Exercise Analysis System Using Bioelectric Abdominal Signal)

  • 강경우;민철홍;김태선
    • 전자공학회논문지
    • /
    • 제49권11호
    • /
    • pp.183-190
    • /
    • 2012
  • 기존의 운동량 측정방법들은 가속도 센서나 GPS, 심장박동, 체온측정 등의 정보를 이용하였으나, 각기 측정방식 및 측정환경 등의 제한으로 인해 정확한 신체활동 측정 및 분석에 어려움이 있었다. 이러한 단점을 극복하기 위해 본 논문에서는, 운동 시 발생하는 생체전기신호를 이용하여 유산소운동은 물론 기존에 측정이 어려웠던 근력운동에 대한 분석도 가능한 시스템을 개발하였다. 운동을 분석하기 위해 두개의 전극이 부착된 허리벨트를 착용해 운동 중 복부에서 발생하는 생체전기신호를 기록했고, 측정된 생체전기신호는 각각 상체 움직임 및 근육활동을 대표할 수 있는 주파수 대역으로 분리한 후, 분리된 각 신호의 파워 값과 차분의 파워 값, 그리고 중간주파수 값들을 운동형태 구분을 위한 특징값으로 추출하였다. 일원분산분석과 다중비교 분석의 통계적 검증을 통하여 추출된 특징값들의 유의성을 검증하였고, 또한 SVM분류기를 이용하여 운동의 형태를 구분하였다. 여섯 가지의 세부운동들을 분류하기 위해 두 가지의 분류방법을 적용하였고, 그 결과 유산소운동과 근력운동으로 분류 시 100%, 유산소운동과 근력운동 및 복합운동으로 분류한 경우 92.7%의 구분율을 보이며 운동형태의 분류가 가능하였다. 또한 유산소운동 및 근력운동의 양을 각각 수치화하여 표현 가능하다. 본 시스템은 기존의 유산소운동 기반의 운동량 측정방식대비 추가적으로 근력운동의 분석이 가능해짐에 따라 보다 다양한 활동에 대해서도 분석이 가능하다.

머신러닝 기법을 활용한 터널 설계 시 시추공 내 암반분류에 관한 연구 (A study on the rock mass classification in boreholes for a tunnel design using machine learning algorithms)

  • 이제겸;최원혁;김양균;이승원
    • 한국터널지하공간학회 논문집
    • /
    • 제23권6호
    • /
    • pp.469-484
    • /
    • 2021
  • 터널 설계 시 지반조사를 통한 암반분류 결과는 공사기간 및 공사비 산출, 그리고 터널안정성 평가에 지대한 영향을 미친다. 국내에서 지금까지 완공된 3,526개소의 터널들의 설계 및 시공을 통해 관련 기술들은 지속적으로 발전되어 왔지만, 터널 설계 시 암질 및 암반등급을 보다 정확하게 평가하기 위한 방법에 대한 연구는 미미하여 평가자의 경험 및 주관에 따라 결과의 차이가 큰 경우가 적지 않다. 따라서 본 연구에서는 암석샘플에 대한 주관적 평가를 통한 기존의 인력에 의한 암반분류 대신, 최근 지반분야에서도 그 활용도가 급증하고 있는 머신러닝 알고리즘을 이용하여 시추조사에서 획득한 다양한 암석 및 암반정보를 분석하여 보다 신뢰성있는 RMR에 의한 암반분류 모델을 제시하고자 하였다. 국내 13개 터널을 대상으로 11개의 학습 인자(심도, 암종, RQD, 전기비저항, 일축압축강도, 탄성파 P파속도 및 S파 속도, 영률, 단위중량, 포아송비, RMR)를 선정하여 337개의 학습 데이터셋과 60개의 시험 데이터셋을 확보하였으며, 모델의 예측성능을 향상시키기 위해 6개의 머신러닝 알고리즘(DT, SVM, ANN, PCA & ANN, RF, XGBoost)과 각 알고리즘별 다양한 초매개변수(hyperparameter)를 적용하였다. 학습된 모델의 예측성능을 비교한 결과, DT 모델을 제외한 5개의 머신러닝 모델에서 시험데이터에 대한 RMR 평균절대오차 값이 8 미만으로 수렴되었으며, SVM 모델에서 가장 우수한 예측성능을 나타내었다. 본 연구를 통해 암반분류 예측에 대한 머신러닝 기법의 적용 가능성을 확인하였으며, 향후 다양한 데이터를 지속적으로 확보하여 예측모델의 성능을 향상시킨다면 보다 신뢰성 있는 암반 분류에 활용될 수 있을 것으로 기대된다.

입력변수 및 학습사례 선정을 동시에 최적화하는 GA-MSVM 기반 주가지수 추세 예측 모형에 관한 연구 (A Study on the Prediction Model of Stock Price Index Trend based on GA-MSVM that Simultaneously Optimizes Feature and Instance Selection)

  • 이종식;안현철
    • 지능정보연구
    • /
    • 제23권4호
    • /
    • pp.147-168
    • /
    • 2017
  • 오래 전부터 학계에서는 정확한 주식 시장의 예측에 대한 많은 연구가 진행되어 왔고 현재에도 다양한 기법을 응용한 예측모형들이 연구되고 있다. 특히 최근에는 딥러닝(Deep-Learning)을 포함한 다양한 기계학습기법(Machine Learning Methods)을 이용해 주가지수를 예측하려는 많은 시도들이 진행되고 있다. 전통적인 주식투자거래의 분석기법으로는 기본적 분석과 기술적 분석방법이 사용되지만 보다 단기적인 거래예측이나 통계학적, 수리적 기법을 응용하기에는 기술적 분석 방법이 보다 유용한 측면이 있다. 이러한 기술적 지표들을 이용하여 진행된 대부분의 연구는 미래시장의 (보통은 다음 거래일) 주가 등락을 이진분류-상승 또는 하락-하여 주가를 예측하는 모형을 연구한 것이다. 하지만 이러한 이진분류로는 추세를 예측하여 매매시그널을 파악하거나, 포트폴리오 리밸런싱(Portfolio Rebalancing)의 신호로 삼기에는 적합치 않은 측면이 많은 것 또한 사실이다. 이에 본 연구에서는 기존의 주가지수 예측방법인 이진 분류 (binary classification) 방법에서 주가지수 추세를 (상승추세, 박스권, 하락추세) 다분류 (multiple classification) 체계로 확장하여 주가지수 추세를 예측하고자 한다. 이러한 다 분류 문제 해결을 위해 기존에 사용하던 통계적 방법인 다항로지스틱 회귀분석(Multinomial Logistic Regression Analysis, MLOGIT)이나 다중판별분석(Multiple Discriminant Analysis, MDA) 또는 인공신경망(Artificial Neural Networks, ANN)과 같은 기법보다는 예측성과의 우수성이 입증된 다분류 Support Vector Machines(Multiclass SVM, MSVM)을 사용하고, 이 모델의 성능을 향상시키기 위한 래퍼(wrapper)로서 유전자 알고리즘(Genetic Algorithm)을 이용한 최적화 모델을 제안한다. 특히 GA-MSVM으로 명명된 본 연구의 제안 모형에서는 MSVM의 커널함수 매개변수, 그리고 최적의 입력변수 선택(feature selection) 뿐만이 아니라 학습사례 선택(instance selection)까지 최적화하여 모델의 성능을 극대화 하도록 설계하였다. 제안 모형의 성능을 검증하기 위해 국내주식시장의 실제 데이터를 적용해본 결과 ANN이나 CBR, MLOGIT, MDA와 같은 기존 데이터마이닝 기법들이나 인공지능 알고리즘은 물론 현재까지 가장 우수한 예측 성과를 나타내는 것으로 알려져 있던 전통적인 다분류 SVM 보다도 제안 모형이 보다 우수한 예측성과를 보임을 확인할 수 있었다. 특히 주가지수 추세 예측에 있어서 학습사례의 선택이 매우 중요한 역할을 하는 것으로 확인 되었으며, 모델의 성능의 개선효과에 다른 요인보다 중요한 요소임을 확인할 수 있었다.

Support Vector Regression에서 분리학습을 이용한 고객의 구매액 예측모형 (The Prediction of Purchase Amount of Customers Using Support Vector Regression with Separated Learning Method)

  • 홍태호;김은미
    • 지능정보연구
    • /
    • 제16권4호
    • /
    • pp.213-225
    • /
    • 2010
  • 본 연구에서는 기업의 마케팅 프로모션에 따른 반응고객의 구매액 예측을 위한 방법을 제시하고 SVR의 효과적인 학습방법을 제시하였다. 프로모션에 의한 고객의 구매액을 기반으로 고객을 5등급으로 등급화하고 각 등급 내에서 SVR을 적용하여 고객의 구매액을 예측하였다. 본 연구에서 제안하는 예측된 고객의 등급 내에서 고객 구매액을 예측하는 분리데이터 학습법이 프로모션에 반응한 모든 고객을 대상으로 구매액을 예측하는 전체데이터 학습법보다 높은 예측성과를 보여주었다. 일반적으로 세분화된 고객집단을 하나의 집단으로 보고 동일한 마케팅 전략을 제시하나 본 연구를 통해 구매액에 따라 등급화 된 고객의 등급 내에서 다시 고객의 거래 구매액을 예측하여 동일한 집단 내에서도 차별화된 마케팅 전략을 제시할 수 있는 기반을 제시하였다. 즉 동일한 등급에서도 고객 구매액에 따라 고객의 우선순위를 정할 수 있으며, 이는 마케팅 담당자가 프로모션을 제시할 고객을 선정할 때 유용한 정보로 활용될 수 있다.

Sentinel 위성영상과 기계학습을 이용한 국내산불 피해강도 탐지 (Wildfire Severity Mapping Using Sentinel Satellite Data Based on Machine Learning Approaches)

  • 심성문;김우혁;이재세;강유진;임정호;권춘근;김성용
    • 대한원격탐사학회지
    • /
    • 제36권5_3호
    • /
    • pp.1109-1123
    • /
    • 2020
  • 국토 대부분이 산림으로 구성되어 있는 대한민국은 매 년 많은 산불이 발생한다. 산불은 토양의 전단강도를 약화시켜 산사태에 취약한 토양층을 만들기도 하고, 수목의 복구가능여부에 따라 다른 계획 설립이 필요하기 때문에 산불피해면적 뿐만 아니라 피해강도에 대한 파악도 중요하다. 위성 원격탐사를 통한 산불피해강도 추정 연구가 많이 수행되어 왔으나, NDVI(Normalized Difference Vegetation Index)와 NBR(Normalized Burn Ratio) 등과 같은 단일 인자의 시계열 변화만을 이용하여 피해강도를 파악하기에는 한계가 있다. 본 연구에서는 Sentinel-1A SAR-C (Synthetic Aperture Radar-C)와 Sentinel-2A MSI(Multi Spectral Instrument)센서의 자료를 이용하여 기계학습방법을 통한 산불 피해강도 탐지 모델들을 제시하였다. 2017년 5월 삼척, 2019년 4월 강릉·동해, 2019년 4월 고성·속초 총 세개의 산불사례를 이용하여 RF(Random forest), LR(Logistic regression), SVM(Support Vector Machine)기계학습 모델을 구축하였다. 연구결과, random forest 모델이 82.3%의 총정확도로 가장 높은 성능을 보여주었다. 모델의 범용성 및 학습자료 민감도 확인을 위해 사례교차검증도 추가 시행하였는데, 그 결과 사례들의 시기적 차이에 의한 식생활력 및 재생도의 차이에 민감도가 높음을 확인하였다. 이는 추후 다양한 시공간적 사례를 추가할 시 개선이 될 것으로 보인다.

Fourier 변환 변이계수를 이용한 미디언 필터링 영상의 포렌식 판정 (Forensic Decision of Median Filtering Image Using a Coefficient of Variation of Fourier Transform)

  • 이강현
    • 전자공학회논문지
    • /
    • 제52권8호
    • /
    • pp.67-73
    • /
    • 2015
  • 디지털 영상의 배포에서, 위 변조자에 의해 영상이 변조되는 심각한 문제가 있다. 이러한 문제를 해결하기 위하여, 본 논문에서는 영상의 Fourier 변환 변이계수를 이용한 미디언 필터링 (Median Filtering: MF) 영상의 포렌식 판정 알고리즘을 제안한다. 제안된 알고리즘에서, 영상의 각 수평, 수직라인의 Fourier 변환 (Fourier Transform: FT)을 하고, 이웃 라인과의 변이계수를 기반으로 하여 MF 검출 (Median Filtering Detection: MFD)을 위한 10 Dim. 특징벡터를 정의한다. 이는 MF 검출기의 SVM (Support Vector Machine) 학습에 사용된다. 제안된 미디언 필터링 검출 스킴은 동일 10 Dim. 특징벡터의 MFR (Median Filter Residual)과 Rhee의 MF 검출 스킴과 비교하여 원영상, JPEG (QF=90), Down 스케일링 (0.9) 그리고 Up 스케일링 (1.1) 영상에서는 성능이 우수하며, Gaussian 필터링($3{\times}3$) 영상에서는 성능이 일부 높았다. 제안된 알고리즘은 성능평가 전체항목에서 민감도 (Sensitivity; TP: True Positive rate)와 1-특이도 (1-Specificity; FP: False Positive rate)에 의한 AUC (Area Under ROC (Receiver Operating Characteristic) Curve)가 모두 1에 수렴하여 'Excellent (A)' 등급임을 확인하였다.

온라인 주식 포럼의 핫토픽 탐지를 위한 감성분석 모형의 개발 (Development of Sentiment Analysis Model for the hot topic detection of online stock forums)

  • 홍태호;이태원;리징징
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.187-204
    • /
    • 2016
  • 소셜 미디어를 이용하는 사용자들이 직접 작성한 의견 혹은 리뷰를 이용하여 상호간의 교류 및 정보를 공유하게 되었다. 이를 통해 고객리뷰를 이용하는 오피니언마이닝, 웹마이닝 및 감성분석 등 다양한 연구분야에서의 연구가 진행되기 시작하였다. 특히, 감성분석은 어떠한 토픽(주제)를 기준으로 직접적으로 글을 작성한 사람들의 태도, 입장 및 감성을 알아내는데 목적을 두고 있다. 고객의 의견을 내포하고 있는 정보 혹은 데이터는 감성분석을 위한 핵심 데이터가 되기 때문에 토픽을 통한 고객들의 의견을 분석하는데 효율적이며, 기업에서는 소비자들의 니즈에 맞는 마케팅 혹은 투자자들의 시장동향에 따른 많은 투자가 이루어지고 있다. 본 연구에서는 중국의 온라인 시나 주식 포럼에서 사용자들이 직접 작성한 포스팅(글)을 이용하여 기존에 제시된 토픽들로부터 핫토픽을 선정하고 탐지하고자 한다. 기존에 사용된 감성 사전을 활용하여 토픽들에 대한 감성값과 극성을 분류하고, 군집분석을 통해 핫토픽을 선정하였다. 핫토픽을 선정하기 위해 k-means 알고리즘을 이용하였으며, 추가로 인공지능기법인 SOM을 적용하여 핫토픽 선정하는 절차를 제시하였다. 또한, 로짓, 의사결정나무, SVM 등의 데이터마이닝 기법을 이용하여 핫토픽 사전 탐지를 하는 감성분석을 위한 모형을 개발하여 관심지수를 통해 선정된 핫토픽과 탐지된 핫토픽을 비교하였다. 본 연구를 통해 핫토픽에 대한 정보 제공함으로써 최신 동향에 대한 흐름을 알 수 있게 되고, 주식 포럼에 대한 핫토픽은 주식 시장에서의 투자자들에게 유용한 정보를 제공하게 될 뿐만 아니라 소비자들의 니즈를 충족시킬 수 있을 것이라 기대된다.

자연어 처리 및 기계학습을 활용한 제조업 현장의 품질 불량 예측 방법론 (A Method for Prediction of Quality Defects in Manufacturing Using Natural Language Processing and Machine Learning)

  • 노정민;김용성
    • Journal of Platform Technology
    • /
    • 제9권3호
    • /
    • pp.52-62
    • /
    • 2021
  • 제조업 현장에서 제작 공정 수행 전 품질 불량 위험 공정을 예측하여 사전품질관리를 수행하는 것은 매우 중요한 일이다. 하지만 기존 엔지니어의 역량에 의존하는 방법은 그 제작공정의 종류와 수가 다양할수록 인적, 물리적 한계에 부딪힌다. 특히 원자력 주요기기 제작과 같이 제작공정이 매우 광범위한 도메인 영역에서는 그 한계가 더욱 명확하다. 본 논문은 제조업 현장에서 자연어 처리 및 기계학습을 활용하여 품질 불량 위험 공정을 예측하는 방법을 제시하였다. 이를 위해 실제 원자력발전소에 설치되는 주기기를 제작하는 공장에서 6년 동안 수집된 제작 기록의 텍스트 데이터를 활용하였다. 텍스트 데이터의 전처리 단계에서는 도메인 지식이 잘 반영될 수 있도록 단어사전에 Mapping 하는 방식을 적용하였고, 문장 벡터화 과정에서는 N-gram, TF-IDF, SVD를 결합한 하이브리드 알고리즘을 구성하였다. 다음으로 품질 불량 위험 공정을 분류해내는 실험에서는 k-fold 교차 검증을 적용하고 Unigram에서 누적 Trigram까지 여러 케이스로 나누어 데이터셋에 대한 객관성을 확보하였다. 또한, 분류 알고리즘으로 나이브 베이즈(NB)와 서포트 벡터 머신(SVM)을 사용하여 유의미한 결과를 확보하였다. 실험결과 최대 accuracy와 F1-score가 각각 0.7685와 0.8641로서 상당히 유효한 수준으로 나타났다. 또한, 수행해본 적이 없는 새로운 공정을 예측하여 현장 엔지니어들의 투표와의 비교를 통해서 실제 현장에 자연스럽게 적용할 수 있음을 보여주었다.

H.264 압축과 SVDD를 이용한 영상 감시 시스템에서의 비정상 집단행동 탐지 (Abnormal Crowd Behavior Detection via H.264 Compression and SVDD in Video Surveillance System)

  • 오승근;이종욱;정용화;박대희
    • 정보보호학회논문지
    • /
    • 제21권6호
    • /
    • pp.183-190
    • /
    • 2011
  • 감시카메라 환경에서 군중의 비정상 집단행동 탐지란 감시카메라로부터 유입되는 영상에서 다중 객체가 위험에 처한 상황을 신속하고 정확하게 탐지하는 분야를 말한다. 본 논문에서는 CCTV 등과 같은 감시카메라 환경에서 움직임 벡터와 SVDD를 이용하여 집단내의 비정상 상황을 탐지하는 프로토타입 시스템을 제안한다. 제안된 시스템은 H.264 압축과정에서의 움직임 벡터 정보를 이용하여 영상내의 움직임 정보를 추출 표현하였으며, 비정상 집단행동의 판별 문제를 실용적 차원의 단일 클래스 분류 문제로 재해석하여 단일 클래스 SVM의 대표적 모델인 SVDD를 탐지기로 설계하였다. 제안된 시스템은 H.264 압축 과정에서 얻어지는 움직임 벡터를 이용함으로써, 실시간성을 보장하며 SVDD의 점증적 갱신 학습 능력으로 인하여 비정상 집단행동 데이터베이스의 변화에도 능동적으로 적응할 수 있다. 공개적으로 사용 가능한 벤치마크 데이터 셋인 PETS 2009와 UMN을 이용하여 본 논문에서 제안한 비정상 집단행동 탐지 시스템의 성능을 실험적으로 검증한다.