• 제목/요약/키워드: Time-series prediction

검색결과 890건 처리시간 0.024초

LSTM Networks 딥러닝 기법과 SWAT을 이용한 유량지속곡선 도출 및 평가 (A study on the derivation and evaluation of flow duration curve (FDC) using deep learning with a long short-term memory (LSTM) networks and soil water assessment tool (SWAT))

  • 최정렬;안성욱;최진영;김병식
    • 한국수자원학회논문집
    • /
    • 제54권spc1호
    • /
    • pp.1107-1118
    • /
    • 2021
  • 지구온난화로 인해 발생한 기후변화는 한반도의 홍수, 가뭄 등의 발생빈도를 증가시켰으며, 이로 인해 인적, 물적 피해가 증가한 것으로 나타났다. 수재해 대비 및 대응을 위해서는 국가 차원의 수자원 관리 계획 수립이 필요하며, 유역 단위 수자원 관리를 위해서는 장기간 관측된 유량 자료를 이용하여 도출된 유량지속곡선이 필요하다. 전통적으로 수자원 분야에서 유량지속곡선을 도출하기 위하여 물리적 기반의 강우-유출 모형이 많이 사용되고 있으며, 최근에는 데이터 기반의 딥러닝 기법을 이용한 유출량 예측 기법에 관한 연구가 진행된 바 있다. 물리적 기반의 모형은 수문학적으로 신뢰도 높은 결과를 도출할 수 있으나, 사용자의 높은 이해도가 요구되며, 모형 구동 시간이 오래 걸릴 수 있는 단점이 있다. 데이터 기반의 딥러닝 기법의 경우 입력 자료가 간단하며, 모형 구동 시간이 비교적 짧으나 입력 및 출력자료 간의 관계가 블랙박스로 처리되어 수리·수문학적 특성을 반영할 수 없는 단점이 있다. 본 연구에서는 물리적 기반 모형으로 국내외에서 적용성이 검증된 Soil Water Assessment Tool (SWAT)의 매개변수 보정(Calibration)을 통해 장기간의 결측치 없는 데이터를 산출하고, 이를 데이터 기반 딥러닝 기법인 Long Short-term Memory (LSTM)의 훈련(Training) 데이터로 활용하였다. 시계열 데이터 분석 결과 검·보정 전체 기간('07-'18) 동안 Nash-Sutcliffe Efficiency (NSE)와 적합도 비교를 위한 결정계수는 각각 0.04, 0.03 높게 도출되어 모형에서 도출된 SWAT의 결과가 LSTM보다 전반적으로 우수한 것으로 나타났다. 또한, 모형에서 도출된 연도별 시계열 자료를 내림차순하여 산정된 유량지속곡선과 관측유량 기반의 유량지속곡선과 비교한 결과 NSE는 SWAT과 LSTM 각각 0.95, 0.91로 나타났으며, 결정계수는 0.96, 0.92로 두 모형 모두 우수한 성능을 보였다. LSTM 모형의 경우 저유량 부분 모의의 정확도 개선이 필요하나, 방대한 입력 자료로 인해 모형 구축 및 구동 시간이 오래 걸리는 대유역과 입력 자료가 부족한 미계측 유역의 유량지속곡선 산정 등에 활용성이 높을 것으로 판단된다.

Hierarchical Attention Network를 이용한 복합 장애 발생 예측 시스템 개발 (Development of a complex failure prediction system using Hierarchical Attention Network)

  • 박영찬;안상준;김민태;김우주
    • 지능정보연구
    • /
    • 제26권4호
    • /
    • pp.127-148
    • /
    • 2020
  • 데이터 센터는 컴퓨터 시스템과 관련 구성요소를 수용하기 위한 물리적 환경시설로, 빅데이터, 인공지능 스마트 공장, 웨어러블, 스마트 홈 등 차세대 핵심 산업의 필수 기반기술이다. 특히, 클라우드 컴퓨팅의 성장으로 데이터 센터 인프라의 비례적 확장은 불가피하다. 이러한 데이터 센터 설비의 상태를 모니터링하는 것은 시스템을 유지, 관리하고 장애를 예방하기 위한 방법이다. 설비를 구성하는 일부 요소에 장애가 발생하는 경우 해당 장비뿐 아니라 연결된 다른 장비에도 영향을 미칠 수 있으며, 막대한 손해를 초래할 수 있다. 특히, IT 시설은 상호의존성에 의해 불규칙하고 원인을 알기 어렵다. 데이터 센터 내 장애를 예측하는 선행연구에서는, 장치들이 혼재된 상황임을 가정하지 않고 단일 서버를 단일 상태로 보고 장애를 예측했다. 이에 본 연구에서는, 서버 내부에서 발생하는 장애(Outage A)와 서버 외부에서 발생하는 장애(Outage B)로 데이터 센터 장애를 구분하고, 서버 내에서 발생하는 복합적인 장애 분석에 중점을 두었다. 서버 외부 장애는 전력, 냉각, 사용자 실수 등인데, 이와 같은 장애는 데이터 센터 설비 구축 초기 단계에서 예방이 가능했기 때문에 다양한 솔루션이 개발되고 있는 상황이다. 반면 서버 내 발생하는 장애는 원인 규명이 어려워 아직까지 적절한 예방이 이뤄지지 못하고 있다. 특히 서버 장애가 단일적으로 발생하지 않고, 다른 서버 장애의 원인이 되기도 하고, 다른 서버부터 장애의 원인이 되는 무언가를 받기도 하는 이유다. 즉, 기존 연구들은 서버들 간 영향을 주지 않는 단일 서버인 상태로 가정하고 장애를 분석했다면, 본 연구에서는 서버들 간 영향을 준다고 가정하고 장애 발생 상태를 분석했다. 데이터 센터 내 복합 장애 상황을 정의하기 위해, 데이터 센터 내 존재하는 각 장비별로 장애가 발생한 장애 이력 데이터를 활용했다. 본 연구에서 고려되는 장애는 Network Node Down, Server Down, Windows Activation Services Down, Database Management System Service Down으로 크게 4가지이다. 각 장비별로 발생되는 장애들을 시간 순으로 정렬하고, 특정 장비에서 장애가 발생하였을 때, 발생 시점으로부터 5분 내 특정 장비에서 장애가 발생하였다면 이를 동시에 장애가 발생하였다고 정의하였다. 이렇게 동시에 장애가 발생한 장비들에 대해서 Sequence를 구성한 후, 구성한 Sequence 내에서 동시에 자주 발생하는 장비 5개를 선정하였고, 선정된 장비들이 동시에 장애가 발생된 경우를 시각화를 통해 확인하였다. 장애 분석을 위해 수집된 서버 리소스 정보는 시계열 단위이며 흐름성을 가진다는 점에서 이전 상태를 통해 다음 상태를 예측할 수 있는 딥러닝 알고리즘인 LSTM(Long Short-term Memory)을 사용했다. 또한 단일 서버와 달리 복합장애는 서버별로 장애 발생에 끼치는 수준이 다르다는 점을 감안하여 Hierarchical Attention Network 딥러닝 모델 구조를 활용했다. 본 알고리즘은 장애에 끼치는 영향이 클 수록 해당 서버에 가중치를 주어 예측 정확도를 높이는 방법이다. 연구는 장애유형을 정의하고 분석 대상을 선정하는 것으로 시작하여, 첫 번째 실험에서는 동일한 수집 데이터에 대해 단일 서버 상태와 복합 서버 상태로 가정하고 비교분석하였다. 두 번째 실험은 서버의 임계치를 각각 최적화 하여 복합 서버 상태일 때의 예측 정확도를 향상시켰다. 단일 서버와 다중 서버로 각각 가정한 첫 번째 실험에서 단일 서버로 가정한 경우 실제 장애가 발생했음에도 불구하고 5개 서버 중 3개의 서버에서는 장애가 발생하지 않은것으로 예측했다. 그러나 다중 서버로 가정했을때에는 5개 서버 모두 장애가 발생한 것으로 예측했다. 실험 결과 서버 간 영향이 있을 것이라고 추측한 가설이 입증된 것이다. 연구결과 단일 서버로 가정했을 때 보다 다중 서버로 가정했을 때 예측 성능이 우수함을 확인했다. 특히 서버별 영향이 다를것으로 가정하고 Hierarchical Attention Network 알고리즘을 적용한 것이 분석 효과를 향상시키는 역할을 했다. 또한 각 서버마다 다른 임계치를 적용함으로써 예측 정확도를 향상시킬 수 있었다. 본 연구는 원인 규명이 어려운 장애를 과거 데이터를 통해 예측 가능하게 함을 보였고, 데이터 센터의 서버 내에서 발생하는 장애를 예측할 수 있는 모델을 제시했다. 본 연구결과를 활용하여 장애 발생을 사전에 방지할 수 있을 것으로 기대된다.

Hybrid CNN-LSTM 알고리즘을 활용한 도시철도 내 피플 카운팅 연구 (A Study on People Counting in Public Metro Service using Hybrid CNN-LSTM Algorithm)

  • 최지혜;김민승;이찬호;최정환;이정희;성태응
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.131-145
    • /
    • 2020
  • 산업혁신의 흐름에 발맞추어 다양한 분야에서 활용되고 있는 IoT 기술은 빅데이터의 접목을 통한 새로운 비즈니스 모델의 창출 및 사용자 친화적 서비스 제공의 핵심적인 요소로 부각되고 있다. 사물인터넷이 적용된 디바이스에서 누적된 데이터는 사용자 환경 및 패턴 분석을 통해 맞춤형 지능 시스템을 제공해줄 수 있어 편의 기반 스마트 시스템 구축에 다방면으로 활용되고 있다. 최근에는 이를 공공영역 혁신에 확대 적용하여 CCTV를 활용한 교통 범죄 문제 해결 등 스마트시티, 스마트 교통 등에 활용하고 있다. 그러나 이미지 데이터를 활용하는 기존 연구에서는 개인에 대한 사생활 침해 문제 및 비(非)일반적 상황에서 객체 감지 성능이 저하되는 한계가 있다. 본 연구에 활용된 IoT 디바이스 기반의 센서 데이터는 개인에 대한 식별이 불필요해 사생활 이슈로부터 자유로운 데이터로, 불특정 다수를 위한 지능형 공공서비스 구축에 효과적으로 활용될 수 있다. 대다수의 국민들이 일상적으로 활용하는 도시철도에서의 지능형 보행자 트래킹 시스템에 IoT 기반의 적외선 센서 디바이스를 활용하고자 하였으며 센서로부터 측정된 온도 데이터를 실시간 송출하고, CNN-LSTM(Convolutional Neural Network-Long Short Term Memory) 알고리즘을 활용하여 구간 내 보행 인원의 수를 예측하고자 하였다. 실험 결과 MLP(Multi-Layer Perceptron) 및 LSTM(Long Short-Term Memory), RNN-LSTM(Recurrent Neural Network-Long Short Term Memory)에 비해 제안한 CNN-LSTM 하이브리드 모형이 가장 우수한 예측성능을 보임을 확인하였다. 본 논문에서 제안한 디바이스 및 모델을 활용하여 그간 개인정보와 관련된 법적 문제로 인해 서비스 제공이 미흡했던 대중교통 내 실시간 모니터링 및 혼잡도 기반의 위기상황 대응 서비스 등 종합적 메트로 서비스를 제공할 수 있을 것으로 기대된다.

미기상해석모듈 출력물의 정확성에 대한 객체기반 검증법: 한반도 풍속예측모형의 정확성 검증에의 응용 (An Object-Based Verification Method for Microscale Weather Analysis Module: Application to a Wind Speed Forecasting Model for the Korean Peninsula)

  • 김혜중;곽화륜;김상일;최영진
    • 응용통계연구
    • /
    • 제28권6호
    • /
    • pp.1275-1288
    • /
    • 2015
  • 미기상해석모듈(microscale weather analysis module)은 복사에너지, 열, 습도 등의 순환을 시-공간적으로 세밀하게 설명하고 모의실험 할 수 있도록 개발한 초고분해능($1km{\times}1km$ 이내)의 기상모델이다. 본 논문은 미기상해석모듈의 정확성을 시공간적으로 검증할 수 있도록 고안한 객체기반 검증법을 제안한다. 이 검증법은 통계그래픽을 사용하는 시각적인 방법이며, 미기상해석모듈의 평가통계출력장 구축단계, 객체식별 및 병합단계, 모듈의 정확성 검증단계로 이루진다. 이를 위해 두 가지 통계를 사용하여 삼차원의 평가통계출력장을 구축하였고, 구축된 출력장에서 정의되는 시계열통계들에 대해 합성(convolution), 가면화(masking) 및 병합작업(merging)을 시행하여 출력장에서 모듈검증대상 지역인 객체를 식별하는 알고리즘을 개발하였다. 또한, 사례연구를 통해 제안된 객체기반 검증법의 유용성을 보였다.

적응형 네트워크 기반 퍼지추론 시스템을 적용한 갑천유역의 홍수유출 모델링 (The Application of Adaptive Network-based Fuzzy Inference System (ANFIS) for Modeling the Hourly Runoff in the Gapcheon Watershed)

  • 김호준;정건희;이도훈;이은태
    • 대한토목학회논문집
    • /
    • 제31권5B호
    • /
    • pp.405-414
    • /
    • 2011
  • 본 연구에서는 유역에서 관측되는 강우량과 유출량의 시계열 자료를 바탕으로 최근 시계열 예측 및 시스템 제어 분야에서 성공적으로 적용되고 있는 적응형 네트워크 기반 퍼지추론 시스템(ANFIS)을 갑천 유역에 적용하여 시유출량을 모델링하였다. 입력구조, 소속함수 종류와 개수 등을 다양하게 변화시켜 ANFIS 모형을 학습하고, 평균제곱근오차(RMSE), 평균첨두유량오차(PE) 및 평균첨두시간오차(TE)를 이용하여 ANFIS의 유출해석에 대한 적용성을 평가하였다. 현재시간의 시유출량 Q(t)에 대한 ANFIS의 적용성은 우수한 것으로 평가되었으며, ANFIS 모형은 관측유출량을 적절히 모의하였다. 입력구조가 다른 입력모형을 구성하여 최대 8시간까지 ANFIS의 유출예측 적용성을 평가하였다. 예측시간 증가에 따라서 ANFIS의 유출예측 정확도는 감소하여 예측시간 4시간 이상의 시유출량에 대한 ANFIS의 유출예측 적용성은 제한적이었다. ANFIS는 입력과 출력 자료들만 이용하므로 물리기반 모형에 비교하여 모형구축이 비교적 손쉽기 때문에 홍수 유출모델링에 ANFIS을 유용하게 적용할 수 있을 것으로 판단된다.

서울 오피스 신규 공급 결정요인과 동태적 관계분석 (The Determinants of New Supply in the Seoul Office Market and their Dynamic Relationship)

  • 양혜선;강창덕
    • 지적과 국토정보
    • /
    • 제47권2호
    • /
    • pp.159-174
    • /
    • 2017
  • 오피스의 수급 불균형은 도시 성장을 약화시킨다. 오피스의 초과공급이 공실률을 높이고 임대료가 하락하는 등 시장의 불안정성을 키울 수 있기 때문이다. 또한 오피스의 초과수요가 기업의 임차비용을 상승시켜 도시의 산업 성장을 제한할 수 있다. 최근 대규모의 신규 공급이 서울 오피스시장의 변동성을 높였다. 그럼에도 불구하고 오피스 공급에 대한 연구는 미미한 실정이다. 따라서 본 연구는 서울 오피스 신규 공급의 영향요인을 확인하고 수급 불균형의 주요 원인인 시차를 고려하여 결정요인들의 동태적 구조적인 움직임을 분석하였다. 이를 위해 시계열모형인 벡터오차수정모형(VECM)을 활용하여 2003년부터 2015년까지 서울 오피스시장의 분기별 자료를 분석하였다. 분석결과, 서울 오피스 신규 공급에 영향을 주는 요인은 1분기 전 오피스 신규 공급량(-), 1분기 전 오피스 고용자 수(+), 2분기 전 이자율(+), 1분기 전 cap rate(-), 2분기 전 cap rate(-)으로 확인되었다. 이를 바탕으로 영향요인들 간의 시간에 따른 상호의존성과 변동에 따른 상대적 기여도를 분석한 결과, 이자율과 cap rate은 신규 공급량에 단기적인 영향을 미친 반면 고용과 공실률은 장기적이고 지속적인 영향을 미쳤다. 따라서 예측 가능한 오피스 시장 전망을 위해서는 이러한 오피스 신규 공급 영향요인에 대한 공신력 있는 자료 구축이 필요하고 지속적인 모니터링이 필요하다. 오피스는 기업과 산업의 성장을 이끄는 핵심적인 도시인프라이기 때문이다.

군집분류를 이용한 흙막이 벽체 배면 지반의 상대적 침하거동 분석 (Analysis of Relative Settlement Behavior of Retaining Wall Backside Ground Using Clustering)

  • 곽영준;한희수
    • 지질공학
    • /
    • 제33권1호
    • /
    • pp.189-200
    • /
    • 2023
  • 도시화와 산업화에 따라 도심지에 개발이 늘어나면서 지반침하로 인한 피해가 지속적으로 발생되고 있으며, 도심지에서의 건물붕괴는 대규모 인명 및 재산 피해로 이어질 위험이 크다. 굴착지반에 균등하지 않은 하중이 작용하고, 대상지반의 사전지식이 없는 경우의 지반거동에 대해서는 연구가 거의 이루어지지 않았다. 이에 따라 지반 조사 정보가 없는 흙막이 공사의 굴착 과정에서 발생되는 배면 지반의 침하거동을 분석하는 방법이 기존에는 없었고, 본 연구에서는 시계열 데이터를 가공하여 상대적 침하거동과 상호관련성을 분석하여 흙막이 벽체 배면 지반의 침하거동을 분석하고자 하였다. 본 논문에서는 평균침하량차지수와 평균상대침하량차를 정의 및 계산하였으며, 이를 좌표계에 도시하여 시간경과에 따라 측점간의 상대적 침하거동을 분석하였다. 또한 관측점들의 군집을 분류할 수 있는 기준이 필요하여 k-평균군집분석과 Dunn Index를 이용하여 분류하였다. 분석결과 계측지점의 침하량이 일정한 값으로 수렴하면서 모든 군집들이 안정영역으로 이동한 것을 확인할 수 있었으며, 군집은 세분화되었다. 이러한 분석결과를 바탕으로 연구대상의 각 측점 간 상관관계를 분석하여 연구대상 지반의 독자거동영역과 동일거동영역을 구분할 수 있었다. 이처럼 측점들 간의 상대적 침하거동을 분석을 통해 거동영역을 구분할 수 있다면, 주변지역의 융기, 지반파괴영역 예측, 터파기 공사 시 활동파괴의 방지 등 침하관리와 안정관리에 도움을 줄 수 있다고 판단된다.

적대적 학습 기반 오토인코더(ATAE)를 이용한 다차원 상수도관망 데이터 생성 (Multidimensional data generation of water distribution systems using adversarially trained autoencoder)

  • 김세형;전상훈;정동휘
    • 한국수자원학회논문집
    • /
    • 제56권7호
    • /
    • pp.439-449
    • /
    • 2023
  • 최근 계측 기술의 발전으로 압력계와 유량계 등 다양한 센서를 설치하여 상수도관망의 상태를 효과적으로 파악할 수 있게 되었으나, 도시가 광범위하게 개발됨에 따라 계측 신뢰도에 영향을 미치는 변수는 다양해지고 있다. 특히 상수도관망 분석에 중요한 영향력을 가지는 수요 데이터의 경우 직접 계측의 난이도가 높고 결측이 발생하기 쉬운 것으로 알려져 데이터 생성의 중요도가 증가하고 있다. 본 논문에서는 상수도관망에서 누락된 데이터를 정확하게 생성하기 위해 생성적 딥러닝 모델에 기반한 적대적 학습 기반 오토인코더(ATAE) 모델을 제안한다. 제안된 모델은 판별 신경망과 생성 신경망의 두 가지 신경망의 적대적 학습을 사용하여 압력 데이터로부터 수요 데이터를 생성한다. 학습이 완료된 ATAE 모델의 생성 신경망은 관망의 계측되는 압력 데이터가 존재하는 경우, 그로부터 추정된 관망 수요 데이터를 제공할 수 있다. ATAE 모델은 미국 텍사스주 오스틴의 실제 상수도망에 적용되어 성능이 검증되었다. 수요 및 압력 시계열 데이터의 불확실성 정도에 따른 ATAE 예측 결과의 정확도를 비교하여 데이터 불확실성의 영향을 분석하였으며, 또한 수요 수준에 따른 데이터 수집 기간별 생성 결과를 비교하여 이에 따른 데이터 생성 성능을 검토하였다.

기계학습을 활용한 상품자산 투자모델에 관한 연구 (A Study on Commodity Asset Investment Model Based on Machine Learning Technique)

  • 송진호;최흥식;김선웅
    • 지능정보연구
    • /
    • 제23권4호
    • /
    • pp.127-146
    • /
    • 2017
  • 상품자산(Commodity Asset)은 주식, 채권과 같은 전통자산의 포트폴리오의 안정성을 높이기 위한 대체투자자산으로 자산배분의 형태로 투자되고 있지만 주식이나 채권 자산에 비해 자산배분에 대한 모델이나 투자전략에 대한 연구가 부족한 실정이다. 최근 발전한 기계학습(Machine Learning) 연구는 증권시장의 투자부분에서 적극적으로 활용되고 있는데, 기존 투자모델의 한계점을 개선하는 좋은 성과를 나타내고 있다. 본 연구는 이러한 기계학습의 한 기법인 SVM(Support Vector Machine)을 이용하여 상품자산에 투자하는 모델을 제안하고자 한다. 기계학습을 활용한 상품자산에 관한 기존 연구는 주로 상품가격의 예측을 목적으로 수행되었고 상품을 투자자산으로 자산배분에 관한 연구는 찾기 힘들었다. SVM을 통한 예측대상은 투자 가능한 대표적인 4개의 상품지수(Commodity Index)인 골드만삭스 상품지수, 다우존스 UBS 상품지수, 톰슨로이터 CRB상품지수, 로저스 인터내셔날 상품지수와 대표적인 상품선물(Commodity Futures)로 구성된 포트폴리오 그리고 개별 상품선물이다. 개별상품은 에너지, 농산물, 금속 상품에서 대표적인 상품인 원유와 천연가스, 옥수수와 밀, 금과 은을 이용하였다. 상품자산은 전반적인 경제활동 영역에 영향을 받기 때문에 거시경제지표를 통하여 투자모델을 설정하였다. 주가지수, 무역지표, 고용지표, 경기선행지표 등 19가지의 경제지표를 이용하여 상품지수와 상품선물의 등락을 예측하여 투자성과를 예측하는 연구를 수행한 결과, 투자모델을 활용하여 상품선물을 리밸런싱(Rebalancing)하는 포트폴리오가 가장 우수한 성과를 나타냈다. 또한, 기존의 대표적인 상품지수에 투자하는 것 보다 상품선물로 구성된 포트폴리오에 투자하는 것이 우수한 성과를 얻었으며 상품선물 중에서도 에너지 섹터의 선물을 제외한 포트폴리오의 성과가 더 향상된 성과를 나타남을 증명하였다. 본 연구에서는 포트폴리오 성과 향상을 위해 기존에 널리 알려진 전통적 주식, 채권, 현금 포트폴리오에 상품자산을 배분하고자 할 때 투자대상은 상품지수에 투자하는 것이 아닌 개별 상품선물을 선정하여 자체적 상품선물 포트폴리오를 구성하고 그 방법으로는 기간마다 강세가 예측되는 개별 선물만을 골라서 포트폴리오를 재구성하는 것이 효과적인 투자모델이라는 것을 제안한다.

재무예측을 위한 Support Vector Machine의 최적화 (Optimization of Support Vector Machines for Financial Forecasting)

  • 김경재;안현철
    • 지능정보연구
    • /
    • 제17권4호
    • /
    • pp.241-254
    • /
    • 2011
  • Support vector machines(SVM)은 비교적 최근에 등장한 데이터마이닝 기법이지만, 재무, CRM 등의 경영학 분야에서 많이 연구되고 있다. SVM은 인공신경망과 필적할 만큼의 예측 정확도를 보이는 사례가 많았지만, 암상자로 불리는 인공신경망 모형에 비해 구축된 예측모형의 구조를 이해하기 쉽고, 인공신경망에 비해 과도적합의 가능성이 적어서 적은 수의 데이터에서도 적용 가능하다는 장점을 가지고 있다. 하지만, 일반적인 SVM을 이용하려면, 인공신경망과 마찬가지로 여러 가지 설계요소들을 설계자가 선택하여야 하기 때문에 임의성이 높고, 국부 최적해에 수렴할 가능성도 크다. 또한, 많은 수의 데이터가 존재하는 경우에는 데이터를 분석하고 이용하는데 시간이 소요되고, 종종 잡음이 심한 데이터가 포함된 경우에는 기대하는 수준의 예측성과를 얻지 못할 가능성이 있다. 본 연구에서는 일반적인 SVM의 장점을 그대로 유지하면서, 전술한 두 가지 단점을 보완한 새로운 SVM 모형을 제안한다. 본 연구에서 제안하는 모형은 사례선택기법을 일반적인 SVM에 융합한 것으로 대용량의 데이터에서 예측에 불필요한 데이터를 선별적으로 제거하여 예측의 정확도와 속도를 제고할 수 있는 방법이다. 본 연구에서는 잡음이 많고 예측이 어려운 것으로 알려진 재무 데이터를 활용하여 제안 모형의 유용성을 확인하였다.