• 제목/요약/키워드: Support Vector

검색결과 2,327건 처리시간 0.028초

이기종 머신러닝기법을 활용한 KOSPI200 옵션변동성 예측 (Estimation of KOSPI200 Index option volatility using Artificial Intelligence)

  • 신소희;오하영;김장현
    • 한국정보통신학회논문지
    • /
    • 제26권10호
    • /
    • pp.1423-1431
    • /
    • 2022
  • 블랙숄즈모형에서 옵션가격을 결정하는 변수 중 기초자산의 변동성은 현재 시점에서는 알 수 없고, 미래시점에 실현된 변동성을 사후에야 알 수 있다. 하지만 옵션이 거래되는 시장에서 관찰되는 가격이 있기 때문에 가격에 내재된 변동성을 역으로 산출한 내재변동성은 현재 시점에 구할 수 있다. 내재변동성을 구하기 위해서는 옵션가격과, 블랙숄즈 모형의 변동성을 제외한 옵션가격결정변수인 기초자산가격, 무위험이자율, 배당률, 행사가격, 잔존기간이 필요하다. 블랙숄즈모형의 변동성은 고정된 상수이나, 내재변동성 산출시 행사가격에 따라 변동성이 다르게 산출되는 변동성스마일현상을 보이기도 한다. 따라서 내재변동성 산출시 옵션 단일 종목이 아닌 시장전반의 변동성을 감안하는 것이 필요하다고 판단하여 본 연구에서는 V-KOSPI지수도 설명변수로 추가하였다. 머신러닝기법 중 지도학습방법을 사용하였으며, Linear Regression 계열, Tree 계열, SVR과 KNN 알고리즘 및 딥뉴럴네트워크로 학습 및 예측하였다. Training성능은 Decision Tree모형이 99.9%로 가장 높았고 Test성능은 Random Forest 알고리즘이 96.9%로 가장 높았다.

역순 워크 포워드 검증을 이용한 암호화폐 가격 예측 (An Accurate Cryptocurrency Price Forecasting using Reverse Walk-Forward Validation)

  • 안현;장백철
    • 인터넷정보학회논문지
    • /
    • 제23권4호
    • /
    • pp.45-55
    • /
    • 2022
  • 암호화폐 시장의 규모는 날이 갈수록 커져가고 있으며, 대표적인 암호화폐인 비트코인의 경우 시가총액이 500조를 넘어섰다. 이에 따라 암호화폐의 가격을 예측하려는 연구도 많이 이루어졌으며, 이들은 대부분 주식가격을 예측하는 방법론과 유사성을 띄는 연구들이다. 하지만 선행연구를 비춰 봤을 때 주식가격예측과 달리 암호화폐 가격 예측은 머신러닝의 정확도가 우위에 있는 사례가 많다는 점, 개념적으로 주식과 달리 암호화폐는 소유로 인한 수동적 소득이 없다는 점, 통계적으로 시가총액 대비 하루 거래량의 비율을 살펴봤을 때 암호화폐가 주식 대비 최소 3배이상 높다는 점이 도출되었다. 이를 통해 암호화폐 가격 예측 연구에는 주식 가격 예측과 다른 방법론이 적용되어야 함을 본 논문에서 주장하였다. 우리는 기존에 주가 딥러닝 예측에 사용되던 워크 포워드 검증를 응용한 역순 워크 포워드 검증을 제안하였다. 역순 워크 포워드 검증은 워크 포워드 검증과 달리 검증 데이터셋을 테스트 데이터셋에 시계열상으로 바로 앞에 부분으로 고정시켜놓고, 훈련데이터를 훈련 데이터셋에 시계열상으로 바로 앞 부분부터 서서히 훈련 데이터셋의 크기를 늘려가면서 검증에 대한 정확도를 측정한다. 측정된 모든 검증 정확도 중 가장 높은 정확도를 보이는 훈련 데이터셋의 크기에 맞춰서 훈련 데이터를 절삭시킨 뒤 검증 데이터와 합쳐서 실험 데이터에 대한 정확도를 측정하였다. 분석모델로는 로지스틱 회귀분석과 SVM을 사용했으며, 우리가 제안한 역순 워크 포워드 검증의 신뢰성을 위해서 분석 모델 내부적으로도 L1, L2, rbf, poly등의 다양한 알고리즘과 정규화 파라미터를 적용하였다. 그 결과 모든 분석모델에서 기존 연구보다 향상된 정확도를 보임이 확인되었으며, 평균적으로도 1.23%p의 정확도 상승을 보였다. 선행연구를 통해 암호화폐 가격 예측의 정확도가 대부분 50%~60%사이에서 머무르는 걸 감안할 때 이는 상당한 정확도 개선이다.

머신러닝을 사용한 서리 예측 연구 (A study on frost prediction model using machine learning)

  • 김효정;김삼용
    • 응용통계연구
    • /
    • 제35권4호
    • /
    • pp.543-552
    • /
    • 2022
  • 서리는 표면 근처의 공기의 이슬점 온도가 빙점 이하일 때 수증기가 승화, 응축되어 땅이나 물체에 얼게 되는 작은 얼음 결정체이다. 서리가 내리면 농작물이 직접 피해를 입는다. 농작물이 낮은 온도에 접촉하면 조직이 얼어서 세포막이나 엽록체가 딱딱해지고 파괴되거나 건조한 세포가 죽습니다. 2020년 7월, 세계 최대 커피 생산국인 브라질 미나스제라이스 주에 갑작스러운 영하의 날씨와 서리가 내려 지역 커피 나무의 약 30%가 피해를 입었다. 이로 인해 피해로 커피값이 크게 올랐고, 피해가 심각한 농가는 농작물이 회복되기까지 3년이 걸리기 때문에 2024년에야 커피를 생산할 수 있다. 본 논문에서는 심한 서리가 내리는 것을 방지하기 위해 기상청이 제공하는 서리 발생 데이터와 기상관측 데이터를 이용해 서리를 예측하려고 했다. 관측 지점의 고도 및 풍속, 온도, 습도, 강수량, 흐림 등의 기상 요인을 반영하여 모델을 구축하였다. XGB, SVM, Random Forest, MLP 모델을 사용하여 다양한 하이퍼 파라미터를 학습 데이터로 적용하여 각 모델에 가장 적합한 모델을 선택하였다. 마지막으로, 결과는 테스트 데이터에서 정확도(acc)와 중요 성공 지수(CSI)로 평가되었다. XGB는 90.4%의 acc와 64.4%의 CSI로 다른 모델에 비해 최고의 모델이었고, SVM은 89.7%의 acc와 61.2%의 CSI로 그 뒤를 이었다. 랜덤 포레스트와 MLP는 약 89%의 acc와 약 60%의 CSI로 비슷한 성능을 보였다.

데이터의 불균형성을 제거한 네트워크 침입 탐지 모델 비교 분석 (Experimental Comparison of Network Intrusion Detection Models Solving Imbalanced Data Problem)

  • 이종화;방지원;김종욱;최미정
    • KNOM Review
    • /
    • 제23권2호
    • /
    • pp.18-28
    • /
    • 2020
  • 컴퓨팅 환경의 발전에 따라 IT 기술이 의료, 산업, 통신, 문화 등의 분야에서 사람들에게 제공해주는 혜택이 늘어나 삶의 질도 향상되고 있다. 그에 따라 발전된 네트워크 환경을 노리는 다양한 악의적인 공격이 존재한다. 이러한 공격들을 사전에 탐지하기 위해 방화벽, 침입 탐지 시스템 등이 존재하지만, 나날이 진화하는 악성 공격들을 탐지하는 데에는 한계가 있다. 이를 해결하기 위해 기계 학습을 이용한 침입 탐지 연구가 활발히 진행되고 있지만, 학습 데이터셋의 불균형으로 인한 오탐 및 미탐이 발생하고 있다. 본 논문에서는 네트워크 침입 탐지에 사용되는 UNSW-NB15 데이터셋의 불균형성 문제를 해결하기 위해 랜덤 오버샘플링 방법을 사용했다. 실험을 통해 모델들의 accuracy, precision, recall, F1-score, 학습 및 예측 시간, 하드웨어 자원 소모량을 비교 분석했다. 나아가 본 연구를 기반으로 랜덤 오버샘플링 방법 이외에 불균형한 데이터 문제를 해결할 수 있는 다른 방법들과 성능이 높은 모델들을 이용하여 좀 더 효율적인 네트워크 침입 탐지 모델 연구로 발전시키고자 한다.

EEG Feature Engineering for Machine Learning-Based CPAP Titration Optimization in Obstructive Sleep Apnea

  • Juhyeong Kang;Yeojin Kim;Jiseon Yang;Seungwon Chung;Sungeun Hwang;Uran Oh;Hyang Woon Lee
    • International journal of advanced smart convergence
    • /
    • 제12권3호
    • /
    • pp.89-103
    • /
    • 2023
  • Obstructive sleep apnea (OSA) is one of the most prevalent sleep disorders that can lead to serious consequences, including hypertension and/or cardiovascular diseases, if not treated promptly. Continuous positive airway pressure (CPAP) is widely recognized as the most effective treatment for OSA, which needs the proper titration of airway pressure to achieve the most effective treatment results. However, the process of CPAP titration can be time-consuming and cumbersome. There is a growing importance in predicting personalized CPAP pressure before CPAP treatment. The primary objective of this study was to optimize the CPAP titration process for obstructive sleep apnea patients through EEG feature engineering with machine learning techniques. We aimed to identify and utilize the most critical EEG features to forecast key OSA predictive indicators, ultimately facilitating more precise and personalized CPAP treatment strategies. Here, we analyzed 126 OSA patients' PSG datasets before and after the CPAP treatment. We extracted 29 EEG features to predict the features that have high importance on the OSA prediction index which are AHI and SpO2 by applying the Shapley Additive exPlanation (SHAP) method. Through extracted EEG features, we confirmed the six EEG features that had high importance in predicting AHI and SpO2 using XGBoost, Support Vector Machine regression, and Random Forest Regression. By utilizing the predictive capabilities of EEG-derived features for AHI and SpO2, we can better understand and evaluate the condition of patients undergoing CPAP treatment. The ability to predict these key indicators accurately provides more immediate insight into the patient's sleep quality and potential disturbances. This not only ensures the efficiency of the diagnostic process but also provides more tailored and effective treatment approach. Consequently, the integration of EEG analysis into the sleep study protocol has the potential to revolutionize sleep diagnostics, offering a time-saving, and ultimately more effective evaluation for patients with sleep-related disorders.

배깅 및 스태킹 기반 앙상블 기계학습법을 이용한 고성능 콘크리트 압축강도 예측모델 개발 (Development of a High-Performance Concrete Compressive-Strength Prediction Model Using an Ensemble Machine-Learning Method Based on Bagging and Stacking)

  • 곽윤지;고채연;곽신영;임승현
    • 한국전산구조공학회논문집
    • /
    • 제36권1호
    • /
    • pp.9-18
    • /
    • 2023
  • 고성능 콘크리트(HPC) 압축강도는 추가적인 시멘트질 재료의 사용으로 인해 예측하기 어렵고, 개선된 예측 모델의 개발이 필수적이다. 따라서, 본 연구의 목적은 배깅과 스태킹을 결합한 앙상블 기법을 사용하여 HPC 압축강도 예측 모델을 개발하는 것이다. 이 논문의 핵심적 기여는 기존 앙상블 기법인 배깅과 스태킹을 통합하여 새로운 앙상블 기법을 제시하고, 단일 기계학습 모델의 문제점을 해결하여 모델 예측 성능을 높이고자 한다. 단일 기계학습법으로 비선형 회귀분석, 서포트 벡터 머신, 인공신경망, 가우시안 프로세스 회귀를 사용하고, 앙상블 기법으로 배깅, 스태킹을 이용하였다. 결과적으로 본 연구에서 제안된 모델이 단일 기계학습 모델, 배깅 및 스태킹 모델보다 높은 정확도를 보였다. 이는 대표적인 4가지 성능 지표 비교를 통해 확인하였고, 제안된 방법의 유효성을 검증하였다.

히스토그램의 최적 높이의 폭에 기반한 3차원 필름 영상 검사 (3D Film Image Inspection Based on the Width of Optimized Height of Histogram)

  • 이재은;김종남
    • 융합신호처리학회논문지
    • /
    • 제23권2호
    • /
    • pp.107-114
    • /
    • 2022
  • 3차원 필름 영상을 양품 또는 불량품으로 분류하기 위해서는 필름의 영상 내 무늬를 검출해야 한다. 하지만 만약 필름 내 화소의 명암이 낮다면 영상 내 무늬가 선명하지 않아서 분류하기가 쉽지 않다. 본 논문에서는 3D 필름 영상들의 히스토그램을 구한 후, 각 히스토그램의 특정 빈도에서의 폭을 비교하여 정품과 불량품으로 분류하는 방법을 제안한다. 실험을 통하여 정품과 불량품의 히스토그램이 뚜렷하게 다르다는 것을 보였으며, 이러한 특징을 반영한 제안 알고리즘을 이용하여 히스토그램의 특정 빈도에서 모든 3D 필름 영상들이 정확하게 분류되는 것을 보였다. 기존에 연구된 방법들인 차영상, 오츠의 이진화 알고리즘, 캐니 엣지, 모폴로지 지오데식 엑티브 컨투어, 그리고 서포트 벡터 머신과의 성능 비교를 통하여 제안한 알고리즘의 성능이 가장 우수함을 검증하였으며, 영상 내 무늬를 검출할 필요 없이도 우수한 분류 정확도를 얻을 수 있다는 것을 보였다.

머신러닝을 이용한 선불전자지급수단의 이상금융거래 탐지 연구 (A Study on the Fraud Detection for Electronic Prepayment using Machine Learning)

  • 최병호;조남욱
    • 한국전자거래학회지
    • /
    • 제27권2호
    • /
    • pp.65-77
    • /
    • 2022
  • 전자금융서비스가 활성화됨에 따라 전자금융 거래 건수와 거래액은 매년 증가하고 있으며, 선불전자지급 과정에서의 사이버 금융범죄도 증가하고 있다. 본 논문에서는 머신러닝 알고리즘을 이용한 선불전자지급수단의 이상금융거래 탐지모델을 제시한다. 이를 위하여 실제 선불전자거래 데이터를 익명화하여 수집하였으며, 데이터의 효과적인 특성을 추출하기 위한 전처리 작업을 수행하였다. 제안된 모델은 거래내역 기반과 이용자 ID 기반 접근법을 이용하였다. 거래내역 기반 모델 분석에서는 원데이터 기반 거래내역 분석과 특성 항목을 추가한 2차 분석을 수행하였으며, 이용자 ID 기반 모델에서도 도메인 특성에 맞는 특성 항목을 추출하여 분석에 활용하였다. 이상치 탐지를 위해 의사결정나무, 인공신경망 및 서포트 벡터 머신 알고리즘을 활용하여 비교 분석하였다. 분석결과 거래내역 기반의 탐지모델보다 이용자 ID 기반의 탐지모델이 선불거래지급수단 이상탐지에 더 효과적임을 확인할 수 있었으며, 이용자 ID 기반 모델에서는 신경망 알고리즘이 가장 좋은 성능을 나타내었다. 제안된 방법론은 향후 이상금융거래 탐지시스템 분석에 활용함으로써 전자금융사고 피해를 줄이는데 기여할 수 있을 것으로 기대된다.

중국지역균형발전전략에 미치는 글로벌 FDI 특성에 관한 연구 :중국주요도시별 한국FDI 특성을 중심으로 (A Study on the Characteristics of Global FDI on China's Balanced Development Strategy : Focusing on Korean FDI Characteristics by Major Cities in China)

  • 류승우;문철주
    • 무역학회지
    • /
    • 제43권4호
    • /
    • pp.155-175
    • /
    • 2018
  • 세계경제의 G1을 추구하는 중국은 이를 위한 경제적 성장유지를 위해 중국에서 시작하여 중앙아시아를 관통하여 유럽에 이르는 옛 실크로드를 개척하는 경제벨트를 추진 중이다. 본 연구는 이러한 중국의 경제확장정책에 효율적으로 동참하기 위한 방안으로 글로벌 대중국투자와 한국의 대중국 투자에 영향을 미치는 거시적 결정변수들의 영향력 정도를 비교분석한 연구이다. 이를 위해 한국의 대중국 FDI 결정변수와 글로벌 대중국 직접투자 결정변수를 벡터오차수정모형(VECM)을 통해 각각의 결정변수가 투자결정에 미치는 영향력을 분석하였다. 분석을 위한 자료로 중국지역균형발전 의 상징지역이라 할 수 있는 베이징, 상하이, 충칭, 시안 및 썬양 등 5개의 주요도시를 횡단면으로 하고 2003~2013년간 이들 도시에 대한 한국의 대중국투자, 글로벌 대중국투자, GDP, 실업률, 임금 추이를 시계열로 하는 패널을 구성하였다. 본 연구가 기존의 연구와 차별되는 점은 첫째, 기존의 대 중국 외국인투자와 관련 연구가 대부분 외국기업의 초기 대중국 투자지역인 연해지역도시에 집중된 것과는 달리 본 연구는 해안, 내륙, 동북의 주요도시들을 동시에 비교 분석하였다. 둘째, 이들 지역전체에 대해 공통적으로 외국인투자에 영향을 미치는 투자결정변수요인간의 인과관계뿐만 아니라 각 도시 별로 외국인투자결정요인 변수간의 비중과 인과관계를 비교하였다. 셋째, 최근 중국의 서부내륙개발과 연계되어 동북3성개발등의 균형정책에 발맞추어 우리의 대중국투자의 가이드라인을 제시하였다. 마지막으로 패널데이타가 가지는 지역적, 시간적 특이성분석을 통해 외국인투자의 결정요인을 분석하는 방법론과 투자의 효율성을 위해 모형의 추정력을 높일 수 있는 누락된 변수의 의미가 무엇인지에 대한 인식과 이에 대한 연구의 필요성을 제시한 의미가 있다고 하겠다.

  • PDF

분광 다양성을 고려한 초분광 영상 기반 부유사 농도 계측 기법 개발 (Development of Suspended Sediment Concentration Measurement Technique Based on Hyperspectral Imagery with Optical Variability)

  • 권시윤;서일원
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.116-116
    • /
    • 2021
  • 자연 하천에서의 부유사 농도 계측은 주로 재래식 채집방식을 활용한 직접계측 방식에 의존하여 비용과 시간이 많이 소요되며 점 계측 방식으로 고해상도의 시공간 자료를 측정하기엔 한계가 존재한다. 이러한 한계점을 극복하기 위해 최근 위성영상과 드론을 활용하여 촬영된 다분광 혹은 초분광 영상을 통해 고해상도의 부유사 농도 시공간분포를 측정하는 기법에 대한 연구가 활발히 진행되고 있다. 하지만, 다른 하천 물리량 계측에 비해 부유사 계측 연구는 하천에 따라 부유사가 비균질적으로 분포하여 원격탐사를 통해 정확하고 전역적인 농도 분포를 재현하기는 어려운 실정이다. 이러한 부유사의 비균질성은 부유사의 입도분포, 광물특성, 침강성 등이 하천에서 다양하게 분포하기 때문이며 이로 인해 부유사는 지역별로 다양한 분광특성을 가지게 된다. 따라서, 본 연구에서는 이러한 영향을 고려한 전역적인 부유사 농도 예측 모형을 개발하기 위해 실내 실험을 통해 부유사 특성별 고유 분광 라이브러리를 구축하고 실규모 수로에서 다양한 부유사 조건에 대한 초분광 스펙트럼과 부유사 농도를 측정하는 실험을 수행하였다. 실제 부유사 농도는 광학 기반 센서인 LISST-200X와 샘플링을 통한 실험실 분석을 통해 계측되었으며, 초분광 스펙트럼 자료는 초분광 카메라를 통해 촬영한 영상에서 부유사 계측 지점에 대한 픽셀의 스펙트럼을 추출하여 구축하였다. 이렇게 생성된 자료들의 분광 다양성을 주성분 분석(Principle Component Analysis; PCA)를 통해 분석하였으며, 부유사의 입도 분포, 부유사 종류, 수온 등과의 상관관계를 통해 분광 특성과 가장 상관관계가 높은 물리적 인자를 규명하였다. 더불어 구축된 자료를 바탕으로 기계학습 기반 주요 특징 선택 알고리즘인 재귀적 특징 제거법 (Recursive Feature Elimination)과 기계학습기반 회귀 모형인 Support Vector Regression을 결합하여 초분광 영상 기반 부유사 농도 예측 모형을 개발하였으며, 이 결과를 원격탐사 계측 연구에서 일반적으로 사용되어 오던 최적 밴드비 분석 (Optimal Band Ratio Analysis; OBRA) 방법으로 도출된 회귀식과 비교하였다. 그 결과, 기존의 OBRA 기반 방법은 비선형성을 증가시켜도 좁은 영역의 파장대만을 고려하는 한계점으로 인해 부유사의 다양한 분광 특성을 반영하지 못하였으며, 본 연구에서 제시한 기계학습 기반 예측 모형은 420 nm~1000 nm에 걸쳐 폭 넓은 파장대를 고려함과 동시에 높은 정확도를 산출하였다. 최종적으로 개발된 모형을 적용해 다양한 유사 조건에 대한 부유사 시공간 분포를 매핑한 결과, 시공간적으로 고해상도의 부유사 농도 분포를 산출하는 것으로 밝혀졌다.

  • PDF