• Title/Summary/Keyword: 서포트 벡터 머신

Search Result 271, Processing Time 0.029 seconds

Feature selection and prediction modeling of drug responsiveness in Pharmacogenomics (약물유전체학에서 약물반응 예측모형과 변수선택 방법)

  • Kim, Kyuhwan;Kim, Wonkuk
    • The Korean Journal of Applied Statistics
    • /
    • v.34 no.2
    • /
    • pp.153-166
    • /
    • 2021
  • A main goal of pharmacogenomics studies is to predict individual's drug responsiveness based on high dimensional genetic variables. Due to a large number of variables, feature selection is required in order to reduce the number of variables. The selected features are used to construct a predictive model using machine learning algorithms. In the present study, we applied several hybrid feature selection methods such as combinations of logistic regression, ReliefF, TurF, random forest, and LASSO to a next generation sequencing data set of 400 epilepsy patients. We then applied the selected features to machine learning methods including random forest, gradient boosting, and support vector machine as well as a stacking ensemble method. Our results showed that the stacking model with a hybrid feature selection of random forest and ReliefF performs better than with other combinations of approaches. Based on a 5-fold cross validation partition, the mean test accuracy value of the best model was 0.727 and the mean test AUC value of the best model was 0.761. It also appeared that the stacking models outperform than single machine learning predictive models when using the same selected features.

On classification model of disaster severity level based on machine learning (머신러닝 기반의 재해 강도 단계 분류모형에 관한 연구)

  • Seungmin Lee;Wonjoon Wang;Yujin Kang;Seongcheol Shin;Hung Soo Kim;Soojun Kim
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2023.05a
    • /
    • pp.239-239
    • /
    • 2023
  • 최근 도시화 및 기후변화에 따른 재난의 피해가 증가하고 있다. 국내 기상청에서는 호우 및 태풍에 대한 예·경보(주의보, 경보)를 전국적으로 통일된 기준(3시간, 12시간 누적강우량)에 따라 발령하고 있다. 이에 따라 현재 예·경보 기준에는 피해가 발생한 사상에 대한 지역별 특성이 고려되지 않는 문제점이 있다. 본 연구에서는 이러한 문제점을 해결하기 위하여 서울특별시, 인천광역시, 경기도의 호우 및 태풍에 대한 재해사상별 발생한 피해액 및 누적강우량을 활용하여 재해강도의 단계별 기준을 수립하고, 입력자료로 관측된 강우값을 활용하여 발생할 수 있는 재해의 발생 강도를 분류하는 모형을 개발하고자 하였다. 본 연구에서는 호우 및 태풍에 의한 재해 피해액의 분위별로 재해강도 단계(관심, 주의, 경계, 심각)를 분류하였고, 재해강도 단계에 따른 누적강우량 기준을 지자체별로 제시하였으며, 분류한 재해의 강도 단계를 모형의 종속변수로 활용하였다. 재해피해가 발생하지 않은 무강우 지속시간을 산정하여 호우 사상을 분류하였다. 지자체별로 재해 발생강도 분류 모형 개발을 위하여 머신러닝 모형 4가지(의사결정나무, 서포트 벡터 머신, 랜덤 포레스트, XGBoost)를 활용하였다. 본 연구에서 분류한 피해가 발생하지 않은 호우사상 및 피해가 발생한 사상별로 강우량, 지속시간 최대 강우량(3시간, 12시간), 선행강우량, 누적강우량을 독립변수로 입력하여 종속변수인 재해 발생 강도를 분류하였다. 각 모형별로 F1 Score를 이용한 정확도 평가 결과, 의사결정나무의 F1 Score가 평균 0.56으로 가장 우수한 정확도를 가지는 것으로 평가되었다. 본 연구에서 제시하는 머신러닝 기반 재해 발생 강도 분류모형을 활용하면 호우 및 태풍에 의한 재해에 대하여 지자체별로 재해 발생 강도를 단계별로 파악할 수 있어, 재난 담당자들의 의사결정을 위한 참고 자료로 활용될 수 있을 것으로 판단된다.

  • PDF

Research Trend Analysis for Fault Detection Methods Using Machine Learning (머신러닝을 사용한 단층 탐지 기술 연구 동향 분석)

  • Bae, Wooram;Ha, Wansoo
    • Economic and Environmental Geology
    • /
    • v.53 no.4
    • /
    • pp.479-489
    • /
    • 2020
  • A fault is a geological structure that can be a migration path or a cap rock of hydrocarbon such as oil and gas, formed from source rock. The fault is one of the main targets of seismic exploration to find reservoirs in which hydrocarbon have accumulated. However, conventional fault detection methods using lateral discontinuity in seismic data such as semblance, coherence, variance, gradient magnitude and fault likelihood, have problem that professional interpreters have to invest lots of time and computational costs. Therefore, many researchers are conducting various studies to save computational costs and time for fault interpretation, and machine learning technologies attracted attention recently. Among various machine learning technologies, many researchers are conducting fault interpretation studies using the support vector machine, multi-layer perceptron, deep neural networks and convolutional neural networks algorithms. Especially, researchers use not only their own convolution networks but also proven networks in image processing to predict fault locations and fault information such as strike and dip. In this paper, by investigating and analyzing these studies, we found that the convolutional neural networks based on the U-Net from image processing is the most effective one for fault detection and interpretation. Further studies can expect better results from fault detection and interpretation using the convolutional neural networks along with transfer learning and data augmentation.

Comparison of Audio Event Detection Performance using DNN (DNN을 이용한 오디오 이벤트 검출 성능 비교)

  • Chung, Suk-Hwan;Chung, Yong-Joo
    • The Journal of the Korea institute of electronic communication sciences
    • /
    • v.13 no.3
    • /
    • pp.571-578
    • /
    • 2018
  • Recently, deep learning techniques have shown superior performance in various kinds of pattern recognition. However, there have been some arguments whether the DNN performs better than the conventional machine learning techniques when classification experiments are done using a small amount of training data. In this study, we compared the performance of the conventional GMM and SVM with DNN, a kind of deep learning techniques, in audio event detection. When tested on the same data, DNN has shown superior overall performance but SVM was better than DNN in segment-based F-score.

A Success Prediction Model for Debut Webtoon Based on Reader reaction Using Deep Learning and Machine Learning (딥러닝과 머신러닝을 활용한 독자 반응 기반 웹툰 데뷔작 성공 예측 모델)

  • Heo, Eun Yeong;Kim, Seung Hwa;Kim, Hyon Hee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.10a
    • /
    • pp.770-773
    • /
    • 2019
  • 본 논문에서는 매년 성장하는 웹툰 시장 속에서 신인 작가들이 성공할 수 있는 성공 요인을 밝히고자 하였다. 국내 1위 웹툰 플랫폼인 네이버 웹툰 중 데뷔작을 기준으로 완결 웹툰 212개, 연재 중인 웹툰 112개, 총 324개의 웹툰을 수집하여 연구를 진행하였다. 기존 선행연구와의 차별화를 두기 위해 독자의 직접적인 반응 중 하나인 댓글을 성공 요인에 포함하였다. 댓글에 담긴 긍정, 부정을 나타내는 주관을 탐지하기 위해 딥러닝을 이용하여 감성 분석을 실시하였다. 각 웹툰에 대한 댓글 반응을 포함하여 평균, '좋아요' 수, 장르 그리고 첫 화 댓글 수와 5화까지 평균 댓글 수를 흥행에 영향을 미치는 독립변수로 사용했다. 댓글 반응이 중요 요인인지를 확인하기 위해 각 모델 생성 시 댓글 반응을 포함한 모델과 포함하지 않은 모델을 생성하여 성능 평가를 실시하였다. 로지스틱 회귀분석, 아다 부스트, 그리고 서포트 벡터 머신 모델을 정확도와 ROC 그래프를 이용해 효율성을 비교하고, 이를 통해 댓글 반응을 활용한 로지스틱 회귀 모델이 가장 적합하다고 판단하였다. 모델 생성 결과 '좋아요' 수, 1화 댓글 수, 댓글 반응 순으로 성공 요인에 많은 영향을 미치는 것을 알 수 있었다.

Diagnosis Atherosclerosis Model Using Radiomics Approach in Carotid Vessel MRI (경동맥 혈관 MRI에서 라디오믹스를 이용한 동맥경화증 진단 모델)

  • Kim, Jong-hun;Park, Hyunjin
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2022.10a
    • /
    • pp.289-290
    • /
    • 2022
  • Arteriosclerosis is a disease in which the carotid vessel wall becomes thick, and it is important to monitor the thickness of the vessel wall for diagnosis. In this study, we propose a model for extracting 324 radiomics features from carotid MRI images and diagnosing arteriosclerosis using machine learning techniques. We learned a total of four classification models: logistic regression, support vector machine, random forest, and XGBoost through radiomics features. XGBoost model, which showed the highest performance in 5-fold cross-validation, shows the results of accuracy 0.9023, sensitivity 0.9517, specificity 0.8035, AUC 0.8776.

  • PDF

Use of Support Vector Machines in Biped Humanoid Robot for Stable Walking (안정적인 보행을 위한 이족 휴머노이드 로봇에서의 서포트 벡터 머신 이용)

  • Kim Dong-Won;Park Gwi-Tae
    • Journal of Institute of Control, Robotics and Systems
    • /
    • v.12 no.4
    • /
    • pp.315-319
    • /
    • 2006
  • Support vector machines in biped humanoid robot are presented in this paper. The trajectory of the ZMP in biped walking robot poses an important criterion for the balance of the walking robots but complex dynamics involved make robot control difficult. We are establishing empirical relationships based on the dynamic stability of motion using SVMs. SVMs and kernel method have become very popular method for learning from examples. We applied SVM to model the practical humanoid robot. Three kinds of kernels are employed also and each result has been compared. As a result, SVM based on kernel method have been found to work well. Especially SVM with RBF kernel function provides the best results. The simulation results show that the generated ZMP from the SVM can be improve the stability of the biped walking robot and it can be effectively used to model and control practical biped walking robot.

Construction Safety and Health Management Cost Prediction Model using Support Vector Machine (서포트 벡터 머신을 이용한 건설업 안전보건관리비 예측 모델)

  • Shin, Sung Woo
    • Journal of the Korean Society of Safety
    • /
    • v.32 no.1
    • /
    • pp.115-120
    • /
    • 2017
  • The aim of this study is to develop construction safety and health management cost prediction model using support vector machine (SVM). To this end, theoretical concept of SVM is investigated to formulate the cost prediction model. Input and output variables have been selected by analyzing the balancing accounts for the completed construction project. In order to train and validate the proposed prediction model, 150 data sets have been gathered from field. Effects of SVM parameters on prediction accuracy are analyzed and from which the optimal parameter values have been determined. The prediction performance tests are conducted to confirm the applicability of the proposed model. Based on the results, it is concluded that the proposed SVM model can effectively be used to predict the construction safety and health management cost.

A Study on the Sentiment analysis of Google Play Store App Comment Based on WPM(Word Piece Model) (WPM(Word Piece Model)을 활용한 구글 플레이스토어 앱의 댓글 감정 분석 연구)

  • Park, jae Hoon;Koo, Myong-wan
    • 한국어정보학회:학술대회논문집
    • /
    • 2016.10a
    • /
    • pp.291-295
    • /
    • 2016
  • 본 논문에서는 한국어 기본 유니트 단위로 WPM을 활용한 구글 플레이 스토어 앱의 댓글 감정분석을 수행하였다. 먼저 자동 띄어쓰기 시스템을 적용한 후, 어절단위, 형태소 분석기, WPM을 각각 적용하여 모델을 생성하고, 로지스틱 회귀(Logistic Regression), 소프트맥스 회귀(Softmax Regression), 서포트 벡터머신(Support Vector Machine, SVM)등의 알고리즘을 이용하여 댓글 감정(긍정과 부정)을 비교 분석하였다. 그 결과 어절단위, 형태소 분석기보다 WPM이 최대 25%의 향상된 결과를 얻었다. 또한 분류 과정에서 로지스틱회귀, 소프트맥스 회귀보다는 SVM 성능이 우수했으며, SVM의 기본 파라미터({'kernel':('linear'), 'c':[4]})보다 최적의 파라미터를 적용({'kernel': ('linear','rbf', 'sigmoid', 'poly'), 'C':[0.01, 0.1, 1.4.5]} 하였을 때, 최대 91%의 성능이 나타났다.

  • PDF

A Verification Algorithm for Temperature Uniformity of the Large-area Susceptor (대면적 서셉터의 온도 균일도 검증 알고리즘)

  • Yang, Hac Jin;Kim, Seong Kun;Cho, Jung Kun
    • Journal of the Korean Society for Precision Engineering
    • /
    • v.31 no.10
    • /
    • pp.947-954
    • /
    • 2014
  • Performance of next generation susceptor is affected by temperature uniformity in order to produce reliably large-sized flat panel display. In this paper, we propose a learning estimation model of susceptor to predict and appropriately assess the temperature uniformity. Artificial Neural Networks (ANNs) and Support Vector Machines (SVMs) are compared for the suitability of the learning estimation model. It is proved that SVMs provides more suitable verification of uniformity modeling than ANNs during each stage of temperature variations. Practical procedure for uniformity estimation of susceptor temperature was developed using the SVMs prediction algorithm.