• Title/Summary/Keyword: 서포트벡터머신

Search Result 270, Processing Time 0.032 seconds

Combining Support Vector Machine Recursive Feature Elimination and Intensity-dependent Normalization for Gene Selection in RNAseq (RNAseq 빅데이터에서 유전자 선택을 위한 밀집도-의존 정규화 기반의 서포트-벡터 머신 병합법)

  • Kim, Chayoung
    • Journal of Internet Computing and Services
    • /
    • v.18 no.5
    • /
    • pp.47-53
    • /
    • 2017
  • In past few years, high-throughput sequencing, big-data generation, cloud computing, and computational biology are revolutionary. RNA sequencing is emerging as an attractive alternative to DNA microarrays. And the methods for constructing Gene Regulatory Network (GRN) from RNA-Seq are extremely lacking and urgently required. Because GRN has obtained substantial observation from genomics and bioinformatics, an elementary requirement of the GRN has been to maximize distinguishable genes. Despite of RNA sequencing techniques to generate a big amount of data, there are few computational methods to exploit the huge amount of the big data. Therefore, we have suggested a novel gene selection algorithm combining Support Vector Machines and Intensity-dependent normalization, which uses log differential expression ratio in RNAseq. It is an extended variation of support vector machine recursive feature elimination (SVM-RFE) algorithm. This algorithm accomplishes minimum relevancy with subsets of Big-Data, such as NCBI-GEO. The proposed algorithm was compared to the existing one which uses gene expression profiling DNA microarrays. It finds that the proposed algorithm have provided as convenient and quick method than previous because it uses all functions in R package and have more improvement with regard to the classification accuracy based on gene ontology and time consuming in terms of Big-Data. The comparison was performed based on the number of genes selected in RNAseq Big-Data.

Feature Analysis of Ultrasonic Signals for Diagnosis of Welding Faults in Tubular Steel Tower (관형 철탑 용접 결함 진단을 위한 초음파 신호의 특징 분석)

  • Min, Tae-Hong;Yu, Hyeon-Tak;Kim, Hyeong-Jin;Choi, Byeong-Keun;Kim, Hyun-Sik;Lee, Gi-Seung;Kang, Seog-Geun
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.25 no.4
    • /
    • pp.515-522
    • /
    • 2021
  • In this paper, we present and analyze a method of applying a machine learning to ultrasonic test signals for constant monitoring of the welding faults in a tubular steel tower. For the machine learning, feature selection based on genetic algorithm and fault signal classification using a support vector machine have been used. In the feature selection, the peak value, histogram lower bound, and normal negative log-likelihood from 30 features are selected. Those features clearly indicate the difference of signals according to the depth of faults. In addition, as a result of applying the selected features to the support vector machine, it has been possible to perfectly distinguish between the regions with and without faults. Hence, it is expected that the results of this study will be useful in the development of an early detection system for fault growth based on ultrasonic signals and in the energy transmission related industries in the future.

A Study on Detection and Quantification of a Scramjet Engine Unstart (스크램제트 엔진의 비시동 검출과 정량화 연구)

  • Kim, Hyunwoo;Seo, Hanseok;Kim, Jong-Chan;Sung, Hong-Gye;Park, Ik-Soo
    • Journal of the Korean Society for Aeronautical & Space Sciences
    • /
    • v.50 no.1
    • /
    • pp.21-30
    • /
    • 2022
  • The restart of scramjet engine is almost impossible in case its unstart happens during engine operation. Therefore, it is essential to prognosticate the scramjet engine unstart phenomena. A numerical simulation of a scramjet engine is conducted to investigate the unstart process of the scramjet engine by adjusting the backpressure at the isolator outlet to the engine analysis environment. The start and unstart of the engine are identified by applying a support vector machine (SVM) through the data measured by wall pressure so that the locations of the pressure sensors most suitable for the unstart detection are selected. And the operation conditions in which the engine is avoid to be unstarted are quantified to perceive the safety margin.

A divide-oversampling and conquer algorithm based support vector machine for massive and highly imbalanced data (불균형의 대용량 범주형 자료에 대한 분할-과대추출 정복 서포트 벡터 머신)

  • Bang, Sungwan;Kim, Jaeoh
    • The Korean Journal of Applied Statistics
    • /
    • v.35 no.2
    • /
    • pp.177-188
    • /
    • 2022
  • The support vector machine (SVM) has been successfully applied to various classification areas with a high level of classification accuracy. However, it is infeasible to use the SVM in analyzing massive data because of its significant computational problems. When analyzing imbalanced data with different class sizes, furthermore, the classification accuracy of SVM in minority class may drop significantly because its classifier could be biased toward the majority class. To overcome such a problem, we propose the DOC-SVM method, which uses divide-oversampling and conquers techniques. The proposed DOC-SVM divides the majority class into a few subsets and applies an oversampling technique to the minority class in order to produce the balanced subsets. And then the DOC-SVM obtains the final classifier by aggregating all SVM classifiers obtained from the balanced subsets. Simulation studies are presented to demonstrate the satisfactory performance of the proposed method.

Development of machine learning framework to inverse-track a contaminant source of hazardous chemicals in rivers (하천에 유입된 유해화학물질의 역추적을 위한 기계학습 프레임워크 개발)

  • Kwon, Siyoon;Seo, Il Won
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2020.06a
    • /
    • pp.112-112
    • /
    • 2020
  • 하천에서 유해화학물질 유입 사고 발생 시 수환경 피해를 최소화하기 위해 신속한 초기 대응이 필요하다. 따라서, 본 연구에서는 수환경 화학사고 대응 시스템 구축을 위해 하천 실시간 모니터링 지점에서 관측된 유해화학물질의 농도 자료를 이용하여 발생원의 유입 지점과 유입량을 역추적하는 프레임워크를 개발하였다. 본 연구에서 제시하는 프레임워크는 첫 번째로 하천 저장대 모형(Transient Storage Zone Model; TSM)과 HEC-RAS 모형을 이용하여 다양한 유량의 수리 조건에서 화학사고 시나리오를 생성하는 단계, 두번째로 생성된 시나리오의 유입 지점과 유입량에 대한 시간-농도 곡선 (BreakThrough Curve; BTC)을 21개의 곡선특징 (BTC feature)으로 추출하는 단계, 최종적으로 재귀적 특징 선택법(Recursive Feature Elimination; RFE)을 이용하여 의사결정나무 모형, 랜덤포레스트 모형, Xgboost 모형, 선형 서포트 벡터 머신, 커널 서포트 벡터 머신 그리고 Ridge 모형에 대한 모형별 주요 특징을 학습하고 성능을 비교하여 각각 유입 위치와 유입 질량 예측에 대한 최적 모형 및 특징 조합을 제시하는 단계로 구축하였다. 또한, 현장 적용성 제고를 위해 시간-농도 곡선을 2가지 경우 (Whole BTC와 Fractured BTC)로 가정하여 기계학습 모형을 학습시켜 모의결과를 비교하였다. 제시된 프레임워크의 검증을 위해서 낙동강 지류인 감천에 적용하여 모형을 구축하고 시나리오 자료 기반 검증과 Rhodamine WT를 이용한 추적자 실험자료를 이용한 검증을 수행하였다. 기계학습 모형들의 비교 검증 결과, 각 모형은 가중항 기반과 불순도 감소량 기반 특징 중요도 산출 방식에 따라 주요 특징이 상이하게 산출되었으며, 전체 시간-농도 곡선 (WBTC)과 부분 시간-농도 곡선 (FBTC)별 최적 모형도 다르게 산출되었다. 유입 위치 정확도 및 유입 질량 예측에 대한 R2는 대부분의 모형이 90% 이상의 우수한 결과를 나타냈다.

  • PDF

Effective Drought Prediction Based on Machine Learning (머신러닝 기반 효과적인 가뭄예측)

  • Kim, Kyosik;Yoo, Jae Hwan;Kim, Byunghyun;Han, Kun-Yeun
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2021.06a
    • /
    • pp.326-326
    • /
    • 2021
  • 장기간에 걸쳐 넓은 지역에 대해 발생하는 가뭄을 예측하기위해 많은 학자들의 기술적, 학술적 시도가 있어왔다. 본 연구에서는 복잡한 시계열을 가진 가뭄을 전망하는 방법 중 시나리오에 기반을 둔 가뭄전망 방법과 실시간으로 가뭄을 예측하는 비시나리오 기반의 방법 등을 이용하여 미래 가뭄전망을 실시했다. 시나리오에 기반을 둔 가뭄전망 방법으로는, 3개월 GCM(General Circulation Model) 예측 결과를 바탕으로 2009년도 PDSI(Palmer Drought Severity Index) 가뭄지수를 산정하여 가뭄심도에 대한 단기예측을 실시하였다. 또, 통계학적 방법과 물리적 모델(Physical model)에 기반을 둔 확정론적 수치해석 방법을 이용하여 비시나리오 기반 가뭄을 예측했다. 기존 가뭄을 통계학적 방법으로 예측하기 위해서 시도된 대표적인 방법으로 ARIMA(Autoregressive Integrated Moving Average) 모델의 예측에 대한 한계를 극복하기위해 서포트 벡터 회귀(support vector regression, SVR)와 웨이블릿(wavelet neural network) 신경망을 이용해 SPI를 측정하였다. 최적모델구조는 RMSE(root mean square error), MAE(mean absolute error) 및 R(correlation Coefficient)를 통해 선정하였고, 1-6개월의 선행예보 시간을 갖고 가뭄을 전망하였다. 그리고 SPI를 이용하여, 마코프 연쇄(Markov chain) 및 대수선형모델(log-linear model)을 적용하여 SPI기반 가뭄예측의 정확도를 검증하였으며, 터키의 아나톨리아(Anatolia) 지역을 대상으로 뉴로퍼지모델(Neuro-Fuzzy)을 적용하여 1964-2006년 기간의 월평균 강수량과 SPI를 바탕으로 가뭄을 예측하였다. 가뭄 빈도와 패턴이 불규칙적으로 변하며 지역별 강수량의 양극화가 심화됨에 따라 가뭄예측의 정확도를 높여야 하는 요구가 커지고 있다. 본 연구에서는 복잡하고 비선형성으로 이루어진 가뭄 패턴을 기상학적 가뭄의 정도를 나타내는 표준강수증발지수(SPEI, Standardized Precipitation Evapotranspiration Index)인 월SPEI와 일SPEI를 기계학습모델에 적용하여 예측개선 모형을 개발하고자 한다.

  • PDF

Fault Detection Technique for PVDF Sensor Based on Support Vector Machine (서포트벡터머신 기반 PVDF 센서의 결함 예측 기법)

  • Seung-Wook Kim;Sang-Min Lee
    • The Journal of the Korea institute of electronic communication sciences
    • /
    • v.18 no.5
    • /
    • pp.785-796
    • /
    • 2023
  • In this study, a methodology for real-time classification and prediction of defects that may appear in PVDF(Polyvinylidene fluoride) sensors, which are widely used for structural integrity monitoring, is proposed. The types of sensor defects appearing according to the sensor attachment environment were classified, and an impact test using an impact hammer was performed to obtain an output signal according to the defect type. In order to cleary identify the difference between the output signal according to the defect types, the time domain statistical features were extracted and a data set was constructed. Among the machine learning based classification algorithms, the learning of the acquired data set and the result were analyzed to select the most suitable algorithm for detecting sensor defect types, and among them, it was confirmed that the highest optimization was performed to show SVM(Support Vector Machine). As a result, sensor defect types were classified with an accuracy of 92.5%, which was up to 13.95% higher than other classification algorithms. It is believed that the sensor defect prediction technique proposed in this study can be used as a base technology to secure the reliability of not only PVDF sensors but also various sensors for real time structural health monitoring.

실시간 수문자료의 특성분리를 통한 예측성능의 향상

  • Hwang, Seok-Hwan;Kim, Chi-Yeong;Cha, Jun-Ho;Jeong, Seong-Won
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2011.05a
    • /
    • pp.128-128
    • /
    • 2011
  • 본 연구에서는 자동유량측정시설에 의하여 실시간으로 생산되는 자동유량측정 자료의 정상성 여부를 판단하는데 중요한 적정 측정 신뢰구간을 실시간으로 예측할 수 있는 기술을 개발하였다. 전세계적으로, 현대적인 유량측정이 시작된 이래 연속유량 산정을 위한 방법은 수위-유량관계곡선을 이용하는 방법 외에 실무적으로 활용 가능한 방법은 거의 전무한 실정이다. 수위-유량관계곡선을 이용하는 방법은 연속수위를 계측하여 이에 해당하는 연속유량을 산정하는 방법으로 수위와 유량간에 일정한 관계를 가지는 정상적인 흐름을 보이는 자연하천의 경우에 정확도가 매우 높다. 그러나 감조나 구조물 등에 의해 유량이 조절되는 경우에 유량산정의 정확도는 현저히 떨어지게 된다. 따라서 수위에서 유량을 환산하는 방법이 아닌 유량을 직접 연속으로 측정하는 방법이 꾸준히 연구되어 왔고, 이 중 가장 대표적인 방법이 자동유량측정 방법이다. 그러나 자동유량측정 방법은 유량을 연속으로 측정할 수 있다는 장점에 반해 측정된 유량의 정확도를 높이기가 매우 어렵다는 단점도 가지고 있다. 계측 자체의 기술적 한계는 주로 계측기기적인 문제로 이는 전자기, 통신 기술 등 첨단 기술의 발전과 함께 다양한 현장 시험을 통해 폭넓은 개선이 이루어지고 있다. 그러나 아직 기술적 완성도가 완전하지 못한 현실에서, 현재 설치되어 있는 자동유량측정 유량자료의 신뢰도를 높이기 위해서는 각각의 계측 시점에서 자료가 정상적으로 산정되고 있는지에 대한 검정이 필요하고, 이는 자동유량측정 자료의 정확도 확보에 매우 중요한 관건으로 작용할 수밖에 없다. 이러한 배경에서 본 연구에서는 조석성분과 유출성분을 분리하여 예측하는 방법을 새롭게 개발 적용하였다. 자료는 자료의 시간해상도 증감에 따른 실제 예측의 정확도 증감을 고려하여 가장 적절하다고 판단되는 시자료를 사용하였으며, 자료간 상관을 분석하여 주 입력 자료로 팔당댐 방류량, 한강대교 지점 수위, 전류 수위를 이용하였다. 모형의 예측 능력을 극대화하기 위하여 조석 영향을 받는 자료의 경우는 웨이블릿 변환(wavelet transform)을 이용하여 순수 유출성분과 조위성분을 분리하여 별도로 적용하였다. 그리고 예측을 위한 모형은 실시간 자료기반 모형으로 그 안정성이 인정된 서포트벡터머신(support vector machine)을 이용하였다. 이러한 과정을 통해 한강대교 지점의 순수 유출성분과 조위성분의 유량을 각각 예측한 후 두 결과를 합성하여 최종 한강 대교 지점의 유량을 산정하였다. 조석성분을 분리하여 한강대교 지점의 유량을 예측한 결과 대부분의 예측치가 95% 예측구간에 포함되었다. 그리고 조석성분을 분리하지 않은 모형과 조석성분을 분리한 모형의 예측 능력을 비교한 결과, 조석성분을 분리한 모형이 예측이 정확도가 높았다. RMSE의 경우 분리하지 않은 모형대비 23%의 예측오차가 감소하였고, NSC의 경우 0.92에서 0.95로 예측의 정확도가 증가하였다.

  • PDF

A Study on Optimization of Perovskite Solar Cell Light Absorption Layer Thin Film Based on Machine Learning (머신러닝 기반 페로브스카이트 태양전지 광흡수층 박막 최적화를 위한 연구)

  • Ha, Jae-jun;Lee, Jun-hyuk;Oh, Ju-young;Lee, Dong-geun
    • The Journal of the Korea Contents Association
    • /
    • v.22 no.7
    • /
    • pp.55-62
    • /
    • 2022
  • The perovskite solar cell is an active part of research in renewable energy fields such as solar energy, wind, hydroelectric power, marine energy, bioenergy, and hydrogen energy to replace fossil fuels such as oil, coal, and natural gas, which will gradually disappear as power demand increases due to the increase in use of the Internet of Things and Virtual environments due to the 4th industrial revolution. The perovskite solar cell is a solar cell device using an organic-inorganic hybrid material having a perovskite structure, and has advantages of replacing existing silicon solar cells with high efficiency, low cost solutions, and low temperature processes. In order to optimize the light absorption layer thin film predicted by the existing empirical method, reliability must be verified through device characteristics evaluation. However, since it costs a lot to evaluate the characteristics of the light-absorbing layer thin film device, the number of tests is limited. In order to solve this problem, the development and applicability of a clear and valid model using machine learning or artificial intelligence model as an auxiliary means for optimizing the light absorption layer thin film are considered infinite. In this study, to estimate the light absorption layer thin-film optimization of perovskite solar cells, the regression models of the support vector machine's linear kernel, R.B.F kernel, polynomial kernel, and sigmoid kernel were compared to verify the accuracy difference for each kernel function.

Machine Learning Based BLE Indoor Positioning Performance Improvement (머신러닝 기반 BLE 실내측위 성능 개선)

  • Moon, Joon;Pak, Sang-Hyon;Hwang, Jae-Jeong
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2021.10a
    • /
    • pp.467-468
    • /
    • 2021
  • In order to improve the performance of the indoor positioning system using BLE beacons, a receiver that measures the angle of arrival among the direction finding technologies supported by BLE5.1 was manufactured and analyzed by machine learning to measure the optimal position. For the creation and testing of machine learning models, k-nearest neighbor classification and regression, logistic regression, support vector machines, decision tree artificial neural networks, and deep neural networks were used to learn and test. As a result, when the test set 4 produced in the study was used, the accuracy was up to 99%.

  • PDF