• 제목/요약/키워드: Vector Machines

검색결과 534건 처리시간 0.025초

기계학습 기반 유전자 발현 데이터를 이용한 치주질환 예측 (Prediction for Periodontal Disease using Gene Expression Profile Data based on Machine Learning)

  • 이제근
    • 한국정보통신학회논문지
    • /
    • 제23권8호
    • /
    • pp.903-909
    • /
    • 2019
  • 치주질환은 상당수의 성인들이 가지고 있는 질환이지만 아직 분자적인 수준에서의 발생 기작과 치료 방법에 대해서는 많은 것이 밝혀져 있지 않다. 본 연구에서는 치주질환 조직과 정상 조직에서 얻어진 유전자 발현 데이터를 이용하여 치주질환 조직과 정상 조직 사이에 분자적 차이가 있는지를 확인한다. 특히 기계학습 알고리즘을 이용하여 유전자 발현양 기반 치주질환 조직과 정상 조직의 분류가 가능한지를 확인하고, 각 조직에서 발현양 차이가 나는 유전자들이 주로 어떤 기능을 하는 것인지 살펴본다. t-SNE를 이용한 분석 결과 정상 조직과 치주질환 조직 샘플이 명확히 구분되어 군집화 될 수 있음이 확인되었다. 또한, 결정 트리, 랜덤 포레스트, 서포트 벡터 머신을 이용한 분류 알고리즘을 적용한 결과 불균형 데이터임에도 높은 정확도와 민감도, 특이도를 보였으며, 염증 반응 및 면역 반응 관련 유전자들이 주로 두 집단 간에 차이를 보임이 확인되었다.

토픽모델링을 활용한 대학생의 중도탈락 데이터 분석 (Data Analysis of Dropouts of University Students Using Topic Modeling)

  • 정도헌;박주연
    • 한국정보통신학회논문지
    • /
    • 제25권1호
    • /
    • pp.88-95
    • /
    • 2021
  • 본 연구의 목적은 대학생의 중도탈락 현상 데이터를 실증적으로 분석하여 대학의 학생지원정책을 수립하기 위한 시사점을 제공하는 데 있다. 이를 위해 D대학의 2017~2019년 입학생 데이터를 토픽모델링 LDA(Latent Dirichlet Allocation)를 활용하여 재학생과 제적생으로 나누어 분석하였다. 연구결과 제적생에서 특징있게 나타난 토픽은 '학적'관련하여 '학기등록 1회', '전공'관련하여 '어문계열학과', '학점'관련하여 '학사경고'이고, '대학생활'관련하여 '비교과 프로그램'에 대한 토픽은 나타나지 않았다. 다음으로 '재학생 토픽'과 '제적생 토픽'의 상호 식별 성능을 측정한 결과, SVM(Support Vector Machines)이 가장 우수한 식별 성능을 보여주었다. 이러한 실험을 통해 기계학습을 활용한 인공지능 기반의 학생 데이터 분류 기법 연구의 가능성을 확인할 수 있었다.

Damaged cable detection with statistical analysis, clustering, and deep learning models

  • Son, Hyesook;Yoon, Chanyoung;Kim, Yejin;Jang, Yun;Tran, Linh Viet;Kim, Seung-Eock;Kim, Dong Joo;Park, Jongwoong
    • Smart Structures and Systems
    • /
    • 제29권1호
    • /
    • pp.17-28
    • /
    • 2022
  • The cable component of cable-stayed bridges is gradually impacted by weather conditions, vehicle loads, and material corrosion. The stayed cable is a critical load-carrying part that closely affects the operational stability of a cable-stayed bridge. Damaged cables might lead to the bridge collapse due to their tension capacity reduction. Thus, it is necessary to develop structural health monitoring (SHM) techniques that accurately identify damaged cables. In this work, a combinational identification method of three efficient techniques, including statistical analysis, clustering, and neural network models, is proposed to detect the damaged cable in a cable-stayed bridge. The measured dataset from the bridge was initially preprocessed to remove the outlier channels. Then, the theory and application of each technique for damage detection were introduced. In general, the statistical approach extracts the parameters representing the damage within time series, and the clustering approach identifies the outliers from the data signals as damaged members, while the deep learning approach uses the nonlinear data dependencies in SHM for the training model. The performance of these approaches in classifying the damaged cable was assessed, and the combinational identification method was obtained using the voting ensemble. Finally, the combination method was compared with an existing outlier detection algorithm, support vector machines (SVM). The results demonstrate that the proposed method is robust and provides higher accuracy for the damaged cable detection in the cable-stayed bridge.

토픽 모형을 이용한 텍스트 데이터의 단어 선택 (Feature selection for text data via topic modeling)

  • 장우솔;김예은;손원
    • 응용통계연구
    • /
    • 제35권6호
    • /
    • pp.739-754
    • /
    • 2022
  • 텍스트 데이터는 일반적으로 많은 변수를 포함하고 있으며 변수들 사이의 연관성도 높아 통계 분석의 정확성, 효율성 등에서 문제가 생길 수 있다. 이러한 문제점에 대처하기 위해 목표 변수가 주어진 지도 학습에서는 목표 변수를 잘 설명할 수 있는 단어들을 선택하여 이 단어들만 통계 분석에 이용하기도 한다. 반면, 비지도 학습에서는 목표 변수가 주어지지 않으므로 지도 학습에서와 같은 단어 선택 절차를 활용하기 어렵다. 이 연구에서는 토픽 모형을 이용하여 지도 학습에서의 목표 변수를 대신할 수 있는 토픽을 생성하고 각 토픽별로 연관성이 높은 단어들을 선택하는 단어 선택 절차를 제안한다. 제안된 절차를 실제 텍스트 데이터에 적용한 결과, 단어 선택 절차를 이용하면 많은 토픽에서 공통적으로 자주 등장하는 단어들을 제거함으로써 토픽을 더 명확하게 식별할 수 있었다. 또한, 군집 분석에 적용한 결과, 군집과 범주 사이에 높은 연관성을 가지는 군집 분석 결과를 얻을 수 있는 것으로 나타났다. 목표 변수에 대한 정보없이 토픽 모형을 이용하여 선택한 단어들을 분류 분석에 적용하였을 때 목표 변수를 이용하여 단어들을 선택한 경우와 비슷한 분류 정확성을 얻을 수 있음도 확인하였다.

Comparative Analysis of Machine Learning Techniques for IoT Anomaly Detection Using the NSL-KDD Dataset

  • Zaryn, Good;Waleed, Farag;Xin-Wen, Wu;Soundararajan, Ezekiel;Maria, Balega;Franklin, May;Alicia, Deak
    • International Journal of Computer Science & Network Security
    • /
    • 제23권1호
    • /
    • pp.46-52
    • /
    • 2023
  • With billions of IoT (Internet of Things) devices populating various emerging applications across the world, detecting anomalies on these devices has become incredibly important. Advanced Intrusion Detection Systems (IDS) are trained to detect abnormal network traffic, and Machine Learning (ML) algorithms are used to create detection models. In this paper, the NSL-KDD dataset was adopted to comparatively study the performance and efficiency of IoT anomaly detection models. The dataset was developed for various research purposes and is especially useful for anomaly detection. This data was used with typical machine learning algorithms including eXtreme Gradient Boosting (XGBoost), Support Vector Machines (SVM), and Deep Convolutional Neural Networks (DCNN) to identify and classify any anomalies present within the IoT applications. Our research results show that the XGBoost algorithm outperformed both the SVM and DCNN algorithms achieving the highest accuracy. In our research, each algorithm was assessed based on accuracy, precision, recall, and F1 score. Furthermore, we obtained interesting results on the execution time taken for each algorithm when running the anomaly detection. Precisely, the XGBoost algorithm was 425.53% faster when compared to the SVM algorithm and 2,075.49% faster than the DCNN algorithm. According to our experimental testing, XGBoost is the most accurate and efficient method.

효율적인 변압기 유중가스 분석 및 분류 방법 (Efficient Transformer Dissolved Gas Analysis and Classification Method)

  • 조윤정;김재영;김종면
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제8권3호
    • /
    • pp.563-570
    • /
    • 2018
  • 본 논문에서는 기계학습 기반의 효율적인 변압기 유중가스 분석 및 분류 방법을 제안하여 기존 IEC 60599 진단기준 기반의 문제점을 해결하고 진단 성능을 개선한다. 기존 IEC 60599 진단기준은 조성비가 진단 기준에 존재하지 않거나 경계조건에 있는 경우 진단 전문가에게 의뢰하지 않고는 해석에 어려움이 있으며 진단영역이 겹치는 부분이 존재하므로 정확한 원인분석을 수행하는 데에 한계가 있다. 따라서 IEC 60599 진단 기준만으로 변압기 유중가스 데이터를 분석 및 분류하는 경우 IEC 60599 기준에 만족하지 않는 데이터를 분류하지 못한다는 문제점이 있다. 이와 같은 문제를 해결하기 위해 기계학습 기반의 변압기 유중가스 분석 및 분류 방법을 제안하였다. 제안한 기계학습 기반의 변압기 유중가스 분석 방법은 IEC 60599 진단기준으로 판단이 불가능한 데이터를 서포트 벡터 머신을 통해 정확히 분류 할 수 있다. 제안한 방법의 성능을 검증하기 위해 실제 유중가스 데이터를 사용하여 기계학습 기반의 변압기 유중가스 분석 방법의 효율성을 검증하였다.

음향방출 기반 배관 조기 결함 검출 및 진단 방법 (Acoustic Emission based early fault detection and diagnosis method for pipeline)

  • 김재영;정인규;김종면
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제8권3호
    • /
    • pp.571-578
    • /
    • 2018
  • 노후된 배관은 예기치 못한 누수나 균열을 발생시킨다. 이를 방치하거나 늦게 대응하면 지속적인 가스자원, 수자원 등의 막대한 손실을 발생시킨다. 본 논문에서는 배관의 결함을 검출하기 위해 음향방출 신호를 사용하는 배관 조기 결함 검출 방법과 진단 알고리즘을 제안한다. 배관의 결함으로 인해 변형이 생길 경우 배관의 고유진동수가 변화하므로 이를 관찰함으로써 배관의 이상 유무를 판단할 수 있다. 배관 조기결함 검출 방법은 정상상태의 스펙트럼과 취득된 신호의 스펙트럼을 주파수 성분의 크기에 대해 비교함으로써 배관의 결함 유무를 판단한다. 배관 조기 결함 진단 알고리즘은 정상상태와 결함상태를 기계학습 알고리즘인 서포트 벡터 머신(SVM)으로 학습하고 실제 취득된 배관 음향방출 신호를 입력하여 배관 상태를 진단한다. 실험에서는 제작된 배관 테스트베드를 사용하여 정상상태, 5mm 균열 상태, 10mm 균열 및 파공 상태를 가공하여 제안 방법을 테스트하였다. 실험 결과에서는 제안한 검출 방법 및 진단 알고리즘의 배관 조기 결함 검출 성능의 우수성을 검증하였다.

Sentiment Analysis for COVID-19 Vaccine Popularity

  • Muhammad Saeed;Naeem Ahmed;Abid Mehmood;Muhammad Aftab;Rashid Amin;Shahid Kamal
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제17권5호
    • /
    • pp.1377-1393
    • /
    • 2023
  • Social media is used for various purposes including entertainment, communication, information search, and voicing their thoughts and concerns about a service, product, or issue. The social media data can be used for information mining and getting insights from it. The World Health Organization has listed COVID-19 as a global epidemic since 2020. People from every aspect of life as well as the entire health system have been severely impacted by this pandemic. Even now, after almost three years of the pandemic declaration, the fear caused by the COVID-19 virus leading to higher depression, stress, and anxiety levels has not been fully overcome. This has also triggered numerous kinds of discussions covering various aspects of the pandemic on the social media platforms. Among these aspects is the part focused on vaccines developed by different countries, their features and the advantages and disadvantages associated with each vaccine. Social media users often share their thoughts about vaccinations and vaccines. This data can be used to determine the popularity levels of vaccines, which can provide the producers with some insight for future decision making about their product. In this article, we used Twitter data for the vaccine popularity detection. We gathered data by scraping tweets about various vaccines from different countries. After that, various machine learning and deep learning models, i.e., naive bayes, decision tree, support vector machines, k-nearest neighbor, and deep neural network are used for sentiment analysis to determine the popularity of each vaccine. The results of experiments show that the proposed deep neural network model outperforms the other models by achieving 97.87% accuracy.

Automated Prioritization of Construction Project Requirements using Machine Learning and Fuzzy Logic System

  • Hassan, Fahad ul;Le, Tuyen;Le, Chau;Shrestha, K. Joseph
    • 국제학술발표논문집
    • /
    • The 9th International Conference on Construction Engineering and Project Management
    • /
    • pp.304-311
    • /
    • 2022
  • Construction inspection is a crucial stage that ensures that all contractual requirements of a construction project are verified. The construction inspection capabilities among state highway agencies have been greatly affected due to budget reduction. As a result, efficient inspection practices such as risk-based inspection are required to optimize the use of limited resources without compromising inspection quality. Automated prioritization of textual requirements according to their criticality would be extremely helpful since contractual requirements are typically presented in an unstructured natural language in voluminous text documents. The current study introduces a novel model for predicting the risk level of requirements using machine learning (ML) algorithms. The ML algorithms tested in this study included naïve Bayes, support vector machines, logistic regression, and random forest. The training data includes sequences of requirement texts which were labeled with risk levels (such as very low, low, medium, high, very high) using the fuzzy logic systems. The fuzzy model treats the three risk factors (severity, probability, detectability) as fuzzy input variables, and implements the fuzzy inference rules to determine the labels of requirements. The performance of the model was examined on labeled dataset created by fuzzy inference rules and three different membership functions. The developed requirement risk prediction model yielded a precision, recall, and f-score of 78.18%, 77.75%, and 75.82%, respectively. The proposed model is expected to provide construction inspectors with a means for the automated prioritization of voluminous requirements by their importance, thus help to maximize the effectiveness of inspection activities under resource constraints.

  • PDF

선박 추진용 저압 전동기에 대한 2레벨 및 3레벨 인버터의 직접토크제어 비교 (Comparison of DTC between two-level and three-level inverters for LV propulsion electric motor in ship)

  • 류기탁;김종필;이윤형
    • 수산해양기술연구
    • /
    • 제60권1호
    • /
    • pp.71-79
    • /
    • 2024
  • In compliance with environmental regulations at sea and the introduction of unmanned autonomous ships, electric propulsion ships are garnering significant attention. Induction machines used as propulsion electric motor (PEM) have maintenance advantages, but speed control is very complicated and difficult. One of the most commonly used techniques for speed control is DTC (direct torque control). DTC is simple in the reference frame transformation and the stator flux calculation. Meanwhile, two-level and three-level voltage source inverters (VSI) are predominantly used. The three-level VSI has more flexibility in voltage space vector selection compared to the two-level VSI. In this paper, speed is controlled using the DTC method based on the specifications of the PEM. The speed controller employs a PI controller with anti-windup functionality. In addition, the characteristics of the two-level VSI and three-level VSI are compared under identical conditions. It was confirmed through simulation that proper control of speed and torque has been achieved. In particular, the torque ripple was small and control was possible with a low DC voltage at low speed in the three-level VSI. The study confirmed that the application of DTC, using a three-level VSI, contributes to enhancing the system's response performance.