• 제목/요약/키워드: SVM classification Algorithm

검색결과 278건 처리시간 0.031초

머신러닝을 활용한 대학생 중도탈락 위험군의 예측모델 비교 연구 : N대학 사례를 중심으로 (A Comparative Study of Prediction Models for College Student Dropout Risk Using Machine Learning: Focusing on the case of N university)

  • 김소현;조성현
    • 대한통합의학회지
    • /
    • 제12권2호
    • /
    • pp.155-166
    • /
    • 2024
  • Purpose : This study aims to identify key factors for predicting dropout risk at the university level and to provide a foundation for policy development aimed at dropout prevention. This study explores the optimal machine learning algorithm by comparing the performance of various algorithms using data on college students' dropout risks. Methods : We collected data on factors influencing dropout risk and propensity were collected from N University. The collected data were applied to several machine learning algorithms, including random forest, decision tree, artificial neural network, logistic regression, support vector machine (SVM), k-nearest neighbor (k-NN) classification, and Naive Bayes. The performance of these models was compared and evaluated, with a focus on predictive validity and the identification of significant dropout factors through the information gain index of machine learning. Results : The binary logistic regression analysis showed that the year of the program, department, grades, and year of entry had a statistically significant effect on the dropout risk. The performance of each machine learning algorithm showed that random forest performed the best. The results showed that the relative importance of the predictor variables was highest for department, age, grade, and residence, in the order of whether or not they matched the school location. Conclusion : Machine learning-based prediction of dropout risk focuses on the early identification of students at risk. The types and causes of dropout crises vary significantly among students. It is important to identify the types and causes of dropout crises so that appropriate actions and support can be taken to remove risk factors and increase protective factors. The relative importance of the factors affecting dropout risk found in this study will help guide educational prescriptions for preventing college student dropout.

신병 주특기교육 성취집단 예측모형 개발 (Development of newly recruited privates on-the-job Training Achievements Group Classification Model)

  • 곽기효;서용무
    • 한국국방경영분석학회지
    • /
    • 제33권2호
    • /
    • pp.101-113
    • /
    • 2007
  • 국방부에서 발표한 '국방개혁에 관한 법률'에 따라 2014년까지 현역병들에 대한 복무기간이 단계적으로 단축될 예정이다. 이에 따라 육군에서는 좀 더 효율적인 직무교육 방안의 일환으로 훈련병들에게 '차등제 교육'을 시행하고 있다. 이러한 차등제 교육의 효과를 향상시키기 위해서는 훈련병들의 예상 학업 성취도를 미리 예측하여 성취집단별로 차별화 된 교육과정을 거치게 하는 것이 매우 중요하다. 따라서 본 연구에서는 입교초기에 얻을 수 있는 신병들의 제한된 자료들만을 이용하여 그들의 예상 교육 성취집단을 예측하는 모형을 개발하였다. 본 모형의 목적 변수는 '성취집단'이며 '일반관리 인원' 및 '집중관리 인원'의 두 가지 값을 갖는다. 사용된 기법은 인공신경망(Neural Network) 모형, 의사결정나무(Decision Tree) 모형, SVM 모형, 그리고 Naive Bayesian모형 등 4가지 순수 모형과, 각각의 순수 모형을 k-means군집기법과 혼합한 4가지의 혼합모형 등 총 8개의 모형의 성능을 비교 분석하였다. 실험 결과 k-means군집기법과 인공신경망 기법을 혼합한 모형이 가장 좋은 예측력을 보이는 것으로 나타났다. 이러한 교육 성취집단 예측 모형은 향후 군에서 이루어지는 다양한 교육 프로그램에 효과적으로 이용될 수 있을 것으로 기대된다.

QRS 특징점 변화에 따른 바이너리 코딩 기반의 부정맥 분류 (Arrhythmia Classification based on Binary Coding using QRS Feature Variability)

  • 조익성;권혁숭
    • 한국정보통신학회논문지
    • /
    • 제17권8호
    • /
    • pp.1947-1954
    • /
    • 2013
  • 부정맥 검출을 위한 기존 연구들은 분류의 정확성을 높이기 위해 신경망, 퍼지 이론, SVM 등과 같은 비선형 방법이 주로 사용되어 왔다. 이러한 대부분의 방법들은 P-QRS-T 지점의 정확한 측정을 필요로 하며, 데이터의 가공 및 연산이 복잡하다. 또한 P파, T파의 개인차가 있어 파형을 구분할 수 없을 경우도 존재한다. 따라서 이러한 문제점을 극복하기 위해서는 최소한의 특징점을 추출함으로써 연산의 복잡도를 줄이고, 실시간으로 다양한 부정맥을 분류할 수 있는 적합한 알고리즘의 설계가 필요하다. 따라서 본 연구에서는 QRS 특징점 변화에 따른 바이너리 코딩 기반의 실시간 부정맥 분류 방법을 제안한다. 이를 위해 전처리를 통해 잡음이 제거된 심전도 신호에서 R파, RR 간격, QRS 폭을 추출하고, 각 특징점들의 문턱치(threshold) 만족 여부를 바이너리 코드화시킴으로써 실시간으로 부정맥을 분류 하였다. 제안한 방법의 우수성을 입증하기 위해 39개의 MIT-BIH 부정맥 데이터베이스 레코드를 대상으로 PVC, PAC, Normal, BBB, Paced beat의 검출률을 비교하였다. 실험결과 PVC, PAC, Normal, BBB, Paced beat는 각각 97.18%, 94.14%, 99.83%, 92.77%, 97.48%의 우수한 평균 검출률을 나타내었다.

영상 폐색영역 검출 및 해결을 위한 딥러닝 알고리즘 적용 가능성 연구 (A Study on the Applicability of Deep Learning Algorithm for Detection and Resolving of Occlusion Area)

  • 배경호;박홍기
    • 한국산학기술학회논문지
    • /
    • 제20권11호
    • /
    • pp.305-313
    • /
    • 2019
  • 최근 드론을 이용한 공간정보 구축이 활성화되면서 공간정보 산업발전에 많은 기여를 하고 있다. 하지만 드론 공간정보는 카메라의 중심투영에 의한 발생하는 폐색영역 뿐 아니라 가로수, 보행자, 현수막과 같은 적치물에 의한 폐색 영역이 필연적으로 발생한다. 이러한 폐색영역을 효율적으로 해결하기 위한 다양한 방안이 연구되고 있다. 본 연구에서는 폐색영역 해결을 위해 원초적인 재촬영이 아닌 딥러닝 알고리즘을 적용하기 위한 다양한 알고리즘별 조사 및 비교 연구를 수행하였다. 그 결과, 객체 검출 알고리즘인 HOG부터 기계학습 방법인 SVM, 딥러닝 방식인 DNN, CNN, RNN까지 다양한 모델들이 개발 및 적용되고 있으며, 이 중 영상의 분류, 검출에 가장 보편적이고 효율적인 알고리즘은 CNN 기법임을 확인하였다. 향후 AI 기반의 자동 객체 탐지와 분류는 공간정보 분야에서 각광받는 최신 과학기술이다. 이를 위해 다양한 알고리즘에 대한 검토와 적용은 중요하다. 따라서, 본 연구에서 제시하는 알고리즘별 적용 가능성은 자동으로 드론 영상의 폐색영역을 탐지하고 해결할 수 있어 공간정보 구축의 시간, 비용, 인력에 대한 효율성 향상에 기여할 것으로 판단된다.

Sentinel-1 위성의 영상 분류 기법을 이용한 백두산 천지의 얼음 면적 변화 탐지 (Changes Detection of Ice Dimension in Cheonji, Baekdu Mountain Using Sentinel-1 Image Classification)

  • 박성재;엄진아;고보균;박정원;이창욱
    • 한국지구과학회지
    • /
    • 제41권1호
    • /
    • pp.31-39
    • /
    • 2020
  • 아시아에서 가장 큰 칼데라 호수인 천지는 해발 약 2250 m의 백두산 정상에 위치한다. 천지는 높은 해발고도 및 바다와 인접한 환경으로 인해 1년 중 6개월 정도가 눈과 얼음으로 뒤덮여 있다. 천지의 수원은 대부분 지하수로부터 유입되기 때문에 수온과 백두산의 화산활동이 밀접한 관련이 있다. 하지만 2000년대에 들어서며 백두산에 많은 화산활동이 관측되고 있다. 본 연구에서는 유럽우주국(European Space Agency: ESA)에서 제공하는 Sentinel-1 위성 영상자료를 활용하여 백두산의 겨울철 생성되는 얼음의 면적을 분석하였다. Sentinel-1 위성의 후방산란 영상에서 얼음의 면적을 산출하기 위해 질감 분석 기법을 활용하여 2개의 편파영상에서 20개의 Gray-Level Co-occurrence Matrix(GLCM) 레이어를 생성했다. 면적 산출에 사용된 방법은 GLCM 레이어를 Support Vector Machine (SVM) 알고리즘으로 분류하여 영상에서 얼음의 면적을 산출했다. 또한 산출된 면적은 삼지연 기상관측소에서 획득된 기온자료와 상관관계를 분석하였다. 본 연구는 본격적인 장기간의 시계열 분석에 앞서 얼음의 면적을 산출하는 새로운 방법에 대한 대안을 제시하는 근거로서 활용될 수 있을 것이다.

뇌파신호를 이용한 감정분류 연구 (Research on Classification of Human Emotions Using EEG Signal)

  • 무하마드 주바이르;김진술;윤장우
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권4호
    • /
    • pp.821-827
    • /
    • 2018
  • Affective Computing은 HCI (Human Computer Interaction) 및 건강 관리 분야에서 다양한 애플리케이션이 개발됨에 따라 최근 몇 년 동안 관심이 높아지고 있다. 이에 필수적으로 필요한 인간의 감정 인식에 대한 중요한 연구가 있었지만, 언어 및 표정과 비교하여 심전도 (ECG) 또는 뇌파계 (EEG) 신호와 같은 생리적 신호 분석에 따른 감정 분석에 대한 관심은 적었다. 본 논문에서는 이산 웨이블릿 변환을 이용한 EEG 기반 감정 인식 시스템을 제안하고 감정 관련 정보를 얻기 위해 다른 뇌파와 뇌 영역을 연구 하였으며, 웨이블릿 계수에 기초한 특징 세트가 웨이블릿 에너지 특징과 함께 추출되었다. 중복성을 최소화하고 피처 간의 관련성을 극대화하기 위해 mRMR 알고리즘이 피쳐 선택에 적용된다. 다중클래스 Support Vector Machine을 사용하여 4 가지 종류의 인간 감정을 크게 분류하였으며 공개적으로 이용 가능한 "DEAP"데이터베이스의 뇌파 기록이 실험에서 사용되었다. 제안 된 접근법은 기존의 알고리즘에 비해 향상된 성능을 보여준다.

Classifying Indian Medicinal Leaf Species Using LCFN-BRNN Model

  • Kiruba, Raji I;Thyagharajan, K.K;Vignesh, T;Kalaiarasi, G
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권10호
    • /
    • pp.3708-3728
    • /
    • 2021
  • Indian herbal plants are used in agriculture and in the food, cosmetics, and pharmaceutical industries. Laboratory-based tests are routinely used to identify and classify similar herb species by analyzing their internal cell structures. In this paper, we have applied computer vision techniques to do the same. The original leaf image was preprocessed using the Chan-Vese active contour segmentation algorithm to efface the background from the image by setting the contraction bias as (v) -1 and smoothing factor (µ) as 0.5, and bringing the initial contour close to the image boundary. Thereafter the segmented grayscale image was fed to a leaky capacitance fired neuron model (LCFN), which differentiates between similar herbs by combining different groups of pixels in the leaf image. The LFCN's decay constant (f), decay constant (g) and threshold (h) parameters were empirically assigned as 0.7, 0.6 and h=18 to generate the 1D feature vector. The LCFN time sequence identified the internal leaf structure at different iterations. Our proposed framework was tested against newly collected herbal species of natural images, geometrically variant images in terms of size, orientation and position. The 1D sequence and shape features of aloe, betel, Indian borage, bittergourd, grape, insulin herb, guava, mango, nilavembu, nithiyakalyani, sweet basil and pomegranate were fed into the 5-fold Bayesian regularization neural network (BRNN), K-nearest neighbors (KNN), support vector machine (SVM), and ensemble classifier to obtain the highest classification accuracy of 91.19%.

SVM 이용한 다중 생체신호기반 온열질환 감지 스마트 안전모 개발 (Smart Helmet for Vital Sign-Based Heatstroke Detection Using Support Vector Machine)

  • 장재민;이강호;주수빈;권오원;이학;이동규
    • 센서학회지
    • /
    • 제31권6호
    • /
    • pp.433-440
    • /
    • 2022
  • Recently, owing to global warming, average summer temperatures are increasing and the number of hot days is increasing is increasing, which leads to an increase in heat stroke. In particular, outdoor workers directly exposed to the heat are at higher risk of heat stroke; therefore, preventing heat-related illnesses and managing safety have become important. Although various wearable devices have been developed to prevent heat stroke for outdoor workers, applying various sensors to the safety helmets that workers must wear is an excellent alternative. In this study, we developed a smart helmet that measures various vital signs of the wearer such as body temperature, heart rate, and sweat rate; external environmental signals such as temperature and humidity; and movement signals of the wearer such as roll and pitch angles. The smart helmet can acquire the various data by connecting with a smartphone application. Environmental data can check the status of heat wave advisory, and the individual vital signs can monitor the health of workers. In addition, we developed an algorithm that classifies the risk of heat-related illness as normal and abnormal by inputting a set of vital signs of the wearer using a support vector machine technique, which is a machine learning technique that allows for rapid binary classification with high reliability. Furthermore, the classified results suggest that the safety manager can supervise the prevention of heat stroke by receiving feedback from the control system.

S-MTS를 이용한 강판의 표면 결함 진단 (Steel Plate Faults Diagnosis with S-MTS)

  • 김준영;차재민;신중욱;염충섭
    • 지능정보연구
    • /
    • 제23권1호
    • /
    • pp.47-67
    • /
    • 2017
  • 강판 표면 결함은 강판의 품질과 가격을 결정하는 중요한 요인 중 하나로, 많은 철강 업체는 그동안 검사자의 육안으로 강판 표면 결함을 확인해왔다. 그러나 시각에 의존한 검사는 통상 30% 이상의 판단 오류가 발생함에 따라 검사 신뢰도가 낮은 문제점을 갖고 있다. 따라서 본 연구는 Simultaneous MTS (S-MTS) 알고리즘을 적용하여 보다 지능적이고 높은 정확도를 갖는 새로운 강판 표면 결함 진단 시스템을 제안하였다. S-MTS 알고리즘은 단일 클래스 분류에는 효과적이지만 다중 클래스 분류에서 정확도가 떨어지는 기존 마할라노비스 다구찌시스템 알고리즘(Mahalanobis Taguchi System; MTS)의 문제점을 해결한 새로운 알고리즘이다. 강판 표면 결함 진단은 대표적인 다중 클래스 분류 문제에 해당하므로, 강판 표면 결함 진단 시스템 구축을 위해 본 연구에서는 S-MTS 알고리즘을 채택하였다. 강판 표면 결함 진단 시스템 개발은 S-MTS 알고리즘에 따라 다음과 같이 진행하였다. 첫째, 각 강판 표면 결함 별로 개별적인 참조 그룹 마할라노비스 공간(Mahalanobis Space; MS)을 구축하였다. 둘째, 구축된 참조 그룹 MS를 기반으로 비교 그룹 마할라노비스 거리(Mahalanobis Distance; MD)를 계산한 후 최소 MD를 갖는 강판 표면 결함을 비교 그룹의 강판 표면 결함으로 판단하였다. 셋째, 강판 표면 결함을 분류하는 데 있어 결함 간의 차이점을 명확하게 해주는 예측 능력이 높은 변수를 파악하였다. 넷째, 예측 능력이 높은 변수만을 이용해 강판 표면 결함 분류를 재수행함으로써 최종적인 강판 표면 결함 진단 시스템을 구축한다. 이와 같은 과정을 통해 구축한 S-MTS 기반 강판 표면 결함 진단 시스템의 정확도는 90.79%로, 이는 기존 검사 방법에 비해 매우 높은 정확도를 갖는 유용한 방법임을 보여준다. 추후 연구에서는 본 연구를 통해 개발된 시스템을 현장 적용하여, 실제 효과성을 검증할 필요가 있다.

불균형 데이터 환경에서 변수가중치를 적용한 사례기반추론 기반의 고객반응 예측 (Response Modeling for the Marketing Promotion with Weighted Case Based Reasoning Under Imbalanced Data Distribution)

  • 김은미;홍태호
    • 지능정보연구
    • /
    • 제21권1호
    • /
    • pp.29-45
    • /
    • 2015
  • 고객반응 예측모형은 마케팅 프로모션을 제공할 목표고객을 효과적으로 선정할 수 있도록 하여 프로모션의 효과를 극대화 할 수 있도록 해준다. 오늘날과 같은 빅데이터 환경에서는 데이터 마이닝 기법을 적용하여 고객반응 예측모형을 구축하고 있으며 본 연구에서는 사례기반추론 기반의 고객반응 예측모형을 제시하였다. 일반적으로 사례기반추론 기반의 예측모형은 타 인공지능기법에 비해 성과가 낮다고 알려져 있으나 입력변수의 중요도에 따라 가중치를 상이하게 적용함으로써 예측성과를 향상시킬 수 있다. 본 연구에서는 프로모션에 대한 고객의 반응여부에 영향을 미치는 중요도에 따라 입력변수의 가중치를 산출하여 적용하였으며 동일한 가중치를 적용한 예측모형과의 성과를 비교하였다. 목욕세제 판매데이터를 사용하여 고객반응 예측모형을 개발하고 로짓모형의 계수를 적용하여 입력변수의 중요도에 따라 가중치를 산출하였다. 실증분석 결과 각 변수의 중요도에 기반하여 가중치를 적용한 예측모형이 동일한 가중치를 적용한 예측모형보다 높은 예측성과를 보여주었다. 또한 고객 반응예측 모형과 같이 실생활의 분류문제에서는 두 범주에 속하는 데이터의 수가 현격한 차이를 보이는 불균형 데이터가 대부분이다. 이러한 데이터의 불균형 문제는 기계학습 알고리즘의 성능을 저하시키는 요인으로 작용하며 본 연구에서 제안한 Weighted CBR이 불균형 환경에서도 안정적으로 적용할 수 있는지 검증하였다. 전체데이터에서 100개의 데이터를 무작위로 추출한 불균형 환경에서 100번 반복하여 예측성과를 비교해 본 결과 본 연구에서 제안한 Weighted CBR은 불균형 환경에서도 일관된 우수한 성과를 보여주었다.