• 제목/요약/키워드: SVM algorithm

검색결과 643건 처리시간 0.022초

변별적 가중치 학습을 이용한 3GPP2 SVM의 실시간 음성/음악 분류 성능 향상 (Enhancement of Speech/Music Classification for 3GPP2 SMV Codec Employing Discriminative Weight Training)

  • 강상익;장준혁;이성로
    • 한국음향학회지
    • /
    • 제27권6호
    • /
    • pp.319-324
    • /
    • 2008
  • 본 논문에서는 변별적 가중치 학습 (discriminative weight training) 기반의 3GPP2 Selectable Mode Vocoder (SMV) 실시간 음성/음악 분류 성능을 향상 시키는 방법을 제안한다. SMV의 음성/음악 실시간 분류 알고리즘에서 사용된 특징벡터와 분류방법을 분석하고, 이를 기반으로 분류성능향상을 위해 MCE (minimum classification error)방법을 도입하여, 각 특징 백터별로 다른 가중치를 적용하는 음성/음악 결정법 (decision rule)을 제시한다. 구체적으로 SMV의 음성/음악 분류알고리즘에서 사용되어진 특징벡터만을 선택적으로 사용하여 가중치를 적용한 값을 기하 평균한 값을 문턱값과 비교하는 실시간 분류기법이 제시되었다. SMV의 음성/음악 분류에 제안한 방법의 성능 평가를 위해 SMV 원래의 분류알고리즘과 비교하였으며, 다양한 음악장르에 대해 시스템의 성능을 평가한 결과 가중치를 적용하였을 때 기존의 SMV의 방법보다 우수한 음성/음악 분류 성능을 보였다.

머신러닝을 활용한 대학생 중도탈락 위험군의 예측모델 비교 연구 : N대학 사례를 중심으로 (A Comparative Study of Prediction Models for College Student Dropout Risk Using Machine Learning: Focusing on the case of N university)

  • 김소현;조성현
    • 대한통합의학회지
    • /
    • 제12권2호
    • /
    • pp.155-166
    • /
    • 2024
  • Purpose : This study aims to identify key factors for predicting dropout risk at the university level and to provide a foundation for policy development aimed at dropout prevention. This study explores the optimal machine learning algorithm by comparing the performance of various algorithms using data on college students' dropout risks. Methods : We collected data on factors influencing dropout risk and propensity were collected from N University. The collected data were applied to several machine learning algorithms, including random forest, decision tree, artificial neural network, logistic regression, support vector machine (SVM), k-nearest neighbor (k-NN) classification, and Naive Bayes. The performance of these models was compared and evaluated, with a focus on predictive validity and the identification of significant dropout factors through the information gain index of machine learning. Results : The binary logistic regression analysis showed that the year of the program, department, grades, and year of entry had a statistically significant effect on the dropout risk. The performance of each machine learning algorithm showed that random forest performed the best. The results showed that the relative importance of the predictor variables was highest for department, age, grade, and residence, in the order of whether or not they matched the school location. Conclusion : Machine learning-based prediction of dropout risk focuses on the early identification of students at risk. The types and causes of dropout crises vary significantly among students. It is important to identify the types and causes of dropout crises so that appropriate actions and support can be taken to remove risk factors and increase protective factors. The relative importance of the factors affecting dropout risk found in this study will help guide educational prescriptions for preventing college student dropout.

공공 기상데이터와 기계학습 모델을 이용한 토양수분 예측 (Prediction of Soil Moisture with Open Source Weather Data and Machine Learning Algorithms)

  • 장영빈;장익훈;최영찬
    • 한국농림기상학회지
    • /
    • 제22권1호
    • /
    • pp.1-12
    • /
    • 2020
  • 토양수분은 농업에서 필수적인 자원으로 이의 변화와 부족을 예측함으로써 관리되어왔다. 최근 현장에서의 적용 용이성과 다양한 지역에 대한 일반화 가능성이 뛰어난 통계 및 기계학습 알고리즘을 활용한 토양수분 예측 연구가 활발히 진행되고 있다. 하지만 국내에서 생성되는 데이터를 이용한 연구들은 부족한 실정이다. 이에 본 연구는 1) 국내 공공기상 데이터만으로 충분한 성능을 내는 토양수분 예측 모델을 만들 수 있는지, 2) 어떠한 기계학습 모델이 국내에서 생산되는 데이터와 토양환경에서 가장 높은 예측 성능을 보이는지, 3) 단일 기계학습 모델을 이용해 다양한 지역에 적용 가능한지를 확인해보려 한다. 본 연구에서 Support Vector Machines (SVM), Random Forest (RF), Extremely Randomized Trees (ET), Gradient Boosting Machines (GBM), and Deep Feedforward Network (DFN) 알고리즘과 종관기상관측 자료, 농업기상관측자료를 활용하여 안동, 보성, 철원, 순천 지역의 토양 수분을 예측하는 모델을 만들었다. 그 결과, GBM을 이용한 모델이 R2 : 0.96, Root Mean Squared Error(RMSE) : 1.8로 가장 낮은 예측 오차를 보였다. 또한 GBM을 사용한 모델이 가장 낮은 지역간 예측 오차 분산을 보여 가장 일반화하기에 적절한 모델로 확인되었다.

EEG 신호 및 사물인터넷 기반 실내 환경 제어 시스템 (Indoor Environment Control System based EEG Signal and Internet of Things)

  • 정해성;이상민;권장우
    • 재활복지공학회논문지
    • /
    • 제11권1호
    • /
    • pp.45-52
    • /
    • 2017
  • EEG 신호는 신체적으로 불편함을 가지고 있는 사용자에게서도 동일하게 발생되는 신호로써 차세대 인터페이스로 각광받고 있다. 본 논문에서는 사용자의 EEG 신호를 이용하여 감성적인 정보처리와 논리적인 정보처리를 보조하는 실내 환경을 제어하는 사물인터넷 시스템을 제안한다. 제안된 시스템은 EEG 측정 장치, EEG 시뮬레이션 소프트웨어, 실내 환경 제어 장치로 구성된다. 실험 데이터로는 편안한 상태에서 발생되는 감성적인 정보처리에 대한 EEG 신호 데이터와 집중 시에 발생되는 논리적인 정보처리에 대한 EEG 신호 데이터를 사용한다. 측정된 신호에서는 ICA 알고리즘이 적용하여 잡음이 제거되고 베타파만을 추출한다. 이후 SVM을 통한 학습 및 테스트 과정을 거치게 된다. 피험자는 EEG 시뮬레이션 소프트웨어를 통해 EEG 신호 정확도 향상 훈련을 거친 결과 평균 82.69%의 정확도를 보였다. EEG 측정 장치로부터 입력되는 EEG 신호는 Serial 통신을 통해 EEG 시뮬레이션 소프트웨어로 전송되며 감성적인 정보처리와 논리적인 정보처리를 분류하여 제어 명령이 생성된다. 이후 생성된 제어 명령은 Zigbee 통신을 통해 실내 환경 제어 장치로 전달되어 감성적인 정보처리일 경우 은은한 조명과 클래식 음악이 출력되고 논리적인 정보처리일 경우 밝은 조명과 함께 학습용 백색소음이 출력된다. 제안한 시스템은 BCI 기반 소프트웨어 및 디바이스 제어에 응용될 수 있어 몸이 불편한 사용자가 자신의 신체적인 한계를 극복하는 것을 가능하게 한다.

영상 폐색영역 검출 및 해결을 위한 딥러닝 알고리즘 적용 가능성 연구 (A Study on the Applicability of Deep Learning Algorithm for Detection and Resolving of Occlusion Area)

  • 배경호;박홍기
    • 한국산학기술학회논문지
    • /
    • 제20권11호
    • /
    • pp.305-313
    • /
    • 2019
  • 최근 드론을 이용한 공간정보 구축이 활성화되면서 공간정보 산업발전에 많은 기여를 하고 있다. 하지만 드론 공간정보는 카메라의 중심투영에 의한 발생하는 폐색영역 뿐 아니라 가로수, 보행자, 현수막과 같은 적치물에 의한 폐색 영역이 필연적으로 발생한다. 이러한 폐색영역을 효율적으로 해결하기 위한 다양한 방안이 연구되고 있다. 본 연구에서는 폐색영역 해결을 위해 원초적인 재촬영이 아닌 딥러닝 알고리즘을 적용하기 위한 다양한 알고리즘별 조사 및 비교 연구를 수행하였다. 그 결과, 객체 검출 알고리즘인 HOG부터 기계학습 방법인 SVM, 딥러닝 방식인 DNN, CNN, RNN까지 다양한 모델들이 개발 및 적용되고 있으며, 이 중 영상의 분류, 검출에 가장 보편적이고 효율적인 알고리즘은 CNN 기법임을 확인하였다. 향후 AI 기반의 자동 객체 탐지와 분류는 공간정보 분야에서 각광받는 최신 과학기술이다. 이를 위해 다양한 알고리즘에 대한 검토와 적용은 중요하다. 따라서, 본 연구에서 제시하는 알고리즘별 적용 가능성은 자동으로 드론 영상의 폐색영역을 탐지하고 해결할 수 있어 공간정보 구축의 시간, 비용, 인력에 대한 효율성 향상에 기여할 것으로 판단된다.

Sentinel-1 위성의 영상 분류 기법을 이용한 백두산 천지의 얼음 면적 변화 탐지 (Changes Detection of Ice Dimension in Cheonji, Baekdu Mountain Using Sentinel-1 Image Classification)

  • 박성재;엄진아;고보균;박정원;이창욱
    • 한국지구과학회지
    • /
    • 제41권1호
    • /
    • pp.31-39
    • /
    • 2020
  • 아시아에서 가장 큰 칼데라 호수인 천지는 해발 약 2250 m의 백두산 정상에 위치한다. 천지는 높은 해발고도 및 바다와 인접한 환경으로 인해 1년 중 6개월 정도가 눈과 얼음으로 뒤덮여 있다. 천지의 수원은 대부분 지하수로부터 유입되기 때문에 수온과 백두산의 화산활동이 밀접한 관련이 있다. 하지만 2000년대에 들어서며 백두산에 많은 화산활동이 관측되고 있다. 본 연구에서는 유럽우주국(European Space Agency: ESA)에서 제공하는 Sentinel-1 위성 영상자료를 활용하여 백두산의 겨울철 생성되는 얼음의 면적을 분석하였다. Sentinel-1 위성의 후방산란 영상에서 얼음의 면적을 산출하기 위해 질감 분석 기법을 활용하여 2개의 편파영상에서 20개의 Gray-Level Co-occurrence Matrix(GLCM) 레이어를 생성했다. 면적 산출에 사용된 방법은 GLCM 레이어를 Support Vector Machine (SVM) 알고리즘으로 분류하여 영상에서 얼음의 면적을 산출했다. 또한 산출된 면적은 삼지연 기상관측소에서 획득된 기온자료와 상관관계를 분석하였다. 본 연구는 본격적인 장기간의 시계열 분석에 앞서 얼음의 면적을 산출하는 새로운 방법에 대한 대안을 제시하는 근거로서 활용될 수 있을 것이다.

안드로이드 플랫폼에서 악성 행위 분석을 통한 특징 추출과 머신러닝 기반 악성 어플리케이션 분류 (Malware Application Classification based on Feature Extraction and Machine Learning for Malicious Behavior Analysis in Android Platform)

  • 김동욱;나경기;한명묵;김미주;고웅;박준형
    • 인터넷정보학회논문지
    • /
    • 제19권1호
    • /
    • pp.27-35
    • /
    • 2018
  • 본 논문은 안드로이드 플랫폼에서 악성 어플리케이션을 탐지하기 위한 연구로, 안드로이드 악성 어플리케이션에 대한 위협과 행위 분석에 대한 연구를 바탕으로 머신러닝을 적용한 악성 어플리케이션 탐지를 수행하였다. 안드로이드의 행위 분석은 동적 분석도구를 통해 수행할 수 있으며, 이를 통해 어플리케이션에 대한 API Calls, Runtime Log, System Resource, Network 등의 정보를 추출할 수 있다. 이 연구에서는 행위 분석을 통한 특징 추출을 머신러닝에 적용하기 위해 특징에 대한 속성을 변환하고, 전체 특징에 대한 머신러닝 적용과 특징들의 연관분석을 통한 주성분분석으로 특징간의 상관분석으로 얻은 머신러닝 적용을 수행하였다, 이에 대한 결과로 악성 어플리케이션에 대한 머신러닝 분류 결과는 전체 특징을 사용한 분류 결과보다 주요 특징을 통한 정확도 결과가 약 1~4%정도 향상되었으며, SVM 분류기의 경우 10%이상의 좋은 결과를 얻을 수 있었다. 이 결과를 통해서 우리는 전체적인 특징을 이용하는 것보다, 주요 특징만을 통해 얻을 결과가 전체적인 분류 알고리즘에 더 좋은 결과를 얻을 수 있고, 데이터 세트에서 의미있는 특징을 선정하는 것이 중요하다고 파악하였다.

딥러닝을 이용한 소규모 지역의 영상분류 적용성 분석 : UAV 영상을 이용한 농경지를 대상으로 (Applicability of Image Classification Using Deep Learning in Small Area : Case of Agricultural Lands Using UAV Image)

  • 최석근;이승기;강연빈;성선경;최도연;김광호
    • 한국측량학회지
    • /
    • 제38권1호
    • /
    • pp.23-33
    • /
    • 2020
  • 최근 UAV (Unmanned Aerial Vehicle)를 이용하여 고해상도 영상을 편리하게 취득할 수 있게 되면서 저비용으로 소규모 지역의 관측 및 공간정보 제작이 가능하게 되었다. 특히, 농업환경 모니터링을 위하여 작물생산 지역의 피복지도 생성에 대한 연구가 활발히 진행되고 있으며, 랜덤 포레스트와 SVM (Support Vector Machine) 및 CNN(Convolutional Neural Network) 을 적용하여 분류 성능을 비교한 결과 영상분류에서 딥러닝 적용에 대하여 활용도가 높은 것으로 나타났다. 특히, 위성영상을 이용한 피복분류는 위성영상 데이터 셋과 선행 파라메터를 사용하여 피복분류의 정확도와 시간에 대한 장점을 가지고 있다. 하지만, 무인항공기 영상은 위성영상과 공간해상도와 같은 특성이 달라 이를 적용하기에는 어려움이 있다. 이러한 문제점을 해결하기 위하여 위성영상 데이터 셋이 아닌 UAV를 이용한 데이터 셋과 국내의 소규모 복합 피복이 존재하는 농경지 분석에 활용이 가능한 딥러닝 알고리즘 적용 연구를 수행하였다. 본 연구에서는 최신 딥러닝의 의미론적 영상분류인 DeepLab V3+, FC-DenseNet (Fully Convolutional DenseNets), FRRN-B (Full-Resolution Residual Networks) 를 UAV 데이터 셋에 적용하여 영상분류를 수행하였다. 분류 결과 DeepLab V3+와 FC-DenseNet의 적용 결과가 기존 감독분류보다 높은 전체 정확도 97%, Kappa 계수 0.92로 소규모 지역의 UAV 영상을 활용한 피복분류의 적용가능성을 보여주었다.

고해상도 영상의 분류결과 개선을 위한 최적의 Shape-Size Index 추출에 관한 연구 (A Study on Optimal Shape-Size Index Extraction for Classification of High Resolution Satellite Imagery)

  • 한유경;김혜진;최재완;김용일
    • 대한원격탐사학회지
    • /
    • 제25권2호
    • /
    • pp.145-154
    • /
    • 2009
  • 고해상도 위성영상이 갖는 공간 객체의 복잡성과 다양성에 의해 기존 중 저해상도 영상에서 사용하던 분류 방식을 고해상도 영상에 그대로 적용하기에는 한계가 있다. 이러한 문제를 극복하기 위하여 영상의 공간적인 특성을 추가적으로 추출하여 분광정보와 결합하여 분류를 수행하는 방식의 연구가 진행되고 있다. 본 연구의 목적은 고해상도 영상의 분류정확도를 개선하기 위하여 새로운 공간 개체(spatial feature)인 SSI(Shape-Size Index)를 제안하는데 있다. SSI feature는 영역 확장(Region Growing) 기반의 영상 분할(Image Segmentation)을 수행한 후, 세그먼트 내에 공간 속성값을 할당하여 공간정보를 추출한다. 추출된 공간정보를 고해상도 영상의 다중분광 밴드와 결합하여 Support Vector Machine(SVM)을 이용한 분류를 수행하였다. SSI를 구성하는데 필요한 두 매개변수인 분할변수와 가중치변수의 최적값을 얻기 위해서 고해상도 위성영상인 KOMFSAT-2와 QuickBird-2에 반복적으로 적용하였다. 결과적으로 고해상도 영상의 공간특성을 표현하는데 적합한 매개변수를 통하여 도출된 SSI와 고해상도 분광 밴드를 결합하여 분류를 수행한 결과가 분광밴드만을 이용하여 분류를 수행한 결과에 비해 높은 분류정확도를 도출함을 확인하였다.

A Classification Model for Illegal Debt Collection Using Rule and Machine Learning Based Methods

  • Kim, Tae-Ho;Lim, Jong-In
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권4호
    • /
    • pp.93-103
    • /
    • 2021
  • 금융당국의 채권추심 가이드라인, 추심업자에 대한 직접적인 관리 감독 수행 등의 노력에도 불구하고 채무자에 대한 불법, 부당한 채권 추심은 지속되고 있다. 이러한 불법, 부당한 채권추심행위를 효과적으로 예방하기 위해서는 비정형데이터 기계학습 등 기술을 활용하여 적은 인력으로도 불법 추심행위에 대한 점검 등에 대한 모니터링을 강화 할 수 있는 방법이 필요하다. 본 연구에서는 대부업체의 추심 녹취 파일을 입수하여 이를 텍스트 데이터로 변환하고 위법, 위규 행위를 판별하는 규칙기반 검출과 SVM(Support Vector Machine) 등 기계학습을 결합한 불법채권추심 분류 모델을 제안하고 기계학습 알고리즘에 따라 얼마나 정확한 식별을 하였는지를 비교해 보았다. 본 연구는 규칙기반 불법 검출과 기계학습을 결합하여 분류에 활용할 경우 기존에 연구된 기계학습만을 적용한 분류모델 보다 정확도가 우수하다는 것을 보여 주었다. 본 연구는 규칙기반 불법검출과 기계학습을 결합하여 불법여부를 분류한 최초의 시도이며 후행연구를 진행하여 모델의 완성도를 높인다면 불법채권 추심행위에 대한 소비자 피해 예방에 크게 기여할 수 있을 것이다.