• 제목/요약/키워드: 10-fold cross validation

검색결과 203건 처리시간 0.029초

Using CNN- VGG 16 to detect the tennis motion tracking by information entropy and unascertained measurement theory

  • Zhong, Yongfeng;Liang, Xiaojun
    • Advances in nano research
    • /
    • 제12권2호
    • /
    • pp.223-239
    • /
    • 2022
  • Object detection has always been to pursue objects with particular properties or representations and to predict details on objects including the positions, sizes and angle of rotation in the current picture. This was a very important subject of computer vision science. While vision-based object tracking strategies for the analysis of competitive videos have been developed, it is still difficult to accurately identify and position a speedy small ball. In this study, deep learning (DP) network was developed to face these obstacles in the study of tennis motion tracking from a complex perspective to understand the performance of athletes. This research has used CNN-VGG 16 to tracking the tennis ball from broadcasting videos while their images are distorted, thin and often invisible not only to identify the image of the ball from a single frame, but also to learn patterns from consecutive frames, then VGG 16 takes images with 640 to 360 sizes to locate the ball and obtain high accuracy in public videos. VGG 16 tests 99.6%, 96.63%, and 99.5%, respectively, of accuracy. In order to avoid overfitting, 9 additional videos and a subset of the previous dataset are partly labelled for the 10-fold cross-validation. The results show that CNN-VGG 16 outperforms the standard approach by a wide margin and provides excellent ball tracking performance.

JAYA-GBRT model for predicting the shear strength of RC slender beams without stirrups

  • Tran, Viet-Linh;Kim, Jin-Kook
    • Steel and Composite Structures
    • /
    • 제44권5호
    • /
    • pp.691-705
    • /
    • 2022
  • Shear failure in reinforced concrete (RC) structures is very hazardous. This failure is rarely predicted and may occur without any prior signs. Accurate shear strength prediction of the RC members is challenging, and traditional methods have difficulty solving it. This study develops a JAYA-GBRT model based on the JAYA algorithm and the gradient boosting regression tree (GBRT) to predict the shear strength of RC slender beams without stirrups. Firstly, 484 tests are carefully collected and divided into training and test sets. Then, the hyperparameters of the GBRT model are determined using the JAYA algorithm and 10-fold cross-validation. The performance of the JAYA-GBRT model is compared with five well-known empirical models. The comparative results show that the JAYA-GBRT model (R2 = 0.982, RMSE = 9.466 kN, MAE = 6.299 kN, µ = 1.018, and Cov = 0.116) outperforms the other models. Moreover, the predictions of the JAYA-GBRT model are globally and locally explained using the Shapley Additive exPlanation (SHAP) method. The effective depth is determined as the most crucial parameter influencing the shear strength through the SHAP method. Finally, a Graphic User Interface (GUI) tool and a web application (WA) are developed to apply the JAYA-GBRT model for rapidly predicting the shear strength of RC slender beams without stirrups.

Surface-Engineered Graphene surface-enhanced Raman scattering Platform with Machine-learning Enabled Classification of Mixed Analytes

  • Jae Hee Cho;Garam Bae;Ki-Seok An
    • 센서학회지
    • /
    • 제33권3호
    • /
    • pp.139-146
    • /
    • 2024
  • Surface-enhanced Raman scattering (SERS) enables the detection of various types of π-conjugated biological and chemical molecules owing to its exceptional sensitivity in obtaining unique spectra, offering nondestructive classification capabilities for target analytes. Herein, we demonstrate an innovative strategy that provides significant machine learning (ML)-enabled predictive SERS platforms through surface-engineered graphene via complementary hybridization with Au nanoparticles (NPs). The hybridized Au NPs/graphene SERS platforms showed exceptional sensitivity (10-7 M) due to the collaborative strong correlation between the localized electromagnetic effect and the enhanced chemical bonding reactivity. The chemical and physical properties of the demonstrated SERS platform were systematically investigated using microscopy and spectroscopic analysis. Furthermore, an innovative strategy employing ML is proposed to predict various analytes based on a featured Raman spectral database. Using a customized data-preprocessing algorithm, the feature data for ML were extracted from the Raman peak characteristic information, such as intensity, position, and width, from the SERS spectrum data. Additionally, sophisticated evaluations of various types of ML classification models were conducted using k-fold cross-validation (k = 5), showing 99% prediction accuracy.

기분석 어절 사전과 음절 단위의 확률 모델을 이용한 한국어 형태소 분석기 복제 (Cloning of Korean Morphological Analyzers using Pre-analyzed Eojeol Dictionary and Syllable-based Probabilistic Model)

  • 심광섭
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권3호
    • /
    • pp.119-126
    • /
    • 2016
  • 본 논문에서는 어절 단위의 기분석 사전과 음절 단위의 확률 모델을 이용하는 한국어 형태소 분석기가 실용성이 있는지를 검증한다. 이를 위해 기존의 한국어 형태소 분석기 MACH와 KLT2000을 복제하고, 복제된 형태소 분석기의 분석 결과가 MACH와 KLT2000 분석 결과와 얼마나 유사한지 정밀도와 재현율로 평가하는 실험을 하였다. 실험은 1,000만 어절 규모의 세종 말뭉치를 10개의 세트로 나누고 10배수 교차 검증을 하는 방식으로 하였다. MACH의 분석 결과를 정답 집합으로 하고 MACH 복제품의 분석 결과를 평가한 결과 정밀도와 재현율이 각각 97.16%와 98.31%였으며, KLT2000 복제품의 경우에는 정밀도와 재현율이 각각 96.80%와 99.03%였다 분석 속도는 MACH 복제품의 경우 초당 30.8만 어절이며, KLT2000 복제품은 초당 43.6만 어절로 나타났다. 이 실험 결과는 어절 단위의 기분석 사전과 음절 단위의 확률 모델로 만든 한국어 형태소 분석기가 실제 응용에 사용될 수 있을 정도의 성능을 가진다는 것을 보여준다.

Machine Learning Prediction for the Recurrence After Electrical Cardioversion of Patients With Persistent Atrial Fibrillation

  • Soonil Kwon;Eunjung Lee;Hojin Ju;Hyo-Jeong Ahn;So-Ryoung Lee;Eue-Keun Choi;Jangwon Suh;Seil Oh;Wonjong Rhee
    • Korean Circulation Journal
    • /
    • 제53권10호
    • /
    • pp.677-689
    • /
    • 2023
  • Background and Objectives: There is limited evidence regarding machine-learning prediction for the recurrence of atrial fibrillation (AF) after electrical cardioversion (ECV). This study aimed to predict the recurrence of AF after ECV using machine learning of clinical features and electrocardiograms (ECGs) in persistent AF patients. Methods: We analyzed patients who underwent successful ECV for persistent AF. Machine learning was designed to predict patients with 1-month recurrence. Individual 12-lead ECGs were collected before and after ECV. Various clinical features were collected and trained the extreme gradient boost (XGBoost)-based model. Ten-fold cross-validation was used to evaluate the performance of the model. The performance was compared to the C-statistics of the selected clinical features. Results: Among 718 patients (mean age 63.5±9.3 years, men 78.8%), AF recurred in 435 (60.6%) patients after 1 month. With the XGBoost-based model, the areas under the receiver operating characteristic curves (AUROCs) were 0.57, 0.60, and 0.63 if the model was trained by clinical features, ECGs, and both (the final model), respectively. For the final model, the sensitivity, specificity, and F1-score were 84.7%, 28.2%, and 0.73, respectively. Although the AF duration showed the best predictive performance (AUROC, 0.58) among the clinical features, it was significantly lower than that of the final machine-learning model (p<0.001). Additional training of extended monitoring data of 15-minute single-lead ECG and photoplethysmography in available patients (n=261) did not significantly improve the model's performance. Conclusions: Machine learning showed modest performance in predicting AF recurrence after ECV in persistent AF patients, warranting further validation studies.

명령 실행 모니터링과 딥 러닝을 이용한 파워셸 기반 악성코드 탐지 방법 (PowerShell-based Malware Detection Method Using Command Execution Monitoring and Deep Learning)

  • 이승현;문종섭
    • 정보보호학회논문지
    • /
    • 제28권5호
    • /
    • pp.1197-1207
    • /
    • 2018
  • 파워셸은 닷넷 프레임워크를 기반에 둔, 커맨드 라인 셸이자 스크립트 언어로, 그 자체가 가진 다양한 기능 외에도 윈도우 운영체제 기본 탑재, 코드 은닉 및 지속의 수월함, 다양한 모의 침투 프레임워크 등 공격 도구로서 여러 이점을 가지고 있다. 이에 따라 파워셸을 이용하는 악성코드가 급증하고 있으나 기존의 악성코드 탐지 기법으로 대응하기에는 한계가 존재한다. 이에 본 논문에서는 파워셸에서 실행되는 명령들을 관찰할 수 있는 개선된 모니터링 기법과, Convolutional Neural Network(CNN)을 이용해 명령에서 특징을 추출하고 실행 순서에 따라 Recurrent Neural Network(RNN)에 전달하여 악성 여부를 판단하는 딥 러닝 기반의 분류 모델을 제안한다. 악성코드 공유 사이트에서 수집한 파워셸 기반 악성코드 1,916개와 난독화 탐지 연구에서 공개한 정상 스크립트 38,148개를 이용하여 제안한 모델을 5-fold 교차 검증으로 테스트한 결과, 약 97%의 True Positive Rate(TPR)와 1%의 False Positive Rate(FPR)로 모델이 악성코드를 효과적으로 탐지함을 보인다.

EEG 신호 기반 경사도 방법을 통한 감정인식에 대한 연구 (A Novel Method for Emotion Recognition based on the EEG Signal using Gradients)

  • 한의환;차형태
    • 전자공학회논문지
    • /
    • 제54권7호
    • /
    • pp.71-78
    • /
    • 2017
  • 감정을 분류하는 대표적인 알고리즘에는 Support-vector-machine (SVM), Bayesian decision rule 등이 있다. 하지만 기존의 연구자들은 위와 같은 방법에는 문제점이 있다고 지적하였다. 이를 보완하기 위해 다른 연구자는 경사도를 이용하여 새로운 패턴인식 알고리즘을 제안하였다. 본 논문에서는 이 알고리즘을 통해 새로운 EEG 기반의 감정 인식 알고리즘을 제안하고 기존의 연구와 비교한다. 본 논문에서는 신뢰도 높은 자료를 얻기 위해 여러 논문에서 사용된 DEAP (a database for emotion analysis using physiological signals)를 사용하였다. 또한, 객관적인 검증을 위해 기존의 연구에서 사용된 4개의 뇌파 채널(Fz, Fp2, F3, F4)의 PSD (Power Spectral Density)를 특징으로 사용하여 감정의 2개 척도 (Arousal, Valence)를 분류하였다. 본 논문에서 실시한 교차검증 (4-fold)에 의하면 Valence 축에서 85%, Arousal 축에서 87.5의 정확도를 얻을 수 있었다.

희박한 데이터에 대한 선형판별분석에서 최적의 차원 수 결정 (Optimal number of dimensions in linear discriminant analysis for sparse data)

  • 신가인;김재직
    • 응용통계연구
    • /
    • 제30권6호
    • /
    • pp.867-876
    • /
    • 2017
  • 오늘날 관찰값의 개수에 비해 변수의 개수가 큰 희박한 데이터셋은 다양한 분야에서 쉽게 찾아볼 수 있고, 통계학에서 그러한 데이터셋에 대한 분석은 하나의 도전이 되어 왔다. 그러한 희박한 데이터에 대한 분류를 위해 판별분석모형들이 최근에 개발되었다. 그러한 판별분석모형들 중 하나의 접근법은 그룹들을 잘 구분해주는 차원들을 찾기를 시도하는데, 그러한 차원들은 데이터의 변수의 개수보다 훨씬 적다. 그러한 모형에서 차원의 수는 예측과 자료의 시각화를 위해 중요한 역할을 하고 일반적으로 K-묶음 교차타당성 방법에 의해 결정된다. 하지만, 희박한 데이터의 경우 K-묶음 교차타당성 방법 적용시 각 묶음에 대한 관찰값의 개수가 매우 적을 수 있기 때문에 교차타당성에 의한 차원 수 결정은 신뢰성이 떨어질 수 있다. 따라서, 본 연구에서는 그러한 희박판별분석모형에 의해 찾아진 차원들에서 각 그룹들의 평균 간의 표준화된 거리에 근거한 측도를 사용하여 최적의 차원 수를 결정하는 방법을 제안하고, 제안된 방법은 모의실험을 통해 검증된다.

음원을 이용한 멀티미디어 휴대용 단말장치 판별 (Hand-held Multimedia Device Identification Based on Audio Source)

  • 이명환;장태웅;문창배;김병만;오득환
    • 한국산업정보학회논문지
    • /
    • 제19권2호
    • /
    • pp.73-83
    • /
    • 2014
  • 다양한 오디오 편집 기술이 개발됨으로써 오디오 데이터의 변경이 보다 쉬워지고 그 결과로 위변조 같은 다양한 사회 문제가 발생하고 있다. 현재 이런 문제를 해결하기 위해 디지털 포렌식 기술이 활발히 연구되어지고 있다. 본 논문에서는 이러한 디지털 포렌식 기술 중의 하나로 모바일 기기를 판별하는 방법을 제안하였다. 제안 방법에서는 사람에게는 들리지 않지만 기기의 디자인과 IC로부터 발생하는 노이즈 특징을 이용한다. 위너필터를 사용하여 기기의 노이즈 음을 추출하고 MIRtoolbox를 이용하여 특징들을 추출한 후 이를 다층 신경망에 학습시켜 기기를 판별한다. 총 6개의 모바일 기기를 사용하였으며 5-fold test를 통하여 99.9%의 판별 성능을 보였다. 또한 UCC 사이트에 업로드 된 데이터에서도 노이즈 음을 통한 판별이 가능한지 실험을 진행하였으며 99.8%의 판별 성능을 보였다.

Transformational Leadership and Depressive Symptoms in Germany: Validation of a Short Transformational Leadership Scale

  • Seegel, Max Leonhard;Herr, Raphael M.;Schneider, Michael;Schmidt, Burkhard;Fischer, Joachim E.
    • Journal of Preventive Medicine and Public Health
    • /
    • 제52권3호
    • /
    • pp.161-169
    • /
    • 2019
  • Objectives: The objective of the present study was to validate a shortened transformational leadership (TL) scale (12 items) comprising core TL behaviour and to test the associations of this shortened TL scale with depressive symptoms. Methods: The study used cross-sectional data from 1632 employees of the overall workforce of a middle-sized German company (51.6% men; mean age, 41.35 years; standard deviation, 9.4 years). TL was assessed with the German version of the Transformational Leadership Inventory and depressive symptoms with the Hospital Anxiety and Depression Scale (HADS). The structural validity of the core TL scale was assessed with confirmatory factor analysis. Associations with depressive symptoms were estimated with structural equation modelling and adjusted logistic regression. Results: Confirmatory factor analysis and structural equation modelling showed better model fit for the core TL than for the full TL score. Logistic regression revealed 3.61-fold (95% confidence interval [CI], 2.20 to 5.93: women) to 4.46-fold (95% CI, 2.86 to 6.95: men) increased odds of reporting depressive symptoms (HADS score >8) for those in the lowest tertile of reported core TL. Conclusions: The shortened core TL seems to be a valid instrument for research and training purposes in the context of TL and depressive symptoms in employees. Of particular note, men reporting poor TL were more likely to report depressive symptoms.