• 제목/요약/키워드: Machine-learning Feature

검색결과 705건 처리시간 0.025초

Cognitive Impairment Prediction Model Using AutoML and Lifelog

  • Hyunchul Choi;Chiho Yoon;Sae Bom Lee
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권11호
    • /
    • pp.53-63
    • /
    • 2023
  • 본 연구는 고령층의 치매 예방을 위한 선별검사 수단으로 자동화된 기계학습(AutoML)을 활용하여 인지기능 장애 예측모형을 개발하였다. 연구 데이터는 한국지능정보사회진흥원의 '치매 고위험군 웨어러블 라이프로그 데이터'를 활용하였다. 분석은 구글 코랩 환경에서 PyCaret 3.0.0이 사용하여 우수한 분류성능을 보여주는 5개의 모형을 선정하고 앙상블 학습을 진행하여 모형을 통합한 뒤, 최종 성능평가를 진행하였다. 연구결과, Voting Classifier, Gradient Boosting Classifier, Extreme Gradient Boosting, Light Gradient Boosting Machine, Extra Trees Classifier, Random Forest Classifier 모형 순으로 높은 예측성능을 보이는 것으로 나타났다. 특히 '수면 중 분당 평균 호흡수'와 '수면 중 분당 평균 심박수'가 가장 중요한 특성변수(feature)로 확인되었다. 본 연구의 결과는 고령층의 인지기능 장애를 보다 효과적으로 관리하고 예방하기 위한 수단으로 기계학습과 라이프로그의 활용 가능성에 대한 고려를 시사한다.

인적요인을 고려한 머신러닝 활용 산림화재 예측 (Predicting Forest Fires Using Machine Learning Considering Human Factors)

  • 장진명;김주찬;김화중;김광태
    • 한국산업정보학회논문지
    • /
    • 제28권5호
    • /
    • pp.109-126
    • /
    • 2023
  • 대형 산림화재를 예방하기 위해 산림화재의 조기발견은 매우 중요하다. 조기발견을 위한 하나의 방안으로 산림화재 발생 예측이 고려되고 있으며 다양한 관련 연구가 진행되었다. 그러나 대다수의 선행연구가 산림화재의 주요 발화 원인 중의 하나인 인적요인을 고려하지 않고 기상요인과 지리적 요인만을 주로 다루고 있다. 따라서 본 연구는 기상 및 지리적 요인뿐만 아니라 인적요인을 고려한 산림화재 예측모형을 개발하기 위해 2003년부터 2020년까지의 강원도 산림화재 데이터를 활용하여 로지스틱 회귀모형과 다양한 머신러닝 기법 기반의 예측모형을 개발하고 성능을 비교분석하였다. 성능분석 결과, 머신러닝 기법인 랜덤 포레스트(AUC=0.920)와 XG Boost 모형(AUC=0.925)이 가장 우수한 성능을 나타냈다. 운영시사점을 도출하기 위해 순열특성중요도 분석을 활용하여 요인들의 상대적 중요도를 분석하였으며, 기상요인이 인적요인보다 높은 영향도를 나타냈지만 다양한 인적요인도 유효한 것으로 확인되었다.

Use of Word Clustering to Improve Emotion Recognition from Short Text

  • Yuan, Shuai;Huang, Huan;Wu, Linjing
    • Journal of Computing Science and Engineering
    • /
    • 제10권4호
    • /
    • pp.103-110
    • /
    • 2016
  • Emotion recognition is an important component of affective computing, and is significant in the implementation of natural and friendly human-computer interaction. An effective approach to recognizing emotion from text is based on a machine learning technique, which deals with emotion recognition as a classification problem. However, in emotion recognition, the texts involved are usually very short, leaving a very large, sparse feature space, which decreases the performance of emotion classification. This paper proposes to resolve the problem of feature sparseness, and largely improve the emotion recognition performance from short texts by doing the following: representing short texts with word cluster features, offering a novel word clustering algorithm, and using a new feature weighting scheme. Emotion classification experiments were performed with different features and weighting schemes on a publicly available dataset. The experimental results suggest that the word cluster features and the proposed weighting scheme can partly resolve problems with feature sparseness and emotion recognition performance.

Predicting Session Conversion on E-commerce: A Deep Learning-based Multimodal Fusion Approach

  • Minsu Kim;Woosik Shin;SeongBeom Kim;Hee-Woong Kim
    • Asia pacific journal of information systems
    • /
    • 제33권3호
    • /
    • pp.737-767
    • /
    • 2023
  • With the availability of big customer data and advances in machine learning techniques, the prediction of customer behavior at the session-level has attracted considerable attention from marketing practitioners and scholars. This study aims to predict customer purchase conversion at the session-level by employing customer profile, transaction, and clickstream data. For this purpose, we develop a multimodal deep learning fusion model with dynamic and static features (i.e., DS-fusion). Specifically, we base page views within focal visist and recency, frequency, monetary value, and clumpiness (RFMC) for dynamic and static features, respectively, to comprehensively capture customer characteristics for buying behaviors. Our model with deep learning architectures combines these features for conversion prediction. We validate the proposed model using real-world e-commerce data. The experimental results reveal that our model outperforms unimodal classifiers with each feature and the classical machine learning models with dynamic and static features, including random forest and logistic regression. In this regard, this study sheds light on the promise of the machine learning approach with the complementary method for different modalities in predicting customer behaviors.

음성 특징에 따른 파킨슨병 분류를 위한 알고리즘 성능 비교 (Performance Comparison of Algorithm through Classification of Parkinson's Disease According to the Speech Feature)

  • 정재우
    • 한국멀티미디어학회논문지
    • /
    • 제19권2호
    • /
    • pp.209-214
    • /
    • 2016
  • The purpose of this study was to classify healty persons and Parkinson disease patients from the vocal characteristics of healty persons and the of Parkinson disease patients using Machine Learning algorithms. So, we compared the most widely used algorithms for Machine Learning such as J48 algorithm and REPTree algorithm. In order to evaluate the classification performance of the two algorithms, the results were compared with depending on vocal characteristics. The classification performance of depending on vocal characteristics show 88.72% and 84.62%. The test results showed that the J48 algorithms was superior to REPTree algorithms.

R-to-R Extraction and Preprocessing Procedure for an Automated Diagnosis of Various Diseases from ECG Data

  • Timothy, Vincentius;Prihatmanto, Ary Setijadi;Rhee, Kyung-Hyune
    • Journal of Multimedia Information System
    • /
    • 제3권2호
    • /
    • pp.1-8
    • /
    • 2016
  • In this paper, we propose a method to automatically diagnose various diseases. The input data consists of electrocardiograph (ECG) recordings. We extract R-to-R interval (RRI) signals from ECG recordings, which are preprocessed to remove trends and ectopic beats, and to keep the signal stationary. After that, we perform some prospective analysis to extract time-domain parameters, frequency-domain parameters, and nonlinear parameters of the signal. Those parameters are unique for each disease and can be used as the statistical symptoms for each disease. Then, we perform feature selection to improve the performance of the diagnosis classifier. We utilize the selected features to diagnose various diseases using machine learning. We subsequently measure the performance of the machine learning classifier to make sure that it will not misdiagnose the diseases. The first two steps, which are R-to-R extraction and preprocessing, have been successfully implemented with satisfactory results.

머신 러닝을 이용한 영상 특징 기반 전기차 검출 및 분류 시스템 (Image Feature-based Electric Vehicle Detection and Classification System Using Machine Learning)

  • 김상혁;강석주
    • 전기학회논문지
    • /
    • 제66권7호
    • /
    • pp.1092-1099
    • /
    • 2017
  • This paper proposes a novel way of vehicle detection and classification based on image features. There are two main processes in the proposed system, which are database construction and vehicle classification processes. In the database construction, there is a tight censorship for choosing appropriate images of the training set under the rigorous standard. These images are trained using Haar features for vehicle detection and histogram of oriented gradients extraction for vehicle classification based on the support vector machine. Additionally, in the vehicle detection and classification processes, the region of interest is reset using a number plate to reduce complexity. In the experimental results, the proposed system had the accuracy of 0.9776 and the $F_1$ score of 0.9327 for vehicle classification.

Experiment on Intermediate Feature Coding for Object Detection and Segmentation

  • Jeong, Min Hyuk;Jin, Hoe-Yong;Kim, Sang-Kyun;Lee, Heekyung;Choo, Hyon-Gon;Lim, Hanshin;Seo, Jeongil
    • 방송공학회논문지
    • /
    • 제25권7호
    • /
    • pp.1081-1094
    • /
    • 2020
  • With the recent development of deep learning, most computer vision-related tasks are being solved with deep learning-based network technologies such as CNN and RNN. Computer vision tasks such as object detection or object segmentation use intermediate features extracted from the same backbone such as Resnet or FPN for training and inference for object detection and segmentation. In this paper, an experiment was conducted to find out the compression efficiency and the effect of encoding on task inference performance when the features extracted in the intermediate stage of CNN are encoded. The feature map that combines the features of 256 channels into one image and the original image were encoded in HEVC to compare and analyze the inference performance for object detection and segmentation. Since the intermediate feature map encodes the five levels of feature maps (P2 to P6), the image size and resolution are increased compared to the original image. However, when the degree of compression is weakened, the use of feature maps yields similar or better inference results to the inference performance of the original image.

쉴드 TBM 기계 데이터 및 머신러닝 기법을 이용한 암석의 일축압축강도 예측 (Prediction of Uniaxial Compressive Strength of Rock using Shield TBM Machine Data and Machine Learning Technique)

  • 김태환;고태영;박양수;김택곤;이대혁
    • 터널과지하공간
    • /
    • 제30권3호
    • /
    • pp.214-225
    • /
    • 2020
  • 쉴드 TBM(Tunnel Boring Machine) 터널 굴착 시 암반의 상태는 굴진 성능을 결정하는 중요한 요소 중 하나이다. 암석 강도는 지반조사 시 실내시험을 통해 얻을 수 있으나, 전체 TBM 굴진 구간에 대해 모두 알 수 없다. TBM 굴진 시 최적 Operation Parameter를 적용하기 위해서는 굴진 속도에 영향을 미치는 암석 강도를 파악하는 것이 매우 중요하다. 이에 본 연구에서는 TBM 굴착 중 생성되는 기계 데이터와 머신러닝(Machine Learning) 기법을 활용하여 암석 강도를 예측하고자 한다. 암석 강도를 예측하기 위해 여러 머신러닝 기법을 사용하여 비교하였고, 가장 예측 성능이 좋은 스태킹 모델을 최종 모델로 선택하였다. 암반 구간 Slurry 쉴드 TBM 굴진 사례에서 지반조사 및 시공 중 조사한 암석 강도와 강도를 획득한 위치에서의 TBM 굴착 데이터를 사용하였다. TBM 굴착 데이터는 Training과 Test용으로 8:2로 분할하였으며, 변수 선택(feature selection), 표준화(scaling), 이상치(outlier) 제거 등 전처리 과정을 수행하였다. 하이퍼파라미터 튜닝까지 마친 후, 스태킹 모델에 대해 평균 제곱근 오차(Root Mean Square Error, RMSE)와 결정 계수(R2)로 모델을 평가한 결과 각각 5.556과 0.943로 나타났으며, TBM 굴착 데이터로 암석 강도를 예측하는 모델로 유용할 것으로 판단된다.

망 분리를 이용한 딥러닝 학습시간 단축에 대한 연구 (A Study on Reducing Learning Time of Deep-Learning using Network Separation)

  • 이희열;이승호
    • 전기전자학회논문지
    • /
    • 제25권2호
    • /
    • pp.273-279
    • /
    • 2021
  • 본 논문에서는 딥러닝 구조를 분할을 이용한 개별 학습을 수행하여 학습시간을 단축하는 알고리즘을 제안한다. 제안하는 알고리즘은 망 분류 기점 설정 과정, 특징 벡터 추출 과정, 특징 노이즈 제거 과정, 클래스 분류 과정 등의 4가지 과정으로 구성된다. 첫 번째로 망 분류 기점 설정 과정에서는 효과적인 특징 벡터 추출을 위한 망 구조의 분할 기점을 설정한다. 두 번째로 특징 벡터 추출 과정에서는 기존에 학습한 가중치를 사용하여 추가 학습 없이 특징 벡터를 추출한다. 세 번째로 특징 노이즈 제거 과정에서는 추출된 특징 벡터를 입력받아 각 클래스의 출력값을 학습하여 데이터의 노이즈를 제거한다. 네 번째로 클래스 분류 과정에서는 노이즈가 제거된 특징 벡터를 입력받아 다층 퍼셉트론 구조에 입력하고 이를 출력하고 학습한다. 제안된 알고리즘의 성능을 평가하기 위하여 Extended Yale B 얼굴 데이터베이스를 사용하여 실험 하였다. 실험 결과, 1회 학습에 소요되는 시간의 경우 제안하는 알고리즘이 기존 알고리즘 기준 40.7% 단축하였다. 또한 목표 인식률까지 학습 횟수가 기존 알고리즘과 비교하여 단축하였다. 실험결과를 통해 1회 학습시간과 전체 학습시간을 감소시켜 기존의 알고리즘보다 향상됨을 확인하였다.