• 제목/요약/키워드: Random forest algorithm

검색결과 217건 처리시간 0.033초

Random Forest를 결정로직으로 활용한 로봇의 실시간 음향인식 시스템 개발 (A Real-Time Sound Recognition System with a Decision Logic of Random Forest for Robots)

  • 송주만;김창민;김민욱;박용진;이서영;손정관
    • 로봇학회논문지
    • /
    • 제17권3호
    • /
    • pp.273-281
    • /
    • 2022
  • In this paper, we propose a robot sound recognition system that detects various sound events. The proposed system is designed to detect various sound events in real-time by using a microphone on a robot. To get real-time performance, we use a VGG11 model which includes several convolutional neural networks with real-time normalization scheme. The VGG11 model is trained on augmented DB through 24 kinds of various environments (12 reverberation times and 2 signal to noise ratios). Additionally, based on random forest algorithm, a decision logic is also designed to generate event signals for robot applications. This logic can be used for specific classes of acoustic events with better performance than just using outputs of network model. With some experimental results, the performance of proposed sound recognition system is shown on real-time device for robots.

대퇴의족의 자동 보행 모드 변경을 위한 랜덤 포레스트 기반 추정 모델 개발에 관한 연구 (A Study on Random Forest-based Estimation Model for Changing the Automatic Walking Mode of Above Knee Prosthesis)

  • 나선종;신진우;엄수홍;이응혁
    • 전기전자학회논문지
    • /
    • 제24권1호
    • /
    • pp.9-18
    • /
    • 2020
  • 의족의 자동 보행 모드 변경 알고리즘 개발에는 주로 사용되는 패턴 인식 또는 퍼지 추론 기법을 이용하지만 즉각적인 보행 환경 변화에는 대응하기 어렵다는 단점을 가진다. 이러한 한계점을 해결하고자 본 논문에서는 한 보행 주기 내 특정 보행단계에서의 보행 환경 추정을 통해 다음 걸음의 보행 모드를 자동으로 변환하는 알고리즘을 개발하였다. 제안하는 알고리즘은 마이크로 컨트롤러 내에 이식되어 운용되어야 하므로 계산량과 추정 소요 시간을 고려하여 랜덤포레스트 기반을 사용하여 개발하였다. 개발된 랜덤포레스트 기반의 보행 단계 및 환경 추정 모델은 마이크로 컨트롤러 내에 이식되어 유효성 평가를 진행하였다.

Using Machine Learning Technique for Analytical Customer Loyalty

  • Mohamed M. Abbassy
    • International Journal of Computer Science & Network Security
    • /
    • 제23권8호
    • /
    • pp.190-198
    • /
    • 2023
  • To enhance customer satisfaction for higher profits, an e-commerce sector can establish a continuous relationship and acquire new customers. Utilize machine-learning models to analyse their customer's behavioural evidence to produce their competitive advantage to the e-commerce platform by helping to improve overall satisfaction. These models will forecast customers who will churn and churn causes. Forecasts are used to build unique business strategies and services offers. This work is intended to develop a machine-learning model that can accurately forecast retainable customers of the entire e-commerce customer data. Developing predictive models classifying different imbalanced data effectively is a major challenge in collected data and machine learning algorithms. Build a machine learning model for solving class imbalance and forecast customers. The satisfaction accuracy is used for this research as evaluation metrics. This paper aims to enable to evaluate the use of different machine learning models utilized to forecast satisfaction. For this research paper are selected three analytical methods come from various classifications of learning. Classifier Selection, the efficiency of various classifiers like Random Forest, Logistic Regression, SVM, and Gradient Boosting Algorithm. Models have been used for a dataset of 8000 records of e-commerce websites and apps. Results indicate the best accuracy in determining satisfaction class with both gradient-boosting algorithm classifications. The results showed maximum accuracy compared to other algorithms, including Gradient Boosting Algorithm, Support Vector Machine Algorithm, Random Forest Algorithm, and logistic regression Algorithm. The best model developed for this paper to forecast satisfaction customers and accuracy achieve 88 %.

강우-유출 모의를 위한 개념적 모형과 기계학습 모형의 성능 비교 (A comparative study of conceptual model and machine learning model for rainfall-runoff simulation)

  • 이승철;김대하
    • 한국수자원학회논문집
    • /
    • 제56권9호
    • /
    • pp.563-574
    • /
    • 2023
  • 최근 기후변화로 인해 유역의 기상자료에 대한 반응이 달라지고 있어 강우-유출 모의에 대한 연구는 중요해지고 있다. 아울러 최근 기계학습 기법에 대한 높은 관심으로 이를 통한 강우-유출 모의 역시 활발하게 증가하고 있으나 기계학습 모형이 전통적으로 사용되어온 개념적 모형에 비해 활용성이 높은지는 아직 확실치 않다. 본 연구에서는 개념적 모형인 GR6J와 기계학습 모형인 Random Forest 성능을 한국 전역의 38개 계측 유역에 대해 계측 유역 예측기법과 미계측 유역 예측기법을 이용해 평가하였다. 먼저 계측 유역 적용기법 평가를 위해 각 모형을 관측 일 유량자료에 학습시키고 분리된 평가기간에 대한 모의성능을 비교하였다. 이후 미계측 유역 모의성능 평가를 위해 인접성 기반 지역화 방법을 Leave-One-Out Cross-Validation (LOOCV)을 이용해 평가하였다. 그 결과 계측 유역 평가에서는 Random Forest 기법이 GR6J 모형보다 일관되게 높은 성능을 보였다. 학습된 데이터를 출력 값으로 재생산하도록 구조화되어 있는 기계학습 기법이 개념적 이론을 통한 모형보다 높은 재현성을 갖기 때문으로 판단된다. 하지만 Random Forest 모형의 성능은 미계측 유역의 예측기법으로는 재현되지 않았고 GR6J 모형보다 성능이 더 낮은 것이 확인되었다. 본 연구는 기계학습 모형은 계측 유역의 유출예측에는 적용성이 높을 수 있으나 미계측 유역에 대한 적용가능성은 전통적인 개념적 모형보다 낮을 수 있음을 제시한다.

해양환경 예측정보를 활용한 인공지능 분석 기반의 최적 안전항로 연구 (Research on optimal safety ship-route based on artificial intelligence analysis using marine environment prediction)

  • 엄대용;이방희
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2023년도 춘계학술대회
    • /
    • pp.100-103
    • /
    • 2023
  • 최근 스마트선박 개발에 발맞춰 정확하고 세밀한 실시간 해양환경 예측정보의 요구가 확대되고 선박에 직접 지원하기 위한 환경이 확보됨에 따라 최적항로 분야에서도 다양한 해양환경을 고려한 정보 생산 및 평가 연구가 필요하다. 스마트선박에서 해양환경의 위험도 및 에너지 소비의 불확실성을 줄이면서 최적항로를 산출할 수 있는 알고리즘은 2단계로 구분하여 개발하였다. 1단계는 해양환경정보들과 선박자동식별시스템(AIS)내에 선박의 위치·상태정보를 결합해 프로파일을 생성하였다. 2단계는 구성한 프로파일 결과를 이용하여 해양환경 에너지맵을 정의할 수 있는 모델을 개발하였고, 약 60만개의 데이터를 반영할 수 있도록 인공지능 머신러닝 기법 중 Random Forest를 적용하여 회귀식을 생성하였다. Random Forest 회귀 모델의 결정계수(R2)는 0.89 를 보였다. 생성한 모델에 2021년 6월 1일~3일의 해양환경 예측정보를 이용하여 Dijikstra 최단경로 알고리즘을 적용해 최적 안전항로를 산출하고 맵에 표출했다. Random Forest 회귀 모델로 산출된 항로는 유선적이고 해양환경 예측정보의 상태를 감안하며 항로를 도출하는 결과를 보였다. 본 연구의 실시간 해양환경 예측정보 기반의 항로 산출 개념은 선박의 이동 경향성을 반영한 현실적이면서 안전한 항로 산출이 가능하고, 향후 경제성, 안전성, 친환경성 평가 모델로 범위로 확대할 수 있을 것으로 기대된다.

  • PDF

랜덤포레스트 머신러닝 기법을 활용한 전통적 비행이론기반 청소년 온·오프라인 비행 예측요인 연구 (A Study on the Classic Theory-Driven Predictors of Adolescent Online and Offline Delinquency using the Random Forest Machine Learning Algorithm)

  • 이택호;김선영;한윤선
    • 한국심리학회지 : 문화 및 사회문제
    • /
    • 제28권4호
    • /
    • pp.661-690
    • /
    • 2022
  • 본 연구에서는 청소년 비행이 지속적인 사회문제로 대두됨에 따라 청소년의 온·오프라인 비행을 예측하는 주요 요인들을 탐색하고 전통적 비행이론(사회학습이론, 일반긴장이론, 사회통제이론, 일상활동이론, 낙인이론)의 적용 가능성을 살펴보았다. 분석에 활용된 데이터는 한국아동·청소년패널조사 2010(KCYPS 2010)의 초1, 초4, 중1 패널 6차년도 데이터이다(N=4,137). 예측 모형을 구축함에 있어 전통적 통계기반의 회귀모형 대신 랜덤포레스트 머신러닝 기법을 활용함으로써 예측 성능 향상과 더불어 보다 많은 예측요인의 고려 가능성에 초점을 두었다. 랜덤포레스트 분석 결과, 청소년의 온·오프라인 비행을 설명하는 데에 전통적인 비행이론은 여전히 유효하였으며, 온라인 비행은 주로 개인적 요인(일상활동이론, 낙인이론)과, 오프라인 비행은 사회적 요인(사회학습이론, 사회통제이론)과 관련이 있는 것으로 나타났다. 또한 일반긴장 이론은 온라인 비행과 오프라인 비행 모두를 예측하는 중요한 이론적 기반임을 확인할 수 있었다. 본 연구는 머신러닝 기법을 통해 청소년 비행에 영향을 주는 주요 요인을 도출하고, 기존 비행이론의 활용 가능성도 함께 고려했다는 점에서 의의가 있으며, 청소년 온·오프라인 비행에 대한 예방 및 개입 방향성을 재고하는 기반을 제공할 것이라 기대된다.

핑거프린트와 랜덤포레스트 기반 실내 위치 인식 시스템 설계와 구현 (Design and Implementation of Indoor Location Recognition System based on Fingerprint and Random Forest)

  • 이선민;문남미
    • 방송공학회논문지
    • /
    • 제23권1호
    • /
    • pp.154-161
    • /
    • 2018
  • 최근 스마트폰 사용자가 늘어남에 따라 실내 위치인식 서비스에 대한 연구의 중요성이 증가하고 있다. 실내 위치인식에는 주로 WiFi, Bluetooth 등이 연구되고 있으나, 본 연구에서는 대부분의 실내 공간에 설치되어 있고 스마트폰에 WiFi 기능이 탑재되어 있어 접근성이 좋은 WiFi를 사용한다. 본 연구에서는 수집된 WiFi의 수신신호세기를 이용하는 핑거프린트 기술과 다변량 분류법 중 Ensemble learning method인 랜덤포레스트 알고리즘을 사용한다. 핑거프린트의 데이터로는 수신신호세기와 더불어 Mac주소를 사용해 총 4개의 라디오 맵을 만들어 사용하였다. 실험은 제한된 실내공간에서 진행하였고 실험분석을 위해 본 연구에서 제안하는 방법과 유사한 기존의 랜덤포레스트를 사용하는 실내 위치인식 시스템과 비교 분석하였다. 실험 결과 기존의 랜덤포레스트를 사용하는 실내 위치인식 시스템보다 본 연구에서 제안하는 시스템의 위치인식 정확도가 약 5.8% 높고 학습 데이터 개수에 상관없이 위치인식 속도가 일정하게 유지 되며 기존 방식 보다 더 빠름을 입증하였다.

랜덤 포레스트 모델을 활용한 국내 청소년 성경험 영향요인 분석 연구: 2019~2021년 청소년건강행태조사 데이터 (Factors Influencing Sexual Experiences in Adolescents Using a Random Forest Model: Secondary Data Analysis of the 2019~2021 Korea Youth Risk Behavior Web-based Survey Data)

  • 양윤석;권주원;양영란
    • 대한간호학회지
    • /
    • 제54권2호
    • /
    • pp.193-210
    • /
    • 2024
  • Purpose: The objective of this study was to develop a predictive model for the sexual experiences of adolescents using the random forest method and to identify the "variable importance." Methods: The study utilized data from the 2019 to 2021 Korea Youth Risk Behavior Web-based Survey, which included 86,595 man and 80,504 woman participants. The number of independent variables stood at 44. SPSS was used to conduct Rao-Scott χ2 tests and complex sample t-tests. Modeling was performed using the random forest algorithm in Python. Performance evaluation of each model included assessments of precision, recall, F1-score, receiver operating characteristics curve, and area under the curve calculations derived from the confusion matrix. Results: The prevalence of sexual experiences initially decreased during the COVID-19 pandemic, but later increased. "Variable importance" for predicting sexual experiences, ranked in the top six, included week and weekday sedentary time and internet usage time, followed by ease of cigarette purchase, age at first alcohol consumption, smoking initiation, breakfast consumption, and difficulty purchasing alcohol. Conclusion: Education and support programs for promoting adolescent sexual health, based on the top-ranking important variables, should be integrated with health behavior intervention programs addressing internet usage, smoking, and alcohol consumption. We recommend active utilization of the random forest analysis method to develop high-performance predictive models for effective disease prevention, treatment, and nursing care.

A Best Effort Classification Model For Sars-Cov-2 Carriers Using Random Forest

  • Mallick, Shrabani;Verma, Ashish Kumar;Kushwaha, Dharmender Singh
    • International Journal of Computer Science & Network Security
    • /
    • 제21권1호
    • /
    • pp.27-33
    • /
    • 2021
  • The whole world now is dealing with Coronavirus, and it has turned to be one of the most widespread and long-lived pandemics of our times. Reports reveal that the infectious disease has taken toll of the almost 80% of the world's population. Amidst a lot of research going on with regards to the prediction on growth and transmission through Symptomatic carriers of the virus, it can't be ignored that pre-symptomatic and asymptomatic carriers also play a crucial role in spreading the reach of the virus. Classification Algorithm has been widely used to classify different types of COVID-19 carriers ranging from simple feature-based classification to Convolutional Neural Networks (CNNs). This research paper aims to present a novel technique using a Random Forest Machine learning algorithm with hyper-parameter tuning to classify different types COVID-19-carriers such that these carriers can be accurately characterized and hence dealt timely to contain the spread of the virus. The main idea for selecting Random Forest is that it works on the powerful concept of "the wisdom of crowd" which produces ensemble prediction. The results are quite convincing and the model records an accuracy score of 99.72 %. The results have been compared with the same dataset being subjected to K-Nearest Neighbour, logistic regression, support vector machine (SVM), and Decision Tree algorithms where the accuracy score has been recorded as 78.58%, 70.11%, 70.385,99% respectively, thus establishing the concreteness and suitability of our approach.

시계열 위성영상과 머신러닝 기법을 이용한 산림 바이오매스 및 배출기준선 추정 (Machine-learning Approaches with Multi-temporal Remotely Sensed Data for Estimation of Forest Biomass and Forest Reference Emission Levels)

  • 이용규;이정수
    • 한국산림과학회지
    • /
    • 제111권4호
    • /
    • pp.603-612
    • /
    • 2022
  • 본 연구는 다중시기 위성영상과 머신러닝 알고리즘을 이용하여 준국가수준의 시계열 산림바이오매스량을 추정하였으며, 이를 바탕으로 산림배출기준선 설정하여 비교·분석하였다. 머신러닝기반의 산림바이오매스 추정 모델을 구축하기 위하여 Landsat TM 위성영상과 유럽항공우주국에서 제공하는 Biomass Climate Change Initiative 정보를 이용하였으며, 머신러닝 알고리즘은 비모수 학습모델인 k-Nearest Neighbor(kNN)과 의사결정나무 기반의 Random Forest(RF)를 적용하였다. 또한, 추정된 산림바이오매스량은 Forest reference emission levels(FREL) 자료와 비교하였다. 머신러닝 알고리즘 별 산림바이오매스 추정 모델을 비교해보면, 최적의 kNN 모델과 RF 모델의 Root Mean Square Error (RMSE)는 각각 35.9와 34.41였으며, RF모델이 kNN모델보다 상대적으로 우수하였다. 또한, FREL, kNN, RF 모델 별 산림배출기준선의 기울기는 각각 약 -33천ton, -253천ton, -92천ton으로 설정되었다.