• 제목/요약/키워드: 랜덤 포레스트 알고리즘

검색결과 90건 처리시간 0.026초

평균이동 기법을 이용한 랜덤포레스트 기반 실시간 얼굴 특징점 추적 (Real Time Face Tracking Method based Random Regression Forest using Mean Shift)

  • 장성걸;박종일
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2017년도 하계학술대회
    • /
    • pp.89-90
    • /
    • 2017
  • 본 논문에서는 평균이동 (mean shift) 기법을 이용하여 랜덤포레스트 (random forest) 기반 실시간 얼굴 특징점 추적 (facial features tracking) 방법을 제안한다. 우선, 눈의 위치를 이용하여 검출된 얼굴영역을 적절한 크기와 위치로 개선하여 랜덤포레스트를 이용한 얼굴 특징점 추적 알고리즘이 받는, 얼굴검출 (face detection) 과정에 얻어지는 얼굴영역 상자 (face bounding box) 크기와 위치의 영향을 감소 하였다. 또한 랜덤포레스트의 얼굴 특징점 추정결과에서 추정평균 대신 평균이동기법을 이용하여 잘못된 추정결과들을 제거하고 제대로 된 추정결과만 사용하여 얼굴 특징점 검출 정확도를 개선하였다. 따라서 제안하는 방법들을 이용하여 기존의 랜덤포레스트 기반 얼굴 특징점 검출 기법의 성능을 제고하고 실시간으로 얼굴 특징점을 추적할 수 있다.

  • PDF

랜덤포레스트를 위한 상관예측변수 중요도 (Correlated variable importance for random forests)

  • 신승범;조형준
    • 응용통계연구
    • /
    • 제34권2호
    • /
    • pp.177-190
    • /
    • 2021
  • 랜덤포레스트는 여러 의사결정나무 모형들을 융합하여 안정성과 예측력을 높여주기 때문에 종종 사용되는 방법이다. 예측력을 증가시키는 반면 해석의 용이성을 희생하기 때문에 이를 보상하기 위해 변수의 중요도를 제공한다. 변수의 중요도는 랜덤포레스트를 구축할 때 변수가 얼마나 중요한 역할을 하는지를 알려 준다. 그러나 어떤 예측변수가 다른 예측변수들과 상관되어 있을 때 기존 알고리즘의 변수중요도는 왜곡될 수 있다. 상관된 예측변수들의 하향 편향은 예측변수의 중요도를 실제 중요도보다 낮게 측정하게 한다. 우리는 기존 알고리즘을 수정하여 상관 예측변수의 하향 편향을 회복하는 새로운 알고리즘을 제안한다. 제안된 알고리즘의 성능은 모의 자료에 의해 증명되고 실제 자료에 의해 설명된다.

연합 학습 환경에서의 랜덤 포레스트 알고리즘 최적화 전략 연구 (Research on Optimization Strategies for Random Forest Algorithms in Federated Learning Environments)

  • 송인서;이강윤
    • 한국빅데이터학회지
    • /
    • 제9권1호
    • /
    • pp.101-113
    • /
    • 2024
  • 연합 학습은 분산 환경에서 데이터 프라이버시와 보안을 유지하면서 효율적으로 머신러닝 모델을 학습하는 방법으로 주목받고 있다. 본 연구에서는 이러한 연합 학습 환경에서 랜덤 포레스트 모델의 성능을 최적화하기 위해 새로운 FedRFBagging 알고리즘을 제안한다. 클라이언트별 데이터 특성에 기반하여 로컬 랜덤 포레스트 모델의 트리를 동적으로 조정함으로써 통신 비용을 줄이고, 다수의 클라이언트 환경에서도 높은 예측 정확도를 달성할 수 있다. 제안하는 방법은 다양한 데이터 조건에 적응하여 모델의 안정성과 학습 속도를 크게 향상시킨다. 랜덤 포레스트 모델은 여러 개의 결정 트리로 구성되나, 연합 학습 환경에서 모든 트리를 서버로 전송하면 통신 오버헤드가 기하급수적으로 증가하여 사용이 어려워진다. 또한 클라이언트 간 데이터 분포의 차이로 인해 트리의 품질 불균형이 발생할 수 있다. 이를 해결하기 위해 FedRFBagging 알고리즘을 제안하며 이는 각 클라이언트에서 성능이 높은 트리만을 선택해 서버로 전송하고, 서버는 불순도 값을 기준으로 트리들을 선택하여 최적의 글로벌 모델을 구성한다. 이를 통해 통신 오버헤드를 줄이고 다양한 데이터 분포에서도 높은 예측 성능을 유지할 수 있다. 글로벌 모델은 다양한 클라이언트 데이터를 반영하지만, 각 클라이언트의 데이터 특성은 다를 수 있다. 이를 보완하기 위해 클라이언트는 글로벌 모델에 추가 트리를 학습하여 로컬 데이터에 맞춘 최적화를 수행한다. 이를 통해 전체 모델의 예측 정확도를 높이고 변화하는 데이터 분포에 적응할 수 있다. 본 연구는 연합 학습 환경에서 랜덤 포레스트 모델이 가지는 통신 비용과 성능 문제를 효과적으로 해결하여 적용 가능한 연합 학습 환경에서 랜덤 포레스트 모델을 위한 알고리즘임을 시사한다.

랜덤 포레스트를 이용한 심전도 기반 생체 인증 (ECG-based Biometric Authentication Using Random Forest)

  • 김정균;이강복;홍상기
    • 전자공학회논문지
    • /
    • 제54권6호
    • /
    • pp.100-105
    • /
    • 2017
  • 본 논문은 개인 인증 알고리즘에 관한 것으로 심전도를 이용한 생체 인증 방식은 특정 보정기준점을 추출하는 방법과 그렇지 않은 방법으로 분류할 수 있으며 본 논문에서 제안하는 방법은 특정 보정기준점을 추출하지 않는 방법으로 이산 코사인 변환과 랜덤 포레스트 분류기를 사용하였다. 심전도 신호는 R-Peak 점을 기준으로 단일 심박으로 나누었으며 각 심박의 특징 추출을 위해 이산 코사인 변환을 적용하였다. 이산 코사인 변환 계수는 정보가 저주파에 집중되는 특성이 있으므로 초기 저주파에 해당하는 40까지 값을 특징으로 랜덤 포레스트 분류기를 구성하였다. 랜덤 포레스트는 의사결정 트리의 앙상블 분류기로 결정 트리를 기본으로 하고 있으므로 빠른 학습 속도와 많은 양의 데이터 처리 능력, 다양한 클래스를 분류할 수 있어 실생활에 적용 가능하며 무엇보다 ID의 승인과 거절을 위한 임계값을 분류기 내부에서 조절할 수 있어 오 분류에 강건한 알고리즘을 구성할 수 있다. 18개의 심전도 파일로 구성된 MIT-BIT Normal Sinus Rhythm 데이터베이스를 선정하여 성능을 평가하였으며 99.99%의 심전도 인식률을 보였다.

배깅과 부스팅 알고리즘을 이용한 핸드볼 결과 예측 비교 (Comparison of Handball Result Predictions Using Bagging and Boosting Algorithms)

  • 김지응;박종철;김태규;이희화;안지환
    • 한국융합학회논문지
    • /
    • 제12권8호
    • /
    • pp.279-286
    • /
    • 2021
  • 본 연구는 여자핸드볼 경기에서 발생되는 움직임 정보를 바탕으로 앙상블 기법의 배깅과 부스팅 알고리즘의 예측력을 비교하고, 움직임 정보의 활용가능성을 분석하는데 목적이 있다. 연구의 목적을 달성하기 위하여 15번의 연습경기에서 관성센서를 활용해 수집한 움직임 정보를 활용한 경기 결과예측을 랜덤포레스트와 Adaboost 알고리즘을 활용해 비교·분석하였다. 연구결과 첫째, 랜덤포레스트 알고리즘의 예측률은 66.9 ± 0.1%로 나타났으며, Adaboost 알고리즘의 예측률은 65.6 ± 1.6%로 나타났다. 둘째, 랜덤포레스트는 승리 결과는 모두 예측하였고, 패배의 결과는 하나도 예측하지 못하였다. 반면, Adaboost 알고리즘은 승리 예측 91.4%, 패배예측 10.4%라고 나타났다. 셋째, 알고리즘의 적합성 여부에서 랜덤포레스트는 과적합의 오류가 없었지만, Adaboost는 과적합의 오류가 나타났다. 본 연구결과를 바탕으로 스포츠경기를 예측할 때 움직임 정보도 활용 가능성을 확인하였으며, 랜덤포레스트 알고리즘이 보다 우수함을 확인하였다.

스마트 폰 기반 차량 환경에서의 랜덤 포레스트를 이용한 시선 인식 시스템 (Gaze Recognition System using Random Forests in Vehicular Environment based on Smart-Phone)

  • 오병훈;정광우;홍광석
    • 한국인터넷방송통신학회논문지
    • /
    • 제15권1호
    • /
    • pp.191-197
    • /
    • 2015
  • 본 논문에서는 스마트 폰 기반 차량 환경에서의 랜덤 포레스트를 이용한 시선 인식 시스템을 제안한다. 제안한 시스템은 Adaboost 알고리즘을 이용한 얼굴 검출, 히스토그램 정보를 이용한 얼굴 구성 요소 추출, 그리고 랜덤 포레스트 알고리즘 기반의 시선 인식으로 구성되어 있다. 카메라로부터 획득한 영상정보를 바탕으로 운전자의 얼굴을 검출하고, 이를 기반으로 운전자의 얼굴 구성 요소를 추정한다. 그리고 추정된 구성 요소로부터 시선 인식에 필요한 특징 벡터를 추출하고, 랜덤 포레스트 인식 알고리즘을 이용하여 9개 방향에 대한 시선을 인식한다. 실험을 위해 실제 환경에서 다양한 시선 방향을 포함하여 DB를 수집하였으며, 실험 결과 얼굴 검출률은 약 82.02%, 시선 인식률은 약 84.77% 성능을 확인하였다.

역전파가 필요없는 시계열 다층 랜덤 포레스트와 산불 조기 감지의 응용 (Time series Multilayered Random Forest Without Backpropagation and Application of Forest Fire Early Detection)

  • 김상원;구스타보 산체즈;고병철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 하계학술대회
    • /
    • pp.660-661
    • /
    • 2020
  • 본 논문에서는 기존 인공 신경망 기반 시계열 학습 기법인 Recurrent Neural Network (RNN)의 많은 연산량 및 고 사양 시스템 요구를 개선하기 위해 랜덤 포레스트 (Random Forest)기반의 새로운 시계열 학습 기법을 제안한다. 기존의 RNN 기반 방법들은 복잡한 연산을 통해 높은 성능을 달성하는 데 집중하고 있다. 이러한 방법들은 학습에 많은 파라미터가 필요할 뿐만 아니라 대규모의 연산을 요구하므로 실시간 시스템에 적용하는데 어려움이 있다. 따라서 본 논문에서는, 효율적이면서 빠르게 동작할 수 있는 시계열 다층 랜덤 포레스트(Time series Multilayered Random Forest)를 제안하고 산불 조기 탐지에 적용해 기존 RNN 계열의 방법들과 성능을 비교하였다. 다양한 산불화재 실험데이터에 알고리즘을 적용해본 결과 GPU 상에서 방대한 연산을 수행하는 RNN 기반 방법들과 비교해 성능적인 한계가 존재했지만 CPU 에서도 빠르게 동작 가능하므로 성능의 개선을 통해 다양한 임베디드 시스템에 적용 가능하다.

  • PDF

기계학습 알고리즘을 이용한 흡연자 예측 연구 (A Study on Smoker Prediction Using Machine Learning Algorithm)

  • 백종우;방준일;이주원;김화종
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.537-538
    • /
    • 2023
  • 본 논문에서는 사람에게서 나타나는 생체 특성과 흡연여부의 상관관계 분석을 위해 랜덤 포레스트와 그래디언트 부스팅 트리의 두 가지 기계학습 알고리즘을 사용하였다. 연구에 사용된 데이터는 국민건강보험공단에서 제공하고 Kaggle에서 취합하여 정리한 건강검진 정보를 사용하였다. 분류 모델의 학습에 있어 혈청 정보가 높은 관계성을 보일 것으로 예상하였으나, 실제 결과는 성별이 가장 큰 영향을 끼치는 것으로 확인되었다.

  • PDF

랜덤 포레스트 기법을 이용한 한국 프로야구 승부 예측에 관한 연구 (A Study on Result Prediction of Korean professional baseball using Random Forest Method)

  • 이재익;이종혁;김응모
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.721-722
    • /
    • 2014
  • 야구는 흔히 기록의 스포츠라는 별명으로 많이 불린다. 그만큼 야구라는 운동이 갖는 기록의 종류는 무척 다양하고 또한 기록의 활용 가능성 역시 무궁무진하다. 이러한 별명에 걸맞게 미국에서는 야구에 대한 다양하고 방대한 정보를 수집하고 활용하고 있다. 그러나 한국 프로야구에 대한 정보의 수집과 활용은 아직까지 크게 부각되지 못하는 것이 현실이다. 랜덤 포레스트 기법을 이용하여 경기의 승부를 예측함으로써 한국 프로야구 데이터의 수집과 활용을 증대 시키는 효과를 기대 해 본다. 본 논문에서는 2014년 한국 프로야구의 승부 예측을 주제로 어떠한 누적 스포츠 데이터집단이 가장 유효한지를 실험 하였다. 승부 예측을 하기위해 사용된 누적 스포츠 데이터는 2014년 선수와 팀 기록, 2013부터 2014년까지의 선수와 팀 기록, 2012년부터 2014년까지의 선수와 팀 기록이다. 이들 세 그룹의 데이터를 이용하여 이분데이터 모형에 랜덤 포레스트 기법을 사용한 승부예측 알고리즘에 적용 시킨 후 어느 그룹의 데이터가 가장 실제 2014 한국 프로야구 정기결과와 맞을 확률이 높음을 구하여 가장 유용한 데이터 그룹이 어떤 그룹인지 연구 하였다.