• 제목/요약/키워드: 랜덤포레스트기법

검색결과 130건 처리시간 0.027초

평균이동 기법을 이용한 랜덤포레스트 기반 실시간 얼굴 특징점 추적 (Real Time Face Tracking Method based Random Regression Forest using Mean Shift)

  • 장성걸;박종일
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2017년도 하계학술대회
    • /
    • pp.89-90
    • /
    • 2017
  • 본 논문에서는 평균이동 (mean shift) 기법을 이용하여 랜덤포레스트 (random forest) 기반 실시간 얼굴 특징점 추적 (facial features tracking) 방법을 제안한다. 우선, 눈의 위치를 이용하여 검출된 얼굴영역을 적절한 크기와 위치로 개선하여 랜덤포레스트를 이용한 얼굴 특징점 추적 알고리즘이 받는, 얼굴검출 (face detection) 과정에 얻어지는 얼굴영역 상자 (face bounding box) 크기와 위치의 영향을 감소 하였다. 또한 랜덤포레스트의 얼굴 특징점 추정결과에서 추정평균 대신 평균이동기법을 이용하여 잘못된 추정결과들을 제거하고 제대로 된 추정결과만 사용하여 얼굴 특징점 검출 정확도를 개선하였다. 따라서 제안하는 방법들을 이용하여 기존의 랜덤포레스트 기반 얼굴 특징점 검출 기법의 성능을 제고하고 실시간으로 얼굴 특징점을 추적할 수 있다.

  • PDF

다중 크기 블록 지역 이진 패턴을 이용한 랜덤 포레스트 기반의 머리 방향 분류 기법 (Head Pose Classification using Multi-scale Block LBP and Random Forest)

  • 강민주;이하연;강제원
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2016년도 하계학술대회
    • /
    • pp.253-255
    • /
    • 2016
  • 본 논문에서는 다중 지역 이진 패턴(Multi-scale Bock LBP, MB-LBP) 특징과 랜덤 포레스트에 기반한 새로운 기법의 머리 방향 분류 기법을 제안한다. 제안 기법에서는 occlusion 과 조명의 변화에 강인한 분류 정확도를 얻기 위해서 랜덤화된 트리를 학습하는 것을 목표로 한다. 우선, 얼굴 이미지로부터 많은 MB-LBP 특징을 추출하고, 얼굴 영상들을 랜덤하게 입력하고 MB-LBP 크기 파라미터와 같은 랜덤 특징과 블록 좌표들을 사용하여 트리를 생성한다. 게다가 각 노드에서 정보 이득을 최대화 하는 트리의 내부 노드를 생성하기 위해서 uniform LBP 의 특성을 고려한 분할 함수를 개발한다. 랜덤화된 트리는 랜덤 포레스트에 포함되어 있으며 마지막 결정단계에서 Maximum-A-Posteriori criterion 으로 최종 결정을 한다. 실험 결과는 제안 기법이 다양한 조명, 자세, 표현, occlusion 상황에서 기존의 방법보다 개선된 성능으로 머리 방향을 분류 할 수 있음을 보여준다.

  • PDF

인공신경망 및 랜덤포레스트 기법을 활용한 기업 분식회계 탐지 성능 평가 연구 (A Study on Accounting Fraud Detection using Neural Network and Random Forest)

  • 황동혁;서영석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.692-693
    • /
    • 2023
  • ESG 경영이 중요해짐에 따라 기업의 분식 여부도 중요해졌다. 따라서 본 논문에서는 인공신경망과 랜덤포레스트를 활용하여 기업의 분식회계 여부를 판단 성능을 비교분석하고 그 유용성에 대해 평가하였다. 실제 기업 회계정보를 수집하여 실험을 수행하였고, 실험 결과 F1-Score 기준 랜덤포레스트의 RFECV 기법이 0.81로 분식 기업을, SMOTE 기법을 사용한 모델이 정상 기업을 탐지하였고 Accuracy 기준 랜덤포레스트의 RFECV 기법과 SMOTE 기법을 사용한 모델이 0.77로 가장 효과적인 탐지 성능을 보여주었다.

머신 러닝 기법을 활용한 박스오피스 관람객 예측 (Prediction of Movies Box-Office Success Using Machine Learning Approaches)

  • 박도균;백주련
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2020년도 제61차 동계학술대회논문집 28권1호
    • /
    • pp.15-18
    • /
    • 2020
  • 특정 영화의 스크린 독과점이 꾸준히 논란이 되고 있다. 본 논문에서는 영화 스크린 분배의 불평등성을 지적하고 이에 대한 개선을 요구할 근거로 머신러닝 기법을 활용한 영화 관람객 예측 모델을 제안한다. 이에 따라 KOBIS, 네이버 영화, 트위터, 구글 트렌드에서 수집한 3,143개의 영화 데이터를 이용하여 랜덤포레스트와 그라디언트 부스팅 기법을 활용한 영화 관람객 예측 모델을 구현하였다. 모델 평가 결과, 그라디언트 부스팅 모델의 RMSE는 600,486, 랜덤포레스트 모델의 RMSE는 518,989로 랜덤포레스트 모델의 예측력이 더 높았다. 예측력이 높았던 랜덤포레스트 모델을 활용, 상영관을 크게 확보하지 못 했던 봉준호 감독의 영화 '옥자'의 상영관 수를 조절하여 관람객 수를 예측, 6,345,011명이라는 결과를 제시한다.

  • PDF

역전파가 필요없는 시계열 다층 랜덤 포레스트와 산불 조기 감지의 응용 (Time series Multilayered Random Forest Without Backpropagation and Application of Forest Fire Early Detection)

  • 김상원;구스타보 산체즈;고병철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 하계학술대회
    • /
    • pp.660-661
    • /
    • 2020
  • 본 논문에서는 기존 인공 신경망 기반 시계열 학습 기법인 Recurrent Neural Network (RNN)의 많은 연산량 및 고 사양 시스템 요구를 개선하기 위해 랜덤 포레스트 (Random Forest)기반의 새로운 시계열 학습 기법을 제안한다. 기존의 RNN 기반 방법들은 복잡한 연산을 통해 높은 성능을 달성하는 데 집중하고 있다. 이러한 방법들은 학습에 많은 파라미터가 필요할 뿐만 아니라 대규모의 연산을 요구하므로 실시간 시스템에 적용하는데 어려움이 있다. 따라서 본 논문에서는, 효율적이면서 빠르게 동작할 수 있는 시계열 다층 랜덤 포레스트(Time series Multilayered Random Forest)를 제안하고 산불 조기 탐지에 적용해 기존 RNN 계열의 방법들과 성능을 비교하였다. 다양한 산불화재 실험데이터에 알고리즘을 적용해본 결과 GPU 상에서 방대한 연산을 수행하는 RNN 기반 방법들과 비교해 성능적인 한계가 존재했지만 CPU 에서도 빠르게 동작 가능하므로 성능의 개선을 통해 다양한 임베디드 시스템에 적용 가능하다.

  • PDF

랜덤 포레스트 기법을 이용한 한국 프로야구 승부 예측에 관한 연구 (A Study on Result Prediction of Korean professional baseball using Random Forest Method)

  • 이재익;이종혁;김응모
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.721-722
    • /
    • 2014
  • 야구는 흔히 기록의 스포츠라는 별명으로 많이 불린다. 그만큼 야구라는 운동이 갖는 기록의 종류는 무척 다양하고 또한 기록의 활용 가능성 역시 무궁무진하다. 이러한 별명에 걸맞게 미국에서는 야구에 대한 다양하고 방대한 정보를 수집하고 활용하고 있다. 그러나 한국 프로야구에 대한 정보의 수집과 활용은 아직까지 크게 부각되지 못하는 것이 현실이다. 랜덤 포레스트 기법을 이용하여 경기의 승부를 예측함으로써 한국 프로야구 데이터의 수집과 활용을 증대 시키는 효과를 기대 해 본다. 본 논문에서는 2014년 한국 프로야구의 승부 예측을 주제로 어떠한 누적 스포츠 데이터집단이 가장 유효한지를 실험 하였다. 승부 예측을 하기위해 사용된 누적 스포츠 데이터는 2014년 선수와 팀 기록, 2013부터 2014년까지의 선수와 팀 기록, 2012년부터 2014년까지의 선수와 팀 기록이다. 이들 세 그룹의 데이터를 이용하여 이분데이터 모형에 랜덤 포레스트 기법을 사용한 승부예측 알고리즘에 적용 시킨 후 어느 그룹의 데이터가 가장 실제 2014 한국 프로야구 정기결과와 맞을 확률이 높음을 구하여 가장 유용한 데이터 그룹이 어떤 그룹인지 연구 하였다.

열 영상에서 핫 스팟 영역을 이용한 휴먼 보행자 검출 기법 (Pedestrian detection in thermal image using hot-spot region)

  • 김덕연;고병철;남재열
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(B)
    • /
    • pp.348-350
    • /
    • 2012
  • 본 논문에서는 열 영상카메라를 통해 입력 받은 영상을 CS-LBP(Center-symmetric LBP)와 랜덤 포레스트(Random forest)를 이용하여 보행자 휴먼 객체를 검출하는 방법을 제안한다. 우선 불필요한 후보영역을 줄이기 위해 열 영상의 표준편차, 밝기 평균, 밝기 최대값을 이용하여 이진화하고, 신체부위 중 가장 발열이 강한 얼굴부위를 핫스팟 영역으로 설정한다. 그 후, 핫스팟 영역에서 CS-LBP특징을 추출하여 결정 트리의 앙상블인 랜덤 포레스트 분류기를 이용하여 최종적인 보행자 휴먼 객체를 검증한다. CS-LBP와 랜덤 포레스트 분류기를 통해 실시간 보행자 객체의 검출이 가능하고, 높은 검출 성능을 나타내었다.

랜덤포레스트를 이용한 국내 학술지 논문의 자동분류에 관한 연구 (An Analytical Study on Automatic Classification of Domestic Journal articles Using Random Forest)

  • 김판준
    • 정보관리학회지
    • /
    • 제36권2호
    • /
    • pp.57-77
    • /
    • 2019
  • 대표적인 앙상블 기법으로서 랜덤포레스트(RF)를 문헌정보학 분야의 학술지 논문에 대한 자동분류에 적용하였다. 특히, 국내 학술지 논문에 주제 범주를 자동 할당하는 분류 성능 측면에서 트리 수, 자질선정, 학습집합 크기 등 주요 요소들에 대한 다각적인 실험을 수행하였다. 이를 통해, 실제 환경의 불균형 데이터세트(imbalanced dataset)에 대하여 랜덤포레스트(RF)의 성능을 최적화할 수 있는 방안을 모색하였다. 결과적으로 국내 학술지 논문의 자동분류에서 랜덤포레스트(RF)는 트리 수 구간 100~1000(C)과 카이제곱통계량(CHI)으로 선정한 소규모의 자질집합(10%), 대부분의 학습집합(9~10년)을 사용하는 경우에 가장 좋은 분류 성능을 기대할 수 있는 것으로 나타났다.

의사결정나무 및 랜덤포레스트 분류 모델을 이용한 교량 안전등급 예측 (Prediction of Safety Grade of Bridges Using the Classification Models of Decision Tree and Random Forest)

  • 홍지수;전세진
    • 대한토목학회논문집
    • /
    • 제43권3호
    • /
    • pp.397-411
    • /
    • 2023
  • 국내에서 공용연수 30년 이상인 노후 교량의 수가 급증하고 있다. 이에 따라 교량 노후도, 상태 및 성능 예측을 바탕으로 한 첨단 유지관리 기술의 중요성이 점차 주목받고 있다. 이 연구에서는 머신러닝 기반의 의사결정나무 및 랜덤포레스트 분류 모델을 사용하여 교량의 안전등급을 예측하는 방법을 제안하였다. 일반국도상 교량 8,850개를 대상으로 해당 모델들을 혼동행렬, 균형 정확도, 재현율, ROC 곡선 및 AUC와 같이 여러가지 평가 지표를 통해 분석한 결과 전반적으로 랜덤포레스트가 의사결정나무보다 더 나은 예측 성능을 보유하였다. 특히 랜덤포레스트 중 랜덤 언더 샘플링 기법은 노후도가 비교적 커서 유지관리에 주의를 기울여야 하는 C, D등급 교량에 대해 재현율 83.4%로 다른 샘플링 기법들보다 예측 성능이 더 뛰어난 것으로 나타났다. 제안된 모델은 최근 점검이 실시되지 않은 교량들의 신속한 안전등급 파악 및 효율적이고 경제적인 유지관리 계획 수립에 유용하게 활용될 수 있을 것으로 기대된다.

Predictive Analysis of Problematic Smartphone Use by Machine Learning Technique

  • Kim, Yu Jeong;Lee, Dong Su
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권2호
    • /
    • pp.213-219
    • /
    • 2020
  • 본 연구는 스마트폰 과의존을 진단하고 예측하기 위하여 할 수 있는 분류분석 방법과 스마트폰 과의존 분류율에 영향을 미치는 중요변수를 규명하고자 시도되었다. 이를 위해 인공지능의 방법인 기계학습 분석 기법 중 의사결정트리, 랜덤포레스트, 서포트벡터머신의 분류율을 비교하였다. 자료는 한국정보화진흥원에서 제공한 '2018년 스마트폰 과의존 실태조사'에 응답한 25,465명의 데이터였고, R 통계패키지(ver. 3.6.2)를 사용하여 분석하였다. 분석한 결과, 3가지 분류분석 기법은 정분류율이 유사하게 나타났으며, 모델에 대한 과적합 문제가 발생되지 않았다. 3가지 분류분석 방법 중 서포트벡터머신의 분류율이 가장 높게 나타났고, 다음으로 의사결정트리 기법, 랜덤포레스트 기법 순이었다. 스마트폰 이용 유형 중 분류율에 영향을 미치는 상위 3개 변수는 생활서비스형, 정보검색형, 여가추구형이었다.