• 제목/요약/키워드: 랜덤 포레스트 알고리즘

검색결과 86건 처리시간 0.026초

저노출 카메라와 웨이블릿 기반 랜덤 포레스트를 이용한 야간 자동차 전조등 및 후미등 인식 (Vehicle Headlight and Taillight Recognition in Nighttime using Low-Exposure Camera and Wavelet-based Random Forest)

  • 허두영;김상준;곽충섭;남재열;고병철
    • 방송공학회논문지
    • /
    • 제22권3호
    • /
    • pp.282-294
    • /
    • 2017
  • 본 논문에서는 차량이 움직일 때 발생하는 카메라의 움직임, 도로상의 광원에 강건한 지능형 전조등 제어 시스템을 제안한다. 후보광원을 검출할 때 카메라의 원근 범위 추정 모델을 기반으로 한 ROI (Region of Interest)를 사용하며 이는 FROI (Front ROI)와 BROI (Back ROI)로 나뉘어 사용된다. ROI내에서 차량의 전조등과 후미등, 반사광 및 주변 도로의 조명들은 2개의 적응적 임계값에 의해 세그먼트화 된다. 세그먼트화 된 광원 후보군들로부터 후미등은 적색도(redness)와 Haar-like특징에 기반한 랜덤포레스트 분류기에 의해 검출된다. 전조등과 후미등 분류 과정에서 빠른 학습과 실시간 처리를 위해 SVM(Support Vector Machine) 또는 CNN(Convolutional Neural Network)을 사용하지 않고 랜덤포레스트 분류기를 사용했다. 마지막으로 페어링(Pairing) 단계에서는 수직좌표 유사성, 광원들간의 연관성 검사와 같은 사전 정의된 규칙을 적용한다. 제안된 알고리즘은 다양한 야간 운전환경을 포함하는 데이터에 적용한 결과, 최근의 관련연구 보다 향상된 검출 성능을 보여주었다.

시뮬레이티드 어니일링 기반의 랜덤 포레스트를 이용한 기업부도예측 (Predicting Corporate Bankruptcy using Simulated Annealing-based Random Fores)

  • 박호연;김경재
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.155-170
    • /
    • 2018
  • 기업의 금융 부도를 예측하는 것은 전통적으로 비즈니스 분석에서 가장 중요한 예측문제 중 하나이다. 선행연구에서 예측모델은 통계 및 기계학습 기반의 기법을 적용하거나 결합하는 방식으로 제안되었다. 본 논문에서는 잘 알려진 최적화기법 중 하나인 시뮬레이티드 어니일링에 기반한 새로운 지능형 예측모델을 제안한다. 시뮬레이티드 어니일링은 유전자알고리즘과 유사한 최적화 성능을 가진 것으로 알려져 있다. 그럼에도 불구하고, 시뮬레이티드 어니일링을 사용한 비즈니스 의사결정 문제의 예측과 분류에 관한 연구가 거의 없었기 때문에, 비즈니스 분석에서의 유용성을 확인하는 것은 의미가 있다. 본 연구에서는 시뮬레이티드 어니일링과 기계학습의 결합 모델을 사용하여 부도예측모델의 입력 특징을 선정한다. 최적화 기법과 기계학습기법을 결합하는 대표적인 유형은 특징 선택, 특징 가중치 및 사례 선택이다. 이 연구에서는 선행연구에서 가장 많이 연구된 특징 선택을 위한 결합모델을 제안한다. 제안하는 모델의 우수성을 확인하기 위하여 본 연구에서는 한국 기업의 실제 재무데이터를 이용하여 그 결과를 분석한다. 분석결과는 제안된 모델의 예측 정확도가 단순한 모델의 예측 정확성보다 우수하다는 것을 보여준다. 특히 기존의 의사결정나무, 랜덤포레스트, 인공신경망, SVM 및 로지스틱 회귀분석에 비해 분류성능이 향상되었다.

랜덤포레스트와 Sentinel-2를 이용한 식생 분류의 입력특성 최적화 (Optimization of Input Features for Vegetation Classification Based on Random Forest and Sentinel-2 Image)

  • 이승민;정종철
    • 한국지리정보학회지
    • /
    • 제23권4호
    • /
    • pp.52-67
    • /
    • 2020
  • 최근 북극은 매년 영구 동토층이 녹아 눈으로 덮인 땅이 드러나고 있어 해당 지역 관리를 위한 공간정보가 필요하다. 한국의 국토지리정보원(NGII)은 극지방의 공간정보를 구축하여 극지공간정보 서비스를 제공하고 있으나, 식생 정보는 제공되지 않고 있으므로 식생 공간정보 구축을 위한 추가적인 연구가 필요하다. 본 연구에서는 북극 스발바르제도의 뉘올레순 지역에 대한 식생 분류를 수행하기 위해 다중 시기의 Sentinel-2 영상을 사용하였다. 전처리 단계에서는 다중 시기 Sentinel-2 영상으로부터 10개 밴드와 6가지 정규 지수식을 생성하였다. 영상 분류는 8개 속성에 대한 토지피복분류를 통해 전체 식생 영역을 추출하는 과정과 전체 식생 영역 내에서 다시 세분류를 수행하는 과정으로 이루어졌다. 영상 분류 알고리즘은 OOB(Out-Of-Bag)를 통해 정확도 평가 및 변수 중요도를 산정할 수 있는 랜덤포레스트를 사용하였다. 전체 정확도는 다시기 영상이 사용되었을 경우와 식생 지수가 추가되었을 경우의 이점을 확인하기 위해 사용된 영상 수에 따라 각각 정확도를 산정하였다. 단일시기의 Sentinel-2 영상은 전체 정확도가 77%였으나, 7개의 다중 시기 Sentinel-2 영상을 기반으로 학습하였을 때, 81%로 향상되었다. 또한, 식생 지수가 추가로 사용된 학습에서 전체 정확도가 약 83%로 향상되었다. 식생 분류 시 변수 중요도는 적색, 녹색, 단파적외선-1 밴드가 가장 높은 변수로 선정되었다. 본 연구는 극지방의 식생에 대한 분류를 수행할 시 입력특성을 최적화하는 기초 연구로 활용될 수 있을 것으로 판단된다.

SinGAN기반 데이터 증강과 random forest알고리즘을 이용한 고무 오링 결함 검출 시스템 (A rubber o-ring defect detection system using data augmentation based on the SinGAN and random forest algorithm)

  • 이용은;이한성;김대원;김경천
    • 한국가시화정보학회지
    • /
    • 제19권3호
    • /
    • pp.63-68
    • /
    • 2021
  • In this study, data was augmentation through the SinGAN algorithm using small image data, and defects in rubber O-rings were detected using the random forest algorithm. Unlike the commonly used data augmentation image rotation method to solve the data imbalance problem, the data imbalance problem was solved by using the SinGAN algorithm. A study was conducted to distinguish between normal products and defective products of rubber o-ring by using the random forest algorithm. A total of 20,000 image date were divided into transit and testing datasets, and an accuracy result was obtained to distinguish 97.43% defects as a result of the test.

전문가의 형태소 분류를 활용한 과학 논증 자동 채점 (Automated Scoring of Scientific Argumentation Using Expert Morpheme Classification Approaches)

  • 이만형;유선아
    • 한국과학교육학회지
    • /
    • 제40권3호
    • /
    • pp.321-336
    • /
    • 2020
  • 본 연구는 실제 교실에서 이루어진 학생의 과학 논증과정을 기계학습을 활용한 자동 채점에 적용함으로써, 논증 자동 채점의 가능성 및 개선 방향을 탐색한다. 분자 구조에 대한 고등학생의 과학 논증수업 중 발생한 2,605개의 모든 발화를 대상으로 연구를 진행하였다. 지도 학습을 위해 5가지의 논증 요소로 발화를 분류하였고, 분류된 발화를 대상으로 텍스트 전처리를 수행하였다. 전처리된 학생 발화를 활용하여 서포트 벡터 머신, 의사결정나무, 랜덤 포레스트, 인공신경망의 기계 학습 방법으로 자동 채점 모델을 구성하였다. 불용어 처리가 되지 않은 학생 발화를 활용한 자동 채점의 결과 랜덤 포레스트의 정확도는 65.96%, kappa는 0.5298의 유미한 결과를 얻었다. 불용어 처리를 수행한 학생 발화를 활용한 새로운 채점 모델의 결과 채점의 정확도가 크게 변화하지 않음에도 논증 발화 중 과학 용어 및 논증 요소의 담화표지가 채점 모델의 분류 기준이 되는 결과를 얻었다. 또한 인간 전문가의 논증 채점 과정을 분석하여 얻어진 전문가 형태소를 자동 채점 모델에 생성 규칙 알고리즘으로 적용하였다. 그 결과 의사결정나무에서 반박에 대한 재현율(recall)이 21.74% 증가하였다. 이에 본 연구 결과는 과학 교육 연구에서 기계 학습 및 논증에 대한 자동 채점의 활용 가능성과 연구 방향성을 제안하였다.

손상 하수관으로 인한 지반함몰의 위험도 평가를 위한 랜덤 포레스트 모델 개발 (Development of Random Forest Model for Sewer-induced Sinkhole Susceptibility)

  • 김준영;강재모;백성하
    • 한국지반공학회논문집
    • /
    • 제37권12호
    • /
    • pp.117-125
    • /
    • 2021
  • 시민의 안전을 위협하는 지반재해 중 하나인 지반함몰이 최근 도심지에서 빈번하게 보고되고 있다. 다양한 지반함몰 발생 메커니즘 중, 하수관 손상부를 통한 토사 유실이 서울시에서 발생하는 지반함몰의 주요원인으로 나타났다. 본 연구에서는 서울시 하수관 정보와 지반함몰이 발생한 위치 정보를 기반으로 머신러닝 기법 중 하나인 랜덤 포레스트 알고리즘을 이용하여 하수관 정보로부터 손상 하수관으로 유발되는 지반함몰의 발생 여부를 예측하는 모델을 학습하였다. 모델 성능 평가 결과, 본 연구에서 도출한 모델이 지반함몰을 상당히 훌륭하게 예측할 수 있는 것으로 나타났다. 또한, 입력변수로 사용한 하수관 정보 중 하수관 길이, 해발고도, 경사, 매립 심도, 하수관 순서로 지반함몰 발생 위험에 영향을 미치는 것을 확인하였다. 본 연구의 결과는 지반함몰 위험도 지도 작성, 지하공동 탐사 계획 수립 및 하수관 정비 사업 계획 수립의 기초 자료로 활용될 수 있을 것으로 기대된다.

주택매매가격 영향요인의 비선형적 효과 분석 (An Analysis of Non-linear Effects of Impact Factors on Housing Price)

  • 장영재
    • Journal of the Korean Data Analysis Society
    • /
    • 제20권6호
    • /
    • pp.2953-2966
    • /
    • 2018
  • 주택가격은 거시경제상황을 나타내는 다양한 변수들과 밀접한 관계를 지니고 있다. 다수의 선행연구에서는 경제상황 변화 하에서의 주택가격 행태나 여러 변수들과의 관계성에 초점을 맞추고 있다. 본 논문에서는 선행연구를 참고하되 데이터에 근거한 새로운 시각의 실증분석을 실시하고자 하였다. 주택가격에 미치는 잠재적 영향요인들 중 정책금리에 초점을 맞추고 금리충격에 대한 여타 주요 변수들의 비선형적 반응 행태를 분석하였다. 데이터마이닝 기법 중 하나인 랜덤 포레스트 알고리즘을 이용하여 선행연구에서 제시되었던 거시경제변수들의 변수 중요도 점수를 산출하였다. 이 과정을 통해 변수를 선택한 뒤, 비선형성을 포착할 수 있는 모형을 사용하여 충격반응을 산출하였다. 동 모형에 따르면 주택가격의 경우에 있어서 금리 인상 시에만 충격반응이 유의미하게 나타났다. 특히 기존 전통적 VAR(vector autoregression) 방법론에서 포착하지 못한 비선형적 특징에 기인하여 금리 인상 충격의 크기가 커질 경우 그 효과가 정률적으로만 증가하는 것이 아니라 그 이상 증폭될 수 있다는 분석 결과를 얻었다. 이러한 파급효과의 비선형성, 비대칭성은 정책 수단으로서의 금리를 보다 신중한 시각에서 접근해야 함을 의미한다고 하겠다.

메탄 가스 기반 가스 누출 위험 예측을 위한 다변량 특이치 제거 (Multivariate Outlier Removing for the Risk Prediction of Gas Leakage based Methane Gas)

  • 홍고르출;김미혜
    • 한국융합학회논문지
    • /
    • 제11권12호
    • /
    • pp.23-30
    • /
    • 2020
  • 본 연구에서는, 천연가스(NG) 데이터와 가스 관련 환경 요소 간의 관계를 기계학습 알고리즘을 사용하여 가스 누출 데이터를 직접 측정하지 않고 가스 누출 위험 수준을 예측하였다. 이번 연구는 서버가 제공하는 오픈 데이터인 IoT 기반 원격 제어 피카로(Picarro) 가스 센서 사양을 기반으로 사용했다. 천연 가스는 공기 중으로 누출이 되며, 대기 오염, 환경, 그리고 건강에 큰 문제가 된다. 본 연구에서 제안하는 방법은 천연 가스의 누출 위험 예측을 위한 랜덤 포레스트(Random Forest) 분류 기반 다변량 특이치 제거 방법이다. 비지도 k-평균 클러스터링 후에 실험 데이터 집합은 불균형 데이터이다. 따라서 우리는 제안된 모델이 중간과 높은 위험 수준을 가장 잘 예측할 수 있다는 점에 초점을 맞춘다. 이 경우 각 분류 모델에 대한 수신자 조작 특성(ROC) 곡선, 정확도, 평균 표준 오차(MSE)를 비교했다. 실험 결과로 정확도, 수신자 조작 특성의 곡선 아래 영역(AUC, Area Under the ROC Curve), MSE가 각각 MOL_RF의 경우 99.71%, 99.57%, 및 0.0016의 결과 값을 얻었다.

빅데이터를 활용한 AI 기반 우선점검 대상현장 선정 모델 (AI-based Construction Site Prioritization for Safety Inspection Using Big Data)

  • 황윤호;지석호;이현승;정현준
    • 대한토목학회논문집
    • /
    • 제42권6호
    • /
    • pp.843-852
    • /
    • 2022
  • 지속적인 안전관리에도 불구하고 매년 건설업 근로자 사망율은 줄어들지 않는 추세다. 이에 따라 건설현장 사고를 예방하기 위한 다양한 연구가 진행 중이다. 본 논문에서는 건설공사 비용 50억원 미만의 건설현장 중 건설사고가 발생할 것으로 예상되는 현장을 우선적으로 선별하는 AI기반 우선점검대상 선정 모델을 개발하였다. 특히, 적용한 AI 알고리즘 중 분류분석에서 가장 뛰어난 성능(사고발생예측 AUC-ROC 90.48 %)을 보인 랜덤 포레스트를 모델 개발에 활용하였으며, 건설사고를 유발하는 주요한 요인으로는 공사비, 총공사일수, 공사실적평가액이 확인되었다. 본 연구를 통해 점검인력 효율화와 건설사고에 대한 선제적 대응의 결과로 8년간 약 917.7 % ROI(투자수익률)를 기대할 수 있다.

다중선형회귀경험식과 머신러닝모델의 2차원 횡 분산계수 예측성능 평가 (Performance Evaluation of Multilinear Regression Empirical Formula and Machine Learning Model for Prediction of Two-dimensional Transverse Dispersion Coefficient)

  • 이선미;박인환
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.172-172
    • /
    • 2022
  • 분산계수는 하천에서 오염물질의 혼합능을 파악할 수 있는 대표적인 인자이다. 특히 하수처리장 방류수 혼합예측과 같이 횡 방향 혼합에 대한 예측이 중요한 경우, 하천의 지형적, 수리학적 특성을 고려한 2차원 횡 분산계수의 결정이 필요하다. 2차원 횡 분산계수의 결정을 위해 기존 연구에서는 추적자실험결과로부터 경험식을 만들어 횡 분산계수 산정에 사용해왔다. 회귀분석을 통한 경험식 산정을 위해서는 충분한 데이터가 필요하지만, 2차원 추적자 실험 건수가 충분치 않아 신뢰성 높은 경험식 산정이 어려운 상황이다. 따라서 본 연구에서는 SMOTE기법을 이용하여 횡분산계수 실험데이터를 증폭시켜 이로부터 횡 분산계수 경험식을 산정하고자 한다. 또한 다중선형회귀분석을 통해 도출된 경험식의 한계를 보완하기 위해 다양한 머신러닝 기법을 적용하고, 횡 분산계수 산정에 적합한 머신러닝 기법을 제안하고자 한다. 기존 추적자실험 데이터로부터 하폭 대 수심비, 유속 대 마찰유속비, 횡 분산계수 데이터 셋을 수집하였으며, SMOTE 알고리즘의 적용을 통해 회귀분석과 머신러닝 기법 적용에 필요한 데이터그룹을 생성했다. 새롭게 생성된 데이터 셋을 포함하여 다중선형회귀분석을 통해 횡 분산계수 경험식을 결정하였으며, 새로 제안한 경험식과 기존 경험식에 대한 정확도를 비교했다. 또한 다중선형회귀분석을 통해 결정된 경험식은 횡 분산계수 예측범위에 한계를 보였기 때문에 머신러닝기법을 적용하여 다중선형회귀분석에 대한 예측성능을 평가했다. 이를 위해 머신러닝 기법으로서 서포트 벡터 머신 회귀(SVR), K근접이웃 회귀(KNN-R), 랜덤 포레스트 회귀(RFR)를 활용했다. 세 가지 머신러닝 기법을 통해 도출된 횡 분산계수와 경험식으로부터 결정된 횡 분산계수를 비교하여 예측 성능을 비교했다. 이를 통해 제한된 실험데이터 셋으로부터 2차원 횡 분산계수 산정을 위한 데이터 전처리 기법 및 횡 분산계수 산정에 적합한 머신러닝 절차와 최적 학습기법을 도출했다.

  • PDF