• 제목/요약/키워드: 랜덤포레스트기법

검색결과 130건 처리시간 0.03초

GIS 기반 LSMS 객체지향 분류 적용 연구 (A study on the application of LSMS object-oriented classification based on GIS)

  • 이한용;정종우;정혜원;이충대
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.408-408
    • /
    • 2023
  • 하천공간은 하도, 사주, 식생, 하천구조물 등에 대한 특성을 지니고 있으며, 현장조사를 통해 하천공간에 대한 자료를 분석하여 기초자료를 생산한다. 기존에는 현장에서 육안조사나 지상에서 사진촬영, 스케치방법으로 하천공간특성에 대한 조사를 수행하였으나, 지상에서 조사한 자료은 하천특성에 대한 물리적·공간적 특성을 파악하기 어렵고 자료의 활용성이 낮은 한계점이 존재한다. 이와 같은 한계를 극복하기 위해 GIS 및 RS 기술을 활용한 고도화된 첨단조사 기술 및 장비가 도입되어 활용되고 있다. 본 연구에서는 하천공간특성을 GIS 기반으로 객체지향 분류 적용 연구와 분류 항목에 따른 공간분석 연구를 수행하였다. 연구를 위한 대상지역은 섬진강권역의 지석천 유역 하류부에 위치하고 있는 지석천 친수공원을 대상으로 선정하였다. 대상지역의 고해상도 항공영상을 수집 및 정합한 후 QGIS에서 제공하는 Orfeo ToolBox(OTB)의 LSMS(Large Scale Mean-Shift) 기법으로 정합한 항공영상의 객체지향 영상분할을 실시하여 벡터 레이어를 생성하였고, 하천공간특성에 따른 항목을 선정하여 각 항목의 영역에 대한 선별을 통해 훈련데이터를 생성하였다. 훈련데이터는 랜덤 포레스트를 이용하여 각 항목에 대한 자동 분류를 확인하였으며, 하천공간특성의 정량적 평가를 위해 분류된 각 항목별 공간분석을 통해 면적, 위치정보(위도, 경도, 표고)를 산정하였다. 분석 결과, 하천공간특성을 GIS 기반의 벡터 레이어와 각 항목에 대한 정량적 분석을 통해 하천공간의 DB를 구축하였다. 이와 같이 하천공간 DB 구축을 통해 전국 하천관리체계를 위한 기초자료를 구축하고자 하였다.

  • PDF

드론기반 초분광 영상을 활용한 하천 합류부 부유사 혼합 분석 (Analysis of suspended sediment mixing in a river confluence using UAV-based hyperspectral imagery)

  • 권시윤;서일원;류시완
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.89-89
    • /
    • 2022
  • 하천 합류부에 지천이 유입되는 경우 복잡한 3차원적 흐름 구조를 발생시키고 이로 인해 유사혼합 및 지형 변화가 활발히 발생하게 된다. 특히, 하천 합류부에서 부유사 거동은 하천의 세굴과퇴적, 하천 지형 변화, 하천 생태계, 하천구조물 안정성 등에 직접적으로 영향을 미치기 때문에 이에 대한 정확한 분석이 하천 관리 및 재해 예방에 필수적인 요소이다. 기존의 하천 합류부 부유사 계측 자료들은 재래식 채취 방식으로 수행되어 시공간적 해상도가 매우 낮아서 실측 자료만으로 합류부에서 부유사 혼합을 분석하기에는 한계가 존재하기에 대하천의 부유사 혼합 거동 해석에 수치모형이 주로 활용되어 왔다. 본 연구에서는 하천 합류부에서 부유사 거동을 공간적으로 정밀하게 분석하기 위해 드론 기반초분광 영상을 활용하여 하천 합류부에 최적화된 부유사 계측 방법론을 제시하였다. 현장에서 계측한 초분광 자료와 부유사 농도간의 관계를 구축하기 위하여 기계학습모형인 랜덤포레스트(Random Forest) 회귀 모형과 합류부에서 분광 특성이 다른 두 하천의 특성을 정확하게 반영하기 위한 가우시안 혼합 모형 (Gaussian Mixture Model) 기반 초분광 군집화 기법을 결합하였다. 본 연구에서 구축한 방법론을 낙동강과 황강의 합류부에 적용한 결과, 초분광 군집을 통해 두하천 흐름의 경계층을 명확히 구별하였으며, 이를 바탕으로 지류와 본류에 대해 각각 분리된 회귀 모형을 구축하여 복잡한 합류부 근역 경계층에서의 부유사 거동을 보다 정확하게 재현하였다. 또한 나아가서 재현된 고해상도의 부유사 공간분포를 바탕으로 경계층에서 강한 두 흐름이 혼합되어 발생한 와류(Wake)가 부유사 혼합에 미치는 영향을 규명하였고, 하천 합류부에서 발생하는 전단층의 수평방향 대규모 와류가 부유사 혼합 양상에 지배적 영향을 미치는 것으로 확인하였다.

  • PDF

실외공기측정기 자료를 이용한 도심 기상 예측 기계학습 모형 비교 (Comparison of Machine Learning Techniques in Urban Weather Prediction using Air Quality Sensor Data)

  • 박종찬;박헌진
    • 한국빅데이터학회지
    • /
    • 제6권2호
    • /
    • pp.39-49
    • /
    • 2021
  • 최근 국가 관측망, 기업 공기 측정기 등을 통해 많고 다양한 기상 데이터가 수집되고 있다. 기계학습 기법을 통해 기상 예측하려는 노력이 곳곳에서 이루어지고 있으며, 국내 미세먼지는 농도가 증가해오고 사람들의 관심이 높아 가장 관심있는 예측 대상 중 하나이다. 본 연구에서는 서울시 전역에 설치된 840여 개실외공기측정기 데이터를 사용하여 PM10·PM2.5 예측 모형을 비교하고자 한다. 5분 뒤 미세먼지 농도 예측을 통해 실시간으로 정보를 제공할 수 있으며, 이는 10분·30분·1시간 뒤 예측 모형 개발에 기반이 될 수 있다. 잡음 제거, 결측치 대체 등의 데이터 전처리를 진행하였고, 시·공간 변수를 고려할 수 있는 파생 변수를 생성하였다. 모형의 매개변수는 반응 표면 방법을 통해 선택하였다. XGBoost, 랜덤포레스트, 딥러닝(Multilayer Perceptron)을 예측 모형으로 사용하여, 미세먼지 농도와 예측값의 차이를 확인하고, 모형 간 성능을 비교하고자 한다.

머신러닝 기반 부산 청년인구 유출위험 요인 분석 (Analysis of Risk Factors for Youth Population Outflow in Busan Based on Machine Learning)

  • 손서영;양혜성;박민서
    • 문화기술의 융합
    • /
    • 제9권6호
    • /
    • pp.131-136
    • /
    • 2023
  • 지방을 떠나 수도권으로 이동하는 청년들이 나날이 늘고 있다. 청년 유출의 요인을 파악하기 위한 연구들이 다양하게 진행되고 있으나 각 지방별로 분석하는 연구는 부족한 실정이다. 이에 따라 본 연구는 부산의 청년 인구 유출 요인을 분석하고, 머신러닝 기법을 사용해 청년 인구 유출 위험 등급을 예측하고자 한다. 국가통계포털에서 수집한 부산의 구별 데이터를 활용하여 나이대(20대 초반, 20대 후반, 30대 초반)별로 세 그룹으로 나눈 뒤, 의사결정나무와 랜덤 포레스트 알고리즘을 이용해 청년 인구 유출 위험 등급을 분류하고 예측한다. 그 결과, 청년 인구 유출 위험 등급 예측 모델은 나이 그룹별 각각 최고 정확도 0.93, 0.75, 0.63을 갖는다.

빅데이터 기반 2형 당뇨 예측 알고리즘 개발 (Development of Type 2 Prediction Prediction Based on Big Data)

  • 심현;김현욱
    • 한국전자통신학회논문지
    • /
    • 제18권5호
    • /
    • pp.999-1008
    • /
    • 2023
  • 당뇨병과 같은 만성 질환의 조기 예측은 중요한 이슈이며, 그중에서도 당뇨 예측의 정확도 향상은 매우 중요하다. 당뇨 예측을 위한 다양한 기계 학습 및 딥 러닝 기반 방법론을 도입하고 있으나, 이러한 기술들은 다른 방법론보다 더 우수한 성능을 위해 대량의 데이터를 필요로 하며, 복잡한 데이터 모델 때문에 학습 비용이 높다. 본 연구에서는 pima 데이터셋과 k-fold 교차 검증을 사용한 DNN이 당뇨 진단 모델의 효율성을 감소시킨다는 주장을 검증하고자 한다. 의사 결정 트리, SVM, 랜덤 포레스트, 로지스틱 회귀, KNN 및 다양한 앙상블 기법과 같은 기계 학습 분류 방법을 사용하여 어떤 알고리즘이 최상의 예측 결과를 내는지 결정하였다. 모든 분류 모델에 대한 훈련 및 테스트 후 제안된 시스템은 ADASYN 방법과 함께 XGBoost 분류기에서 최상의 결과를 제공하였으며, 정확도는 81%, F1 계수는 0.81, AUC는 0.84였다. 또한 도메인 적응 방법이 제안된 시스템의 다양성을 보여주기 위해 구현되었다. LIME 및 SHAP 프레임워크를 사용한 설명 가능한 AI 접근 방식이 모델이 최종 결과를 어떻게 예측하는지 이해하기 위해 구현되었다.

강건한 태양광 발전량 예측을 위한 2단계 신경망 최적화 (Two-Stage Neural Network Optimization for Robust Solar Photovoltaic Forecasting)

  • 오진영;소다영;문지훈
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2024년도 제69차 동계학술대회논문집 32권1호
    • /
    • pp.31-34
    • /
    • 2024
  • 태양광 에너지는 탄소 중립 이행을 위한 주요 방안으로 많은 주목을 받고 있다. 태양광 발전량은 여러 환경적 요인에 따라 크게 달라질 수 있으므로, 정확한 발전량 예측은 전력 네트워크의 안정성과 효율적인 에너지 관리에 근본적으로 중요하다. 대표적인 인공지능 기술인 신경망(Neural Network)은 불안정한 환경 변수와 복잡한 상호작용을 효과적으로 학습할 수 있어 태양광 발전량 예측에서 우수한 성능을 도출하였다. 하지만, 신경망은 모델의 구조나 초매개변수(Hyperparameter)를 최적화하는 것은 복잡하고 시간이 많이 드는 작업이므로, 에너지 분야에서 실제 산업 적용에 한계가 존재한다. 본 논문은 2단계 신경망 최적화를 통한 태양광 발전량 예측 기법을 제안한다. 먼저, 태양광 발전량 데이터 셋을 훈련 집합과 평가 집합으로 분할한다. 훈련 집합에서, 각기 다른 은닉층의 개수로 구성된 여러 신경망 모델을 구성하고, 모델별로 Optuna를 적용하여 최적의 초매개변숫값을 선정한다. 다음으로, 은닉층별 최적화된 신경망 모델을 이용해 훈련과 평가 집합에서는 각각 5겹 교차검증을 적용한 발전량 추정값과 예측값을 출력한다. 마지막으로, 스태킹 앙상블 방식을 채택해 기본 초매개변숫값으로 설정해도 우수한 성능을 도출하는 랜덤 포레스트를 이용하여 추정값을 학습하고, 평가 집합의 예측값을 입력으로 받아 최종 태양광 발전량을 예측한다. 인천 지역으로 실험한 결과, 제안한 방식은 모델링이 간편할 뿐만 아니라 여러 신경망 모델보다 우수한 예측 성능을 도출하였으며, 이를 바탕으로 국내 에너지 산업에 이바지할 수 있을 것으로 기대한다.

  • PDF

설명 가능한 정기예금 가입 여부 예측을 위한 앙상블 학습 기반 분류 모델들의 비교 분석 (A Comparative Analysis of Ensemble Learning-Based Classification Models for Explainable Term Deposit Subscription Forecasting)

  • 신지안;문지훈;노승민
    • 한국전자거래학회지
    • /
    • 제26권3호
    • /
    • pp.97-117
    • /
    • 2021
  • 정기예금 가입 여부 예측은 은행의 대표적인 금융 마케팅 중 하나로, 은행은 다양한 고객 정보를 활용하여 예측 모델을 구성할 수 있다. 정기예금 가입 여부의 분류 정확도를 향상하기 위해, 많은 연구에서 기계학습 기법들을 이용하여 분류 모델들을 개발하였다. 하지만, 이러한 모델들이 만족스러운 성능을 보일지라도 모델의 의사결정 과정에 대한 근거가 적절하게 설명되지 않는다면 산업에서 활용하기가 쉽지 않다. 이러한 문제점을 해결하기 위해, 본 논문은 설명 가능한 정기예금 가입 여부 예측 기법을 제안한다. 먼저, 테이블 형식에서 우수한 성능을 도출하는 의사결정 나무 기반 앙상블 학습 기법인 랜덤 포레스트, GBM, XGBoost, LightGBM을 이용하여 분류 모델들을 개발하고, 10겹 교차검증을 통해 모델들의 분류 성능을 심층 분석한다. 다음으로, 가장 우수한 성능을 도출하는 모델에 설명 가능한 인공지능 기법인 SHAP을 적용하여 고객 정보의 영향도와 의사결정 과정 등을 해석할 수 있는 근거를 제공한다. 제안한 기법의 실용성과 타당성을 입증하기 위해, Kaggle에서 제공한 은행 마케팅 데이터 셋을 대상으로 모의실험을 진행하였으며, 데이터 셋 구성에 따라 GBM과 LightGBM 모델에 SHAP을 각기 적용하여 설명 가능한 정기예금 가입 여부를 위한 분석 및 시각화를 수행하였다.

낙동강의 중·하류 4개보에서 남조류 우점 환경 요인 분석 (Factors analysis of the cyanobacterial dominance in the four weirs installed in of Nakdong River)

  • 김성진;정세웅;박형석;조영철;이희숙
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2019년도 학술발표회
    • /
    • pp.413-413
    • /
    • 2019
  • 하천과 호수에서 남조류의 이상 과잉증식 문제(이하 녹조문제)는 담수생태계의 생물다양성을 감소시키며, 음용수의 이취미 원인물질을 발생시켜 물 이용에 장해가 된다. 또한 독소를 생산하는 유해남조류가 대량 증식할 경우에는 가축이나 인간의 건강에 치명적 해를 끼치기도 한다. 그 동안 국내에서 녹조문제는 댐 저수지와 하구호와 같은 정체수역에서 간헐적으로 문제를 일으켰으나, 4대강사업(2010-2011)으로 16개의 보가 설치된 이후 낙동강, 금강, 영산강 등 대하천에서도 광범위하게 발생되고 있어 중요한 사회적 환경적 이슈로 대두되었다. 한편, 대하천에 설치된 보 구간에서 빈번히 발생하는 녹조현상의 원인에 대해서는 전 지구적 기온상승에 따른 기후변화의 영향이라는 주장과 유역으로부터 영양염류의 과도한 유입, 가뭄에 따른 유량감소, 보 설치에 따른 체류시간 증가 등 다양한 의견이 제시되고 있으나, 대상 유역과 수체의 특성에 따라 녹조 발생의 원인이 상이하거나 또는 다양한 요인이 복합적으로 작용하기 때문에 보편적 해석(universal interpretation)이 어려운 것이 현실이다. 따라서 각 수계별, 보별 녹조현상에 대한 정확한 원인분석과 효과적인 대책 마련을 위해서는 집중된 실험자료와 데이터마이닝 기법에 근거로 한 보다 과학적이고 객관적인 접근이 이루어져야 한다. 본 연구에서는 2012년 보 설치 이후 남조류에 의한 녹조현상이 빈번히 발생하고 있는 낙동강 4개보(강정고령보, 달성보, 합천창녕보, 창녕함안보)를 대상으로 집중적인 현장조사와 실험분석을 수행하고, 수집된 기상, 수문, 수질, 조류 자료에 대해 통계분석과 다양한 데이터모델링 기법을 적용하여 보별 남조류 우점 환경조건과 이를 제어하기 위한 주요 조절변수를 규명하는데 있다. 연구대상 보 별 수질과 식물플랑크톤의 정성 및 정량 실험은 2017년 5월부터 2018년 11월까지 2년에 걸쳐 실시하였으며, 남조류 세포수 밀도와 환경요인과의 상관성 분석을 실시하고, 단계적 다중회귀모델(Step-wise Multiple Linear Regressions, SMLR), 랜덤포레스트(Random Forests, RF) 모델과 재귀적 변수 제거 기법(Recursive Feature Elimination using Random Forest, RFE-RF)을 이용한 변수중요도 평가, 의사결정나무(Decision Tree, DT), 주성분분석(Principal Component Analysis, PCA) 기법 등 다양한 모수적 및 비모수적 데이터마이닝 결과를 바탕으로 각 보별 남 조류 우점 환경요인을 종합적으로 해석하였다.

  • PDF

머신러닝 기반 고속도로 내 수소충전소 최적입지 선정 연구 (A Study on the Optimal Location Selection for Hydrogen Refueling Stations on a Highway using Machine Learning)

  • 조재혁;김성수
    • 지적과 국토정보
    • /
    • 제51권2호
    • /
    • pp.83-106
    • /
    • 2021
  • 대기오염, 지구온난화 문제 등 환경 문제의 심각성이 대두되면서 청정 연료의 관심이 커지고 있다. 그 중 수소는 기존 화석연료와는 달리 연소 시 부산물로 수분만이 발생하는 대표적인 친환경 에너지원으로 현재 다양한 분야에서 주목을 받고 있다. 물류 분야에서도 수소를 활용한 물류 네트워크를 구축하기 위해 다양한 정책적 노력이 활발히 이루어지고 있다. 이러한 수소 물류 네트워크의 구축에 있어 수소충전소의 입지 결정은 매우 중요한 문제이다. 최근 개발된 수소추진(수소연료전지) 화물차에 수소를 공급하는 충전소는 수소 기반 물류체계가 본격적으로 자리 잡는 데 있어 필수 불가결한 요소이다. 이러한 수소충전소의 최적 입지를 결정하는 선행연구는 대부분 수리적 모형에 기반한 최적화 기법만을 사용하여 수소충전소의 최적 입지를 결정하고자 하였다. 본 연구에서는 기존 연구의 동향과는 차별화하여 최적화 기법의 중요한 투입 변수 중 하나인 충전소 후보지에 대한 공간적 특성을 검토하는 방법으로 머신러닝 모형들을 활용하고 그 적용가능성을 확인하였다. 머신러닝은 다양한 분야에서 우수한 성과를 증명한 기법이지만 수소충전소의 최적 입지를 결정하는 연구 분야에서는 아직 적용된 바가 없다. 이를 위해 본 연구에서는 개별공시지가, 수소공급지와의 거리 등 전국 고속도로 휴게소와 고속도로의 무작위 지점들의 위치와 관련된 변수들을 독립변수로 선정하여 단일 머신러닝 모형과 앙상블 모형을 적용하고 그 성과를 비교하였다. 분석 결과, 랜덤포레스트(Random Forest) 모형이 가장 우수한 성과를 보였으며, 다른 모형들 또한 우수한 분류 성능을 보여 최적 입지 문제에 대해 공간적 특성을 예비적으로 검토하는 방법론으로써 머신러닝의 적용 가능성을 확인할 수 있었다. 따라서 머신러닝 모형은 수소충전소의 최적 입지 결정 분야에서 향후 최적화 기법을 적용한 연구의 예비적 검토 방법론으로 널리 활용할 수 있을 것으로 기대된다.

분광분석과 기계학습기법을 활용한 조선누층군 타이타늄 함유 면산층 탐지 (Detection of Titanium bearing Myeonsan Formation in the Joseon Supergroup based on Spectral Analysis and Machine Learning Techniques)

  • 박찬혁;유재형;오민규;이길재;이기연
    • 자원환경지질
    • /
    • 제55권2호
    • /
    • pp.197-207
    • /
    • 2022
  • 본 연구는 조선누층군 내 타이타늄 광체의 모암이 되는 면산층 암석을 기계학습기법을 분광분석 결과에 적용하여 탐지하였다. 이를 위해 면산층과 타 층들의 구성 광물을 파악하고, 타이타늄 함량을 측정하였으며, 전자기파 반응 특성을 분석하였다. 면산층은 다른 층들에 비해 불투명 광물을 많이 함유하고, 석영 입자와 점토광물로 구성된다. X선 형광분석 결과, 면산층의 평균 타이타늄 함량은 타 층들에 비해 최소 10배 이상의 타이타늄 함량을 보이며 낮은 함량군과 높은 함량군의 다봉분포를 갖는다. 이는 면산층 내의 타이타늄이 함유되는 사질과 이질이 교호 반복되는데 사질 부분은 이질 부분보다 타이타늄의 함량이 상대적으로 높기 때문이다. 분광분석 결과, 면산층은 산화철의 흡광 특성이 근적외선 영역에서, 점토광물에 의한 흡광 특성이 단파적외선 영역에서 관찰되며, 풍화면의 경우 점토광물 특성이 보다 강해지는 경향을 보인다. 타이타늄 광화대의 탐지는 티탄철석 자체의 분광 특성이 특징적이지 않아 광체를 탐지의 대상으로 보기보다는 모암인 면산층을 탐지하는 것이 적절할 것으로 생각된다. 랜덤포레스트 기계학습 기법을 이용한 면산층의 탐지 정확도는 84%, 전체정확도 97%를 보였으며, 산화철의 분광 특성과 점토광물 분광 특성이 가장 중요한 역할을 하는 것으로 분석되었다. 이는 분광 특성이 타이타늄 모암인 면산층 암석을 효율적으로 탐지할 수 있음을 지시하고, 확대 적용 될경우 무인항공기반 타이타늄 광체 탐사에 적용할 수 있을 것으로 기대한다.