• 제목/요약/키워드: RMSE(Root Mean Squared Error)

검색결과 141건 처리시간 0.025초

누가분포함수를 활용한 강우강도식의 국내 적용성 평가 (Application of Intensity-Duration-Frequency Curve to Korea Derived by Cumulative Distribution Function)

  • 김규태;김태순;김수영;허준행
    • 대한토목학회논문집
    • /
    • 제28권4B호
    • /
    • pp.363-374
    • /
    • 2008
  • 국내에서 수공구조물의 설계를 위한 확률강우량을 산정하기 위해서 널리 사용되는 강우강도식은 주로 회귀분석을 적용한 형태가 일반적이지만, 본 연구에서는 각 지점별 적정확률분포형의 누가분포함수를 활용하여 강우강도식의 형태를 결정하고, 매개변수는 유전자알고리즘을 적용하여 추정하는 강우강도식을 제안하고자 한다. 기존에 사용하던 강우강도식과의 정확도 비교를 위하여 기상청 22개 지점에 대한 재현기간, 지속기간별 평균제곱근오차, 평균제곱근 상대오차를 검토한 결과 누가분포함수를 활용한 강우강도식이 더 높은 정확도를 가짐을 보였으며, 또한, 최근의 집중호우에 대한 영향을 살펴보기 위하여 2006년 까지의 강우자료를 이용하여 기존의 회귀식에 의한 방법과 누가분포함수를 활용한 경우의 결과값을 비교한 결과 이 경우에도 누가분포함수를 활용한 강우강도식의 정확도가 더 높음을 알 수 있었다. 결과적으로 본 연구에서 제안된 누가분포함수를 활용한 강우강도식은 기존의 회귀분석을 활용한 강우강도식보다 정확도면에서 우수하다고 할 수 있으며, 국내에 충분히 적용가능한 형태의 강우강도식이라고 판단된다.

BERT 기반 감성분석을 이용한 추천시스템 (Recommender system using BERT sentiment analysis)

  • 박호연;김경재
    • 지능정보연구
    • /
    • 제27권2호
    • /
    • pp.1-15
    • /
    • 2021
  • 추천시스템은 사용자의 기호를 파악하여 물품 구매 결정을 도와주는 역할을 할 뿐만 아니라, 비즈니스 전략의 관점에서도 중요한 역할을 하기에 많은 기업과 기관에서 관심을 갖고 있다. 최근에는 다양한 추천시스템 연구 중에서도 NLP와 딥러닝 등을 결합한 하이브리드 추천시스템 연구가 증가하고 있다. NLP를 이용한 감성분석은 사용자 리뷰 데이터가 증가함에 따라 2000년대 중반부터 활용되기 시작하였지만, 기계학습 기반 텍스트 분류를 통해서는 텍스트의 특성을 완전히 고려하기 어렵기 때문에 리뷰의 정보를 식별하기 어려운 단점을 갖고 있다. 본 연구에서는 기계학습의 단점을 보완하기 위하여 BERT 기반 감성분석을 활용한 추천시스템을 제안하고자 한다. 비교 모형은 Naive-CF(collaborative filtering), SVD(singular value decomposition)-CF, MF(matrix factorization)-CF, BPR-MF(Bayesian personalized ranking matrix factorization)-CF, LSTM, CNN-LSTM, GRU(Gated Recurrent Units)를 기반으로 하는 추천 모형이며, 실제 데이터에 대한 분석 결과, BERT를 기반으로 하는 추천시스템의 성과가 가장 우수한 것으로 나타났다.

가뭄 분석을 위한 지하수위 모니터링 및 예측기법 개발(II) - 표준강수지수, 표준지하수지수 및 인공신경망을 이용한 지하수 가뭄 예측 (Development of groundwater level monitoring and forecasting technique for drought analysis (II) - Groundwater drought forecasting Using SPI, SGI and ANN)

  • 이정주;강신욱;김태호;전근일
    • 한국수자원학회논문집
    • /
    • 제51권11호
    • /
    • pp.1021-1029
    • /
    • 2018
  • 본 연구에서는 미급수지역의 주요 수원인 지하수의 수위 변동 상황을 기반으로 한 미급수지역 가뭄 예보 기법 개발을 목적으로 하였다. 이를 위해 지역화된 표준지하수지수(SGI)와 표준강수지수들(SPIs)의 상관관계를 분석하였다. 관측 지하수위로부터 산정된 SGI의 자기회귀 특성 및 지속기간별 SPI와 SGI의 상관관계를 동시에 고려할 수 있는 NARX (nonlinear autoregressive exogenous model) 인공신경망 모형을 이용하여 지역별 예측모형을 구축하였다. 학습기간 동안 관측 SGI와 모델 출력 SGI의 상관계수는 0.7 이상인 곳이 전체 167개 지역별 모형 중 146개(87%)로 상관성이 높은 것으로 분석되었다. 적용기간에 대해서는 평균제곱근오차와 상관계수로 모형을 평가하였다. 본 연구를 통해 기상청에서 제공하는 59개 관측소별 강수량 전망 값으로부터 산정된 지속기간별 SPI와 관측된 지하수위를 이용한 지역별 SGI 전망이 가능하도록 하였으며, 미급수지역의 가뭄 예 경보를 위한 기초자료로 활용이 가능토록 하였다.

인공신경망 기반 온실 외부 온도 예측을 통한 난방부하 추정 (Outside Temperature Prediction Based on Artificial Neural Network for Estimating the Heating Load in Greenhouse)

  • 김상엽;박경섭;류근호
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권4호
    • /
    • pp.129-134
    • /
    • 2018
  • 최근, 인공신경망 모델은 예측, 수치제어, 로봇제어, 패턴인식 등의 분야에서 촉망되는 기술이다. 본 연구에서는 인공신경망 모델을 이용하여 온실 외부 온도를 예측하고 이를 온실제어에 활용하는데 목적이 있다. 예측 모델의 성능 평가를 위해 다중회귀모델과 SVM 모델과의 비교분석을 수행하였다. 평가 방법으로는 10-Fold Cross Validation을 사용하였으며, 예측 성능 향상을 위해 상관관계분석 통해 데이터 축소를 수행하였고, 측정 데이터로부터 새로운 Factor 추출하여 데이터의 신뢰성을 확보하였다. 인공신경망 구축을 위해 Backpropagation algorithm을 사용하였으며, 다중회귀모델은 M5 method로 구축하였고, SVM 모델을 epsilon-SVM으로 구축하였다. 각 모델의 비교분석 결과 각각 0.9256, 1.8503과 7.5521로 나타났다. 또한 예측모델을 온실 난방부하 계산에 적용함으로써 온실에 사용되는 에너지 비용 절감을 통한 수입증대에 기여할 수 있다. 실험한 온실의 난방부하는 3326.4kcal/h이며, 총 난방시간이 $10000^{\circ}C/h$일 때 연료소비량은 453.8L로 예측된다. 아울러 데이터 마이닝 기술 중 하나인 인공신경망을 정밀온실제어, 재배기법, 수확예측 등 다양한 농업 분야에 적용함으로써 스마트 농업으로의 발전에 기여할 수 있다.

바이오폴리머-흙 처리(BPST) 기술의 강도 발현 거동에 대한 주요 영향인자 분석에 관한 연구 (Investigation on the Key Parameters for the Strengthening Behavior of Biopolymer-based Soil Treatment (BPST) Technology)

  • 이해진;조계춘;장일한
    • 토지주택연구
    • /
    • 제12권3호
    • /
    • pp.109-119
    • /
    • 2021
  • 최근 지구 온난화로 인한 이상 기후로 인해 과거보다 더 많은 지반공학 재해들이 발생하고 있으며, 재해들의 규모도 더욱 증대되고 있다. 최근 토목 및 건설분야에 소개된 바이오폴리머 기반 흙 처리(BPST; Biopolymer-based soil treatment) 기술은 효율적으로 흙의 강도를 증진시키면서 탄소배출이 거의 없는 친환경 지반보강법으로 알려져 있다. 특히, 아가검, 젤란검, 잔탄검과 같은 열적젤화 특성을 지닌 바이오폴리머들의 강도 증진 효과가 매우 우수함이 여러 연구를 통해 밝혀지고 있다. 하지만 바이오폴리머 함량 외에는 바이오폴리머 기반 흙 처리에서 흙의 강도 증진을 제어하는 주요 영향인자 규명에 대한 연구는 많이 부족한 실정이다. 본 연구에서는 기존 발표된 열적젤화 바이오 폴리머 처리 흙의 불구속일축압축강도(UCS; Unconfined compressive strength) 자료에 대한 기계학습 기반 선형회귀 분석을 통해 젤란검 바이오폴리머로 처리된 흙의 강도 발현을 결정하는 주요 인자들을 분석하였다. 해석 결과, 바이오폴리머 함량과 더불어 흙 속 점토 함량이 강도 발현에 가장 중요한 인자임을 확인할 수 있었다.

GNSS관측 공공측량 정확도 분석 및 업무프로세스 제안 (Accuracy Analysis of GNSS-based Public Surveying and Proposal for Work Processes)

  • 배태석
    • 한국측량학회지
    • /
    • 제36권6호
    • /
    • pp.457-467
    • /
    • 2018
  • 공공측량/통합기준점측량 작업규정은 기존 트래버스 측량 작업규정을 준용하고 있으며, GNSS관측 특성을 정확하게 반영하지 않아서 현장 작업과 자료처리에 어려움이 있다. 또한, GNSS관측 자료처리 절차에 대한 규정이 명확하지 않고, 정확도 검증방법 역시 일반적인 기준과 차이가 있다. 본 연구에서는 현재 규정을 분석하고 적절한 업무프로세스를 제안하기 위해 공공기준점 측량과 유사한 시나라오를 바탕으로 짧은 세션(30분) 데이터를 처리했다. 서울특별시 네트워크 RTK (Real Time Kinematic) 기준점에 대해서 3일간 동일한 시간대 결과를 비교했으며, 하루 중 시간에 따른 결과를 비교해서 전반적인 자료처리 정확도를 평가했다. 대류권 지연오차 추정여부에 따른 정확도 차이를 동시에 분석했으며, 추정결과는 24시간 정지측량 결과와 비교했다. 대류층 지연오차를 추정하는 것이 정확도와 좌표안정성 향상에 유리하며, 평균제곱근오차는 대략 평면 5mm, 수직 1cm 수준으로 추정되었다. 본 연구결과를 바탕으로 통합기준점을 포함한 동시관측 일간해를 추정하고, 이를 통합하여 최소제약조건을 통해 최종해를 결정하는 업무프로세스를 제안한다. 이를 위해서는 학술용 자료처리시스템을 이용한 자료처리자동화시스템이 구축되어야하며, GNSS자료처리를 위해 통합기준점과 공공기준점 코드를 표준화해야 한다.

위성 자료와 수치모델 자료를 활용한 스태킹 앙상블 기반 SO2 지상농도 추정 (Monitoring Ground-level SO2 Concentrations Based on a Stacking Ensemble Approach Using Satellite Data and Numerical Models)

  • 최현영;강유진;임정호;신민소;박서희;김상민
    • 대한원격탐사학회지
    • /
    • 제36권5_3호
    • /
    • pp.1053-1066
    • /
    • 2020
  • 이산화황(SO2)은 대기 중 화학 반응을 통해 2차 대기오염물질을 생성하는 전구체로, 주로 산업활동이나 주거 및 교통 활동 등을 통해 배출된다. 장기간 노출 시 호흡기 질환이나 심혈관 질환 등을 유발하여 인체 건강에 부정적인 영향을 미칠 수 있기 때문에 이에 대한 지속적인 모니터링이 필요하다. 우리나라에서는 SO2에 대해 관측소 기반의 모니터링이 수행되고 있으나 이는 공간적으로 연속적인 정보를 제공하는 데에 한계가 있다. 따라서, 본 연구에서는 위성자료와 수치모델 자료를 융합하여 일별 13시를 타겟으로 하는 1 km의 고해상도로 공간적으로 연속적인 SO2 지상농도를 산출하였다. 2015년 1월부터 2019년 4월까지의 기간 동안 남한 지역에 대하여 스태킹 앙상블 기법을 이용하여 SO2 지상농도 추정 모델을 개발하였다. 스태킹 앙상블 기법이란 여러가지 기계학습 기법을 두 단계로 쌓는 방식으로 융합하여 단일 모델 대비 더 향상된 성능을 도출하는 방법이다. 본 연구에서는 베이스 모델로는 RF (Random Forest)와 XGB (eXtreme Gradient BOOSTing) 기법이, 메타 모델로는 MLR (Multiple Linear Regression) 기법이 사용되었다. 구축된 모델의 교차검증 결과 메타 모델은 상관계수(R) = 0.69와 root-mean-squared-error(RMSE) = 0.0032 ppm의 결과를 보였으며 이는 베이스 모델의 평균 대비 약 25% 향상된 안정성을 보였다. 또한 모델 구축에 사용되지 않은 기간에 대한 예측 검증을 수행하여 모델의 일반화 가능성을 평가하였다. 구축된 모델을 이용하여 남한 지역의 SO2 지상농도 공간분포를 분석한 결과 일반적인 계절성과 배출원의 변화를 잘 반영하는 패턴을 보임을 확인하였다.

산림 총일차생산량 예측의 공간적 확장을 위한 인공위성 자료와 기계학습 알고리즘의 활용 (Application of Machine Learning Algorithm and Remote-sensed Data to Estimate Forest Gross Primary Production at Multi-sites Level)

  • 이보라;김은숙;임종환;강민석;김준
    • 대한원격탐사학회지
    • /
    • 제35권6_2호
    • /
    • pp.1117-1132
    • /
    • 2019
  • 산림생태계 내의 총일차생산량은 산림 자원 생산량과 직결되고, 산림생태계의 건강성, 산림식물계절 및 생태계 서비스의 중요한 지표가 된다. 이 연구에서는 인공위성 자료와 기계학습 알고리즘을 활용하여 우리 나라의 산림유역의 총일차생산량을 연구하였다. 에디공분산 타워가 있는 6개 지점에서의 MODIS (Moderate Resolution Imaging Spectroradiometer) 산출물과 에디공분산타워의 총일차생산성으로 연구기간의 75%-80%에 해당하는 자료로 기계학습 알고리즘을 훈련하고 나머지 기간으로 구축된 모델의 총일차생산성 예측 결과를 검증하였다. 모델을 구축할 때 MODIS 지상 산출물과 대기 산출물을 조합하여 새로운 입력자료(e.g., 포화수증기압차)를 모델의 입력자료(Processed MODIS)로 사용하였을 때와 이러한 과정 없이 QC(Quality control)만 거친 MODIS 산출물을 그대로 입력자료(Unprocessed MODIS)로 사용하였을 때의 총일차생산량을 비교해 보고 그 활용 가능성에 대해 고찰하였다. 추가로 MODIS 총일차생산량 산출물(MYD17)과 에디공분산 총일차생산성 및 기계학습 알고리즘 기반의 총일차생산성과의 상관관계를 보고 그 적합성에 대해 논의하였다. 이 연구에서 사용된 기계학습 알고리즘은 Support Vector Machine (SVM)으로 산림생태계 연구에서 가장 많이 사용되고 있는 기계학습 알고리즘 중 하나이다. 기계학습 알고리즘 기반(SVM 모델)의 총일차생산량 예측 결과는 MODIS 총일차생산량 산출물(MYD17)보다 에디공분산 총일차생산량과 전반적으로 높은 상관관계를 보였고 특히 식생 성장을 시작하는 시점의 값을 좀더잘 예측하는 결과를 보였다. 단일 지역에서 Unprocessed MODIS 입력자료로 훈련된 SVM 모델 결과는 피어슨 상관계수 0.75 - 0.95 (p < 0.001), 6개의 연구 지점에서 훈련된 SVM 모델 결과는 피어슨 상관계수 0.77 - 0.94 (p < 0.001) 사이를 보였다. 이 결과는 훈련 자료에 다양한 이벤트들이 포함되면 모델의 예측력이 향상되는 가능성을 보여주었고 위성영상의 산출물을 재계산하여 새로운 산출물을 내는 과정을 거친 위성 자료가 아니어도 그 예측력에는 크게 문제가 없음을 보여주었다.

머신러닝 기법의 산림 총일차생산성 예측 모델 비교 (Predicting Forest Gross Primary Production Using Machine Learning Algorithms)

  • 이보라;장근창;김은숙;강민석;천정화;임종환
    • 한국농림기상학회지
    • /
    • 제21권1호
    • /
    • pp.29-41
    • /
    • 2019
  • 산림생태계에서 총일차생산성(Gross Primary Production, GPP)은 기후변화에 따른 산림의 생산성과 그에 영향을 미치는 식물계절, 건강성, 탄소 순환 등을 대표하는 지표이다. 총일차생산성을 추정하기 위해서는 에디공분산 타워 자료나 위성영상관측자료를 이용하기도 하고 물리지형적 한계나 기후변화 등을 고려하기 위해 기작기반모델링을 활용하기도 한다. 그러나 총일차생산성을 포함한 산림 탄소 순환의 기작기반 모델링은 식물의 생물, 생리, 화학적 기작들의 반응과 지형, 기후 및 시간 등과 같은 환경 조건들이 복잡하게 얽혀 있어 비선형적이고 유연성이 떨어져 반응에 영향을 주는 조건들을 모두 적용하기가 어렵다. 본 연구에서는 산림 생산성 추정 모델을 에디공분산 자료와 인공위성영상 정보를 사용하여 기계학습 알고리즘을 사용한 모델들로 구축해 보고 그 사용 및 확장 가능성을 검토해 보고자 하였다. 설명변수들로는 에디공분산자료와 인공위성자료에서 나온 대기기상인자들을 사용하였고 검증자료로 에디공분산 타워에서 관측된 총일차생산성을 사용하였다. 산림생산성 추정 모델은 1) 에디공분산 관측 기온($T_{air}$), 태양복사($R_d$), 상대습도(RH), 강수(PPT), 증발산(ET) 자료, 2) MODIS 관측 기온(T), 일사량($R_{sd}$), VPD 자료(개량식생지수 제외), 3) MODIS 관측 기온(T), 일사량($R_{sd}$), VPD, 개량식생지수(EVI) 자료를 사용하는 세 가지 경우로 나누어 구축하여 2006 - 2013년 자료로 훈련시키고 2014, 2015년 자료로 검증하였다. 기계학습 알고리즘은 support vector machine (SVM), random forest (RF), artificial neural network (ANN)를 사용하였고 단순 비교를 위해 고전적 방법인 multiple linear regression model (LM)을 사용하였다. 그 결과, 에디공분산 입력자료로 훈련시킨 모델의 예측력은 피어슨 상관계수 0.89 - 0.92 (MSE = 1.24 - 1.62), MODIS 입력자료로 훈련시킨 모델의 예측력은 개량식생지수 제외된 모델은 0.82 - 0.86 (MSE = 1.99 - 2.45), 개량식생지수가 포함된 모델은 0.92 - 0.93(MSE = 1.00 - 1.24)을 보였다. 이러한 결과는 산림총일차생산성 추정 모델 구축에 있어 MODIS인공위성 영상 정보 기반으로 기계학습 알고리즘을 사용하는 것에 대한 높은 활용가능성을 보여주었다.

자기조직화 지도를 활용한 성장모형 기반의 시장 성장패턴 지도 구축: ICT제품을 중심으로 (Development of Market Growth Pattern Map Based on Growth Model and Self-organizing Map Algorithm: Focusing on ICT products)

  • 박도형;정재권;정여진;이동원
    • 지능정보연구
    • /
    • 제20권4호
    • /
    • pp.1-23
    • /
    • 2014
  • 시장 예측은 일정 기간 동안 소비자에게 판매되는 동종 제품 또는 서비스의 수량 혹은 매출액의 규모를 추정하는 활동으로 정의할 수 있다. 정확한 시장 예측은 기업의 입장에서 새로운 제품의 도입시기 결정, 제품 설계, 생산계획 수립, 마케팅 전략 수립 등에 활용됨으로써 경영활동에 있어 효율적인 의사결정을 내릴 수 있게 하고, 정부의 입장에서는 발전 가능성이 있는 분야에 국가예산을 더 배분할 수 있는 효율적인 예산수립이 가능하게 한다. 본 연구는 정보통신기술(Information and Communication Technology: ICT) 분야의 제품 및 서비스에 대해서 과거의 시계열 자료를 이용하여 시장 성장곡선을 도출하고, 성장패턴이 비슷한 그룹으로 분류하여, 산업 내 시장에 대해 이해하고, 제품들의 미래 전망을 예측하는 데 목적이 있다. 다양한 아이템들을 통일되고 일관적인 방법으로 예측하기 위하여, 로지스틱 모형, 곰페르츠 모형, Bass 모형의 세 가지 전통적인 성장모형과 로지스틱 모형이나 곰페르츠 모형에서 도출되는 잠재시장 크기를 Bass 모형에 결합시킨 두 가지 하이브리드 성장모형을 개발하여 비교 분석하였다. 데이터 설명력이 우수한 로지스틱 + Bass 모형을 최적의 모형으로 선정하여 ICT 제품 및 서비스들 각각의 시장 성장곡선 모수를 확인하였다. 도출된 모수를 데이터로 하여, 자기조직화 지도 알고리즘을 통해, 5개의 의미 있는 영역으로 구분된 시장 성장패턴 지도가 구축되었는데, 각 영역별로 차별화된 특징과 성장패턴을 가지고 있었다. 본 연구에서 제안한 프로세스 및 시스템은 산업 시장 분석 시스템의 수요 예측 기능으로 활용될 수 있으며, ICT 산업뿐만 아니라 다양한 산업 및 분야에도 적용 가능할 것으로 기대된다.