• 제목/요약/키워드: 앙상블모형

검색결과 190건 처리시간 0.036초

비정상성 빈도해석을 위한 기상인자 선정 및 확률강우량 산정 (Selection of Climate Indices for Nonstationary Frequency Analysis and Estimation of Rainfall Quantile)

  • 정태호;김한빈;김현식;허준행
    • 대한토목학회논문집
    • /
    • 제39권1호
    • /
    • pp.165-174
    • /
    • 2019
  • 수문관측자료에서 비정상성(nonstationarity)이 관측됨에 따라 수공구조물 설계에서 비정상성 빈도해석에 대한 연구가 활발히 진행되고 있다. 대기-해양 시스템에 내재된 기후 변동성은 비정상성 현상과 관련이 있는 것으로 알려져 있지만, 비정상성 빈도해석은 일반적으로 선형적 추세를 기반으로 이루어지고 있다. 본 연구에서는 우리나라의 기후 변동성과 극치 강우 사상의 장기 경향성을 고려하기 위하여 기상인자를 활용한 비정상성 빈도해석을 수행하였다. 먼저, 경향성이 나타나는 11개 기상관측지점의 연 최대치 강우자료에 대하여 통계적 분해 방법인 앙상블 경험적 모드분해법을 활용해 자료에 내재된 장기 경향성을 추출하였으며, 계절에 따른 다양한 기상인자와의 상관성 분석을 수행하였다. 그 결과, 연 최대 강우 발생년도를 기준으로 전년도 가을철 AMM과 전년도 가을철 AMO, 그리고 전년도 여름철 NINO4가 10개 이상의 지점에서 연 최대치 강우자료의 장기 경향성에 유의한 영향을 미치는 것으로 나타났다. 선정된 기상인자를 일반 극치(generalized extreme value, GEV) 분포모형에 적용하여 비정상성 GEV (NS-GEV) 모형을 구축하고 기존의 선형적 추세를 고려한 NS-GEV 모형과의 AIC값을 비교하여 최적모형을 선정하였다. 선정된 모형과 기존의 선형적 추세를 고려한 NS-GEV 모형에 대한 성능 평가를 통해 기상인자를 활용한 NS-GEV 모형이 극치강우사상을 반영하여 확률강우량의 과소산정 문제를 보완할 수 있음을 확인하였다.

지연보상 위너 필터링에 의한 유발전위 파형개선 (Enhancement of Evoked Potential Waveform using Delay-compensated Wiener Filtering)

  • 이지은;유선국
    • 전자공학회논문지
    • /
    • 제50권12호
    • /
    • pp.261-269
    • /
    • 2013
  • 본 연구에서는 자극에 대한 유발전위 발현시점의 변화와 유발전위에 혼입된 무작위 잡음을 시간지연현상과 자음혼입 가법모형으로 모델링 하였다. 동기시점 불일치에 따른 평균화 처리과정의 유발전위 신호의 왜곡을 개선하기 위하여 시간지연추정을 잡음제거 위너필터에 결합한 복합적 시간지연보상-잡음개선 위너필터-앙상블평균 처리기법 (DWEA: Delay compensated Wiener filtered ensemble averaging)을 적용하였다. 제시한 방법의 성능은 임의의 시간지연과 크기의 변화를 변화시킨 백색잡음 데이터를 합성한 대리모의실험을 통하여 검증하였다. 모의실험데이터에 대하여 DWEA 방법이 위너필터링앙상블평균 방법과 기존의 앙상블평균방법보다 우수 하였다. DWEA 방법은 10% MSE 오차한계에 대하여 잡음이득 7까지 동작 가능하였다. 실험결과를 통하여 DWEA 방법은 잡음의 혼입과 동기 불일치 현상을 보이는 유발전위의 신호개선의 가능성을 제시하였다.

장단기 메모리(LSTM) 및 다층퍼셉트론(MLP) 인공신경망 앙상블을 이용한 장기 강우유출모의: 삼척 오십천 유역을 대상으로 (Long term discharge simulation using an Long Short-Term Memory(LSTM) and Multi Layer Perceptron(MLP) artificial neural networks: Forecasting on Oshipcheon watershed in Samcheok)

  • 안성욱;김병식
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.206-206
    • /
    • 2023
  • 지구온난화로 인한 기후변화에 따라 평균강수량과 증발량이 증가하며 강우지역 집중화와 강우강도가 높아질 가능성이 크다. 우리나라의 경우 협소한 국토면적과 높은 인구밀도로 기후변동의 영향이 크기 때문에 한반도에 적합한 유역규모의 수자원 예측과 대응방안을 마련해야 한다. 이를 위한 수자원 관리를 위해서는 유역에서 강수량, 유출량, 증발량 등의 장기적인 자료가 필요하며 경험식, 물리적 강우-유출 모형 등이 사용되었고, 최근들어 연구의 확장성과 비 선형성 등을 고려하기 위해 딥러닝등 인공지능 기술들이 접목되고 있다. 본 연구에서는 ASOS(동해, 태백)와 AWS(삼척, 신기, 도계) 5곳의 관측소에서 2011년~2020년까지의 일 단위 기상관측자료를 수집하고 WAMIS에서 같은 기간의 오십천 하구 일 유출량 자료를 수집 후 5개 관측소를 기준으로Thiessen 면적비를 적용해 기상자료를 구축했으며 Angstrom & Hargreaves 공식으로 잠재증발산량 산정해 3개의 모델에 각각 기상자료(일 강수량, 최고기온, 최대 순간 풍속, 최저기온, 평균풍속, 평균기온), 일 강수량과 잠재증발산량, 일 강수량 - 잠재증발산량을 학습 후 관측 유출량과 비교결과 기상자료(일 강수량, 최고기온, 최대 순간 풍속, 최저기온, 평균풍속, 평균기온)로 학습한 모델성능이 가장 높아 최적 모델로 선정했으며 일, 월, 연 관측유출량 시계열과 비교했다. 또한 같은 학습자료를 사용해 다층 퍼셉트론(Multi Layer Perceptron, MLP) 앙상블 모델을 구축하여 수자원 분야에서의 인공지능 활용성을 평가했다.

  • PDF

인경신경망을 이용한 한국프로야구 관중 수요 예측에 관한 연구 (A Study on Prediction of Attendance in Korean Baseball League Using Artificial Neural Network)

  • 박진욱;박상현
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권12호
    • /
    • pp.565-572
    • /
    • 2017
  • 본 연구는 기존의 수요 예측 등의 시계열 연구에서 주로 사용되는 ARIMA 모형의 어려움을 극복하고자 인공신경망(Artificial neural network) 모형을 이용하여 한국 프로 야구 관중 수를 예측하였다. 훈련 자료로는 2015년 3월부터 9월까지의 일별 KBO 관중 수 자료를 대상으로 하였다. 전방향 신경망(Feedforward neural network)의 모형 훈련 과정에서, 그리드 탐색(Grid search)을 적용하여 최적의 초모수(Hyperparameter)를 찾고자 하였다. 그 결과, 그리드 탐색법의 최적 모형을 이용한 평균 절대 백분율 오차(MAPE)는 평균 20.9% 였다. 앙상블 기법을 이용한 모형의 MAPE는 평균 20.0%였다. 이는 다중회귀와 비교해보았을 때, 평균적으로 각각 26.3%, 30.3% 높은 예측력을 보인다.

머신러닝 기반 KOSDAQ 시장의 관리종목 지정 예측 연구: 재무적 데이터를 중심으로 (Study on Predicting the Designation of Administrative Issue in the KOSDAQ Market Based on Machine Learning Based on Financial Data)

  • 윤양현;김태경;김수영
    • 벤처창업연구
    • /
    • 제17권1호
    • /
    • pp.229-249
    • /
    • 2022
  • 본 연구는 다양한 머신러닝 기법을 통해 코스닥(KOSDAQ) 시장 내 관리종목 지정을 예측할 수 있는 모델에 대해 연구하였다. 증권시장 내 기업이 관리종목으로 지정이 되면 시장에서는 이를 부정적인 정보로 인식하여 해당 기업과 투자자에게 손실을 가져오게 된다. 본 연구를 통해 기업의 재무적 데이터를 바탕으로 조기에 관리종목 지정을 예측하고, 투자자들의 포트폴리오 리스크 관리에 도움을 주기 위한 머신러닝 접근이 타당한지 살펴본다. 본 연구를 위해 활용한 독립변수는 수익성, 안정성, 활동성, 성장성을 나타내는 21개의 재무비율을 활용하였으며, K-IFRS가 적용된 2011년부터 2020년까지 관리종목과 비관리종목의 기업의 재무 데이터를 표본으로 추출하였다. 로지스틱 회귀분석, 의사결정나무, 서포트 벡터 머신, 랜덤 포레스트, LightGBM을 활용하여 관리종목 지정 예측 연구를 수행하였다. 연구결과는 분류 정확도가 82.73%인 LightGBM이 가장 우수한 예측 모형이었으며 분류 정확도가 가장 낮은 예측 모형은 정확도가 71.94%인 의사결정나무였다. 의사결정나무 기반 학습 모형의 변수 중요도의 상위 3개 변수를 확인한 결과 각 모형에서 공통적으로 나온 재무변수는 ROE(당기순이익), 자본금회전율(Capital stock turnover ratio)로 해당 재무변수가 관리종목 지정에 있어 상대적으로 중요한 변수임을 확인하였다. 대체적으로 앙상블을 이용한 학습 모형이 단일 학습 모형보다 예측 성능이 높은 것을 확인하였다. 기존 선행연구가 K-IFRS에 대한 고려를 하지 않았고, 다소 제한된 머신러닝에 의존하였다. 따라서 본 연구의 필요성과 함께 현실적 요구를 충족시키는 결과를 제시하였음을 알 수 있으며, 시장참여자들에게 있어 관리종목 지정에 대한 사전 예측을 확인할 수 있도록 기여했다고 볼 수 있다.

데이터마이닝 기법을 활용한 맞춤형 고혈압 사후관리 모형 개발 (A Development of a Tailored Follow up Management Model Using the Data Mining Technique on Hypertension)

  • 박일수;용왕식;김유미;강성홍;한준태
    • 응용통계연구
    • /
    • 제21권4호
    • /
    • pp.639-647
    • /
    • 2008
  • 본 연구는 국민건강보험공단의 건강검진데이터, 자격 및 보험료 그리고 진료비 데이터를 활용하여 고혈압 관리를 위한 맞춤형 고혈압 사후관리모형(고혈압 진료예측모형 및 고혈압 진료순응도세분화모형)을 개발하고자 하였다. 모형 개발에는 데이터마이닝의 로지스틱 회귀모형, 의사결정나무 그리고 앙상블 모형을 활용하였다. 고혈압 진료예측모형에서는 3가지 모형 중 로지스틱 회귀모형이 가장 우수한 모형으로 채택되었으며, 고혈압 진료순응도세분화모형은 의사결정나무모형을 통해 개발되었다. 본 연구는 전국 규모의 수년간 축적된 자료를 데이터마이닝을 활용함으로써 고혈압의 진료 및 진료순응도에 이르는 고혈압 사후관리 프로세스 전반에 걸친 결과를 도출함으로써 우리나라 고혈압 사후관리체계 구축에 기여할 것으로 사료된다.

강우 및 홍수 예측을 위한 수치예보자료의 적용 및 정확도 개선 (Application and Accuracy Improvement of Numerical Weather Prediction Data for Rainfall and Flood Forecasting)

  • 문혜진;정관수
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2018년도 학술발표회
    • /
    • pp.10-10
    • /
    • 2018
  • 기후변화로 인한 집중호우의 빈도 및 강도가 증가하여 치수 구조물의 설계 홍수 빈도를 초과하는 피해가 발생하고 있다. 본 연구에서는 이러한 침수 피해를 저감하기 위해 수치예보자료를 활용한 홍수 예 경보시스템의 적용성을 비교 평가하였다. 수치예보자료는 국내 기상청에서 제공하는 국지예보모델(LDAPS)과 일본 기상청의 중규모모델(Meso-scale Model ; MSM)을 이용하였으며, 남강댐 유역 내의 산청 유역에 대해 태풍 및 정체 전선 등 3 개의 강우사상을 선정하였다. 강우유출 해석에는 분포형 수문 모형인 KWMSS(Kinematic Wave Method for Subsurface and Surface)를 이용하였다. 그 결과, LDAPS와 MSM 모두 강우발생 유무를 잘 재현하였다. 특히, 광역적 강우인 태풍사상에 대해 강우 예측에서 비교적 높은 정확도를 나타내었다. 강우 예측의 정확도 향상을 위해 강우장의 공간 변위를 고려하여 앙상블 강우 분포를 적용한 결과, 강우 예측의 정확도가 향상되는 것으로 나타났다. 홍수 예측의 경우 두 수치예보자료 모두 유출 패턴을 잘 재현하였다. 앙상블 홍수 예측 결과, 단일 강우 자료를 통한 홍수 예측에서의 예측 불확실성을 개선하는 것으로 나타났다. 3개의 강우 사상에 대해 MSM의 예측 결과가 LDAPS의 예측 결과보다 비교적 높은 상관관계를 나타내었다. 본 연구를 통해 강우 및 홍수 예측에 수치예보자료의 적용 가능성이 있다고 판단되며, 홍수 예 경보의 기초자료로 활용성이 있다고 판단된다.

  • PDF

베이즈이론을 이용한 가뭄 확률 전망 기법 고도화 (Improvement in probabilistic drought prediction method using Bayes' theorem)

  • 김대호;김영오
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2020년도 학술발표회
    • /
    • pp.153-153
    • /
    • 2020
  • 우리나라에선 크고 작은 가뭄 피해가 자주 일어나고 있으며 최근엔 유래 없는 다년가뭄이 발생하면서 가뭄에 대한 경각심이 커지고 있다. 가뭄에 적절하게 대응하여 피해를 경감시키기 위해서는 신뢰도 높은 가뭄 예측이 선행되어야 한다. 이에 본 연구는 앙상블 예측과 베이즈이론(Bayes' theorem)을 수문학적 가뭄지수 중 하나인 SRI(Standardized Runoff Index)에 적용해 가뭄 확률 전망을 실시했으며 이를 EDP(Ensemble Drought Prediction)라고 칭하였다. 국내 8개 댐유역에서 EDP를 생성하고 개선하는 과정은 다음과 같이 진행된다. 우선 TANK모형을 활용한 1개월 선행 유량 예측(Ensemble Streamflow Prediction, ESP)의 결과를 SRI로 변환하여 EDP 확률분포를 생성한다. 그런 다음, EDP를 개선하기 위해 그 기초인 ESP에서 미흡한 토양수분 초기조건을 보완하고자 베이즈이론을 활용했다. APCC(APEC Climate Center)의 위성 관측 SMI(Soil Moisture Index) 자료로 SRI와의 회귀식을 구축, 이를 우도함수로 정의해 사전 EDP 분포를 업데이트한 EDP+ 확률분포를 생성했다. 그 결과, EDP와 EDP+ 모두 심도가 깊은 가뭄을 전망할수록 예측력이 기후학적 예측보다 좋지 않았다. 그럼에도 우도함수로 사용한 회귀식의 정확도가 높을수록 EDP+의 정확도도 향상되는 경향이 나타났으며, 이는 베이즈이론을 사용한다면 가뭄 확률 전망을 개선할 수 있다는 것을 의미하고 있다. 하지만, 확정 전망 정확도는 확률 전망 정확도와는 관계가 없었는데 이는 확정 전망과 확률 전망이 본질적으로 다르기 때문인 것으로 사료된다.

  • PDF

외환거래에서 의사결정나무와 그래디언트 부스팅을 이용한 수익 모형 연구 (The study of foreign exchange trading revenue model using decision tree and gradient boosting)

  • 정지현;민대기
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권1호
    • /
    • pp.161-170
    • /
    • 2013
  • 외환차액거래는 국제외환 시장에서 외국의 통화를 거래하는 것으로 현물시장에서 이뤄지는 장외 통화선물 거래를 의미한다. 외환차액거래 데이터를 이용하여 의사결정나무와 그래디언트 부스팅 방법을 이용한 수익모델을 비교하였다. 금융시장의 예측을 위해 사용되고 있는 시계열분석과 같은 방법들은 장기간의 예측 모형을 설명하기에 장점이 있지만, 파동이많고 짧은 시간에 가격이 급변하는 외환시장을 예측하기에는 한계가 있다. 따라서 본 논문에서는 단기간 즉 1, 3, 5분에서 외환시장의 수익구조를 의사결정나무와 앙상블기법의 하나인 그래디언트 부스팅으로 비교하여 매수, 매도거래 시 수익을 만들기 위한 규칙을 연구하였다.

수질자료의 특성을 고려한 앙상블 머신러닝 모형 구축 및 설명가능한 인공지능을 이용한 모형결과 해석에 대한 연구 (Development of ensemble machine learning model considering the characteristics of input variables and the interpretation of model performance using explainable artificial intelligence)

  • 박정수
    • 상하수도학회지
    • /
    • 제36권4호
    • /
    • pp.239-248
    • /
    • 2022
  • The prediction of algal bloom is an important field of study in algal bloom management, and chlorophyll-a concentration(Chl-a) is commonly used to represent the status of algal bloom. In, recent years advanced machine learning algorithms are increasingly used for the prediction of algal bloom. In this study, XGBoost(XGB), an ensemble machine learning algorithm, was used to develop a model to predict Chl-a in a reservoir. The daily observation of water quality data and climate data was used for the training and testing of the model. In the first step of the study, the input variables were clustered into two groups(low and high value groups) based on the observed value of water temperature(TEMP), total organic carbon concentration(TOC), total nitrogen concentration(TN) and total phosphorus concentration(TP). For each of the four water quality items, two XGB models were developed using only the data in each clustered group(Model 1). The results were compared to the prediction of an XGB model developed by using the entire data before clustering(Model 2). The model performance was evaluated using three indices including root mean squared error-observation standard deviation ratio(RSR). The model performance was improved using Model 1 for TEMP, TN, TP as the RSR of each model was 0.503, 0.477 and 0.493, respectively, while the RSR of Model 2 was 0.521. On the other hand, Model 2 shows better performance than Model 1 for TOC, where the RSR was 0.532. Explainable artificial intelligence(XAI) is an ongoing field of research in machine learning study. Shapley value analysis, a novel XAI algorithm, was also used for the quantitative interpretation of the XGB model performance developed in this study.