• 제목/요약/키워드: GBM 모형

검색결과 25건 처리시간 0.021초

앙상블 머신러닝 모형을 이용한 하천 녹조발생 예측모형의 입력변수 특성에 따른 성능 영향 (Effect of input variable characteristics on the performance of an ensemble machine learning model for algal bloom prediction)

  • 강병구;박정수
    • 상하수도학회지
    • /
    • 제35권6호
    • /
    • pp.417-424
    • /
    • 2021
  • Algal bloom is an ongoing issue in the management of freshwater systems for drinking water supply, and the chlorophyll-a concentration is commonly used to represent the status of algal bloom. Thus, the prediction of chlorophyll-a concentration is essential for the proper management of water quality. However, the chlorophyll-a concentration is affected by various water quality and environmental factors, so the prediction of its concentration is not an easy task. In recent years, many advanced machine learning algorithms have increasingly been used for the development of surrogate models to prediction the chlorophyll-a concentration in freshwater systems such as rivers or reservoirs. This study used a light gradient boosting machine(LightGBM), a gradient boosting decision tree algorithm, to develop an ensemble machine learning model to predict chlorophyll-a concentration. The field water quality data observed at Daecheong Lake, obtained from the real-time water information system in Korea, were used for the development of the model. The data include temperature, pH, electric conductivity, dissolved oxygen, total organic carbon, total nitrogen, total phosphorus, and chlorophyll-a. First, a LightGBM model was developed to predict the chlorophyll-a concentration by using the other seven items as independent input variables. Second, the time-lagged values of all the input variables were added as input variables to understand the effect of time lag of input variables on model performance. The time lag (i) ranges from 1 to 50 days. The model performance was evaluated using three indices, root mean squared error-observation standard deviation ration (RSR), Nash-Sutcliffe coefficient of efficiency (NSE) and mean absolute error (MAE). The model showed the best performance by adding a dataset with a one-day time lag (i=1) where RSR, NSE, and MAE were 0.359, 0.871 and 1.510, respectively. The improvement of model performance was observed when a dataset with a time lag up of about 15 days (i=15) was added.

블랙숄즈모형을 적용한 태양광 핵심소재 기술가치평가: 기업사례를 중심으로 (Valuation on the Photovoltaic Core Material Technology Using Black-Scholes Model: a Company's Case Study)

  • 이동수;정기호
    • 기술혁신학회지
    • /
    • 제14권3호
    • /
    • pp.578-598
    • /
    • 2011
  • 본 논문은 차세대 그린에너지원으로 주목받고 있는 태양광산업의 핵심소재 기술에 대한 가치를 실물 옵션 기법을 이용하여 추정한다. 본 논문의 기여는 두 가지이다. 하나는 방법론적인 기여로서, 실물옵션의 기초자산 불확실성을 대변하는 변수로서 주가를 고려하여 실물옵션 적용에서 가장 복잡한 단계인 기초자산 불확실성의 모형과정을 대폭 단순화시켰다. 다른 하나는 응용장의 기여로서, 최근 수요가 크게 증가하고 있는 태양광산업의 핵심소재인 폴리실리콘의 생산공정 기술의 경제적 가치를 평가하였다. 분석사례인 폴리실리콘 산업의 A기업에 적용한 결과, 동 기업의 폴리실리콘 기술의 기초자산이 기하브라운모션을 따르는 것으로 나타났으며 이러한 결과에 블랙-숄즈 옵션가격결정모형을 적용하여 A기업의 폴리실리콘 기술에 대한 콜옵션의 가치는 약 34,229억원으로 측정되었다.

  • PDF

국면전환 확산모형을 통한 정보통신산업 발전과정의 특성 국제비교

  • 구재범;이정동;정종욱
    • 기술경영경제학회:학술대회논문집
    • /
    • 기술경영경제학회 2005년도 제26회 동계학술발표회 논문집
    • /
    • pp.268-286
    • /
    • 2005
  • 본 연구에서는 OECD 주요 10개국을 대상으로 국가별 정보통신산업의 성장 추이를 각각 분석하고 국별 특성을 비교하는데 목적이 있다. 이를 바탕으로 각국의 정보통신산업이 경기순환 또는 단계별 발전 속성을 지니고 있는지를 파악하고 국가별 공통점과 특이점을 분석하고자 하였다. 방법론적으로 OECD 국가들의 정보통신산업 GDP 추이 및 성장률의 움직임을 국면전환 (regime change) 확산과정으로 묘사함으로써 각 국가별 정보통신산업 발전 양상의 특징 및 국면전환 시점 등을 포착해 내고자 하였다 추세를 갖는 대표적 확산과정인 GBM 모형과 평균회귀 성향을 갖는 대표적 확산과정인 Vasicek 모형에 각각 마코프 국면전환을 도입하여 국가별 정보통신산업 GDP 및 GDP 성장률의 추이에 있어 국면 전환 여부와 독특한 발전 특성을 비교 분석하였다. 실증분석 결과 정보통신산업 GDP의 성장률과 변동성 사이에는 높은 상관관계가 있었으며, 한국, 멕시코 등은 고성장, 고변동성을, 미국, 프랑스, 일본 등은 저성장, 저변동성의 특성을 보이는 것으로 나타났다 또한 한국의 경우 유일하게 성장률과 변동성 모두 국면전환이 일어나는 국가로 나타났다. 장기평균 성장률의 특성에 따라 분류한 결과, 한국, 일본, 미국, 멕시코, 뉴질랜드는 고성장에서 저성장으로의 국면전환, 핀란드와 덴마크는 경기 순환적 국면전환, 노르웨이, 프랑스, 캐나다는 단일 국면으로 분류할 수 있었다. 특히 한국의 경우 평균회귀 속도와 변동성이 타 국가에 비해 높은 특성을 보여주었다. 본 연구는 정보통신산업을 미시적 분석이나 세부 항목별 정량적 분석을 통해서가 아니라 산업의 발전 속성 및 경기 순환 등의 관점에서 분석함으로써 정보통신산업 정책의 수립 및 집행을 거시적 안목 하에 정립할 수 있게 한다는 데 의의를 가진다. 또한 경제변수를 묘사하는데 있어 국면전환 확산과정을 사용함으로써 향후 실물옵션 등을 통한 기술 및 무형자산의 가치평가에 있어 기초자산의 움직임을 보다 정확히 포착해 낼 수 있는 프로세스를 제공하였다는데 또 다른 의의를 갖는다고 하겠다.

  • PDF

인공위성 원격 탐사 정보가 자료 기반 모형의 미계측 유역 하천유출 예측성능에 미치는 영향 분석 (Analysis of the Impact of Satellite Remote Sensing Information on the Prediction Performance of Ungauged Basin Stream Flow Using Data-driven Models)

  • 서지유;정하은;원정은;최시중;김상단
    • 한국습지학회지
    • /
    • 제26권2호
    • /
    • pp.147-159
    • /
    • 2024
  • 부족한 하천유출 관측 데이터는 모델 보정 작업을 어렵게 만들어 모델의 성능 향상을 제한한다. 위성 기반 원격탐사 자료는 수문 관련 데이터의 확보에 적극적으로 활용될 수 있으므로 새로운 대안이 될 수 있다. 최근에는 여러 연구를 통하여 기존의 개념적/물리적 모델보다는 인공지능을 이용한 해법이 더 적절하다는 평가를 받고 있다. 본 연구에서는 다양한 순환 신경망들과 의사결정나무 기반 알고리즘들을 결합한 자료 기반 접근 방식을 제안하였다. 또한 인공지능 학습을 위하여 인공위성 원격탐사 정보의 활용성을 조사하였다. 본 연구에서 위성영상은 MODIS와 SMAP의 자료가 사용된다. 공적으로 공개된 25개 유역의 자료를 사용하여 제안된 접근 방식을 검증하였다. 전통적인 지역화 접근법에서 착안하여 모든 유역의 자료를 통합하여 하나의 자료 기반 모델을 학습하는 전략을 채택하였으며, Leave-one-out cross-validation 지역화 설정을 이용하여 하나의 모델이 다양한 유역의 하천유출을 예측함으로써 제안된 접근 방식의 잠재력을 평가하였다. GRU + Light GBM 모델이 대상 유역에 적합한 모델 조합으로 판명되었으며(25개 미계측 유역 일 하천유량 예측 모형효율계수 평균 0.7187) 하천유출이 매우 작은 시기를 제외하면 우수한 미계측 유역의 하천유출 예측 성능을 보여주었다. 인공위성 원격탐사 정보의 영향력은 최대 10% 정도로 파악되었으며, 위성 정보의 추가 적용이 풍수기 또는 평수기보다는 저수기 또는 갈수기의 하천유출 예측에 더 큰 영향을 미쳤다.

데이터 마이닝 기법을 활용한 군용 항공기 비행 예측모형 및 비행규칙 도출 연구 (A Study on the Development of Flight Prediction Model and Rules for Military Aircraft Using Data Mining Techniques)

  • 유경열;문영주;정대율
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제31권3호
    • /
    • pp.177-195
    • /
    • 2022
  • Purpose This paper aims to prepare a full operational readiness by establishing an optimal flight plan considering the weather conditions in order to effectively perform the mission and operation of military aircraft. This paper suggests a flight prediction model and rules by analyzing the correlation between flight implementation and cancellation according to weather conditions by using big data collected from historical flight information of military aircraft supplied by Korean manufacturers and meteorological information from the Korea Meteorological Administration. In addition, by deriving flight rules according to weather information, it was possible to discover an efficient flight schedule establishment method in consideration of weather information. Design/methodology/approach This study is an analytic study using data mining techniques based on flight historical data of 44,558 flights of military aircraft accumulated by the Republic of Korea Air Force for a total of 36 months from January 2013 to December 2015 and meteorological information provided by the Korea Meteorological Administration. Four steps were taken to develop optimal flight prediction models and to derive rules for flight implementation and cancellation. First, a total of 10 independent variables and one dependent variable were used to develop the optimal model for flight implementation according to weather condition. Second, optimal flight prediction models were derived using algorithms such as logistics regression, Adaboost, KNN, Random forest and LightGBM, which are data mining techniques. Third, we collected the opinions of military aircraft pilots who have more than 25 years experience and evaluated importance level about independent variables using Python heatmap to develop flight implementation and cancellation rules according to weather conditions. Finally, the decision tree model was constructed, and the flight rules were derived to see how the weather conditions at each airport affect the implementation and cancellation of the flight. Findings Based on historical flight information of military aircraft and weather information of flight zone. We developed flight prediction model using data mining techniques. As a result of optimal flight prediction model development for each airbase, it was confirmed that the LightGBM algorithm had the best prediction rate in terms of recall rate. Each flight rules were checked according to the weather condition, and it was confirmed that precipitation, humidity, and the total cloud had a significant effect on flight cancellation. Whereas, the effect of visibility was found to be relatively insignificant. When a flight schedule was established, the rules will provide some insight to decide flight training more systematically and effectively.