• Title/Summary/Keyword: Ensemble Model

Search Result 644, Processing Time 0.028 seconds

Methodology on e-Navigation-Assisted Ocean Monitoring and Big Data Analysis (이내비게이션을 활용한 해양환경관측 및 빅데이터 분석방안)

  • LEE, GUAN-HONG;PARK, JAE-HUN;HA, HO KYUNG;KIM, DO WAN;LEE, WOOJOO;KIM, HONGTAE;SHIN, HYUN-JUNG
    • The Sea:JOURNAL OF THE KOREAN SOCIETY OF OCEANOGRAPHY
    • /
    • v.23 no.4
    • /
    • pp.204-217
    • /
    • 2018
  • This study proposes a cost-effective method to monitor coastal environments using e-Navigation-implemented domestic and international ferries, and to analyze big data of records such as wind, temperature, salinity, waves, and currents that are gathered through e-Navigation system. First, we present the concept and architecture of e-Navigation operation system based on the General Information Center on Maritime Safety and Security. Then, the marine observation system that can be applied to ferries operating in our nation's territory is discussed. Analytical methods, such as spatio-temporal mixed effects model, ensemble method, and meshfree method, in handling real-time big data obtained by the e-Navigation observing system are then explained in detail. This study will support the implementation of the Korean e-Navigation project that focuses on the safety of small vessels such as coasters and fishing vessels.

Predicting win-loss using game data and deriving the importance of subdivided variables (게임데이터를 이용한 승패예측 및 세분화된 변수 중요도 도출 기법)

  • Oh, Min-Ji;Choi, Eun-Seon;Oui, Som Akhamixay;Cho, Wan-Sup
    • The Journal of Bigdata
    • /
    • v.5 no.2
    • /
    • pp.231-240
    • /
    • 2020
  • With the development in the IT industry and the growth in the game industry, user's game data is recorded in seconds according to various plays and options, and a vast amount of game data can be analyzed based on Bigdata. Combined with business, Bigdata is used to discover new values for profit creation in various fields, but it is utilized in the game industry in insufficient ways. In this study, considering the characteristics of the subdivided lines, we constructed a win-loss prediction model for each line using the game data of League of Legends, and derived the importance of variables. This study can contribute to planning of strategies for general game users to get information about team members in advance and increase the win rate by using the record search sites.

Age Prediction based on the Transcriptome of Human Dermal Fibroblasts through Interval Selection (피부섬유모세포 전사체 정보를 활용한 구간 선택 기반 연령 예측)

  • Seok, Ho-Sik
    • Journal of IKEEE
    • /
    • v.26 no.3
    • /
    • pp.494-499
    • /
    • 2022
  • It is reported that genome-wide RNA-seq profiles has potential as biomarkers of aging. A number of researches achieved promising prediction performance based on gene expression profiles. We develop an age prediction method based on the transcriptome of human dermal fibroblasts by selecting a proper age interval. The proposed method executes multiple rules in a sequential manner and a rule utilizes a classifier and a regression model to determine whether a given test sample belongs to the target age interval of the rule. If a given test sample satisfies the selection condition of a rule, age is predicted from the associated target age interval. Our method predicts age to a mean absolute error of 5.7 years. Our method outperforms prior best performance of mean absolute error of 7.7 years achieved by an ensemble based prediction method. We observe that it is possible to predict age based on genome-wide RNA-seq profiles but prediction performance is not stable but varying with age.

Projecting forest fire potential in the Baekdudaegan of the Chungcheong region under the SSP scenario climate change using KBDI Drought Index (KBDI 가뭄지수를 이용한 SSP 기후변화 시나리오하의 충청지역 백두대간 산불 잠재력 전망)

  • Choi, Jaeyong;Kim, Su-Jin;Jung, Huicheul;Kim, Sung-Yeol;Moon, Geon-Soo
    • Journal of the Korean Society of Environmental Restoration Technology
    • /
    • v.25 no.6
    • /
    • pp.1-11
    • /
    • 2022
  • Recently, climate change has been regarded as a major cause of large-scale forest fires worldwide, and there is concern that more frequent and severe forest fires will occur due to the level of greenhouse gas emissions. In this study, the daily Keetch and Byram Drought Index (KBDI) of the Baekdudaegan in Chungcheong region including Sobaeksan, Songnisan, and Woraksan National Parks were calculated to assess effect of climate change on the forest fire potential- severity of annual maximum KBDI and frequency of high KBDI days. The present (2000~2019) and future KBDI(2021~2040, 2041~2060, 2081~2090) were calculated based on the meteorological observation and the ensemble regional climate model of the SSP1-2.6 and SSP5-8.5 scenarios with a spatial resolution of 1-km provided by Korea Meteorological Administration(KMA). Under the SSP5-8.5 scenario, 6.5℃ increase and 14% precipitation increase are expected at the end of the 21st century. The severity of maximum daily KBDI increases by 48% (+50mm), and the frequency of high KBDI days (> 100 KBDI) increases more than 100 days, which means the high potential for serious forest fires. The analysis results showed that Songnisan National Park has the highest potential for forest fire risk and will continue to be high in intensity and frequency in the future. It is expected that the forest vulnerability of the Baekdudaegan in the Chungcheong region will greatly increase and the difficulty in preventing and suppressing forest fires will increase as the abundance of combustible materials increases along with climate changes.

Damaged cable detection with statistical analysis, clustering, and deep learning models

  • Son, Hyesook;Yoon, Chanyoung;Kim, Yejin;Jang, Yun;Tran, Linh Viet;Kim, Seung-Eock;Kim, Dong Joo;Park, Jongwoong
    • Smart Structures and Systems
    • /
    • v.29 no.1
    • /
    • pp.17-28
    • /
    • 2022
  • The cable component of cable-stayed bridges is gradually impacted by weather conditions, vehicle loads, and material corrosion. The stayed cable is a critical load-carrying part that closely affects the operational stability of a cable-stayed bridge. Damaged cables might lead to the bridge collapse due to their tension capacity reduction. Thus, it is necessary to develop structural health monitoring (SHM) techniques that accurately identify damaged cables. In this work, a combinational identification method of three efficient techniques, including statistical analysis, clustering, and neural network models, is proposed to detect the damaged cable in a cable-stayed bridge. The measured dataset from the bridge was initially preprocessed to remove the outlier channels. Then, the theory and application of each technique for damage detection were introduced. In general, the statistical approach extracts the parameters representing the damage within time series, and the clustering approach identifies the outliers from the data signals as damaged members, while the deep learning approach uses the nonlinear data dependencies in SHM for the training model. The performance of these approaches in classifying the damaged cable was assessed, and the combinational identification method was obtained using the voting ensemble. Finally, the combination method was compared with an existing outlier detection algorithm, support vector machines (SVM). The results demonstrate that the proposed method is robust and provides higher accuracy for the damaged cable detection in the cable-stayed bridge.

A Study On The Classification Of Driver's Sleep State While Driving Through BCG Signal Optimization (BCG 신호 최적화를 통한 주행중 운전자 수면 상태 분류에 관한 연구)

  • Park, Jin Su;Jeong, Ji Seong;Yang, Chul Seung;Lee, Jeong Gi
    • The Journal of the Convergence on Culture Technology
    • /
    • v.8 no.6
    • /
    • pp.905-910
    • /
    • 2022
  • Drowsy driving requires a lot of social attention because it increases the incidence of traffic accidents and leads to fatal accidents. The number of accidents caused by drowsy driving is increasing every year. Therefore, in order to solve this problem all over the world, research for measuring various biosignals is being conducted. Among them, this paper focuses on non-contact biosignal analysis. Various noises such as engine, tire, and body vibrations are generated in a running vehicle. To measure the driver's heart rate and respiration rate in a driving vehicle with a piezoelectric sensor, a sensor plate that can cushion vehicle vibrations was designed and noise generated from the vehicle was reduced. In addition, we developed a system for classifying whether the driver is sleeping or not by extracting the model using the CNN-LSTM ensemble learning technique based on the signal of the piezoelectric sensor. In order to learn the sleep state, the subject's biosignals were acquired every 30 seconds, and 797 pieces of data were comparatively analyzed.

Assessment of Seasonal Forecast Skill of Springtime Droughts over Northeast Asia in Climate Forecast Models (기후 예보 모델의 동북아시아 봄철 가뭄 예측성 연구)

  • Jonghun Kam;Byeong-Hee Kim
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2023.05a
    • /
    • pp.42-42
    • /
    • 2023
  • 최근 IPCC 6차 보고서에서는 전 지구의 온도가 0.5℃가 증가할 때마다 기상학적 가뭄 지역이 증가하며, 인위적 강제력은 가뭄 현상의 강도와 빈도를 증가하는 것으로 밝혔다. 봄철(3월-5월) 동남아시아(남중국, 필리핀 등)에 비해 상대적으로 건조한 동북아시아(동중국, 한반도, 일본) 지역은 가뭄에 취약하며 기후 변화에 따라 가뭄으로 인한 피해가 커질 것으로 전망된다. 그러므로 이 지역은 봄철 가뭄으로 인한 피해를 완화하기 위해 봄철 강수량에 대한 신뢰할 만한 계절적 예보 기술이 꼭 필요하다. 본 연구에서는 1992-2022년 봄철의 Standardized Precipitation Index(SPI) 값을 기준으로 2001년과 2011년 동북아시아 가뭄이 발생한 것을 확인하였으며, 각 해의 3월에 관측된 기상학적 초기 조건으로부터 다중 기후 예보 모델들의 봄철 강수량의 계절적 예측성을 정량적으로 평가하였다. 관측자료로부터 2001년 가뭄은 동북아시아 대기 상층의 저기압성 순환의 강화로 인한 제트류(Jet stream)의 강화와 연관되어 있었으며, 2011년 가뭄은 제트류 강화와 함께 태평양 열대 지역 기류 강화가 동반되어 발생하였음을 알 수 있었다. North American Multi-Model Ensemble 기후 예보 모델들은 2011년 가뭄에 비해 2001년 가뭄에 대한 예측성이 높았으며, 그 이유로는 대기 상층 순환의 예측성과 연관이 있음을 밝혔다. 또한, 봄철 대기-해양 상호 패턴을 관측과 유사하게 재현한 GFDL-SPEARS 모델이 가뭄 해의 대기 상층 저기압성 순환과 강수 예측성이 가장 높은 것을 보였다. 본 연구의 결과들을 통해 동북아시아 봄철 가뭄과 같은 극한 기상의 강수량 예측성 향상에 있어서 기후 예보 모델들의 현실적인 대기-해양 결합 과정 모사 능력의 중요성을 밝혔다. 본 연구에서 제안된 방안들은 기후 예측 모델 개선을 위한 전략적인 정보를 제공할 것으로 보인다.

  • PDF

Development of data assimilation technique using a surrogate model (대체모형을 이용한 자료동화기법 개발)

  • Kim, Jongho;Tran, Vinh Ngoc
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2020.06a
    • /
    • pp.381-381
    • /
    • 2020
  • 자료동화(Data Assimilation) 기법은 실시간 수문학적 예측에 있어 정확도 향상을 위해 필수적인 과정이다. 가장 대중적으로 사용되는 기법들 중 하나가 모델 상태변수와 매개변수를 동시에 업데이트할 수 있는 이중 앙상블 칼만 필터(Dual Ensemble Kalman Filter)이다. 이 방법은 정확도 개선 및 적용의 용이성 때문에 많은 연구 분야에서 사용되어져 왔지만, 앙상블을 생성하는 과정에서 상당시간이 소요되는 단점이 존재한다. 본 연구에서는 상태변수와 매개변수를 동시에 업데이트 하면서 홍수 예측의 정확성을 보장할 뿐만 아니라, 앙상블 생성에 있어 계산 효율을 크게 향상시킬 수 있는 기법을 제안한다. Polynomial Chaos Expansion(PCE) 기법을 사용하여 앙상블 칼만 필터를 모방(mimic)할 수 있는 새로운 대체필터(Surrogate Filter)를 개발하는 것을 목표로 한다. 구체적으로 대체필터를 구성하기 위한 다양한 필터를 설계하였다. 첫째 시간에 대해서 PCE가 변화하지 않는 '불변 필터'(즉, 전체 예측기간에 대해 하나의 필터를 사용하여 자료동화할 수 있는 대체필터)와, 매 시간마다 PCE가 변화하는 '시변 필터'(즉, 예측하는 매 시간마다 새로운 필터를 생성해야 하는 대체필터)를 설계하여 적용성, 정확성, 예측성 등을 비교하였다. 또한, PCE의 하이퍼 매개변수를 최적화하기 위한 최적의 프레임 워크가 제안되어, 대체필터를 구축하는 데 효율을 높이고 PCE의 과적합(overfitting) 현상을 피할 수 있도록 하였다. 본 연구에서 제안된 기법은 기존 단일 및 이중 앙상블 칼만 필터(EnKF)의 결과와 비교 검증하였으며, 그 결과는 다음과 같다. (1) 대체필터의 대부분은 원래 EnKF와 비슷한 정도의 불확실성을 설명할 수 있음; (2) 모든 대체 필터는 선행시간이 짧은 경우의 예측에 있어 우수한 결과를 제공하며, 시변 필터가 불변 필터보다 더 정확한 예측 결과를 제공함; (3) 대체필터는 원래 앙상블 칼만필터보다 최대 500배 빠른 속도로 성능을 향상시킬 수 있음. 제안된 대체필터는 자료동화를 수행하는 기존필터와 비슷한 정도의 정확성, 매우 향상된 효율성을 보장함을 확인할 수 있었다.

  • PDF

A study on the uncertainty analysis of LENS-GRM using formal and informal likelihood measure (정형·비정형 우도를 이용한 LENS-GRM 불확실성 해석)

  • Lee, Sang Hyup;Choo, Inn Kyo;Yu, Yeong Uk;Jung, Younghun
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2020.06a
    • /
    • pp.317-317
    • /
    • 2020
  • 수재해는 수자원 인프라의 부족 및 관리 미흡 등 많은 요인들이 있지만 강우의 유무와 크기가 가장 원초적인 요인들 중 하나이다. 정확한 강우량 추정 및 강우발생시간 예측은 수재해로 인한 피해를 예방하고 빠르게 대처할 수 있다. 그러나 강우예측에는 많은 불확실성을 내포하고 있기 때문에 이러한 불확실성을 이해하고 줄여 나가는 것이 필요하다. 최근 컴퓨터의 성능의 발전에 비례해 강우 예측 자료들도 점진적으로 발전을 거듭하고 있다. 이를 강우-유출 모형에 적용시 유출량 예측의 정확성 또한 비례하여 한층 더 발전할 수 있을 것이다. 하지만 신뢰성이 낮은 입력자료를 대상으로 하는 유출해석 모형은 많은 불확실성을 내포할 것이다. 따라서 본 연구에서는 위천 유역에 대해 LENS(Limited area ENsemble prediction System) 강우앙상블 예측자료의 적용성을 검토하고 그리드 기반 강우 유출 모델 GRM(Grid based Rainfall-runoff Model) 에 적용하여 유출예측의 불확실성을 평가하고자 하였다. 또한 강우예측 및 유출예측은 수 많은 매개변수를 포함하며 최종적인 예측은 더 큰 불확실한 범위로 산출될 수 있다. 이에 따라 본 연구에서는 Python3 기반 코딩으로 LENS 자료 구축 및 GRM 모형의 매개변수 보정을 각 2000회 씩에 걸쳐 총 2회 실시하여 수문학적, 지형학적 인자에 따른 불확실성 범위를 보정하고자 하였다. 매개변수의 보정은 비정형우도(Informal likelihood) NSE, 정형우도(Formal likelihood) Lognormal(Log-likelihood function)의 우도에 따른 행위모델을 산정하여 보정하였다. 따라서 본 연구에서는 선행연구들을 참고한 정형, 비정형 우도의 임계치를 이용한 불확실성해석에 적용하였으며 이는 사용자의 행위모델선정 임계치 범위 선정으로 인한 불확실성을 줄여나감에 기여할 수 있을것으로 사료된다.

  • PDF

AutoFe-Sel: A Meta-learning based methodology for Recommending Feature Subset Selection Algorithms

  • Irfan Khan;Xianchao Zhang;Ramesh Kumar Ayyasam;Rahman Ali
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • v.17 no.7
    • /
    • pp.1773-1793
    • /
    • 2023
  • Automated machine learning, often referred to as "AutoML," is the process of automating the time-consuming and iterative procedures that are associated with the building of machine learning models. There have been significant contributions in this area across a number of different stages of accomplishing a data-mining task, including model selection, hyper-parameter optimization, and preprocessing method selection. Among them, preprocessing method selection is a relatively new and fast growing research area. The current work is focused on the recommendation of preprocessing methods, i.e., feature subset selection (FSS) algorithms. One limitation in the existing studies regarding FSS algorithm recommendation is the use of a single learner for meta-modeling, which restricts its capabilities in the metamodeling. Moreover, the meta-modeling in the existing studies is typically based on a single group of data characterization measures (DCMs). Nonetheless, there are a number of complementary DCM groups, and their combination will allow them to leverage their diversity, resulting in improved meta-modeling. This study aims to address these limitations by proposing an architecture for preprocess method selection that uses ensemble learning for meta-modeling, namely AutoFE-Sel. To evaluate the proposed method, we performed an extensive experimental evaluation involving 8 FSS algorithms, 3 groups of DCMs, and 125 datasets. Results show that the proposed method achieves better performance compared to three baseline methods. The proposed architecture can also be easily extended to other preprocessing method selections, e.g., noise-filter selection and imbalance handling method selection.