• 제목/요약/키워드: Model Ensemble

검색결과 638건 처리시간 0.032초

APCC MME 계절예측정보를 이용한 가뭄전망 (Drought Outlook using APCC MME Seasonal Prediction Information)

  • 강부식;문수진;손수진;이우진
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2010년도 학술발표회
    • /
    • pp.1784-1788
    • /
    • 2010
  • APEC 기후센터(APEC Climate Center, APCC)에서 제공하는 다중모형앙상블(Multi-model Ensemble, MME) 형태의 계절예측정보를 이용하여 3개월 가뭄전망을 수행하였다. APCC MME는 기후예측모형이 가지는 불확실성을 최소화하기 위한 방법으로, 아시아 태평양 지역 내 9개 회원국 16개 기관 21개 기후모형의 계절예측정보를 활용하여, 개별 모형이 가지는 계통오차(Systematic error)를 앙상블 기법을 통하여 상쇄함으로써 최적의 예측자료를 도출한다. 또한, 기후예측 모형이 예측한 대기순환장은 관측 지점변수와 경험적 통계적 관련성을 가지므로, 이를 바탕으로 상세지역의 이상기후에 대한 정보를 도출할 수 있다. 본 연구에서는 가뭄 관리 및 전망을 위한 입력 자료로서, 기상전문 기관인 APEC 기후센터 (APEC Climate Center, APCC)에서 제공하는 전구 규모의 기온 및 강수 전망자료를 기상청 산하 59개 지점의 전망자료로 통계적 규모 축소화 기법을 통해 3개월 예보를 실시하였다. APCC 계절예측자료를 가뭄모니터링시스템의 자료입력 포맷에 따라 적절히 가공한 뒤, 가뭄 관리 및 전망을 위하여 SPI(Standard Precipitation Index) 및 PDSI(Palmer Drought Severity Index)지수의 입력자료로 사용하여 SPI 및 PDSI 지수를 산정하였다. 또한 분위사상법(Quantile Mapping)을 이용하여 총 59개 지점의 과거 월평균 관측값과 최근 2009년에 대한 모의값의 누적확률분포값을 계산하고 모의값의 확률분포를 관측값의 확률분포에 사상시켜 가뭄 전망을 위한 기상변수의 오차를 보정하고자 하였다. 이러한 계절예측정보를 이용하여 가뭄 전망에 대한 신뢰도가 높아진다면, 사전예방 및 피해완화로 가뭄상황에 대한 신속한 대처 및 피해의 경감이 이루어질 수 있을 것이다.

  • PDF

Analyzing Machine Learning Techniques for Fault Prediction Using Web Applications

  • Malhotra, Ruchika;Sharma, Anjali
    • Journal of Information Processing Systems
    • /
    • 제14권3호
    • /
    • pp.751-770
    • /
    • 2018
  • Web applications are indispensable in the software industry and continuously evolve either meeting a newer criteria and/or including new functionalities. However, despite assuring quality via testing, what hinders a straightforward development is the presence of defects. Several factors contribute to defects and are often minimized at high expense in terms of man-hours. Thus, detection of fault proneness in early phases of software development is important. Therefore, a fault prediction model for identifying fault-prone classes in a web application is highly desired. In this work, we compare 14 machine learning techniques to analyse the relationship between object oriented metrics and fault prediction in web applications. The study is carried out using various releases of Apache Click and Apache Rave datasets. En-route to the predictive analysis, the input basis set for each release is first optimized using filter based correlation feature selection (CFS) method. It is found that the LCOM3, WMC, NPM and DAM metrics are the most significant predictors. The statistical analysis of these metrics also finds good conformity with the CFS evaluation and affirms the role of these metrics in the defect prediction of web applications. The overall predictive ability of different fault prediction models is first ranked using Friedman technique and then statistically compared using Nemenyi post-hoc analysis. The results not only upholds the predictive capability of machine learning models for faulty classes using web applications, but also finds that ensemble algorithms are most appropriate for defect prediction in Apache datasets. Further, we also derive a consensus between the metrics selected by the CFS technique and the statistical analysis of the datasets.

확률론적 홍수예측을 위한 불확실성 분석 (Uncertainty Analysis for the Probabilistic Flood Forecasting)

  • 이경태;김영오;강태호
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2012년도 학술발표회
    • /
    • pp.71-71
    • /
    • 2012
  • 현재 전 세계적으로 극한강우의 발생빈도가 점차 높아지고 있으며 홍수량 또한 강도가 커지고 있는 것이 현실이다. 하지만 과거의 홍수발생 빈도에 따라 설계된 홍수방어시설들이 점차 한계를 보이고 있으므로 이를 대비하기위한 구조적 대책뿐만 아니라 홍수피해 발생 가능지역에 사전 예경보를 시행하는 비구조적 대책마련 또한 필요하다. 기존의 홍수예측은 확정적인 하나의 유량예측값만을 제공함으로써 신속하고 편리하였지만 이에 대한 불확실성이 큰 경우 예상치 못한 큰 인적 물적 피해를 가져올 수 있다. 이처럼 확률론적 홍수예측의 필요성이 대두되어 지면서 유럽이나 미국등 선진국에서는 EFFS(European Flood Forecasting System)과 NWSRFS(National Water Service River Forecast System)같이 이미 확률론적 홍수예측에 대한 연구 및 기술개발이 활발하게 진행되어지고 있다. 하지만 홍수예측의 확률론적 접근에 있어서는 많은 불확실성들이 내포되어 있으므로 예측시스템에서 생성된 앙상블 유량예측 결과의 신뢰도 분석과 올바른 불확실성 정보의 제공이 필요하다. 본 연구는 확률론적 홍수예측 방법을 국내에 적용시켜서 기상청의 예측시스템 KLAPS(Korea Local Analysis and Prediction System), MAPLE(McGill Algorithm for Precipitation Nowcasting by Lagrangian Extrapolation), UM(Unified Model) 그리고 MOGREPS(Met Office Global Regional Ensemble Prediction System)으로부터 생성된 기상앙상블을 현재 국토해양부 홍수통제소에서 사용하고 있는 강우-유출모형인 저류함수모형(Storage Function Method)의 입력 자료로 사용한다. 확률론적 홍수예측에서 오는 불확실성을 분석하기 위해서 첫 번째로 제공되는 기상예측 시스템의 시 공간적 스케일 및 대상유역의 공간특성에 따라 어떠한 형태로 전파되어지는지를 분석하였다. 두 번째는 각각의 예측시스템들이 선행기간(Lead time)에 따라 불확실성의 특성이 어떻게 나타나게 되는지를 확인하였다. 이러한 불확실성의 특성을 정확하게 파악하게 된다면 예측에 있어서 현재 갖고 있는 문제점들로부터 개선해 나가야 할 방향을 제시해주어 향후연구에 유용하게 활용될 수 있을 것이다.

  • PDF

낙동강유역 강우의 공간자기상관 특성분석을 통한 베이지안 앙상블 강우 검증 (Spatial Autocorrelation Characteristic Analysis on Bayesian ensemble Precipitation of Nakdong River Basin)

  • 문수진;손호영;강부식
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.411-411
    • /
    • 2017
  • 유역 내 발생하는 강우의 공간적인 분포는 인접성 및 거리에 따라 달라질 수 있다. 공간자기상관 분석은 공간단위(유역 또는 행정구역)의 변수(강수 등)가 주변지역과 갖는 관계를 통해 얼마나 분산되어 있는지 혹은 군집되어 있는지를 판별하는 기법으로 최근 많은 연구에서 활성화 되고 있다. 본 연구에서는 낙동강유역을 대상으로 1980~2000년까지 20개년의 기상청을 통해 수집한 강우자료와 CMIP5(Coupled Model Intercomparison Project Phase 5)에서 제공하는 기후변화 자료 중 가용할 수 있는 20개 모델의 강우를 수집하였다. 기후변화 자료는 정상성 분위사상법으로 지역오차보정을 실시하고 불확실성을 저감하고자 베이지안 모델 평균기법을 통해 새로운 시계열을 생성하였다. 생성된 시계열의 공간적인 분포를 정량적으로 평가하고자 중권역별 공간자기상관 분석을 수행하였다. 대부분의 연구에서는 GIS를 활용하여 정성적으로 강우의 분포를 나타내고 있지만 본 연구에서는 공간단위의 인접성 또는 거리에 따른 척도를 기반으로 공간자기상관을 탐색할 수 있는 Moran's I와 LISA(Local Indicators of Spatial Association)기법을 적용하였다. Moran's I는 전체 연구지역에 대한 관계를 하나의 값으로 보여주는 전역적인 기법이며, LISA는 상대적으로 넓은 지역을 국지적으로 구분하여 특정지역에 대한 Hot spot 및 Cold spot을 통해 공간자기상관 정도를 나타내는 국지적인 기법이다. 두 기법을 적용하기 위하여 인접성 기반의 공간매트릭스를 산정하고 계절별 관측값과 베이지안 앙상블 강우의 Moran's I 및 LISA 분석을 실시하였다. 관측자료와 베이지안 앙상블 강우의 분석결과가 매우 유사하게 나타남으로써 베이지안 앙상블 강우의 공간적인 분포가 관측강우를 충분히 재현하고 있다고 판단된다.

  • PDF

기후변화 적응을 위한 사용자 중심의 기후서비스체계 제안 및 사용자인터페이스 플랫폼 개발 (Suggestion of User-Centered Climate Service Framework and Development of User Interface Platform for Climate Change Adaptation)

  • 조재필;정임국;조원일;이은정;강대인;이준혁
    • 한국기후변화학회지
    • /
    • 제9권1호
    • /
    • pp.1-12
    • /
    • 2018
  • There is an emphasis on the importance of adaptation against to climate change and related natural disasters. As a result, various climate information with different time-scale can be used for science-based climate change adaptation policy. From the aspects of Global Framework for Climate Services (GFCS), various time-scaled climate information in Korea is mainly produced by Korea Meteorological Administration (KMA) However, application of weather and climate information in different application sectors has been done individually in the fields of agriculture and water resources mostly based-on weather information. Furthermore, utilization of climate information including seasonal forecast and climate change projections are insufficient. Therefore, establishment of the Cooperation Center for Application of Weather and Climate Information is necessary as an institutional platform for the UIP (User Interface Platform) focusing on multi-model ensemble (MME) based climate service, seamless climate service, and climate service based on multidisciplinary approach. In addition, APCC Integrated Modeling Solution (AIMS) was developed as a technical platform for UIP focusing on user-centered downscaling of various time-scaled climate information, application of downscaled data into impact assessment modeling in various sectors, and finally producing information can be used in decision making procedures. AIMS is expected to be helpful for the increase of adaptation capacity against climate change in developing countries and Korea through the voluntary participation of producer and user groups within in the institutional and technical platform suggested.

이내비게이션을 활용한 해양환경관측 및 빅데이터 분석방안 (Methodology on e-Navigation-Assisted Ocean Monitoring and Big Data Analysis)

  • 이관홍;박재훈;하호경;김도완;이우주;김홍태;신현정
    • 한국해양학회지:바다
    • /
    • 제23권4호
    • /
    • pp.204-217
    • /
    • 2018
  • 본 연구에서는 이내비게이션 시스템이 장착된 연안 및 국제여객선을 활용하여 효율적으로 해양환경관측을 실시하고 관측된 해양 환경 빅데이터를 분석할 수 있는 방안을 제시하였다. 먼저, 이내비게이션 시스템과 운영 개념을 소개하고, 우리나라 연안의 해양환경모니터링 현황을 개괄한 후, 기존 관측망의 단점을 보완하고 장점을 강화할 수 있도록 이내비게이션을 활용한 해양환경모니터링 관측방법과 관측요소(기상, 물성, 유속 및 수심)를 제안하였다. 또한, 이내비게이션 시스템이 장착된 여객선에서 관측한 자료를 실시간으로 분석하는 시공간 혼합효과모형, 앙상블기법 및 무요소기법과 같은 해양빅데이터 분석 기법을 제안하였다. 본 연구는 연안 선박과 소형어선에 중점을 둔 한국형 이내비게이션 추진에 도움이 될 것으로 기대한다.

게임데이터를 이용한 승패예측 및 세분화된 변수 중요도 도출 기법 (Predicting win-loss using game data and deriving the importance of subdivided variables)

  • 오민지;최은선;;조완섭
    • 한국빅데이터학회지
    • /
    • 제5권2호
    • /
    • pp.231-240
    • /
    • 2020
  • 정보통신기술의 발달과 더불어 게임 산업이 성장하면서 유저의 게임데이터는 다양한 플레이 및 옵션에 따라 초 단위로 기록되며 방대한 양의 게임데이터를 빅데이터 기반으로 분석할 수 있게 되었다. 비즈니스와 결합하여 다양한 분야에서 수익창출을 위한 새로운 가치를 발견하는 것에 빅데이터를 활용하고 있지만, 게임 산업에서의 빅데이터 활용은 미흡한 실정이다. 본 연구에서는 리그오브레전드의 게임데이터를 이용하여 라인 별 승패예측모형을 구축한 뒤 세분화 된 라인의 특성을 반영한 변수 중요도를 도출하여 일반 게임유저가 승률을 올리기 위해 전적검색사이트를 이용하여 사전에 팀 구성원에 대한 정보를 제공받을 수 있도록 한다.

피부섬유모세포 전사체 정보를 활용한 구간 선택 기반 연령 예측 (Age Prediction based on the Transcriptome of Human Dermal Fibroblasts through Interval Selection)

  • 석호식
    • 전기전자학회논문지
    • /
    • 제26권3호
    • /
    • pp.494-499
    • /
    • 2022
  • 본 논문에서는 인간의 피부섬유모세포(Human dermal fibroblasts)로부터 확보한 전사체 정보를 활용하여 나이를 예측하는 방법을 소개한다. 제안 방법에서는 훈련을 통해 확보한 분류기 및 회귀 모델을 이용하여 샘플이 속한 적합한 연령 그룹을 선택한 후, 선택된 연령 그룹에 속하는 훈련 데이터의 관측값을 활용하여 구체적인 연령을 예측한다. 연령을 예측하려는 샘플이 입력되면 복수 개의 판별 규칙이 순서대로 실행되는데, 개별 판별 규칙에서는 분류기와 회귀 모델을 동시에 실행하여 해당 판별 규칙에 대한 선택조건이 만족되는지 여부를 확인한다. 선택 조건이 만족될 경우 판별 규칙의 타겟 연령 그룹에 속하는 데이터를 이용하여 훈련된 회귀 모델로 연령을 예측하며, 선택 조건이 만족되지 않으면 후속 판별 규칙을 실행한다. 공개 데이터에 대하여 실험한 결과 기존 연구에서 달성한 7.7년의 평균 예측 오차보다 우수한 5.7년이라는 평균 예측 오차를 달성함을 확인하였다.

KBDI 가뭄지수를 이용한 SSP 기후변화 시나리오하의 충청지역 백두대간 산불 잠재력 전망 (Projecting forest fire potential in the Baekdudaegan of the Chungcheong region under the SSP scenario climate change using KBDI Drought Index)

  • 최재용;김수진;정휘철;김성열;문건수
    • 한국환경복원기술학회지
    • /
    • 제25권6호
    • /
    • pp.1-11
    • /
    • 2022
  • Recently, climate change has been regarded as a major cause of large-scale forest fires worldwide, and there is concern that more frequent and severe forest fires will occur due to the level of greenhouse gas emissions. In this study, the daily Keetch and Byram Drought Index (KBDI) of the Baekdudaegan in Chungcheong region including Sobaeksan, Songnisan, and Woraksan National Parks were calculated to assess effect of climate change on the forest fire potential- severity of annual maximum KBDI and frequency of high KBDI days. The present (2000~2019) and future KBDI(2021~2040, 2041~2060, 2081~2090) were calculated based on the meteorological observation and the ensemble regional climate model of the SSP1-2.6 and SSP5-8.5 scenarios with a spatial resolution of 1-km provided by Korea Meteorological Administration(KMA). Under the SSP5-8.5 scenario, 6.5℃ increase and 14% precipitation increase are expected at the end of the 21st century. The severity of maximum daily KBDI increases by 48% (+50mm), and the frequency of high KBDI days (> 100 KBDI) increases more than 100 days, which means the high potential for serious forest fires. The analysis results showed that Songnisan National Park has the highest potential for forest fire risk and will continue to be high in intensity and frequency in the future. It is expected that the forest vulnerability of the Baekdudaegan in the Chungcheong region will greatly increase and the difficulty in preventing and suppressing forest fires will increase as the abundance of combustible materials increases along with climate changes.

Damaged cable detection with statistical analysis, clustering, and deep learning models

  • Son, Hyesook;Yoon, Chanyoung;Kim, Yejin;Jang, Yun;Tran, Linh Viet;Kim, Seung-Eock;Kim, Dong Joo;Park, Jongwoong
    • Smart Structures and Systems
    • /
    • 제29권1호
    • /
    • pp.17-28
    • /
    • 2022
  • The cable component of cable-stayed bridges is gradually impacted by weather conditions, vehicle loads, and material corrosion. The stayed cable is a critical load-carrying part that closely affects the operational stability of a cable-stayed bridge. Damaged cables might lead to the bridge collapse due to their tension capacity reduction. Thus, it is necessary to develop structural health monitoring (SHM) techniques that accurately identify damaged cables. In this work, a combinational identification method of three efficient techniques, including statistical analysis, clustering, and neural network models, is proposed to detect the damaged cable in a cable-stayed bridge. The measured dataset from the bridge was initially preprocessed to remove the outlier channels. Then, the theory and application of each technique for damage detection were introduced. In general, the statistical approach extracts the parameters representing the damage within time series, and the clustering approach identifies the outliers from the data signals as damaged members, while the deep learning approach uses the nonlinear data dependencies in SHM for the training model. The performance of these approaches in classifying the damaged cable was assessed, and the combinational identification method was obtained using the voting ensemble. Finally, the combination method was compared with an existing outlier detection algorithm, support vector machines (SVM). The results demonstrate that the proposed method is robust and provides higher accuracy for the damaged cable detection in the cable-stayed bridge.