• 제목/요약/키워드: ensemble technique

검색결과 214건 처리시간 0.033초

대체모형을 이용한 자료동화기법 개발 (Development of data assimilation technique using a surrogate model)

  • 김종호;쩐옥빈
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2020년도 학술발표회
    • /
    • pp.381-381
    • /
    • 2020
  • 자료동화(Data Assimilation) 기법은 실시간 수문학적 예측에 있어 정확도 향상을 위해 필수적인 과정이다. 가장 대중적으로 사용되는 기법들 중 하나가 모델 상태변수와 매개변수를 동시에 업데이트할 수 있는 이중 앙상블 칼만 필터(Dual Ensemble Kalman Filter)이다. 이 방법은 정확도 개선 및 적용의 용이성 때문에 많은 연구 분야에서 사용되어져 왔지만, 앙상블을 생성하는 과정에서 상당시간이 소요되는 단점이 존재한다. 본 연구에서는 상태변수와 매개변수를 동시에 업데이트 하면서 홍수 예측의 정확성을 보장할 뿐만 아니라, 앙상블 생성에 있어 계산 효율을 크게 향상시킬 수 있는 기법을 제안한다. Polynomial Chaos Expansion(PCE) 기법을 사용하여 앙상블 칼만 필터를 모방(mimic)할 수 있는 새로운 대체필터(Surrogate Filter)를 개발하는 것을 목표로 한다. 구체적으로 대체필터를 구성하기 위한 다양한 필터를 설계하였다. 첫째 시간에 대해서 PCE가 변화하지 않는 '불변 필터'(즉, 전체 예측기간에 대해 하나의 필터를 사용하여 자료동화할 수 있는 대체필터)와, 매 시간마다 PCE가 변화하는 '시변 필터'(즉, 예측하는 매 시간마다 새로운 필터를 생성해야 하는 대체필터)를 설계하여 적용성, 정확성, 예측성 등을 비교하였다. 또한, PCE의 하이퍼 매개변수를 최적화하기 위한 최적의 프레임 워크가 제안되어, 대체필터를 구축하는 데 효율을 높이고 PCE의 과적합(overfitting) 현상을 피할 수 있도록 하였다. 본 연구에서 제안된 기법은 기존 단일 및 이중 앙상블 칼만 필터(EnKF)의 결과와 비교 검증하였으며, 그 결과는 다음과 같다. (1) 대체필터의 대부분은 원래 EnKF와 비슷한 정도의 불확실성을 설명할 수 있음; (2) 모든 대체 필터는 선행시간이 짧은 경우의 예측에 있어 우수한 결과를 제공하며, 시변 필터가 불변 필터보다 더 정확한 예측 결과를 제공함; (3) 대체필터는 원래 앙상블 칼만필터보다 최대 500배 빠른 속도로 성능을 향상시킬 수 있음. 제안된 대체필터는 자료동화를 수행하는 기존필터와 비슷한 정도의 정확성, 매우 향상된 효율성을 보장함을 확인할 수 있었다.

  • PDF

기후변화에 따른 법정보호종 분포 예측을 위한 종분포모델 적용 방법 검토 - Rodgersia podophylla를 중심으로 - (A Study on the Application of Modeling to predict the Distribution of Legally Protected Species Under Climate Change - A Case Study of Rodgersia podophylla -)

  • 유영재;황진후;전성우
    • 한국환경복원기술학회지
    • /
    • 제27권3호
    • /
    • pp.29-43
    • /
    • 2024
  • Legally protected species are one of the crucial considerations in the field of natural ecology when conducting environmental impact assessments (EIAs). The occurrence of legally protected species, especially 'Endangered Wildlife' designated by Ministry of Environment, significantly influences the progression of projects subject to EIA, necessitating clear investigations and presentations of their habitats. In perspective of statistics, a minimum of 30 occurrence coordinates is required for population prediction, but most of endangered wildlife has insufficient coordinates and it posing challenges for distribution prediction through modeling. Consequently, this study aims to propose modeling methodologies applicable when coordinate data are limited, focusing on Rodgersia podophylla, representing characteristics of endangered wildlife and northern plant species. For this methodology, 30 random sampling coordinates were used as input data, assuming little survey data, and modeling was performed using individual models included in BIOMOD2. After that, the modeling results were evaluated by using discrimination capacity and the reality reflection ability. An optimal modeling technique was proposed by ensemble the remaining models except for the MaxEnt model, which was found to be less reliable in the modeling results. Alongside discussions on discrimination capacity metrics(e.g. TSS and AUC) presented in modeling results, this study provides insights and suggestions for improvement, but it has limitations that it is difficult to use universally because it is not a study conducted on various species. By supporting survey site selection in EIA processes, this research is anticipated to contribute to minimizing situations where protected species are overlooked in survey results.

설명가능 AI 기반의 변수선정을 이용한 기업부실예측모형 (Corporate Bankruptcy Prediction Model using Explainable AI-based Feature Selection)

  • 문건두;김경재
    • 지능정보연구
    • /
    • 제29권2호
    • /
    • pp.241-265
    • /
    • 2023
  • 기업의 부실 예측 모델은 기업의 재무 상태를 객관적으로 모니터링하는 데 필수적인 도구 역할을 한다. 적시에 경고하고 대응 조치를 용이하게 하며 파산 위험을 완화하고 성과를 개선하기 위한 효과적인 관리 전략을 수립할 수 있도록 지원한다. 투자자와 금융 기관은 금융 손실을 최소화하기 위해 부실 예측 모델을 이용한다. 기업 부실 예측을 위한 인공지능(AI) 기술 활용에 대한 관심이 높아지면서 이 분야에 대한 광범위한 연구가 진행되고 있다. 해석 가능성과 신뢰성이 강조되며 기업 부실 예측에서 설명 가능한 AI 모델에 대한 수요가 증가하고 있다. 널리 채택된 SHAP(SHapley Additive exPlanations) 기법은 유망한 성능을 보여주었으나 변수 수에 따른 계산 비용, 처리 시간, 확장성 문제 등의 한계가 있다. 이 연구는 전체 데이터 세트를 사용하는 대신 부트스트랩 된 데이터 하위 집합에서 SHAP 값을 평균화하여 변수 수를 줄이는 새로운 변수 선택 접근법을 소개한다. 이 기술은 뛰어난 예측 성능을 유지하면서 계산 효율을 향상시키는 것을 목표로 한다. 해석 가능성이 높은 선택된 변수를 사용하여 랜덤 포레스트, XGBoost 및 C5.0 모델을 훈련하여 분류 결과를 얻고자 한다. 분류 결과는 고성능 모델 설계를 목표로 soft voting을 통해 생성된 앙상블 모델의 분류 정확성과 비교한다. 이 연구는 1,698개 한국 경공업 기업의 데이터를 활용하고 부트스트래핑을 사용하여 고유한 데이터 그룹을 생성한다. 로지스틱 회귀 분석은 각 데이터 그룹의 SHAP 값을 계산하는 데 사용되며, SHAP 값 평균은 최종 SHAP 값을 도출하기 위해 계산된다. 제안된 모델은 해석 가능성을 향상시키고 우수한 예측 성능을 달성하는 것을 목표로 한다.

나선형 형상의 초고층건물의 공력감쇠의 특성 (Characteristics of Aerodynamic Damping on Helical-Shaped Super Tall Building)

  • 김원술;이진학;타무라 유키오
    • 대한토목학회논문집
    • /
    • 제37권1호
    • /
    • pp.9-17
    • /
    • 2017
  • 본 연구에서는 변위 및 가속도 응답의 저감 효과에 있어서, 유리한 형상인 $180^{\circ}$ 나선형(Helical $180^{\circ}$) 초고층건물을 대상으로 공력진동실험 수행하여 나선형 초고층건물의 공력감쇠율의 특성을 조사하였다. 공력감쇠율은 RD법(Random decrement technique)을 이용하여 평가하였다. 또한 RD법에서 부분 샘플의 개수와 초기 조건 값의 변화가 공력감쇠율에 어떤 영향을 미치는지 조사하였다. 실험 결과, 최소 2000개 이상의 부분 샘플을 이용하여 앙상블 평균을 적용하면 공력감쇠율의 불규칙한 변동의 폭을 줄일 수 있음을 검증했고, 기존 연구들과도 잘 부합되는 것을 알 수 있었다. 정방형 모형과 $180^{\circ}$ 나선형 모형의 공력감쇠율의 결과를 살펴보면, 풍방향 공력감쇠율은 건물의 형상이 다름에도 불구하고 무차원 풍속에 따른 공력감쇠율은 매우 유사한 경향을 보였다. 한편, 정방형 모형에 대한 풍직각방향의 공력감쇠율은 $180^{\circ}$ 나선형모형의 공력감쇠율의 특성과는 다른 양상을 보이는 것을 알 수 있었다. 특히 풍향 변화에 따른 $180^{\circ}$ 나선형 모형의 Y방향에 대한 공력감쇠율은 풍향의 변화와 상관없이, 전반적으로 0에 가까운 값을 갖는 경향이 나타났고, 무차원 풍속의 증가와 함께 변동의 폭은 작지만 점진적으로 증가하는 경향을 보였다. 초기 조건 값의 변화에 따른 공력감쇠율을 평가한 결과, 초기 조건 값을 "응답의 표준편차" 또는 RD 함수에 대한 최적화 "${\sqrt{2}}{\times}$응답의 표준 편차"를 적용하여 평가한 공력감쇠율은 매우 유사한 결과 값과 분포를 보이는 것으로 나타났다.

후정해변 고파랑 조건하에서 파랑유속 방향전환점에서 발생하는 난류성분의 측정 (Measurement of Turbulence Properties at the Time of Flow Reversal Under High Wave Conditions in Hujeong Beach)

  • 장연식;도종대;김선신;안경모;진재율
    • 한국해안·해양공학회논문집
    • /
    • 제29권4호
    • /
    • pp.206-216
    • /
    • 2017
  • 교란운동에너지(TKE)와 레이놀즈 응력의 수직성분($-{\bar{u^{\prime}w^{\prime}}}$)에 대한 한 주기 파장 안에서의 시간변화를 관측자료를 사용하여 분석하였다. 관측자료는 동해에서 온대성저기압이 발달하였던 2017년 1월 14일부터 18일까지 동해안 후정해변에서 측정한 파랑자료를 사용하였다. 이 기간 동안 관측된 모든 파랑자료들 중에서 비슷한 형태를 갖는 수백 개의 규칙파들을 구분하였으며 이 자료를 토대로 Ensemble Average 기법을 사용하여 이 기간 파랑특성을 대표하는 세 개의 평균파를 계산하였다. 그리고 이 평균파를 기준으로 각 파의 요동을 측정하여 한 주기 동안의 교란운동에너지와 레이놀즈 응력을 계산하였다. 이렇게 계산된 자료들을 분석한 결과 교란운동에너지는 파랑의 평균유속과 비슷한 분포를 나타내었으나(즉 유속이 최대값을 나타낼 때 교란운동에너지도 최대값을 나타내었다), $-{\bar{u^{\prime}w^{\prime}}}$는 파랑의 수평유속 방향이 전환되는 '방향전환점'에서 가파르게 증가하는 경향을 나타내었다. 이러한 $-{\bar{u^{\prime}w^{\prime}}}$의 독특한 분포는 Nielsen(1992)에 의해 제안된 난류 convection 현상을 뒷받침하는 발견으로 퇴적물과 같은 물질들의 부유현상이 파랑의 '방향전환점(한 주기 안에서 파랑의 횡단방향 유속 부호가 바뀌는 시점)'에서 촉진될 수 있음을 보여준다. 이렇게 관측된 난류에너지 분포 특성을 CADMAS-SURF 모델을 사용하여 구현해 보았다. 그 결과 교란운동에너지의 경우 모델결과와 관측치 사이에 유사성이 발견되었으나 레이놀즈 응력($-{\bar{u^{\prime}w^{\prime}}}$)의 경우 모델이 '방향전환점'에서의 증가현상을 구현해 내지 못하였다. 이는 CADMAS-SURF와 같은 Reynolds-Averaged Navier-Stokes(RANS) 모델들이 가지는 한계점으로 RANS 모델의 경우 레이놀즈 응력과 같은 난류에너지가 평균유속의 분포에 강한 영향을 받기 때문인 것으로 판명되었다.

진동하는 NACA 0012 에어포일의 근접후류 측정 (Near-wake Measurements of an Oscillating NACA 0012 Airfoil)

  • 김동하;김학봉;장조원
    • 한국항공우주학회지
    • /
    • 제34권12호
    • /
    • pp.1-8
    • /
    • 2006
  • 진동하는 에어포일의 후류에 미치는 레이놀즈수의 영향을 조사하기 위한 실험적 연구를 수행하였다. NACA 0012 에어포일은 1/4 시위를 기준으로 피칭운동을 하고, $\pm$6$^{\circ}$ 내에서 진동하도록 설정하였다. 진동하는 에어포일에서 후류를 측정하기 위하여 2축 열선풍속계가 사용되었고 연선 가시화 기법이 경계층을 관찰하기 위하여 사용되었다. 실험조건에서 자유흐름속도는 1.98, 2.83 그리고 4.03 m/s이며, 이를 근거로 한 레이놀즈수는 각각 $2.3{\times}10^4$, 3.3${\times}10^4$, 4.8${\times}10^4$이다. 모든 경우에 에어포일 진동수는 무차원 진동수 K=0.1에 맞게 조절되었다. 실험 결과, 피칭하는 에어포일의 경계층 및 후류 유동 특성은 레이놀즈수 2.3$\times$104, 3.3$\times$104 사이에서 크게 다르게 나타나며, 레이놀즈수 3.3${\times}10^4$와 4.8${\times}10^4$에서 유사하게 나타난다. 이것은 레이놀즈수 2.3$\times$104에서 비정상 분리가 크게 지연되기 때문이다.

강우 및 강우-유출 모형의 불확실성을 고려한 홍수빈도곡선 유도 (Derivation of Flood Frequency Curve with Uncertainty of Rainfall and Rainfall-Runoff Model)

  • 권현한;김장경;박세훈
    • 한국수자원학회논문집
    • /
    • 제46권1호
    • /
    • pp.59-71
    • /
    • 2013
  • 신뢰성 있는 홍수빈도해석을 수행하기 위해서는 충분한 홍수량 및 강우자료가 필요하다. 강우자료의 경우 우리나라 대부분 지역에서 30년 이상의 극치자료가 활용이 가능한 반면 홍수량 자료는 상대적으로 충분한 자료가 확보되지 않아 신뢰성 있는 빈도해석이 어려운 실정이다. 이에 따라 강우모의 기법에 근거한 홍수빈도곡선 유도방안연구가 몇몇 연구에서 제안된 바 있으나, 기본적으로 입력된 강우의 빈도와 홍수의 빈도가 동일하다고 가정함으로 인하여 발생하는 불확실성이 상당부분 내포되어 있다. 이러한 점에서 본 연구의 목적은 강우모의기법과 불확실성 분석이 고려된 홍수빈도곡선 유도방법을 개발하는 것으로 홍수빈도곡선을 유도하는데 있어서의 핵심은 미래에 발생 가능한 극치강수량을 효과적으로 재현할 수 있는 강수량 모의발생 기법과 강우-유출관계의 불확실성 분석에 있다. 본 연구에서는 극치강수량 모의를 위해 불연속 Kernel Pareto 분포를이용한 다지점 강수모의기법과 Bayesian HEC-1 (BHEC-1) 모형을 연계하여 본연구의 대상유역인 대청댐 유역의 강우-유출 관계의 불확실성을 고려한 홍수빈도곡선을 개발하고 모형의 적합성을 평가하였다. 최종적으로 기존 홍수빈도결정방법과 비교를 통해서 모형의 적합성을 확인하였다.

산물벼 함수율 측정을 위한 $2{\times}2$ 마이크로스트립 패치 안테나 개발 (A $2{\times}2$ Microstrip Patch Antenna Array for Moisture Content Measurement of Paddy Rice)

  • 김기복;김종헌;노상하
    • Journal of Biosystems Engineering
    • /
    • 제25권2호
    • /
    • pp.97-106
    • /
    • 2000
  • To develop the grain moisture meter using microwave free space transmission technique, a 10.5GHz microwave signal with the power of 11mW generated by an oscillar with a dielectric resonator is transmitted to an isolator and radiated from a transmitting $2{\times}2$ microstrip patch array antenna into the sample holder filled with the 12 to 26%w.b. of Korean Hwawung paddy rice. the microwave signal, attenuated through the grain with moisture, is collected by a receiving $2{\times}2$ microstrip patch array antenna and detected using a Shottky diode with excellent high frequency characteristic. A pair of light and simple microstrip patch array antenna for measurement of grain moisture content is designed and implemented on atenflon substrate with trleative dielectric constant of 2.6 and thickness of 0.54 by using Ensemble ver. 4.02 software. The aperture of microstrip patch arrays is 41 mm width and 24mm high. The characteristics of microstrip patch antenna such as grain. return loss, and bandwidth are 11.35dBi, -38dB and 0.35GHz($50^{\circ}$ at far-field pattern of E and H plane. The width of the sample holder is large enough to cover the signal between the antennas temperature and bulk density respectively. The calibration model for measurement of grain moisture content is proposed to reduce the effects of fluectuations in bulk density and temperature which give serious errors for the measurements . From the results of regression analysis using the statistically analysis method, the moisture content of grain samples (MC(%)) is expressed in terms of the output voltage(v), temperature (t), and bulk density of samples(${\rho}b$)as follows ;$$MC(%)\;=\;(-3.9838{\times}10^{-8}{\times}v^{3}+8.023{\times}10^{-6}{\times}v^{2}-0.0011{\times}v-0.0004{\times}t+0.1706){\frac{1}{{\rho}b}}{\times}100$ Its determination coefficient, standard error of prediction(SEP) and bias were found to be 0.9855, 0.479%w.b. and -0.0.369 %w.b. respectively between measured and predicted moisture contents of the grain samples.

  • PDF

OpenMP를 이용한 제내지 침수 병렬해석 (Flood Inundation Analysis Using OpenMP Technique)

  • 박재홍
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2016년도 학술발표회
    • /
    • pp.74-74
    • /
    • 2016
  • 복잡한 지형에서 컴퓨터를 이용한 물리적 기반 수치모의는 합리적인 시간내에 연산을 완료하기 위해 대개 큰 연산장비 들을 요구한다. 더욱이 모의되는 현상이 시간단계마다 갱신되어지는 동역학적 현상에 기반된 비정상상태일 때 연산성능은 고려되어지는 가장 중요한 주제가 될 수 있다. 연산 시간을 줄이기 위한 가장 널리 이용되는 전략중의 하나는 적절한 수의 프로세서를 이용하는 병렬 기법이다. 최근 들어 연산속도를 가속화하기 위해 다수의 코어를 이용한 OpenMP 와 MPI 기법들이 병렬해석기법으로 대두되었고 그래픽 연산장치를 이용한 병렬처리 해석기법도 소개되고 있다. 본 연구에서는 중앙연산장치를 이용한 병렬 해석기법을 이용하여 제내지 침수해석의 적용성을 검토하고 그 결과을 비교하였다. 본 연구를 위해 OpenMP 병렬기법을 이용하여 확산파 침수해석 프로그램의 원시코드를 재작성하여 가상 및 실제 유역에 적용하였다. 해석결과는 분산메모리 병렬해석 기법인 MPI를 도입한 모형의 결과와 비교되었다. OpenMP를 도입한 모형과 MPI를 도입한 경우 유량 및 수심의 경우 오차 허용 한계내에 수렴되어 만족되었으나 그러나 연산 속도의 경우 두 기법간의 자료의 저장 방법 차이로 인해 차이를 나타내었다. 가상 유역에 적용된 결과로 검토된 각 기법의 증속(speedup) 효과는 MPI의 경우 4 코어를 이용하였을 때 최고 2.62 배 정도에 도달하는 것으로 나타났다. OpenMP 를 적용한 경우 2.87 배 정도로 나타나 OpenMP 를 이용하였을 때 증속효과가 조금 더 뛰어났다. 이는 두 기법의 메모리 저장방식의 차이로 인해 자료의 전송량과 전송 시간이 적은 OpenMP 를 도입한 모형에서 MPI 모형 보다 상대적으로 뛰어난 결과를 나타내었다. 실제 유역의 적용을 위해 상대적으로 우수한 증속결과를 나타낸 OpenMP를 도입한 모형을 Malpasset 댐 붕괴 유역에 적용하였다. 적용된 요소의 수는 각각 45254, 11352 개로 비교적 많은 요소를 가진 하류지역에 적용하여 병렬효과를 극대화하고자 하였다. 적용결과 두 경우 모두 병렬 해석 기법을 도입한 모형에서 유속과 침수심 등은 순차적 모형과 동일한 값을 나타내었으나 증속효과로 인한 연산시간은 순차적 모형에서 8.57 배로 나타나 병렬 모형의 상대적으로 빠른 연산속도를 판단할 있었다. 위의 적용결과를 통해 계산 요소들이 많은 2 차원 해석의 경우 기존의 단일 코어를 이용한 순차적 해석은 장시간에 걸치 연산시간으로 인해 작업효율이 낮아지는 결과를 발생시킬 수 있으며 병렬 해석을 도입할 경우 주어진 컴퓨터 자원를 효율적으로 이용가능하여 합리적인 연산시간으로 연산결과를 얻는 것이 가능하여 반복적 통계 기법/Ensemble 해석 등을 이용한 종합적 해석이 좀 더 실용적으로 이루어 질 수 있을 것이라고 판단되었다.

  • PDF

Use of the Quantitatively Transformed Field Soil Structure Description of the US National Pedon Characterization Database to Improve Soil Pedotransfer Function

  • Yoon, Sung-Won;Gimenez, Daniel;Nemes, Attila;Chun, Hyen-Chung;Zhang, Yong-Seon;Sonn, Yeon-Kyu;Kang, Seong-Soo;Kim, Myung-Sook;Kim, Yoo-Hak;Ha, Sang-Keun
    • 한국토양비료학회지
    • /
    • 제44권5호
    • /
    • pp.944-958
    • /
    • 2011
  • Soil hydraulic properties such as hydraulic conductivity or water retention which are costly to measure can be indirectly generated by soil pedotransfer function (PTF) using easily obtainable soil data. The field soil structure description which is routinely recorded could also be used in PTF as an input to reduce the uncertainty. The purposes of this study were to use qualitative morphological soil structure descriptions and soil structural index into PTF and to evaluate their contribution in the prediction of soil hydraulic properties. We transformed categorical morphological descriptions of soil structure into quantitative values using categorical principal component analysis (CATPCA). This approach was tested with a large data set from the US National Pedon Characterization database with the aid of a categorical regression tree analysis. Six different PTFs were used to predict the saturated hydraulic conductivity and those results were averaged to quantify the uncertainty. Quantified morphological description was successively used in multiple linear regression approach to predict the averaged ensemble saturated conductivity. The selected stepwise regression model with only the transformed morphological variables and structural index as predictors predicted the $K_{sat}$ with $r^2$ = 0.48 (p = 0.018), indicating the feasibility of CATPCA approach. In a regression tree analysis, soil structure index and soil texture turned out to be important factors in the prediction of the hydraulic properties. Among structural descriptions size class turned out to be an important grouping parameter in the regression tree. Bulk density, clay content, W33 and structural index explained clusters selected by a two step clustering technique, implying the morphologically described soil structural features are closely related to soil physical as well as hydraulic properties. Although this study provided relatively new method which related soil structure description to soil structure index, the same approach should be tested using a datasets containing the actual measurement of hydraulic properties. More insight on the predictive power of soil structure index to estimate hydraulic properties would be achieved by considering measured the saturated hydraulic conductivity and the soil water retention.