DOI QR코드

DOI QR Code

입도분석에 기반한 Deep Neural Network를 이용한 최대 건조 단위중량 예측 모델 평가

Evaluation of Maximum Dry Unit Weight Prediction Model Using Deep Neural Network Based on Particle Size Analysis

  • Kim, Myeong Hwan (Department of Agricultural and Rural Engineering, Chungbuk National University)
  • 투고 : 2023.01.26
  • 심사 : 2023.03.17
  • 발행 : 2023.05.31

초록

The compaction properties of the soil change depending on the physical properties, and are also affected by crushing of the particles. Since the particle size distribution of soil affects the engineering properties of the soil, it is necessary to analyze the material properties to understand the compaction characteristics. In this study, the size of each sieve was classified into four in the particle size analysis as a material property, and the compaction characteristics were evaluated by multiple regression and maximum dry unit weight. As a result of maximum dry unit weight prediction, multiple regression analysis showed R2 of 0.70 or more, and DNN analysis showed R2 of 0.80 or more. The reliability of the prediction result analyzed by DNN was evaluated higher than that of multiple regression, and the analysis result of DNN-T showed improved prediction results by 1.87% than DNN. The prediction of maximum dry unit weight using particle size distribution seems to be applied to evaluate the compacting state by identifying the material characteristics of roads and embankments. In addition, the particle size distribution can be used as a parameter for predicting maximum dry unit weight, and it is expected to be of great help in terms of time and cost of applying it to the compaction state evaluation.

키워드

Ⅰ. 서론

최적함수비와 최대건조단위중량 (Maximum dry unit weight, MDD)은 흙 댐, 도로 제방, 되메우기와 같은 토목공사에서 중요한 매개변수이다. 성토 다짐에 대한 품질관리는 위에서 언급한 매개변수인 최적함수비와 MDD를 확인하여 관리한다 (Bera and Ghosh, 2011). 흙에 대한 다짐 특성은 점토질, 모래질, 자갈질의 물리적 특성에 따라 변화한다 (Park and Kim, 2017). 다짐특성은 다짐 시 입자 파쇄에 의한 영향과 (Noh et al., 2006), 입도분포 등 토질의 공학적 성질에도 영향을 받는다 (Kim et al., 1995). 노후화된 저수지 제체에서도 다짐불량으로 수위변동에 의한 함몰이나 싱크홀 등이 발생할 수 있다 (Lee et al., 2015). 따라서, 재해 위험성에 대한 위험도를 평가하기 위해서는 재료의 특성에 대한 명확한 분석이 필요하다 (Kim et al., 2017). 불량한 재료의 입도를 조정하여 흙의 성질을 개량하는 것은 MDD를 증가시키고 최적함수비를 감소시켜 다짐효과를 가장 많이 개선할 수 있으므로 재료의 특성에 대한 파악이 무엇보다 중요하다 (Baek et al., 2007). 이러한 다짐에 대한 다양한 연구들 중에서 Jonson and Sallberg (1960)는 다양한 토양의 다짐에 사용되는 방법에 대한 일반적인 기본사항을 연구하여 표준화된 다짐 곡선을 제시 하였으며, Ring III et al. (1962)은 MDD와 최적함수비에 대한 상관관계를 연구하였다. 이외에도 액성한계에 의한 다짐특성 예측 (Pandian et al., 1997), 다짐에너지를 고려한 다짐특성 연구 (Gurtug and Sridharan, 2004), 자갈질 함유량 기준에 대한 연구 (Chinkulkijniwat et al., 2010) 등이 있다. 또한, 벤토나이트의 최적 구성비와 다짐기준을 비교·분석 (Park, 2010), 동절기 기온의 영향이 다짐에 미치는 영향에 대한 연구 (Lee et al., 2015) 등을 수행하였다. 입상재료의 MDD를 정확하게 모사하고 평가하기 위한 DEM을 이용한 수치해석적 연구에서 단일입도로 구성되어 마찰계수가 큰 경우에는 MDD 모사의 신뢰성을 높일 수 있는 근거 제시가 필요하다고 하였다 (Yun, 2018). 지반의 거동특성을 D50에 해당하는 유효입경만으로 분석하는 경우에는 입자의 분포를 고려할 수 없다는 문제점이 있다 (Park et al., 2016). 다짐에서 얻은 MDD와 최적 함수비는 흙의 종류, 입자의 모양과 크기 분포에 따라 크게 달라질 수 있기 때문이다 (Jonson and Sallberg, 1960). 또한, 입자의 크기 분포는 다짐 거동에 큰 영향을 미치며 재료의 다짐 특성과 상관관계가 존재할 수 있다 (Chen et al., 2018). 실제 공학적인 작업을 준비하기 위해서는 입자 크기의 범위와 다양한 입자의 비율을 결정해야 한다. 입상 재료의 크기 범위는 일반적으로 0.001 mm에서 1,000 mm 사이에서 광범위하게 구성되는 것으로 알려져 있다 (Ma et al., 2014). 따라서, 입자의 조성에 대한 분포는 흙의 물리적 및 역학적 특성을 연구하는 데 중요한 지표가 된다 (Lumay and Vandewalle, 2004). 흙의 입자 크기 범위와 토양 구조 간의 관계는 통계적인 방법이 과학적이고 정확한 도구라고 생각하였다 (Perfect and Kay, 2004). 하지만, 다수의 많은 연구에도 물리적인 특성을 기반으로 하는 연구는 다소 부족하며, 현장에서 사용할 수 있는 정량적 특성에 대한 자료도 부족한 상황이다. 또한, 도로와 제방 등의 현장은 실내 및 현장 다짐시험을 수행하면서 필요 이상의 경비와 시간이 소요되고 있다 (Park and Kim, 2017).

따라서, 본 연구에서는 흙의 재료적 특성인 입도분석 결과를 이용한 MDD의 예측 가능성을 파악하고자 하였다. 이를 위해서 흙의 종류별 입도분석결과에서 대표적인 체의 크기를 4개 선정하여 다중회귀분석 (Multiple regression, MR), 심층 신경망 (Deep neural network, DNN)을 이용하여 MDD를 예측·비교하였다. MR과 DNN으로 분석된 결과는 Nash-Sutcliffe efficiency (NSE), mean absolute percent error (MAPE), root mean square error (RMSE), R squared (R2)를 이용하여 최적의 모델을 평가하였다.

Ⅱ. 재료 및 방법

1. 재료 및 특성

본 연구에서 분석에 사용된 흙은 서울 (5개), 경기 (29개), 충북 (15개), 충남 (6개), 전남 (4개), 경남 (15개), 강원 (5개) 지역에서 채취된 흙을 대상으로 하였다. 흙은 모래, 자갈, 점토질로 구분하여 할 수 있으며 물리적 특성과 MDD를 부록에 정리하였다. 각 흙에 대해서는 모래질 흙의 비율이 가장 많았으며, 점토질과 자갈질의 경우 데이터의 수가 충분하지 않기 때문에 데이터 축적이 추가적으로 필요할 것으로 판단된다. 지역별로 수집된 자갈질, 모래질, 점토질 비율에 따른 D 다짐시험 결과의 범위를 Table 1에 정리하였다.

Table 1 Range of physical characteristics on soil of gravelly, sandy, and clayey

NGHHCI_2023_v65n3_15_t0001.png 이미지

Wn: Natural water content; Gs: Specific gravity; LL: Liquid limit; PI: Plasticity index; USCS: Unified soil classification system

본 연구에서는 D 다짐 시험결과의 MDD를 예측하고 오차를 평가하기 위하여 매개변수로 사용된 표준체의 크기가 4.75 mm (#4), 2.0 mm (#10), 0.425 mm (#40), 0.075 mm (#200)의 통과중량백분율에 의한 영향을 받는 것으로 가정하였다. 매개변수로 사용된 표준체의 크기에서 #4는 모래와 자갈의 구분하는 기준이 되고, #10은 비중시험에 사용되는 기준이 되고, #40은 흙의 컨시스턴시를 구분하는 시험의 기준이 되고, #200은 조립토와 세립토를 구분하는 기준이 되고 있어 이번 연구에서 대표적인 표준체로 선정하였다.

2. 연구방법

가. 모델의 평가

본 DNN 모델의 성능을 평가하기 위해서 NSE, MAPE, RMSE, R2를 사용하였다.

NSE는 모델의 성능을 해석 가능한 척도로 정규화하는 것이며, 식 (1)과 같다. NSE가 1이면 모델의 결과가 측정값과 완벽하게 일치함을 의미한다.

\(\begin{aligned}\mathrm{NSE}=1-\frac{\sum_{\mathrm{i}=1}^{\mathrm{n}}\left(\mathrm{y}_{\mathrm{i}}-\mathrm{y}_{\mathrm{i}}^{\prime}\right)^{2}}{\sum_{\mathrm{i}=1}^{\mathrm{n}}\left(\mathrm{y}_{\mathrm{i}}-\overline{\mathrm{y}}\right)^{2}}\end{aligned}\)       (1)

MAPE는 식 (2)와 같이 계산되며, 퍼센트로 표현된다. MAPE의 핵심은 오류의 크기를 RMSE와 같이 정량화하지 않고 비율로 나타내는 것이다. MAPE는 0∼100 퍼센트의 범위로 표현되기 때문에 결과 해석이 용이하다는 특징이 있다. MAPE는 0에 가까울수록 모델의 성능이 우수하다는 것을 의미한다.

\(\begin{aligned}\operatorname{MAPE}=\frac{100}{\mathrm{n}} \sum_{\mathrm{i}=1}^{\mathrm{n}}\left|\frac{\mathrm{yi}-\mathrm{y}_{\mathrm{i}}^{\prime}}{\mathrm{yi}}\right|\end{aligned}\)       (2)

RMSE는 MSE에 root를 씌움으로써 큰 차이의 오차에 덜 민감한 특징이 있으며, 실제값의 크기에 의존적이기에 크기 의존적 에러가 발생할 수 있다. RMSE를 통해 정량적으로 모델의 추정값이 실측값에 가까운지를 식 (3)으로 확인할 수 있다. 범위는 해당 데이터의 범위 내에서 0부터 무한대로 나타난다. RMSE 자체에 대한 평가 기준은 명확하지 않으나, 0으로 가까울수록 모델의 결과가 실측값에 일치함을 의미한다.

\(\begin{aligned}\operatorname{RMSE}=\sqrt{\frac{1}{\mathrm{n}} \sum_{\mathrm{i}=1}^{\mathrm{n}}\left(\mathrm{y}_{\mathrm{i}}-\mathrm{y}_{\mathrm{i}}^{\prime}\right)^{2}}\end{aligned}\)       (3)

R2은 0부터 1까지의 범위이며, 1에 가까울수록 좋은 예측성능을 보임을 의미한다. 실측값과 예측값 사이의 선형성을 검토하는 것으로 식 (4)와 같이 산정할 수 있다.

\(\begin{aligned}\mathrm{R}^{2}=1-\frac{\sum_{\mathrm{i}}^{\mathrm{n}}\left(\mathrm{y}_{\mathrm{i}}-\overline{\mathrm{y}_{\mathrm{i}}}\right)^{2}}{\sum_{\mathrm{i}}^{\mathrm{n}}\left(\mathrm{y}_{\mathrm{i}}-\overline{\mathrm{y}}\right)^{2}}\end{aligned}\)       (4)

여기서, yi및 y'i는 실측값과 예측값을, \(\begin{aligned}\bar {y}\end{aligned}\)\(\begin{aligned}\bar {y}_i\end{aligned}\)는 실측값 및 예측값의 평균을 의미한다.

나. 다중회귀분석 모델

전통적인 선형시계열 모델의 통계적 기법들은 현실의 문제들에 적용하는 부분에서 한계가 있다 (Park et al., 2013). MR은 2개 이상의 독립변수와 종속변수 사이의 관계를 파악하는 도구이며 (Bengio et al., 2013), 여러 설명변수들이 반응변수에 미치는 영향을 모형화함으로써 반응변수의 예측과 변수들의 영향력을 분석하는 데 매우 유용한 방법이기 때문에 매우 다양한 분야에서 활용되고 있다 (Cho et al., 2020; Baek and Chung, 2020; Kim et al., 2019). 본 연구에서는 IBM SPSS Statistics 20을 사용하였으며, 일반적인 MR 모델의 수식은 식 (5)와 같이 나타낼 수 있다.

Yt = β1 x β2xt2 + β3xt3 + …βKxtK + 𝜖t       (5)

여기서, 모수의 숫자는 K (즉 β1 … βK), 모수 β1은 절편 (상수)항, β1에 대응되는 변수는 xt1 = 1다.

다. 인공 신경망 모델

인공 신경망 (ANN)은 생물학적 신경망을 정보 처리 시스템으로 모방하여 수학적 모델로 개발되었다 (Elgibaly and Elkamel, 1998; Groupe, 2007). ANN은 인간의 뇌와 신경계의 활동 및 능력을 모방하는 가장 강력한 기술이다 (Sezer 2009; Park, 2011). ANN의 정보처리는 개별 뉴런의 프로세서에서 수행된다. 입력값이 뉴런으로 구현되면 각각의 연결과 관련된 가중치가 곱해진다. 이후 다음 뉴런으로 편향되어 가중 입력의 합에 추가된다. 각 뉴런은 선형 또는 비선형 전달함수를 적용하여 출력값을 생성하게 된다 (Park, 2011). 이러한 알고리즘을 적용하여 많은 분야에서 문제를 해결하기 위해 널리 사용되었다. 예를 들어, 최근 기후변화에 대비하기 위한 농업생산기반 구조물들의 위험성 평가 방안 (Yu et al., 2022)과 농업용 저수지의 투수계수 평가를 위한 적용 (Kim et al., 2022) 사례가 대표적이며, 이러한 사례들은 기존에 적용해 왔던 퍼지논리 모델 등보다 높은 신뢰성과 적용성을 보이기 때문이다.

선형 및 비선형 패턴 모두에서 DNN은 일반적으로 출력과 입력 사이의 은닉층을 결정하기 위해 사용된다. 본 연구에서는 79개의 데이터 세트 중 임의로 수집한 20개의 데이터 세트를 테스트 단계에 사용하고 59개의 데이터 세트를 훈련 단계에 사용하였다. 파라미터는 #4, #10, #40, #200이 모델에 입력 변수로 사용되었고 MDD는 출력 변수로 사용되었다.

MDD 예측을 위한 DNN 모델의 구조는 Table 2 및 Fig. 1과 같다. 훈련 데이터는 입력층에서 가중치의 변화를 tanh 함수로 처리하며, 최적화 함수는 adam을 이용하여 출력값을 예측하도록 하였다.

Table 2 Data Set for DNN model in this study

NGHHCI_2023_v65n3_15_t0002.png 이미지

NGHHCI_2023_v65n3_15_f0001.png 이미지

Fig. 1 Structure of the DNN model for prediction the MDD

모델의 훈련평가는 손실함수 (Loss function)를 평균제곱오차 (Mean squared error, MSE)로 하였고, 모델학습 중의 모델 검증 (validation)은 평균절대오차 (mean absolute error, MAE)를 사용하였다.

DNN 모델의 구조에서 신경망 구조의 중간단계에 “Thinking layer”라는 신경망 (DNN-T)을 생성하여 훈련한 데이터를 예측하는 모델을 개발하였다. DNN-T 모델의 구조는 신경망 구조의 감각 뉴런과 운동 뉴런의 신호전달체계에서 신호를 분석하고, 통합하여 적절한 반응에 대한 명령을 형성, 전달해 주는 운동 뉴런의 기능과 구조를 모방하여 DNN 구조를 변형한 것이다.

뇌신경은 시냅스의 신호와 중간뉴런에 의한 정보를 함께 받아 신호를 처리하고, 피드백 억제를 통한 안정화를 시키는 것으로 알려져 있다 (Keijser and Sprekeler, 2022). 이러한 중간 뉴런의 유형에 따라 예측 오작동을 개선하는데 기여하고 있다는 보고도 있다 (Hertäg and Sprekeler, 2020). DNN-T의 모델을 Fig. 2와 같이 구축하였다. MDD 예측을 위한 DNN-T 모델의 구조는 Table 3과 같이 요약할 수 있다. 입력 데이터는 “Thinking payer” 층에서 개별적으로 훈련되어지면서 가중치값으로 안정화를 선행하고, flattern layer와 은닉층에서 tanh 함수로 훈련된 결과를 sigmoid 함수로 배치 정규화하고 최종 MDD를 예측하도록 하였다.

NGHHCI_2023_v65n3_15_f0002.png 이미지

Fig. 2 Structure of the DNN-T model for prediction of MDD

Table 3 Data Set for DNN-T model in this study

NGHHCI_2023_v65n3_15_t0003.png 이미지

Ⅲ. 결과 및 고찰

1. 다짐시험 결과

D 다짐방법에 따른 MDD의 변화는 Fig. 3과 같으며, 결과의 범위를 Table 4에 정리하였다. D 다짐은 KS F 2312 기준에 의해 시료는 건조법으로 다짐은 반복법으로 실시하였다. 이때 사용한 래머는 4.5 kg이며, 몰드는 직경 15 cm로 허용 최대입자의 지름이 37.5 mm가 넘지 않도록 하였다. D 다짐의 MDD는 점토질이 17.18 kN/m3, 모래질이 18.65 kN/m3, 자갈질이 19.76 kN/m3으로 점토질 흙을 기준으로 모래질은 7.9%, 자갈질은 13.1% 증가하는 것으로 분석되었다.

NGHHCI_2023_v65n3_15_f0003.png 이미지

Fig. 3 MDD distribution range on analysis clayey sandy, gravelly soil

Table 4 Range of D compaction results on clayey sandy, gravelly soil

NGHHCI_2023_v65n3_15_f0004.png 이미지

매개변수로 선정된 #4, #10, #40, #200과 MDD의 상관관계에 대한 회귀분석 결과를 Fig. 4와 같이 나타났다. 수집된 데이터 전체와 MDD의 상관관계는 매개별수별로 R2은 0.48∼0.59로 나타났다. 토질별로 분류된 데이터와 MDD의 상관관계에 대한 회귀분석에서는 자갈질의 경우 R2이 0.20∼0.35, 모래질의 경우 R2이 0.09∼0.29, 점토질의 경우 R2이 0.14∼0.66의 범위를 보였다. 토질별로 분석된 결과는 자갈질과 모래질에서 약한 상관관계를 보였지만, 점토질에서는 #40과 #200에서 R2이 0.61 이상으로 보통의 상관관계를 보였다. 점토질은 세립분의 비율이 높아 입경이 클수록 통과량이 거의 없으며, #40과 #200의 범위에서 분포하고 있기 때문에 자갈질과 모래질보다 높은 상관관계를 보이는 것으로 사료된다.

NGHHCI_2023_v65n3_15_t0004.png 이미지

Fig. 4 Correlation of MDD Vs. #4, #10, #40, #200 by soil type

2. MR 분석 결과

MR 분석은 입력변수의 조건에 따라 다른 결과와 오차를 보일 수 있다. 이러한 점에서 독립변수의 입력 조건별로 MR 분석을 실시하여, 입력변수의 조건별 결과에 대한 오차를 Table 5에 정리하였다. 회귀분석에서는 각 모델에 대한 MSE를 계산하는 것을 목표로 한다 (Alawi and Rajab, 2013). MSE가 큰 모델은 최상의 회귀방정식으로 선택될 가능성이 낮기 때문에 작은 모델로 자세히 조사하면 된다. MSE는 case-3, case-4, case-7에서 가장 작게 나타났다. R2는 case-1, case-3, case-4, case-7에서 높게 나타났다.

Table 5 Summary of MR analysis results by case for input parameter

NGHHCI_2023_v65n3_15_t0005.png 이미지

DNN 분석결과와 비교를 위해 본 연구에서는 MSE가 가장 작고 R2가 비교적 높은 case-3과 case-4의 경우에 대해서 분석하였다. case-7의 경우 #4와 #200 사이에 포함되는 모래가 없는 관계로 분석대상에서 제외하였다. case-1에 대해서는 상대적인 비교를 위하여 추가 선택하여 분석하였다. Adjusted-R2의 경우 입력 데이터의 기호가 모두 같아 R2 값과 큰 차이를 보이지 않기 때문에 항목에서 제외하였다

MR 분석에서 독립변수들 사이에 강한 선형관계가 있는 경우 다중공선성 문제가 있을 수 있으며, 이는 예측의 정확도를 저하시킬 수 있다. Myers (1990)는 예측 변수가 단순한 상관관계 측면에서 다른 예측 변수와 중간 정도 또는 상대적으로 약한 연관성을 가질 수 있지만 다른 모든 예측 변수에 대해 회귀할 때 상당히 높은 R을 가질 수 있는데, 수치적으로 분산 팽창계수 (variance inflation factor, VIF)가 10 이상이면 어느 정도 우려할 만한 이유가 있다고 하였다. 이러한 문제를 해결하기 위해 변수 삭제 또는 최소 제곱 추정에 대한 대안의 고려를 제안하였다. 본 연구에서도 다중공선성의 VIF를 식 (6)과 같이 구하였다.

\(\begin{aligned}V I F=\frac{1}{\left(1-R_{k}^{2}\right)}\end{aligned}\)       (6)

MR 분석에서 SPSS 20을 이용하여 분석된 VIF를 Table 6에 정리하였다. 다중공선성 (Multicollinearity)은 VIF가 10 이상이며, 서로 상관관계가 강한 관계를 보이게 된다. MDD를 예측하기 위해 입력변수를 모든 적용한 case-1에서는 #200을 제외한 나머지 입력변수의 VIF가 10 이상으로 강한 상관관계가 있는 것으로 나타났다. 이를 해결하기 위해 3개의 입력변수 중 VIF가 가장 큰 #10을 제거하여 다중공선성 문제를 해결하였다. VIF가 가장 크게 나타난 #10을 제외한 case-3의 분석결과에서는 모든 입력변수의 VIF가 10이하로 나타났다.

Table 6 Summary of MR analysis results on case-1, case-3, and case-4

NGHHCI_2023_v65n3_15_t0006.png 이미지

3. DNN 분석 결과

DNN과 DNN-T 모델을 이용하여 MR의 분석결과에서 다중공선성 문제가 해결된 case-3에 대하여 분석을 실시하였다. 입력변수의 조건에 따른 차이점을 파악하기 위하여 case-1을 비교대상으로 선택하였다. DNN을 이용한 분석은 조건별로 DNN-1과 DNN-2로 구분하였으며, DNN-T를 이용한 분석은 DNN-T-1과 DNN-T-2로 구분하였다. DNN과 DNN-T은 다중공선성에 의한 강한 상관관계가 있는 입력변수 #10의 사용유무에 따라 구분된 것이다. 분석 모델에 대한 명칭의 구분은 Table 7과 같다.

Table 7 Case by target data in DNN and DNN-T

NGHHCI_2023_v65n3_15_t0007.png 이미지

가. DNN 분석 결과

DNN 모델을 이용한 case-1, case-3의 훈련데이터에 대한 학습의 변화를 Fig. 5에서 보여주고 있다. 검증 데이터 세트의 매트릭이 훈련 데이터 세트의 매트릭보다 높게 나타나고 있다. 이상적인 훈련 조건을 나타내지 않고 있으며, 0에 가깝게 수렴하여 과적합이 발생하지 않았으므로 훈련 및 일반화가 충분히 진행되었음을 확인하였다.

NGHHCI_2023_v65n3_15_f0005.png 이미지

Fig. 5 Results of DNN model training on Loss and Validation loss, MAE and Validation_MAE

훈련 데이터를 입력하여 MDD를 예측한 결과에 대한 실측값과 예측값의 차이를 Fig. 6과 Fig. 7에서 보여주고 있다. DNN-1과 DNN-2의 예측결과의 R2이 0.81로 높은 상관관계를 보이는 것으로 나타났다. 입력변수 #10의 사용유무에 따라 DNN-1과 DNN-2의 분석 결과는 큰 차이가 없는 것으로 나타났다. Kim et al. (2015)은 batch size 조절은 훈련 성능을 유지하면서 계산 속도를 빠르게 할 수 있으며, 이를 위해서는 batch size와 iteration의 크기를 상호보완적으로 변경해야 한다고 하였다. 신경망에서 입력되는 변수의 차이는 계산되어야 하는 가중치 수가 많아져 처리 시간이 증가할 수 있다. 본 연구에서는 계산에 들어가는 데이터의 미니 batch size를 조절하였기 때문에 실측값과 예측값에서 큰 차이를 보이지 않은 것으로 사료된다.

NGHHCI_2023_v65n3_15_f0006.png 이미지

Fig. 6 Comparison of DNN-1 model training results in DNN

NGHHCI_2023_v65n3_15_f0007.png 이미지

Fig. 7 Comparison of DNN-2 model training results in DNN

나. DNN-T 분석 결과

DNN-T 모델을 이용한 DNN-T-1과 DNN-T-2의 훈련데이터에 대한 학습의 변화를 Fig. 8에서 보여주고 있다. DNN-T에서도 0에 가깝게 수렴하면서 과적합이 발생하지 않았으므로 훈련 및 일반화가 충분히 진행되었음을 확인하였다.

NGHHCI_2023_v65n3_15_f0008.png 이미지

Fig. 8 Results of DNN-T model training on Loss and Validation loss, MAE and Validation_MAE

훈련 데이터를 입력하여 MDD를 예측한 결과에 대한 실측값과 예측값이 차이를 Fig. 9와 Fig. 10에서 보여주고 있다. DNN-T의 훈련 데이터 세트를 훈련하여 MDD를 예측한 결과는 DNN-T-1과 DNN-T-2에서 R2은 0.83의 높은 상관관계를 보이는 것으로 나타났다. R2는 RM 모델의 0.70보다는 15.68%, DNN 모델의 0.81보다 예측성능이 1.87% 증가하는 것으로 나타났다. 또한, 입력변수 #10의 사용유무에 따라 결과의 차이는 없는 것으로 나타났다. 이는 DNN 분석결과와 같이 미니 batch size를 조절하였기 때문인 것으로 사료된다. 또한, Ding et al. (2020)은 MDD를 정확하게 예측하고 평가하기 위해서는 전체 입도를 사용해야 한다고 하였다. 본 연구에서도 모델간 예측결과의 차이가 없는 것으로 나타났기 때문에 DNN-T-1의 전체 입도를 사용하여 MDD의 예측이 가능할 것으로 사료된다.

NGHHCI_2023_v65n3_15_f0009.png 이미지

Fig. 9 Comparison of DNN-T-1 model training results in DNN-T

NGHHCI_2023_v65n3_15_f0010.png 이미지

Fig. 10 Comparison of DNN-T-2 model training results in DNN-T

4. 분석 결과 평가

각 분석 방법에 따른 예측오차 평가 결과를 NSE, MAPE, RMSE, R2와 비교하여 Table 8에 정리하였다. MDD에 대한 예측오차의 RMSE는 MR 모델의 case-3에서 가장 작은 오차를 보였으며, DNN과 DNN-T 모델에서는 오차의 차이가 크지 않은 것으로 나타났다. MAPE는 MR 모델의 case-3에서 2.390%로 가장 작은 오차는 보였으며, DNN과 DNN-T 모델에서는 3.192∼3.374%로 큰 차이를 보이지 않는 것으로 나타났다. R2는 MR 모델보다는 신경망으로 분석한 결과에서 더 높은 상관관계를 보였으며, DNN 모델보다는 DNN-T 모델로 분석한 결과에서 평균적으로 1.87% 상관성이 높아진 것으로 나타났다. NSE는 MR의 경우 MR 모델의 case-1을 제외하고 나머지 case에서는 0.06 이상으로 나타났으며, DNN-T-1에서 0.681로 가장 높은 결과를 보였다.

Table 8 Evaluation of error on MR, DNN and DNN-T

NGHHCI_2023_v65n3_15_t0008.png 이미지

흙의 입도가 MDD에 미치는 영향은 #10의 적용 유무에 관계없이 오차의 차이는 크지 않았다. 이는 각 체의 입도 크기별로 MDD에 고유의 영향을 미치고 있기 때문으로 사료된다 (Ding et al., 2020). 예측 결과는 DNN-T > DNN > MR 모델의 순으로 좋은 결과를 보였다. 따라서, MR과 DNN 분석의 정확도를 높이기 위해서는 많은 데이터의 수집을 통한 분석이 필요할 것으로 사료되며, 흙의 입도분포는 다짐특성을 유추하는 매개변수로도 충분히 활용 가능할 것으로 보인다.

Ⅳ. 결론

토질별 입도분석 결과를 입력 매개변수로 이용하여 MR, DNN, DNN-T 모델로 예측된 MDD를 비교·평가하여 정리하였다. 체의 크기별 특성에 따라 MDD를 예측한 결과는 MR 분석에서 R2이 0.70 이상으로 나타났다. MR 분석에서 4개의 입력변수를 사용한 경우 VIF가 10이상으로 예측변수 사이의 상관관계가 높게 나타났다. 입력변수 중에서 #10을 제외한 경우 VIF가 10이하로 나타나 다중공선성 문제를 해결할 수 있었다. DNN으로 분석한 경우 R2은 0.80 이상으로 MR 분석 결과보다 높은 것으로 나타났다. 또한, DNN-T 분석의 R2으로 평가한 예측오차는 0.80 이상으로 MR 보다 15.68%, DNN 보다 1.87% 더 향상된 결과를 보였다. MR 분석과 같이 #10을 입력변수에서 제외한 경우 DNN과 DNN-T 분석 결과는 큰 차이를 보이지 않는 것으로 나타났다. 분석 모델별로 MAPE는 MR 분석의 case-3에서 가장 작았지만, 다른 조건에서는 큰 차이를 보이지 않았다. RMSE는 MR 분석의 case-3에서 0.56으로 가장 작았지만, DNN과 DNN-T 분석에서는 0.74∼0.79로 큰 차이를 보이지 않았다. NSE는 DNN과 DNN-T에서 높은 정확도를 보이는 것으로 나타났다. 평가 오차를 종합적으로 정리하면, MR 보다는 DNN과 DNN-T로 분석한 MDD의 예측 결과가 더 양호하게 나타났다. DNN-T의 예측결과는 DNN 보다 R2에서 향상된 결과를 보였기 때문에 분석도구로서의 활용성 가능성을 확인하였다. 하지만, 보다 높은 정확도와 신뢰성을 높이기 위해서는 추가적인 데이터를 이용한 분석이 필요하다. 또한, 입도분포는 MDD 예측을 위한 매개변수로 활용이 가능하다는 것을 확인하였다. 이를 도로, 제방 등의 다짐상태를 평가하는데 재료적 특성을 이용한다면 시간과 비용적인 측면에서 많은 도움이 될 수 있을 것으로 보인다.

Appendix

참고문헌

  1. Alawi, M. H., and M. I. Rajab, 2013. Prediction of California bearing ratio of subbase layer using multiple linear regression models. Road Materials and Pavement Design, 14(1): 211-219. doi: 10.1080/14680629.2012.757557.
  2. Baek, J. W., and K. Chung, 2020. Context deep neural network model for predicting depression risk using multiple regression. IEEE Access, 8: 18171-18181. doi: 10.1109/ACCESS.2020.2968393.
  3. Baek, S. H., S. W. Yun, J. C. Park, and C. Yu, 2007. Characteristic of compaction and permeability of soils with the variation of particle distribution and compaction energy. Journal of Agriculture & Life Science, 41(2): 45-50.
  4. Bengio, Y., A. Courville, and P. Vincent, 2014. Representation learning: a review and new perspectives. IEEE Transactions on Patter Analysis and Machine Intelligence, 35(8): 1798-1828. doi: 10.48550/arXiv.1206.5538.
  5. Bera, A., and A. Ghosh, 2011. Regression model for prediction of optimum moisture content and maximum dry unit weight of fine grained soil. International Journal of Geotechnical Engineering, 5: 297-305. doi: 10.3328/IJGE.2011.05.03.297-305.
  6. Chen, M. L., G. J. Wu, B. R. Gan, W. H. Jiang, and J. W. Zhou, 2018. Physical and compaction properties of granular materials with artificial grading behind the particle size distributions. Advances in Materials Science and Engineering. Volume 2018, Article ID 8093571, 1-20. doi: 10.1155/2018/8093571.
  7. Chinkulkijniwat, A., E. Man-Koksung, A. Uchaipichat, and S. Horpibulsuk, 2010. Compaction characteristics of non-gravel and gravelly soils using a small compaction apparatus. Journal of ASTM International, 7(7): 1-15. https://doi.org/10.1520/JAI102945
  8. Cho, S. H., H. S. Nam, K. J. Ryu, and D. K. Ryoo, 2020. A comparative analysis of the forecasting performance of coal and iron ore in Gwangyang Port using stepwise regression and artificial neural network model. Journal of Navigation and Port Research, 44(3): 187-194. doi: 10.5394/KINPR.2020.44.3.187. (in Korean).
  9. Ding, Y., Y. Rao, A. K. Sarmah, X. Huang, B. Pan, and D. Liu, 2020. Prediction and evaluation of grain size-dependent maximum dry density for gravelly soil. International Journal of Geomechanics, 20(9): 04020153. doi: 10.1061/(ASCE)GM.1943-5622.0001775.
  10. Elgibaly, A. A., and A. M. Elkamel, 1998. A new correlation for predicting hydrate formation conditions for various gas mixtures and inhibitors. Fluid Phase Equilibria, 152: 23-42. https://doi.org/10.1016/S0378-3812(98)00368-9
  11. Groupe, D., 2007. Principle of artificial neural networks, 2nd ed. World Scientific Publishing Co., Singapore.
  12. Gurtug, Y., and A. Sridharan, 2004. Compaction behaviour and prediction of its characteristics of fine grained soils with particular reference to compaction energy. Soil and Foundation, 44(5): 27-36. https://doi.org/10.3208/sandf.44.5_27
  13. Hertag, L., and H. Sprekeler, 2020. Learning prediction error neurons in a canonical interneuron circuit. Elife, 9: e57541.
  14. Johnson, A. W., and J. R. Sallberg, 1960. Factors that influence field compaction of soils. Highway Research Board Bulletin, 272: 206.
  15. Keijser, J., and H. Sprekeler, 2022. Optimizing interneuron circuits for compartment-specific feedback inhibition. PLoS Computational Biology, 18(4): e1009933.
  16. Kim, K., J. Jeon, and H. Choi, 2019. A comparison study of correlation modeling. Journal of the Korean Data Analysis Society, 11(6), 3319-3329. (in Korean).
  17. Kim, M. H., C. M. Song, and S. E. Eom, 2022. Evaluation of permeability coefficient of agriculture reservoirs using deep neural network. KSAE Annual Conference, Oct 13-14, 2022, Interburgo Hotel, Daegu, Korea.
  18. Kim, W. Y., N. R. Kim, and J. Y. Lim, 2017. A study on the experiment for classification of construction material properties of reservoir. J. Korean Soc. Hazard Mitig., 17(2): 219-230. doi: 10.9798/KOSHAM.2017.17.2.219.
  19. Kim Y. G., H. J. Park, S. G. Lee, and E. Y. Cha, 2015. Correlation analysis and optimization between parameters using with deep learning. Annual Conference of Korea Information Processing Society, Oct. 28, 22(2): 1285-1288.
  20. Kim, Y. S., S. B. Lee, and S. G. Jung, 1995. The engineering characteristics of weathered sedimentary rock soils - In Taegu and Kyungpook areas -, Journal of the Korean Geotechnical Society, 11(4): 63-74.
  21. Lee, C. W., S. Y. Park, H. M. Oh, and Y. S. Kim, 2015. Numerical simulation on seepage and seismic behaviors of poorly-compacted raised reservoir levee. Journal of the Korean Society of Agricultural Engineers, 57(4): 85-99. doi: 10.5389/KSAE.2015.57.4.085.
  22. Lee, J. H., B. S. Hwang, D. H. Chae, and W. J. Cho, 2015. Evaluations on the compaction energy effects on the soil compaction at sub-zero temperature. Journal of the Korean Geo-Environmental Society, 16(8): 13-18. (in Korean). https://doi.org/10.14481/jkges.2015.16.8.13
  23. Lumay, G., and N. Vandewalle, 2004. Compaction of anisotropic granular materials: experiments and simulations. Physical Review E, 70(1), 051315-1-5. doi: 10.1103/PhysRevE.70.051314
  24. Myers, R. H., 1990. Classical and modern regression with applications (2nd ed.), Boston, Mass.: Duxbury Press.
  25. Noh, S. K., P. W. Chang, and Y. H. Son, 2006. Analysis of effect of compaction energy using fragmentation fractal. Journal of the Korean Society of Agricultural Engineers, 48(6): 59-67. https://doi.org/10.5389/KSAE.2006.48.6.059
  26. Ma, Z. Y., Dang, F. N., and H. J. Liao, 2014. Numerical study of the dynamic compaction of gravel soil ground using the discrete element method. Granular Matter, 16(6): 881-889. https://doi.org/10.1007/s10035-014-0529-x
  27. Pandian, N. S., T. S. Nagaraj, and M. Manoj, 1997. Reexamination of compaction characteristics of fine grained soils. Geotechnique, 47(2): 363-366. https://doi.org/10.1680/geot.1997.47.2.363
  28. Park, H. I., 2011. Development of neural network model to estimate the permeability coefficient of soils. Marine Georesources and Geotechnology, 29: 267-278. doi: 10.1080/1064119X.2011.554963.
  29. Park, H. M., H. S. Park, and S. W. Park, 2016. Mechanical evaluation of compacted granular materials considering particle size distribution. Journal of the Korean Geotechnical Society, 32(1): 45-53. doi: 10.7843/kgs.2016.32.1.45.
  30. Park, J. H., 2010. A study on evaluation of compaction ratio using 10% air voids line, Master's thesis, Keimyung University, 36-51. (in Korean).
  31. Park, J. M., Y. B. Han, and Y. S. Jang, 2013. Estimation of ultimate bearing capacity of gravel compaction piles using nonlinear regression analysis. Journal of Korean Society of Coastal and Ocean Engineers, 25(2): 112-121. doi: 10.9765/KSCOE.2013.25.2.112.
  32. Park. C. S., and J. H. Kim, 2017. Correlation between physical and compaction characteristics of various soils. Journal of the Korean Geo-Environmental Society, 18(1): 23-29. doi: 10.14481/jkges.2017.18.1.23.
  33. Perfect, E., and B. D. Kay, 1995. Applications of fractals in soil and tillage research: A review. Soil and Tillage Research, 36(1-2): 1-20. https://doi.org/10.1016/0167-1987(96)81397-3
  34. Ring III, G. W., J. R. Sallberg, and W. H. Collins, 1962. Correlation of compaction and classification test data. Highway Research Board Bulletin, 325: 577-587.
  35. Sezer, A., A. B. Goktepe, and S . Altun, 2009. E stimation of the permeability of granular soils using neuro-fuzzy system, AIAI-2009 Workshops Proceedings.
  36. Yu, C., W. S. Kim, K. J. Kang, S. Y. Park, and S. Y. Na, 2002. A risk evaluation method of agricultural infrastructures with climate change using hybridized fuzzy logic and neural network theory. KSAE Annual Conference, Oct 13-14, Interburgo Hotel, Daegu, Korea.
  37. Yun, T. Y., 2018. Applicability evaluation of DEM with spherical particles for packing degree estimation. International Journal of Highway Engineering, 20(6): 21-30. (in Korean). doi: 10.7855/IJHE.2018.20.6.021.