• 제목/요약/키워드: Statistical predictions

검색결과 213건 처리시간 0.026초

전자빔을 이용한 triclosan 제거에 있어서 실험계획법의 이용 (Decomposition of Triclosan onto E-beam Process using a Design of Experiment(DOE))

  • 장태범;이시진
    • 한국지반환경공학회 논문집
    • /
    • 제13권6호
    • /
    • pp.51-57
    • /
    • 2012
  • 본 연구는 E-beam 공정을 통한 triclosan의 광분해에 대하여 조사하였다. 공정의 최적화는 실험계획법에 의한 회분식 실험을 통해 수행되었다. 실험계획법은 통계적 적용 방안의 하나로 각 인자간의 영향을 고려하기 위해 반응표면을 설계하는 방법이다. 반응은 triclosan의 제거율(%, $Y_1$)과 TOC 제거율(%, $Y_2$)로 적용되었고 두 개의 독립변수로서 triclosan의 농도를 "$x_1$", 조사강도를 "$x_2$"로 설계하였다. 코드화 된 인자에 대한 Triclosan 제거율과 TOC 제거율에 따른 회귀식은 각각 $Y_1=63-12.4335x_1+15.1835x_2+5.8125x{_1}^2-5.6875x{_2}^2-0.75x_1x_2(R^2=95.1%,\;R^2(Adj)=91.7%)$$Y_2=46-8.8462x_1+11.7175x_2-0.75x{_1}^2-6.25x{_2}^2(R^2=98.7%,\;R^2(Adj)=97.7%)$로 나타났다. $Y_1$$Y_2$에 대한 모델 예측식의 결정계수($R^2$)와 수정결정계수($R{^2}_{(Adj)}$)의 값이 90% 이상으로 나타나 실험적 관찰결과와 잘 부합하였다. 이러한 결과는 회귀모델이 E-beam 공정에서의 인자영향을 잘 설명하며 통계적 적용이 성공적으로 적용된 것으로 판단된다.

부산-울산 고속국도(5공구)에 위치한 암반사면의 추계론적 절리연결구조 모사에 대한 사례연구 (A Case Study on Stochastic Fracture Network Modeling for Rock Slopes of Busan-Ulsan Highway(Reach 5))

  • 허인실;엄정기;김용필;김국한;이영균
    • 지질공학
    • /
    • 제16권4호
    • /
    • pp.337-349
    • /
    • 2006
  • 부산울산 고속국도 중 8.02 km 구간에서 유문암질 응회암류로 구성된 암반사면에 설치된 6개의 조사선으로부터 총751개의 절리가 측정 기록되었다. 조사된 절리 자료를 사용하여 절리군 분석이 수행되었으며 구분된 개별 절리군에서 방향성, 절리선 길이, 절리 간격 및 삼차원적 절리 크기에 대한 확률분포가 도출되었다. 구분된 모든 절리군에서 방향분포는 높은 변동성을 수반하며 대부분의 절리군에서 기존의 피셔분포가 방향분포 모델로 채택될 수 없는 것으로 검정되었다. 절리 간격 및 절리선 반길이에 대한 통계분포 모델로 음지수, 감마 및 대수정규 분포가 모두 적합한 것으로 분석되었다. 이들 통계분포를 도출하기 위해서는 절리 간격과 절리선 길이에 관계된 자료왜곡을 보정하였다. 이로부터 추계론적으로 모사된 삼차원 절리연결구조는 사면암반의 이차원 영역에서 각 절리군에 대한 절리선 구조를 예측하는데 이용되었다. 예측된 절리분포의 통계적 특성치를 현장조사 자료와 비교하여 타당성을 검토한 결과 사면암반에서 모사된 삼차원 절리연결구조는 현장암반의 절리 분포특성을 잘 반영하는 것으로 해석되었다.

시계열 분석 및 딥러닝 모형을 활용한 월 강수량 예측 비교 (Comparing Monthly Precipitation Predictions Using Time Series Analysis with Deep Learning Models)

  • 정연지;김민기;엄명진
    • 대한토목학회논문집
    • /
    • 제44권4호
    • /
    • pp.443-463
    • /
    • 2024
  • 본 연구는 지역별로 과거 30년간의 월 강수량 데이터를 활용하여 강수량 예측의 정확성을 높이고자 하였다. 통계적 모형(ARIMA, SARIMA)과 딥러닝 모형(LSTM, GBM)을 사용하여 강릉, 광주, 대구, 대전, 부산, 서울, 제주 그리고 춘천 지역에서 1983년부터 2012년까지의 월 강수량 데이터를 학습하고 이를 바탕으로 2013년부터 2022년까지 10년간 월 강수량을 예측하였다. 예측 결과, 대부분 모형에서 강수량의 추세는 정확하게 예측했으나, 실제 강수량보다 과소 예측하는 경향을 보였다. 이러한 문제점을 해결하고자 지역별, 계절별 적합한 모델을 선정하였다. 강릉, 광주, 대구, 대전, 부산, 서울, 제주 그리고 춘천에는 LSTM 모형이 적합한 결과를 보였다. 계절별로 나누어 예측력을 비교하면, SARIMA 모형은 강릉, 광주, 대구, 대전, 서울 그리고 춘천 지역에서 겨울철에 특히 적합한 예측 성능을 나타냈다. 또한, LSTM 모형은 강수가 집중된 여름철에 다른 모형에 비해 높은 성능을 보였다. 결론적으로, 지역별 및 계절별 강수 패턴을 면밀하게 분석하고 이에 기반한 적합한 예측 모형을 선택하는 것은 강수량 예측의 정확도를 높이는 데 결정적인 역할을 한다.

미국 프로농구(NBA)의 플레이오프 진출에 영향을 미치는 주요 변수 예측: 3점과 턴오버 속성을 중심으로 (Prediction of Key Variables Affecting NBA Playoffs Advancement: Focusing on 3 Points and Turnover Features)

  • 안세환;김영민
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.263-286
    • /
    • 2022
  • 본 연구는 웹 크롤링을 이용하여 1990년부터 2022년까지 총 32개년에 해당하는 NBA 통계 정보를 획득하고, 탐색적 데이터 분석을 통해 관심 변수를 관찰하고 관련된 파생변수를 생성한다. 입력 데이터에 대한 정제 과정을 거쳐 무의미한 변수들을 제거하고, 남은 변수에 대한 상관관계 분석, t 검정 및 분산분석을 수행하였다. 관심 변수에 대해 플레이오프 진출/미진출 그룹 간 평균의 차이를 검정하였고, 이를 보완하기 위해 순위를 기준으로 하는 3개 집단(상위/중위/하위) 간 평균 차이를 재확인하였다. 입력 데이터 중 올해 시즌 데이터만을 테스트 세트로 활용하였고, 모델 훈련을 위해서는 훈련 세트와 검증 세트를 분할하여 5-fold 교차검증을 수행하였다. 교차검증 결과와 시험 세트를 이용한 최종 분석 결과를 비교하여 성능 지표에서 차이가 없음을 확인함으로써 과적합 문제를 해결하였다. 원시 데이터의 품질 수준이 높고, 통계적 가정을 만족하기 때문에 적은 수준의 데이터 세트임에도 불구하고 대부분 모델에서 좋은 결과를 나타냈다. 본 연구는 단순히 머신러닝을 이용하여 NBA의 경기 결과를 예측하거나 플레이오프 진출 여부만을 분류하는 것에서 그치지 않고, 입력 특성의 중요도를 파악하여 높은 중요도를 갖는 주요 변수에 본 연구의 관심 대상 변수가 포함되는지를 확인하였다. Shap value의 시각화를 통해 특성 중요도의 결과만으로 해석할 수 없었던 한계를 극복하고, 변수의 진입/제거 과정에서 중요도 산출에 일관성이 부족하다는 점을 보완할 수 있었다. 본 연구에서 관심 대상으로 분류했던 3점 및 실책과 관련된 다수의 변수가 미국 프로농구에서의 플레이오프 진출에 영향을 미치는 주요 변수에 포함되는 것으로 나타났다. 본 연구는 기존의 스포츠 데이터 분석 분야에서 다루었던 경기 결과, 플레이오프 및 우승 예측 등의 주제를 포함하고 분석을 위해 여러 머신러닝 모델을 비교 분석했다는 점에서 유사성이 있지만, 사전에 관심 속성을 설정하고, 이를 통계적으로 검증함으로써 머신러닝 분석 결과와 비교하였다는 측면에서 차이가 있다. 또한 XAI 모델 중 하나인 SHAP를 이용하여 설명 가능한 시각화 결과를 제시함으로써 기존 연구와 차별화하였다.

부도예측을 위한 KNN 앙상블 모형의 동시 최적화 (Investigating Dynamic Mutation Process of Issues Using Unstructured Text Analysis)

  • 민성환
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.139-157
    • /
    • 2016
  • 앙상블 분류기란 개별 분류기보다 더 좋은 성과를 내기 위해 다수의 분류기를 결합하는 것을 의미한다. 이와 같은 앙상블 분류기는 단일 분류기의 일반화 성능을 향상시키는데 매우 유용한 것으로 알려져 있다. 랜덤 서브스페이스 앙상블 기법은 각각의 기저 분류기들을 위해 원 입력 변수 집합으로부터 랜덤하게 입력 변수 집합을 선택하며 이를 통해 기저 분류기들을 다양화 시키는 기법이다. k-최근접 이웃(KNN: k nearest neighbor)을 기저 분류기로 하는 랜덤 서브스페이스 앙상블 모형의 성과는 단일 모형의 성과를 개선시키는 데 효과적인 것으로 알려져 있으며, 이와 같은 랜덤 서브스페이스 앙상블의 성과는 각 기저 분류기를 위해 랜덤하게 선택된 입력 변수 집합과 KNN의 파라미터 k의 값이 중요한 영향을 미친다. 하지만, 단일 모형을 위한 k의 최적 선택이나 단일 모형을 위한 입력 변수 집합의 최적 선택에 관한 연구는 있었지만 KNN을 기저 분류기로 하는 앙상블 모형에서 이들의 최적화와 관련된 연구는 없는 것이 현실이다. 이에 본 연구에서는 KNN을 기저 분류기로 하는 앙상블 모형의 성과 개선을 위해 각 기저 분류기들의 k 파라미터 값과 입력 변수 집합을 동시에 최적화하는 새로운 형태의 앙상블 모형을 제안하였다. 본 논문에서 제안한 방법은 앙상블을 구성하게 될 각각의 KNN 기저 분류기들에 대해 최적의 앙상블 성과가 나올 수 있도록 각각의 기저 분류기가 사용할 파라미터 k의 값과 입력 변수를 유전자 알고리즘을 이용해 탐색하였다. 제안한 모형의 검증을 위해 국내 기업의 부도 예측 관련 데이터를 가지고 다양한 실험을 하였으며, 실험 결과 제안한 모형이 기존의 앙상블 모형보다 기저 분류기의 다양화와 예측 성과 개선에 효과적임을 알 수 있었다.

코로나 홀을 이용한 CIR과 지자기 폭풍의 경험적 예보 연구 (Empirical Forecast of Corotating Interacting Regions and Geomagnetic Storms Based on Coronal Hole Information)

  • 이지혜;문용재;최윤희;유계화
    • Journal of Astronomy and Space Sciences
    • /
    • 제26권3호
    • /
    • pp.305-316
    • /
    • 2009
  • 이 연구에서 우리는 코로나 홀(Coronal hole, CH)의 정보(위치, 면적)를 이용하여 CIR(Corotating Interaction Regions)과 지자기폭퐁(Geomagnetic Storm)에 대한 경험적인 예보를 수행하였다. 이것을 위해 1996년 1월 $\sim$ 2003년 11월까지의 미국 국립 천문대-Kitt Peak 관측소의 He I $1083{\AA}$ 영상으로부터 코로나 홀 자료를 얻고, Choi et al.(2009)로부터 확인된 CIR과 지자기폭풍 자료를 활용하였다. 지자기 폭풍을 일으키는 코로나 홀의 특성을 고려하여 코로나 홀의 중심이 $N40^{\circ}$$S40^{\circ}$ 사이, $E40^{\circ}$$W20^{\circ}$ 사이에 위치하고 태양 반구에 대한 면적 비율이 다음과 같은 세 가지 경우를 선택하였다: (1) case 1: 0.36% 이상, (2) case 2: 0.66% 이상, (3) case 3: $1996{\sim}2000$년 동안에는 0.36%, $2001{\sim}2003$년 동안에는 0.66% 이상. 우리는 각 경우에 대하여 예보의 성공 유무를 확인할 수 있는 예보 분할표(Contingency Table)를 만들고, 그들의 태양 주기 위상(Solar cycle phase)에 대한 의존성을 조사하였다 분할표로부터 우리는 PODy(the probability of detection yes), FAR(the false alarm ratio), Bias(the ratio of "yes" predictions to "yes" observations) 그리고 CSI(critical success index)와 같은 예보 평가 지수를 결정하였다. 이와 같은 예보에서 PODy와 CSI가 상대적으로 더 중요한 사실을 고려하여, 우리는 가장 좋은 후보가 case 3이라는 것을 발견하였다. 이 경우에 두 가지 예보에 대한 예보평가 지수는 아래와 같다: CH-CIR의 경우는 PODy=0.77, FAR=0.66, Bias=2.28, CSI=0.30이고, CH-storm의 경우는 PODy=0.81, FAR=0.84, Bias=5.00, CSI=0.16이다. 또한 태양 활동 극대기 이후 감쇄기간 동안의 지수들이 태양 극대기 이전의 값들 보다 훨씬 잘 예보되고 있음을 알 수 있다. 따라서 코로나 홀을 이용한 CIR의 예보는 충분한 가능성을 보여주고 있으나, 지자기 폭풍의 예보는 너무 많은 허위 예보로 인하여 다소 어려울 것으로 비상된다.

산학연 협업 활성화를 위한 R&D 네트워크 연결 예측 연구 (Predicting link of R&D network to stimulate collaboration among education, industry, and research)

  • 박미연;이상헌;김국성;심홍매;김우주
    • 지능정보연구
    • /
    • 제21권3호
    • /
    • pp.37-52
    • /
    • 2015
  • 최근 전세계적으로 R&D 네트워크 및 산학연 협력 등을 강화하고 있는 추세이다. 네트워크 및 협업연구 부문에 대한 지원이 증가하면 학제간 융합 연구를 통한 새로운 이론의 창출과 새로운 학문 사업 분야로의 확장 가능성을 높일 수 있다. 우리나라도 정부의 R&D 과제 수행을 통해 형성된 R&D 네트워크를 효율적으로 지원할 수 있는 전략의 필요성이 증대되고 있다. 그럼에도 불구하고 우리나라는 국가 R&D 사업 참여자에 대한 개별인력정보와 일반화된 통계 자료에만 의존하여 네트워크 관점에서의 정책은 미흡한 실정이다. 이에 따라 R&D 사업에 참여하는 각 주체들 간의 관계를 분석하고 산학연 R&D 네트워크를 기반으로 향후 발생할 수 있는 네트워크의 변화를 예측하고자 한다. R&D 네트워크 변화 예측을 위해 Common Neighbor 모형과 Jaccard's Coefficient 모형을 기반 모델로서 채택하고자 하며, 이들의 한계점을 보완하고 Link Prediction 정확도를 향상시킨 새로운 예측 모형을 제안하고 이들간의 비교분석 결과를 도출하고자 한다. 이와 같은 연구 결과는 향후 R&D 네트워크의 변화에 대한 효과적인 예측을 통해 선제적인 산학연 사업 지원 전략을 수립하고, 융합 R&D사업 등을 효과적으로 지원할 수 있는 국가 정책을 도모하기 위한 방안을 제시한다는 점에서 의의가 있다. 본 연구결과 가중치의 적용은 Common Neighbor 모형과 Jaccard's coefficient 모형 모두에서 긍정적인 성과를 나타냈는데 상대적으로는 가중치가 적용된 Common Neighbor 모형에서의 정확도가 더 개선된 것으로 도출되었다. 즉, Common Neighbor 모형에서는 4,136개 중 650개를 예측한 반면, 가중치를 적용한 Common Neighbor 모형에서는50개의 정답이 증가한 700개를 예측하는 효과를 보였다. 한편, 상대적으로 Jaccard 계수의 경우는 약간의 성능 개선은 있으나 그 차이가 미미한 것으로 나타났다.

동아시아지역의 CMAQ 대류권 오존 모의에 화학적 측면 경계조건이 미치는 효과 (The Effect of the Chemical Lateral Boundary Conditions on CMAQ Simulations of Tropospheric Ozone for East Asia)

  • 홍성철;이재범;최진영;문경정;이현주;홍유덕;이석조;송창근
    • 한국대기환경학회지
    • /
    • 제28권5호
    • /
    • pp.581-594
    • /
    • 2012
  • The goal of this study is to investigate the effects of the chemical lateral boundary conditions (CLBCs) on Community Multi-scale Air Quality (CMAQ) simulations of tropospheric ozone for East Asia. We developed linking tool to produce CLBCs of CMAQ from Goddard Earth Observing System-Chemistry (GEOS-Chem) as a global chemistry model. We examined two CLBCs: the fixed CLBC in CMAQ (CLBC-CMAQ) and the CLBC from GEOS-Chem (CLBC-GEOS). The ozone fields by CMAQ simulation with these two CLBCs were compared to Tropospheric Emission Spectrometer (TES) satellite data, ozonesonde and surface measurements for May and August in 2008. The results with CLBC-GOES showed a better tropospheric ozone prediction than that with CLBC-CMAQ. The CLBC-GEOS simulation led to the increase in tropospheric ozone concentrations throughout the model domain, due to be influenced high ozone concentrations of upper troposphere and near inflow western and northern boundaries. Statistical evaluations also showed that the CLBC-GEOS case had better results of both the index of Agreement (IOA) and mean normalized bias. In the case of IOA, the CLBC-GEOS simulation was improved about 0.3 compared to CLBC-CMAQ due to the better predictions for high ozone concentrations in upper troposphere.

깊이 인자를 고려한 매설배관의 사고피해영향 비교 분석에 관한 연구 (A Study for Comparison of Consequence Analysis for Buried Pipeline Considering the Depth Factor)

  • 한승훈;설지우;류병태;태찬호;고재욱
    • 한국가스학회지
    • /
    • 제20권5호
    • /
    • pp.9-16
    • /
    • 2016
  • 매설배관은 내부 또는 외부의 결함으로 인하여 leak나 rupture가 발생 할 수 있으며, 가스가 누출 시 큰 사고가 발생할 수 있기 때문에 정량적 위험성평가를 통한 분석이 필요하다. 하지만 현재 매설배관에 대한 위험성 평가시 매설을 고려하지 않거나, 매설 깊이를 고려하지 않고 무조건 배관압력의 1/10으로 가정하는 OGP기준을 사용하고 있는 실정이다. 이에 본 연구에서는 여러 기관의 매설배관 ETA분석자료를 통하여 발생가능 사고 중 Jet fire의 사고피해영향을 분석하였으며, Jet fire의 복사열 계산에 있어서 배관의 매설깊이 인자를 고려한 매설모델을 수립하였다. 사례연구는 New Jersey의 Edison지역에서 발생한 사고를 이용하여 본 모델과 OGP모델을 비교 분석하였다. 연구결과 화염원으로부터 10m거리를 기준으로 매설모델의 복사열 값이 OGP모델에 비해 실제 사례와 비슷한 값을 얻을 수 있었다.

항공안전 위기관리 모형 구축에 관한 연구 (Modeling the Aviation Safety Risk Management)

  • 홍석진;김연명
    • 대한교통학회지
    • /
    • 제24권1호
    • /
    • pp.19-28
    • /
    • 2006
  • 항공수요의 급속한 팽창으로 항공기 운항의 증가와 공역 및 활주로의 혼잡도 심화로 인해 운영상 위험(Operational risk)이 급증하고 있어 체계적인 항공안전에 대한 위기관리시스템의 구축이 필요하다 항공안전 분야의 선진국일수록 평상시 비상대응체계 및 여러 가지 위험관리기법을 가동함으로써 조직의 긴장감 유지 및 예방안전의 도구로 활용하고 있다. 따라서 항공운송산업의 안전에 대해 총괄적인 관리 감독의 의무가 있는 항공안전본부 차원에서 이와 같은 과학적인 위기관리 모형을 이용한 위기관리체계의 도입이 필요하다. 위험요인분석 기법들은 데이터베이스가 구축되어 있거나, 충분한 정보와 자료가 있는 경우에는 사용될 수 있으나 현재의 국내 여건 상 충분한 자료의 확보가 곤란하여 실용적으로 사용되기가 어려운 것이 현실이다. 따라서 본 연구에서는 현재의 제한된 자료를 사용하여 실현가능 한 위험관리모형을 제시하기 위해 위험인자를 선정하고 각 위험인자에 대한 중요도와 발생빈도를 계산한 후 위험관리 모형을 제시하였다 이러한 위험관리 모형을 통해 항공운송분야에서 주기적 위험관리를 효과적으로 시행하기 위해서는 반드시 국가차원의 광범위한 자료의 수집이 선행되어야 한다.