• 제목/요약/키워드: Ensemble Average

검색결과 140건 처리시간 0.023초

EPC 프로젝트의 위험 관리를 위한 ITB 문서 조항 분류 모델 연구: 딥러닝 기반 PLM 앙상블 기법 활용 (Research on ITB Contract Terms Classification Model for Risk Management in EPC Projects: Deep Learning-Based PLM Ensemble Techniques)

  • 이현상;이원석;조보근;이희준;오상진;유상우;남마루;이현식
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권11호
    • /
    • pp.471-480
    • /
    • 2023
  • 국내 건설수주 규모는 2013년 91.3조원에서 2021년 총 212조원으로 특히 민간부문에서 크게 성장하였다. 국내외 시장 규모가 성장하면서, EPC(Engineering, Procurement, Construction) 프로젝트의 규모와 복잡성이 더욱 증가되고, 이에 프로젝트 관리 및 ITB(Invitation to Bid) 문서의 위험 관리가 중요한 이슈가 되고 있다. EPC 프로젝트 발주 이후 입찰 절차에서 실제 건설 회사에게 부여되는 대응 시간은 한정적일 뿐만 아니라, 인력 및 비용의 문제로 ITB 문서 계약 조항의 모든 리스크를 검토하는데 매우 어려움이 있다. 기존 연구에서는 이와 같은 문제를 해결하고자 EPC 계약 문서의 위험 조항을 범주화하고, 이를 AI 기반으로 탐지하려는 시도가 있었으나, 이는 레이블링 데이터 활용의 한계와 클래스 불균형과 같은 데이터 측면의 문제로 실무에서 활용할 수 있는 수준의 지원 시스템으로 활용하기 어려운 상황이다. 따라서 본 연구는 기존 연구와 같이 위험 조항 자체를 정의하고 분류하는 것이 아니라, FIDIC Yellow 2017(국제 컨설팅엔지니어링 연맹 표준 계약 조건) 기준 계약 조항을 세부적으로 분류할 수 있는 AI 모델을 개발하고자 한다. 프로젝트의 규모, 유형에 따라서 세부적으로 검토해야 하는 계약 조항이 다를 수 있기 때문에 이와 같은 다중 텍스트 분류 기능이 필요하다. 본 연구는 다중 텍스트 분류 모델의 성능 고도화를 위해서 최근 텍스트 데이터의 컨텍스트를 효율적으로 학습할 수 있는 ELECTRA PLM(Pre-trained Language Model)을 사전학습 단계부터 개발하고, 해당 모델의 성능을 검증하기 위해서 총 4단계 실험을 진행했다. 실험 결과, 자체 개발한 ITB-ELECTRA 모델 및 Legal-BERT의 앙상블 버전이 57개 계약 조항 분류에서 가중 평균 F1-Score 기준 76%로 가장 우수한 성능을 달성했다.

진동하는 NACA 0012 에어포일의 근접후류 측정 (Near-wake Measurements of an Oscillating NACA 0012 Airfoil)

  • 김동하;김학봉;장조원
    • 한국항공우주학회지
    • /
    • 제34권12호
    • /
    • pp.1-8
    • /
    • 2006
  • 진동하는 에어포일의 후류에 미치는 레이놀즈수의 영향을 조사하기 위한 실험적 연구를 수행하였다. NACA 0012 에어포일은 1/4 시위를 기준으로 피칭운동을 하고, $\pm$6$^{\circ}$ 내에서 진동하도록 설정하였다. 진동하는 에어포일에서 후류를 측정하기 위하여 2축 열선풍속계가 사용되었고 연선 가시화 기법이 경계층을 관찰하기 위하여 사용되었다. 실험조건에서 자유흐름속도는 1.98, 2.83 그리고 4.03 m/s이며, 이를 근거로 한 레이놀즈수는 각각 $2.3{\times}10^4$, 3.3${\times}10^4$, 4.8${\times}10^4$이다. 모든 경우에 에어포일 진동수는 무차원 진동수 K=0.1에 맞게 조절되었다. 실험 결과, 피칭하는 에어포일의 경계층 및 후류 유동 특성은 레이놀즈수 2.3$\times$104, 3.3$\times$104 사이에서 크게 다르게 나타나며, 레이놀즈수 3.3${\times}10^4$와 4.8${\times}10^4$에서 유사하게 나타난다. 이것은 레이놀즈수 2.3$\times$104에서 비정상 분리가 크게 지연되기 때문이다.

진동하는 NACA 0012 에어포일에서의 항력계수 변화 (Drag Coefficient Variations of an Oscillating NACA 0012 Airfoil)

  • 김동하;장조원;김학봉;전창수
    • 한국항공우주학회지
    • /
    • 제36권2호
    • /
    • pp.137-145
    • /
    • 2008
  • 진동하는 에어포일의 항력계수 변화에 미치는 레이놀즈수 영향을 조사하기 위한 실험적 연구가 수행되었다. NACA 0012 에어포일은 ${\pm}6^{\circ}$의 진동 진폭을 갖고, 1/4 시위를 기준으로 피칭운동을 하도록 하였다. 실험조건에서 자유흐름속도는 1.98, 2.83 그리고 4.03 m/s이며, 이를 근거로 한 시위길이 레이놀즈수는 각각 $2.3{\times}10^4$, $3.3{\times}10^4$, $4.8{\times}10^4$이다. 항력계수는 근접후류에서 2축 열선프로브(X-type, 55R51)로 측정된 평균속도 분포로부터 산출되었다. 레이놀즈수 2.3×104에서 항력계수는 음(-)의 댐핑(negative damping)을 보이며, 에어포일이 공기력에 의해 가진 될 수 있는 불안정한 상태를 나타내었다. 반면에 레이놀즈수가 $3.3{\times}10^4$에서 $4.8{\times}10^4$이다로 증가하면서 항력계수 곡선은 양(+)의 댐핑(positive damping)을 나타내었다. 따라서 항력계수 변화는 레이놀즈수 $2.3{\times}10^4$$4.8{\times}10^4$ 사이에 상당한 차이가 있다는 것을 나타낸다.

마이크로프로세서를 이용한 자동청력검사 시스템 개발 (Development of A-ABR System Using a Microprocessor)

  • 노형욱;이탁형;김남현;김수찬;차은종;김덕원
    • 전자공학회논문지SC
    • /
    • 제46권2호
    • /
    • pp.15-21
    • /
    • 2009
  • 난청은 가장 흔한 선천성 장애이다. 이 질병의 발생 빈도는 신생아 1000명 출생 당 $1{\sim}3$명 정도로 상당히 높다. 이러한 청력 장애가 조기에 발견된다면 수술적인 치료 등으로 예방할 수 있으나, 그렇지 못할 경우 언어와 학습장애를 초래하게 된다. 이런 관점을 근거로 신생아를 대상으로 한 선천성 난청의 선별검사는 큰 의미를 가지며 난청환자의 조기발견을 위한 노력이 필수적이라 할 수 있다. 기존의 수동 청력검사 시스템은 신생아 청력 평가 시 검사자의 주관성에 의존하게 되므로, 청성뇌간 반응의 뇌파 분석이 잘못될 가능성이 커진다. 따라서 본 연구에서는 난청여부를 자동으로 판독하여 결과를 나오도록 개발하고자 하였으며, 또한 기존 제품들과 차별화하기 위하여 휴대용으로 개발하여 차폐실이 아닌 일반 병실에서도 검사가 가능하도록 함에 따라 유소아의 청각 장애를 극복시키는데 기여하고자 하였다.

신생아 청성뇌간 반응의 자동 판독 알고리즘 (Automated algorithm of automated auditory brainstem response for neonates)

  • 정원혁;홍현기;남기창;차은종;김덕원
    • 전자공학회논문지SC
    • /
    • 제44권1호
    • /
    • pp.100-107
    • /
    • 2007
  • 자동화 청성뇌간반응검사(automated auditory brainstem response; AABR)는 ABR 파형을 자동으로 검출하여 신생아의 청각선별검사에 사용되고 있다. 본 논문은 앙상블 평균된 ABR 파형에 대해서 롤의 정리를 이용한 새로운 자동화 ABR 파형 검출 알고리즘을 제안하였다. 정상 청력을 가진 신생아의 55개의 귀를 대상으로 30, 40, 50, 60 dBnHL의 다양한 강도를 가진 클릭 자극음에 대한 청성뇌간반응 파형을 측정하였다. 수동 검출법(manual detection method)과 제안된 자동 검출법을 이용하여 파형 III 과 V의 평균 잠복기(average latency time) 차를 분석하였는데, 동일한 파형(잠복기 차 < 0.2 ms)으로 관측되어 두 방법 간에는 유의한 차이가 없었다. 또한 미분 자동 검출법(automated detection method using derivative estimation)과 제안된 자동 검출법을 파형 III과 V로 판명될 후보 파형의 개수에 대해 비교하였다. 미분 자동 검출법에 비해 제안한 자동 검출법에서 후보 파형의 개수가 47 % 감소되어 검출되었다. 또한 수동 검출법에 대한 제안된 자동 검출법의 잠복기 오차율은 미분 자동 검출법에 비해 60 dBnHL의 자극강도에서 낮은 잠복기 오차율(<0.01 %)을 보였다. 따라서 제안된 알고리즘으로 청각전문가가 기존의 수동 검출 방법보다 객관적이고 정량적으로 파형 III과 V를 검출하고 표시할 수 있게 된 데에 의의가 있다.

PNU CGCM-WRF Chain을 이용한 남한지역 벼의 생육단계별 고온해 및 저온해 발생일수에 대한 예측성 연구 (A Study on the Predictability of the Number of Days of Heat and Cold Damages by Growth Stages of Rice Using PNU CGCM-WRF Chain in South Korea)

  • 김영현;최명주;심교문;허지나;조세라;안중배
    • 대기
    • /
    • 제31권5호
    • /
    • pp.577-592
    • /
    • 2021
  • This study evaluates the predictability of the number of days of heat and cold damages by growth stages of rice in South Korea using the hindcast data (1986~2020) produced by Pusan National University Coupled General Circulation Model-Weather Research and Forecasting (PNU CGCM-WRF) model chain. The predictability is accessed in terms of Root Mean Square Error (RMSE), Normalized Standardized Deviations (NSD), Hit Rate (HR) and Heidke Skill Score (HSS). For the purpose, the model predictability to produce the daily maximum and minimum temperatures, which are the variables used to define heat and cold damages for rice, are evaluated first. The result shows that most of the predictions starting the initial conditions from January to May (01RUN to 05RUN) have reasonable predictability, although it varies to some extent depending on the month at which integration starts. In particular, the ensemble average of 01RUN to 05RUN with equal weighting (ENS) has more reasonable predictability (RMSE is in the range of 1.2~2.6℃ and NSD is about 1.0) than individual RUNs. Accordingly, the regional patterns and characteristics of the predicted damages for rice due to excessive high- and low-temperatures are well captured by the model chain when compared with observation, particularly in regions where the damages occur frequently, in spite that hindcasted data somewhat overestimate the damages in terms of number of occurrence days. In ENS, the HR and HSS for heat (cold) damages in rice is in the ranges of 0.44~0.84 and 0.05~0.13 (0.58~0.81 and -0.01~0.10) by growth stage. Overall, it is concluded that the PNU CGCM-WRF chain of 01RUN~05RUN and ENS has reasonable capability to predict the heat and cold damages for rice in South Korea.

랜섬웨어 탐지를 위한 머신러닝 기반 암호화 행위 감지 기법 (A Machine Learning-Based Encryption Behavior Cognitive Technique for Ransomware Detection)

  • 황윤철
    • 산업융합연구
    • /
    • 제21권12호
    • /
    • pp.55-62
    • /
    • 2023
  • 최근 등장하는 랜섬웨어들은 다양한 공격 기법과 다양한 경로를 통해 공격을 수행하고 있어 조기 탐지와 방어에 많은 어려움을 겪고 있으며, 그 피해 규모도 날로 증가하고 있다. 따라서 본 논문에서는 효과적인 랜섬웨어 탐지를 위하여 파일 암호화와 암호화 패턴을 머신러닝 기반으로 하는 감지 기법을 제안한다. 파일 암호화는 랜섬웨어가 공격하는데 필수적으로 사용하는 기능으로 암호 행위와 암호화 패턴을 분석함으로써 랜섬웨어를 탐지하고 랜섬웨어의 특정 변종이나 새로운 유형의 랜섬웨어를 탐지할 수 있기 때문에 랜섬웨어 공격을 식별하고 차단하는 데 매우 효과적이다. 제안한 머신러닝 기반의 암호화 행위 감지 기법은 암호화 특성과 암호화 패턴 특성을 추출하여 머신러닝 기반의 분류기를 통해 각각 학습을 시켜 해당 행위에 대한 탐지를 진행하고 최종 결과는 두 분류기의 평가 결과를 기반으로 앙상블 분류기에서 랜섬웨어 유무를 판별하여 좀 더 정확도를 높였다. 또한, 제안한 기법을 numpy와 pandas, 파이썬의 사이킷런 라이브러리를 사용하여 구현하여 평가지표를 사용한 성능를 평가한 결과 평균적으로 94%,의 정확도와 95%의 정밀도, 93%의 재현률과 95%의 F1 스코어가 산출되었다. 성능 평가 결과를 보면 암호화 행위 감지를 통해 랜섬웨어 탐지가 가능하다는 것을 확인할 수 있었고 랜섬웨어의 사전 탐지를 위해 제안한 기법의 성능을 높이기 위한 연구도 계속해서 진행되어야 한다.

SSP-RCP 기후변화 시나리오 기반 한반도의 평균 기온 및 온량지수 변화 (Changes in Mean Temperature and Warmth Index on the Korean Peninsula under SSP-RCP Climate Change Scenarios)

  • 허지나;김용석;조세라;김응섭;강민구;심교문;홍승길
    • 대기
    • /
    • 제34권2호
    • /
    • pp.123-138
    • /
    • 2024
  • Using 18 multi-model-based a Shared Socioeconomic Pathway (SSP) and Representative Concentration Pathways (RCP) climate change scenarios, future changes in temperature and warmth index on the Korean Peninsula in the 21st century (2011~2100) were analyzed. In the analysis of the current climate (1981~2010), the ensemble averaged model results were found to reproduce the observed average values and spatial patterns of temperature and warmth index similarly well. In the future climate projections, temperature and warmth index are expected to rise in the 21st century compared to the current climate. They go further into the future and the higher carbon scenario (SSP5-8.5), the larger the increase. In the 21st century, in the low-carbon scenario (SSP1-2.6), temperature and warmth index are expected to rise by about 2.5℃ and 24.6%, respectively, compared to the present, while in the high-carbon scenario, they are expected to rise by about 6.2℃ and 63.9%, respectively. It was analyzed that reducing carbon emissions could contribute to reducing the increase in temperature and warmth index. The increase in the warmth index due to climate change can be positively analyzed to indicate that the effective heat required for plant growth on the Korean Peninsula will be stably secured. However, it is necessary to comprehensively consider negative aspects such as changes in growth conditions during the plant growth period, increase in extreme weather such as abnormally high temperatures, and decrease in plant diversity. This study can be used as basic scientific information for adapting to climate change and preparing response measures.

공간분포모델을 활용한 사료작물 이탈리안 라이그라스(Lolium multiflorum L.)의 재배적지 변동예측연구 (A Study on the Prediction of Suitability Change of Forage Crop Italian Ryegrass (Lolium multiflorum L.) using Spatial Distribution Model)

  • 김현애;현신우;김광수
    • 한국농림기상학회지
    • /
    • 제16권2호
    • /
    • pp.103-113
    • /
    • 2014
  • 우리나라에서의 사료작물 생산면적이 제한적이기 때문에 미래의 기후조건에서 최적 재배 가능 지역을 중심으로 이탈리안 라이그라스와 같은 사료작물의 생산체계를 설계하는 것이 필요하다. 특히, 한반도를 대상으로 이탈리안 라이그라스의 재배 가능지역을 파악하는 것이 미래를 대비한 정책 결정에 도움을 줄 수 있다. 이번 연구에서는 기후자료를 기반으로 작물의 재배적합도를 예측하는 EcoCrop 모델을 사용하여 현재(1950~2000), 2020년대(2010~2039), 2050년대(2040~2069), 2080년대(2070~2099)의 이탈리안 라이그라스의 재배 가능지역을 분석하였다. 또한, 전구 기후모델인 CCCMA, CSIRO, UKMO-HadCM3, UKMO-HadGEM1, 그리고 NCAR 모델 등으로부터 얻어진 규모축소 기후자료를 활용한 앙상블 예측기법을 재배적합도 예측에 적용하여 미래 기후변화 조건에서의 불확실도를 낮추는 것을 시도하였다. 2050년대까지 이탈리안 라이그라스의 재배적합도는 남한과 북한 모두 크게 상승할 것으로 예측되었다. 예를 들어, 현재 기후조건에서 충청북도와 강원도에서 평균적인 재배적합도가 76.75와 44.77으로 낮게 예측되었지만 2020년대에 각각 16.2% 및 46.1% 증가하여 2080년대에는 모든 행정구역에서 평균적인 재배적합도가 90이상으로 나타날 것으로 예측되었다. 반면, 2080년대에 16개의 시 도 중 11개의 지역에서 재배적합도가 감소할 것으로 예측되었다. 북한의 경우 현재 기후조건에서 평균적인 재배적합도는 28.40으로 평균적인 재배적합도가 낮았다. 그러나 기후변화가 진행되면서 재배적합도가 크게 증가하여 2080년대에는 14개 행정구역 중 10곳에서 평균적인 재배적합도가 80 이상일 것으로 예측되었다. 특히 나선, 신의주 및 개성 인근 지역의 재배적합도가 크게 증가할 것으로 예측되어 이를 중심으로 수출을 위한 사료 생산단지 및 축산단지 조성이 가능할 것으로 예상되었다. 현재, 내한성 향상을 중심으로 이탈리안 라이그라스의 새로운 품종들이 개발 및 보급되고 있어 이러한 신품종을 대상으로 한 이모작 가능지를 구분하기 위해 품종별로 최적화된 모수를 활용한 재배적합도 예측지도를 작성연구가 연구가 필요할 것으로 사료되었다.

비대칭 오류 비용을 고려한 XGBoost 기반 재범 예측 모델 (A Recidivism Prediction Model Based on XGBoost Considering Asymmetric Error Costs)

  • 원하람;심재승;안현철
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.127-137
    • /
    • 2019
  • 재범예측은 70년대 이전부터 전문가들에 의해서 꾸준히 연구되어온 분야지만, 최근 재범에 의한 범죄가 꾸준히 증가하면서 재범예측의 중요성이 커지고 있다. 특히 미국과 캐나다에서 재판이나 가석방심사 시 재범 위험 평가 보고서를 결정적인 기준으로 채택하게 된 90년대를 기점으로 재범예측에 관한 연구가 활발해졌으며, 비슷한 시기에 국내에서도 재범요인에 관한 실증적인 연구가 시작되었다. 지금까지 대부분의 재범예측 연구는 재범요인 분석이나 재범예측의 정확성을 높이는 연구에 집중된 경향을 보이고 있다. 그러나 재범 예측에는 비대칭 오류 비용 구조가 있기 때문에 경우에 따라 예측 정확도를 최대화함과 동시에 예측 오분류 비용을 최소화하는 연구도 중요한 의미를 가진다. 일반적으로 재범을 저지르지 않을 사람을 재범을 저지를 것으로 오분류하는 비용은 재범을 저지를 사람을 재범을 저지르지 않을 것으로 오분류하는 비용보다 낮다. 전자는 추가적인 감시 비용만 증가되는 반면, 후자는 범죄 발생에 따른 막대한 사회적, 경제적 비용을 야기하기 때문이다. 이러한 비대칭비용에 따른 비용 경제성을 반영하여, 본 연구에서 비대칭 오류 비용을 고려한 XGBoost 기반 재범 예측모델을 제안한다. 모델의 첫 단계에서 최근 데이터 마이닝 분야에서 높은 성능으로 각광받고 있는 앙상블 기법, XGBoost를 적용하였고, XGBoost의 결과를 로지스틱 회귀 분석(Logistic Regression Analysis), 의사결정나무(Decision Trees), 인공신경망(Artificial Neural Networks), 서포트 벡터 머신(Support Vector Machine)과 같은 다양한 예측 기법과 비교하였다. 다음 단계에서 임계치의 최적화를 통해 FNE(False Negative Error)와 FPE(False Positive Error)의 가중 평균인 전체 오분류 비용을 최소화한다. 이후 모델의 유용성을 검증하기 위해 모델을 실제 재범예측 데이터셋에 적용하여 XGBoost 모델이 다른 비교 모델 보다 우수한 예측 정확도를 보일 뿐 아니라 오분류 비용도 가장 효과적으로 낮춘다는 점을 확인하였다.