• 제목/요약/키워드: Science and Technology Predictions

검색결과 335건 처리시간 0.025초

다중 웹 데이터와 LSTM을 사용한 전염병 예측 (Prediction of infectious diseases using multiple web data and LSTM)

  • 김영하;김인환;장백철
    • 인터넷정보학회논문지
    • /
    • 제21권5호
    • /
    • pp.139-148
    • /
    • 2020
  • 전염병은 오래전부터 인류를 괴롭혀 왔으며 이를 예측 하고 예방하는 것은 인류에게 있어 큰 과제였다. 이러한 이유로 지금까지도 전염병을 예측하기 위해 다양한 연구가 진행되고 있다. 초기의 연구 중 대부분은 CDC(Centers for Disease Control and Prevention)의 역학 데이터에 의존한 연구였으며, CDC에서 제공하는 데이터는 일주일에 한 번만 갱신돼 실시간 질병 발생 건수를 예측하기 어렵다는 문제점을 갖고 있었다. 하지만 최근 IT 기술의 발전으로 여러 인터넷 매체들이 등장하면서 웹 데이터를 통해 전염병의 발생을 예측하고자 하는 연구가 진행되었고 이 중 우리가 조사한 연구 중 대부분은 단일 웹 데이터를 사용하여 질병을 예측하는 연구였다. 하지만 단일 웹 데이터를 통한 질병 예측은 "COVID-19" 같이 최근에 등장한 전염병에 대해서는 많은 양의 학습 데이터를 수집하기 어려우며 이러한 모델을 통해 정확한 예측을 하기 어렵다는 단점을 가지고 있다. 이에 우리는 전염병 발생을 LSTM 모델을 통해 예측할 때 여러 개의 웹 데이터를 사용하는 모델이 단일 웹 데이터를 사용하는 모델보다 정확도가 더 높음을 실험을 통해 증명하고 전염병 예측에 적절한 모델을 제안하고자 한다. 본 실험에서는 단일 웹 데이터를 사용하는 모델과 우리가 제안하는 모델을 사용하여 "말라리아"와 "유행성이하선염"의 발생을 예측했다. 우리는 2017년 12월 31 일부터 2019년 12월 28일까지 총 104주 분량의 NEWS, SNS, 검색 쿼리 데이터를 수집했는데, 이 중 75주는 학습 데이터로, 29주는 검증 데이터로 사용됐다. 실험 결과 우리가 제안한 모델의 예측 결과와 단일 웹 데이터를 사용한 모델의 예측 결과를 비교했을 때 검증 데이터에 대해서 피어슨 상관계수가 0.94, 0.86로 가장 높았고 RMSE 또한 0.19, 0.07로 가장 낮은 오차를 보여주었다.

다중회귀모형을 이용한 벤츄리가 없는 충격기류식 여과집진장치 압력손실 예측 (Pressure Drop Predictions Using Multiple Regression Model in Pulse Jet Type Bag Filter Without Venturi)

  • 서정민;박정호;조재환;진경호;정문섭;이병인;홍성철;시바쿠마르;최금찬
    • 한국환경과학회지
    • /
    • 제23권12호
    • /
    • pp.2045-2056
    • /
    • 2014
  • In this study, pressure drop was measured in the pulse jet bag filter without venturi on which 16 numbers of filter bags (Ø$140{\times}850{\ell}$) are installed according to operation condition(filtration velocity, inlet dust concentration, pulse pressure, and pulse interval) using coke dust from steel mill. The obtained 180 pressure drop test data were used to predict pressure drop with multiple regression model so that pressure drop data can be used for effective operation condition and as basic data for economical design. The prediction results showed that when filtration velocity was increased by 1%, pressure drop was increased by 2.2% which indicated that filtration velocity among operation condition was attributed on the pressure drop the most. Pressure was dropped by 1.53% when pulse pressure was increased by 1% which also confirmed that pulse pressure was the major factor affecting on the pressure drop next to filtration velocity. Meanwhile, pressure drops were found increased by 0.3% and 0.37%, respectively when inlet dust concentration and pulse interval were increased by 1% implying that the effects of inlet dust concentration and pulse interval were less as compared with those changes of filtration velocity and pulse pressure. Therefore, the larger effect on the pressure drop the pulse jet bag filter was found in the order of filtration velocity($V_f$), pulse pressure($P_p$), inlet dust concentration($C_i$), pulse interval($P_i$). Also, the prediction result of filtration velocity, inlet dust concentration, pulse pressure, and pulse interval which showed the largest effect on the pressure drop indicated that stable operation can be executed with filtration velocity less than 1.5 m/min and inlet dust concentration less than $4g/m^3$. However, it was regarded that pulse pressure and pulse interval need to be adjusted when inlet dust concentration is higher than $4g/m^3$. When filtration velocity and pulse pressure were examined, operation was possible regardless of changes in pulse pressure if filtration velocity was at 1.5 m/min. If filtration velocity was increased to 2 m/min. operation would be possible only when pulse pressure was set at higher than $5.8kgf/cm^2$. Also, the prediction result of pressure drop with filtration velocity and pulse interval showed that operation with pulse interval less than 50 sec. should be carried out under filtration velocity at 1.5 m/min. While, pulse interval should be set at lower than 11 sec. if filtration velocity was set at 2 m/min. Under the conditions of filtration velocity lower than 1 m/min and high pulse pressure higher than $7kgf/cm^2$, though pressure drop would be less, in this case, economic feasibility would be low due to increased in installation and operation cost since scale of dust collection equipment becomes larger and life of filtration bag becomes shortened due to high pulse pressure.

머신러닝 기반 기업부도위험 예측모델 검증 및 정책적 제언: 스태킹 앙상블 모델을 통한 개선을 중심으로 (Machine learning-based corporate default risk prediction model verification and policy recommendation: Focusing on improvement through stacking ensemble model)

  • 엄하늘;김재성;최상옥
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.105-129
    • /
    • 2020
  • 본 연구는 부도위험 예측을 위해 K-IFRS가 본격적으로 적용된 2012년부터 2018년까지의 기업데이터를 이용한다. 부도위험의 학습을 위해, 기존의 대부분 선행연구들이 부도발생 여부를 기준으로 사용했던 것과 다르게, 본 연구에서는 머튼 모형을 토대로 각 기업의 시가총액과 주가 변동성을 이용하여 부도위험을 산정했으며, 이를 통해 기존 방법론의 한계로 지적되어오던 부도사건 희소성에 따른 데이터 불균형 문제와 정상기업 내에서 존재하는 부도위험 차이 반영 문제를 해소할 수 있도록 하였다. 또한, 시장의 평가가 반영된 시가총액 및 주가 변동성을 기반으로 부도위험을 도출하되, 부도위험과 매칭될 입력데이터로는 비상장 기업에서 활용될 수 있는 기업 정보만을 활용하여 학습을 수행함으로써, 포스트 팬데믹 시대에서 주가 정보가 존재하지 않는 비상장 기업에게도 시장의 판단을 모사하여 부도위험을 적절하게 도출할 수 있도록 하였다. 기업의 부도위험 정보가 시장에서 매우 광범위하게 활용되고 있고, 부도위험 차이에 대한 민감도가 높다는 점에서 부도위험 산출 시 안정적이고 신뢰성 높은 평가방법론이 요구된다. 최근 머신러닝을 활용하여 기업의 부도위험을 예측하는 연구가 활발하게 이루어지고 있으나, 대부분 단일 모델을 기반으로 예측을 수행한다는 점에서 필연적인 모델 편향 문제가 존재하고, 이는 실무에서 활용하기 어려운 요인으로 작용하고 있다. 이에, 본 연구에서는 다양한 머신러닝 모델을 서브모델로 하는 스태킹 앙상블 기법을 활용하여 개별 모델이 갖는 편향을 경감시킬 수 있도록 하였다. 이를 통해 부도위험과 다양한 기업정보들 간의 복잡한 비선형적 관계들을 포착할 수 있으며, 산출에 소요되는 시간이 적다는 머신러닝 기반 부도위험 예측모델의 장점을 극대화할 수 있다. 본 연구가 기존 머신러닝 기반 모델의 한계를 극복 및 개선함으로써 실무에서의 활용도를 높일 수 있는 자료로 활용되기를 바라며, 머신러닝 기반 부도위험 예측 모형의 도입 기준 정립 및 정책적 활용에도 기여할 수 있기를 희망한다.

고객별 구매빈도에 동적으로 적응하는 개인화 시스템 : 음료수 구매 예측에의 적용 (The Adaptive Personalization Method According to Users Purchasing Index : Application to Beverage Purchasing Predictions)

  • 박윤주
    • 지능정보연구
    • /
    • 제17권4호
    • /
    • pp.95-108
    • /
    • 2011
  • 인터넷 비즈니스의 활성화에 따라서 기업은 고객의 인물정보 및 거래정보를 활용하여 보다 맞춤화된 개인화 서비스를 제공하고 있다. 기존의 고객군별 예측기법은 유사한 고객들을 군집화하여 고객군별로 예측모델을 수립하는 것으로, 구매가 많고 충성도가 높은 핵심고객에게 요구되는 일대일 서비스를 제공하는 데는 한계가 있다. 반면 일대일 고객별 예측기법은 각 고객에게 고도로 맞춤화된 서비스를 제공하지만, 과거 구매이력이 많지 않은 고객 이나 신규 고객에게는 정확한 개인화 서비스를 제공하지 못한다. 본 연구는 고객의 구매빈도에 따라서 유사 고객들과의 군집화 수준을 동적으로 조정하는 새로운 지능형 개인화 시스템을 제안한다. 제안된 시스템은 과거 구매가 많은 고객들에 대해서는 일대일 예측모델을 수립하지만, 구매 빈도가 낮은 고객의 경우 다른 고객들과의 최적화된 군집화를 통해 예측모델을 수립한다. 본 기법을 Neilsen의 음료수 구매 데이터셋에 적용하여 고객의 일회 구매금액 및 구매품목을 예측한 결과, 기존 두 예측기법들에 비하여 적정한 계산비용(computational cost)으로 더욱 정확한 개안화 서비스를 제공할 수 있음을 확인하였다.

'본글로벌(born global)전략'을 추구하는 벤처기업의 특성과 성과에 관한 연구 (A Study on the Born Global Venture Corporation's Characteristics and Performance)

  • 김형준;정덕화
    • 마케팅과학연구
    • /
    • 제17권3호
    • /
    • pp.39-59
    • /
    • 2007
  • 기업 환경의 국제화에 따라 설립초기에 국제화를 시도하는 벤처 기업이 증가하고 있고 이러한 현상은 기존의 기업 국제화의 단계적인 모델로는 설명에 한계를 가진다. 소위 태생적 글로벌 벤처(born global venture; BGV)은 R&D 밀집도와 경쟁밀집도가 높은 하이테크 산업에서 많이 나타나며 기존의 실증 연구에서 BGV의 환경 및 기업의 역량 특성과 국제화에 따른 기업 성과에 대한 연구가 진행되어 왔다. 그러나 기업의 성과의 경우 실증적인 연구에서 상호 다른 결과를 보이고 있으며 기업의 성과에 중요한 영향을 미치는 마케팅 전략에 대한 논의가 부족했다고 판단된다. 이에 본 연구에서는 BGV에 포함되지 않는 기업(Non_BGV)에 비하여 BGV가 보유하고 있는 기업 역량과 마케팅 전략의 차이 및 BGV의 기업 성과를 성장성, 수익성, 시장 성과 측면에서 분석해 보았다. 결과적으로 BGV는 Non_BGV에 비하여 기업의 지식을 활용하는 능력 및 해외 경험에서 차이를 보였으며 두 기업군이 추구하는 마케팅 전략에서도 차이가 있음을 보였다. 또한 기업의 성과 측면에서는 성장성과 시장 성과에서는 BGV가 더 나은 성과를 보였으나 수익성 측면에서는 차이가 없는 것으로 분석되었다.

  • PDF