• 제목/요약/키워드: linear predictive

검색결과 510건 처리시간 0.022초

한국 30~40대 실업률 예측을 위한 구글 검색 정보의 활용 (Application of Google Search Queries for Predicting the Unemployment Rate for Koreans in Their 30s and 40s)

  • 정재운;황진호
    • 디지털융복합연구
    • /
    • 제17권9호
    • /
    • pp.135-145
    • /
    • 2019
  • 장기불황으로 인해 한국 청년실업률이 수년간 10% 안팎의 높은 수준을 유지하고 있는 가운데, 주요 경제활동 인구인 30~40대의 실업률이 최근 상승세를 보이고 있다. 정부의 기존 청년 중심의 고용촉진 및 실업복지 정책을 30~40대를 포함한 다양한 연령층으로 확대 강화하기 위해서는 각 연령층에 대한 실업예측 모형 연구가 필요하다. 이에 본 연구에서는 한국 통계청 실업률 자료와 구글 검색어를 활용하여 한국 30~40대 연령층에 특화된 실업률 예측모형을 개발하고자 하였다. 실업률 자료와 계절성 자기회귀누적이동평균 모형을 활용하여 기초모형(Model 1)을 다중선형회귀 모형으로 추정하였으며, 개선된 모형을 구하고자 구글 검색 질의어 정보를 Model 1에 추가 활용하였다(Model 2). 그 결과, 30대와 40대 연령층 모두 구글 검색 질의어를 추가 활용한 Model 2가 Model 1보다 우수한 예측력을 보였다. 이는 웹 검색 질의어가 여전히 한국의 실업률 예측모형을 개선하는 데 유의미함을 의미한다. 본 연구는 실질적인 활용을 위해 추가적인 연구가 필요하지만, 연령대별 실업률 예측 연구에 기여할 것으로 판단된다.

최적 염소 소독 모형의 개발 및 파라미터 연구 (Development of Optimal Chlorination Model and Parameter Studies)

  • 김준현;안수영;박민우
    • 환경영향평가
    • /
    • 제29권6호
    • /
    • pp.403-413
    • /
    • 2020
  • 최적의 염소 소독 전략을 구축하기 위해 8개의 연립 준선형 편미분방정식으로 구성된 수학적 모형이 제안되었다. 다차원 수치 프로그램을 개발하기 위해 상류 가중 유한요소법을 사용하였다. 프로그램은 세 가지 유형의 반응기에서 측정된 농도에 대해 검증되었다. 16개의 실험 결과에 대해 경계 조건 및 반응 속도를 보정하여 측정된 값을 재생시켰다. 모델링 결과로부터 8개의 반응 속도계수가 추정되었다. 반응 속도계수는 pH 및 온도로 표현되었다. 반응 속도계수를 추정하기 위해 수치 오차의 제곱의 합을 최소화하는 자동 최적 알고리즘의 프로그램을 개발하고 모형에 결합하였다. 최종 사용지에서 염소 및 오염물의 농도를 최소화하기 위해서는 정수장의 염소소독공정으로부터 최종 사용지까지의 수질 변화를 모형에 의해 예측하고 이를 기반으로 유입수 수질에 따라 염소소독공정을 운영하는 실시간 예측 제어 시스템이 필요하다. 본 모형을 이용하여 정수장에 이러한 시스템을 구축할 수 있을 것이다.

신경망 내 잔여 블록을 활용한 콕스 모델 개선: 자궁경부암 사망률 예측모형 연구 (Cox Model Improvement Using Residual Blocks in Neural Networks: A Study on the Predictive Model of Cervical Cancer Mortality)

  • 이낭경;김주영;탁지수;이형록;전현지;양지명;이승원
    • 정보처리학회 논문지
    • /
    • 제13권6호
    • /
    • pp.260-268
    • /
    • 2024
  • 자궁경부암은 전 세계적으로 여성에게 발생하는 암 중 네 번째로 흔한 암이며, 2020년 한 해 동안 60만 4천 건 이상의 신규 케이스가 보고되었고 이로 인한 사망자 수는 약 34만 1천 831명에 달했다. 콕스 회귀 모델은 암 연구에서 널리 채택되고 있는 주요 모델이지만, 비선형 연관성의 존재를 고려하면 선형 가정으로 인해 한계에 부딪힌다. 이러한 문제를 해결하기 위해, 본 논문에서는 ResNet의 잔여 학습 프레임워크를 활용하여 자궁경부암 사망률 예측의 정확성을 개선한 새로운 모델인 ResSurvNet을 제안한다. 이 모델은 본 연구에서 비교한 DNN, CPH, CoxLasso, Cox Gradient Boost, RSF 모델들을 능가하는 정확도를 보여주었기에 이러한 우수한 예측 성능은 자궁경부암 환자 관리에 있어 조기 진단 및 치료 전략 수립에 기여할 수 있고 임상적으로 적용할 때 큰 가치가 있음을 입증하며, 생존 분석 분야에서도 의미 있는 진전을 나타낸다.

Optimizing Clustering and Predictive Modelling for 3-D Road Network Analysis Using Explainable AI

  • Rotsnarani Sethy;Soumya Ranjan Mahanta;Mrutyunjaya Panda
    • International Journal of Computer Science & Network Security
    • /
    • 제24권9호
    • /
    • pp.30-40
    • /
    • 2024
  • Building an accurate 3-D spatial road network model has become an active area of research now-a-days that profess to be a new paradigm in developing Smart roads and intelligent transportation system (ITS) which will help the public and private road impresario for better road mobility and eco-routing so that better road traffic, less carbon emission and road safety may be ensured. Dealing with such a large scale 3-D road network data poses challenges in getting accurate elevation information of a road network to better estimate the CO2 emission and accurate routing for the vehicles in Internet of Vehicle (IoV) scenario. Clustering and regression techniques are found suitable in discovering the missing elevation information in 3-D spatial road network dataset for some points in the road network which is envisaged of helping the public a better eco-routing experience. Further, recently Explainable Artificial Intelligence (xAI) draws attention of the researchers to better interprete, transparent and comprehensible, thus enabling to design efficient choice based models choices depending upon users requirements. The 3-D road network dataset, comprising of spatial attributes (longitude, latitude, altitude) of North Jutland, Denmark, collected from publicly available UCI repositories is preprocessed through feature engineering and scaling to ensure optimal accuracy for clustering and regression tasks. K-Means clustering and regression using Support Vector Machine (SVM) with radial basis function (RBF) kernel are employed for 3-D road network analysis. Silhouette scores and number of clusters are chosen for measuring cluster quality whereas error metric such as MAE ( Mean Absolute Error) and RMSE (Root Mean Square Error) are considered for evaluating the regression method. To have better interpretability of the Clustering and regression models, SHAP (Shapley Additive Explanations), a powerful xAI technique is employed in this research. From extensive experiments , it is observed that SHAP analysis validated the importance of latitude and altitude in predicting longitude, particularly in the four-cluster setup, providing critical insights into model behavior and feature contributions SHAP analysis validated the importance of latitude and altitude in predicting longitude, particularly in the four-cluster setup, providing critical insights into model behavior and feature contributions with an accuracy of 97.22% and strong performance metrics across all classes having MAE of 0.0346, and MSE of 0.0018. On the other hand, the ten-cluster setup, while faster in SHAP analysis, presented challenges in interpretability due to increased clustering complexity. Hence, K-Means clustering with K=4 and SVM hybrid models demonstrated superior performance and interpretability, highlighting the importance of careful cluster selection to balance model complexity and predictive accuracy.

Kinetic Behavior of Escherichia coli on Various Cheeses under Constant and Dynamic Temperature

  • Kim, K.;Lee, H.;Gwak, E.;Yoon, Y.
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제27권7호
    • /
    • pp.1013-1018
    • /
    • 2014
  • In this study, we developed kinetic models to predict the growth of pathogenic Escherichia coli on cheeses during storage at constant and changing temperatures. A five-strain mixture of pathogenic E. coli was inoculated onto natural cheeses (Brie and Camembert) and processed cheeses (sliced Mozzarella and sliced Cheddar) at 3 to 4 log CFU/g. The inoculated cheeses were stored at 4, 10, 15, 25, and $30^{\circ}C$ for 1 to 320 h, with a different storage time being used for each temperature. Total bacteria and E. coli cells were enumerated on tryptic soy agar and MacConkey sorbitol agar, respectively. E. coli growth data were fitted to the Baranyi model to calculate the maximum specific growth rate (${\mu}_{max}$; log CFU/g/h), lag phase duration (LPD; h), lower asymptote (log CFU/g), and upper asymptote (log CFU/g). The kinetic parameters were then analyzed as a function of storage temperature, using the square root model, polynomial equation, and linear equation. A dynamic model was also developed for varying temperature. The model performance was evaluated against observed data, and the root mean square error (RMSE) was calculated. At $4^{\circ}C$, E. coli cell growth was not observed on any cheese. However, E. coli growth was observed at $10{\circ}C$ to $30^{\circ}C$C with a ${\mu}_{max}$ of 0.01 to 1.03 log CFU/g/h, depending on the cheese. The ${\mu}_{max}$ values increased as temperature increased, while LPD values decreased, and ${\mu}_{max}$ and LPD values were different among the four types of cheese. The developed models showed adequate performance (RMSE = 0.176-0.337), indicating that these models should be useful for describing the growth kinetics of E. coli on various cheeses.

유기화합물의 승화열 예측을 위한 QSPR분석 (QSPR analysis for predicting heat of sublimation of organic compounds)

  • 박유선;이종혁;박한웅;이성광
    • 분석과학
    • /
    • 제28권3호
    • /
    • pp.187-195
    • /
    • 2015
  • 승화열은 대기 유기 오염물질의 확산에 관련된 환경적인 문제를 해결하거나, 위험한 화학 물질의 위해성을 평가하는 데에 중요한 변수이다. 하지만 실험적으로 승화열을 측정하려면 많은 시간과 비용이 소모 되며, 그 실험자체도 복잡하고 위험하다. 따라서 본 연구에서는 유기화합물의 승화열을 간단하게 예측하는 모델을 개발하기 위하여 정량적 구조-물성 상관관계 연구를 이용하였다. 군기반 전진선택방법을 적용하여 다중선형회귀방법과 서포트 벡터 머신과 같은 학습방법에 적합한 분자표현자들을 선택하도록 하였다. 개별 모델과 복합모델들은 부스트래핑 방법과 y-임의추출법에 의해 내부검증이 되었다. 외부 테스트 데이터의 예측 성능은 적용범위를 고려하므로서 개선되었다. 다중선형회귀모델에 따르면, 승화열은 분자간의 분산력, 수소결합, 정전기적 상호작용, 쌍극자-쌍극자 상호작용과 관련이 있는 것을 나타낼 수 있었다.

A Real-Time Embedded Speech Recognition System

  • Nam, Sang-Yep;Lee, Chun-Woo;Lee, Sang-Won;Park, In-Jung
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 ITC-CSCC -1
    • /
    • pp.690-693
    • /
    • 2002
  • According to the growth of communication biz, embedded market rapidly developing in domestic and overseas. Embedded system can be used in various way such as wire and wireless communication equipment or information products. There are lots of developing performance applying speech recognition to embedded system, for instance, PDA, PCS, CDMA-2000 or IMT-2000. This study implement minimum memory of speech recognition engine and DB for apply real time embedded system. The implement measure of speech recognition equipment to fit on embedded system is like following. At first, DC element is removed from Input voice and then a compensation of high frequency was achieved by pre-emphasis with coefficients value, 0.97 and constitute division data as same size as 256 sample by lapped shift method. Through by Levinson - Durbin Algorithm, these data can get linear predictive coefficient and again, using Cepstrum - Transformer attain feature vectors. During HMM training, We used Baum-Welch reestimation Algorithm for each words training and can get the recognition result from executed likelihood method on each words. The used speech data is using 40 speech command data and 10 digits extracted form each 15 of male and female speaker spoken menu control command of Embedded system. Since, in many times, ARM CPU is adopted in embedded system, it's peformed porting the speech recognition engine on ARM core evaluation board. And do the recognition test with select set 1 and set 3 parameter that has good recognition rate on commander and no digit after the several tests using by 5 proposal recognition parameter sets. The recognition engine of recognition rate shows 95%, speech commander recognizer shows 96% and digits recognizer shows 94%.

  • PDF

회귀분석을 통한 토양 내 Pyr 농도로부터 BaP와 총 PAH의 예측기법 (Prediction of BaP and Total PAH in Soil from Pyr Concentration using Regression Analysis)

  • 이우범;김종오
    • 대한환경공학회지
    • /
    • 제39권3호
    • /
    • pp.118-123
    • /
    • 2017
  • 본 연구에서는 기존에 발표된 PAH 데이터 세트를 이용하여 BaP와 총 PAH의 예측을 위하여 통계적 분석을 시행하였다. 선형회귀 및 다중회귀 분석 결과, Pyr과 BaP ($R^2=0.94$), Pyr과 ${\Sigma}PAH$ ($R^2=0.99$) 사이에 매우 높은 상관성을 보여주었다. 개발된 회귀식을 이용하여 다른 PAH 측정값과 비교하기 위하여 검증과 적용 연구를 시도한 경우, 예측한 PAH 농도는 서로 유사하였다. 통계적 분석을 통해서 Pyr과 BaP가 서로 상관성이 높은 것으로 조사되어 이들 화합물 모두 연소기원 형태로 분류 할 수 있을 것으로 여겨진다. 비록 BaP나 ${\Sigma}PAH$ 예측에 어느 정도가 한계가 있을 수 있으나 개발된 회귀식을 이용할 경우 추가적인 측정 없이 PAH를 빠르게 대략적인 값을 계산 할 수 있는 장점이 있다.

유한요소해석을 통한 다층지반에서의 버킷기초 수직지지력 산정 (Evaluation of Vertical Bearing Capacity of Bucket Foundations in Layered Soil by Using Finite Element Analysis)

  • 박정선;박두희;윤세웅;만도카일 사이둘라
    • 한국지반공학회논문집
    • /
    • 제32권7호
    • /
    • pp.35-45
    • /
    • 2016
  • 해양구조물을 지지하기 위해 사용되는 버킷기초를 설계하는데 있어 수직지지력을 정확하게 예측하는 것은 중요하다. 사질토 또는 점성토 지반에 설치된 버킷기초의 수직지지력에 대한 실험적, 이론적 연구가 많이 수행되었지만, 실제와 같은 다층지반에서의 산정방법은 명확하게 제시되지 않았다. 본 연구에서는 2차원 축대칭 유한요소해석을 수행하여 점성토 지반 위의 사질토 층에 설치된 버킷기초의 수직지지력을 산정하였다. 사질토의 마찰각, 점성토의 비배수전단강도, 사질토 층 두께, 기초의 장경비가 다양한 조건에 대하여 매개변수 해석을 수행하였으며, 이들의 영향에 따른 지반의 파괴 메커니즘 차이를 분석하였다. 최종적으로 수치해석을 수행하여 얻어진 극한지지력의 결과를 바탕으로 버킷기초 설계에 사용할 수 있는 지지력 산정 차트를 제시하였다. 또한 설계차트에 직접 제시되어 있지 않은 조건에 대해서는 차트에 제시된 값에 선형보간법을 적용하여 버킷기초의 선단지지력을 예측할 수 있는 것으로 나타났다.

탄템 GMA 용접공정의 표면비드높이 예측을 위한 STACO모델 개발에 관한 연구 (A Study on Development of STACO Model to Predict Bead Height in Tandem GMA Welding Process)

  • 이종표;김일수;박민호;박철균;강봉용;심지연
    • Journal of Welding and Joining
    • /
    • 제32권6호
    • /
    • pp.8-13
    • /
    • 2014
  • One of the main challenges of the automatic arc welding process which has been widely used in various constructions such as steel structures, bridges, autos, motorcycles, construction machinery, ships, offshore structures, pressure vessels, and pipelines is to create specific welding knowledge and techniques with high quality and productivity of the production-based industry. Commercially available automated arc welding systems use simple control techniques that focus on linear system models with a small subset of the larger set of welding parameters, thereby limiting the number of applications that can be automated. However, the correlations of welding parameters and bead geometry as welding quality have mostly been linked by a trial and error method to adjust the welding parameters. In addition, the systematic correlation between these parameters have not been identified yet. To solve such problems, a new or modified models to determine the welding parameters for tandem GMA (Gas Metal Arc) welding process is required. In this study, A new predictive model called STACO model, has been proposed. Based on the experimental results, STACO model was developed with the help of a standard statistical package program, MINITAB software and MATLAB software. Cross-comparative analysis has been applied to verify the reliability of the developed model.