• 제목/요약/키워드: Multiple regression model

검색결과 2,523건 처리시간 0.029초

Confounder를 고려한 3단계의 logistic regression model을 통한 노인인구에 있어서의 치주질환과 뇌경색 경험 유무와의 상관관계에 대한 연구 (Relationship between periodontal disease and stroke history in the geriatric population - Using logistic regression model with 3-step adjustment considering effect of confounder)

  • 이효정
    • 대한치과의사협회지
    • /
    • 제44권10호통권449호
    • /
    • pp.658-670
    • /
    • 2006
  • 1980년대 후반기부터 치주질환과 뇌경색(ischemic stroke)자료의 연관성을 모색하는 시도가 있어왔다. 이번 연구의 목적은 치주질환과 뇌경색 유무와의 어떤 관계가 있는지를 60세 이상의 노인을 대상으로 조사, 통계 분석하였다. 자료는 미국의 총 국민조사 격인 The Third Nation Health and Nutrition Examination Survey (NHANES III)를 이용하였다. 이번 연구에서 unadjusted logistic model 통계법을 이용하여 치아 상실수와 뇌경색 경험이 통계학적으로 유의한 수치의 상관성이 있음을 알게 되었다. 또한 나이와 흡연유무를 고려, 조정한 후 multiple logistic model 통계법으로 잔존치아가 적을수록 더욱 뇌경색에 걸릴 확률이 높음을 보였다. 그러나 두 질병에 동시에 선택된 중요한 위험인자 (risk factor)를 모두 고려, 조정 한 후에는 통계학적인 유의성을 찾지 못했다. 치은퇴축, 치주낭 깊이, 치석, 탐침시 출혈과 뇌경색 경험은 각각의 비교법에서 약간의 상관성을 보이나, 모든 통계법을 통해 일괄된 결과를 얻을 수는 없었다.

  • PDF

기계 학습을 이용한 인공지지체 외형 불량 예측 모델에 관한 연구 (A Study on Prediction Model of Scaffold Appearance Defect Using Machine Learning)

  • 이송연;허용정
    • 반도체디스플레이기술학회지
    • /
    • 제19권2호
    • /
    • pp.26-30
    • /
    • 2020
  • In this paper, we studied the problem if the experiment number occurring in order to identify defect in scaffold. We need to change each of the 5 print factor to predict defect when printing disk type scaffold using FDM 3d printer. So then the number of scaffold print will be more than 100,000 times. This experiment number is difficult to perform in the field. In order to solve this problem, we have produced a prediction model based on machine learning multiple linear regression using print conditions and defect scaffold data for print conditions. The prediction model produced was verified through experiments. The verification confirmed that the error was less than 0.5 %. We have confirmed that satisfied within the target margin of error 5 %.

A Generation and Accuracy Evaluation of Common Metadata Prediction Model Using Public Bicycle Data and Imputation Method

  • Kim, Jong-Chan;Jung, Se-Hoon
    • 한국멀티미디어학회논문지
    • /
    • 제25권2호
    • /
    • pp.287-296
    • /
    • 2022
  • Today, air pollution is becoming a severe issue worldwide and various policies are being implemented to solve environmental pollution. In major cities, public bicycles are installed and operated to reduce pollution and solve transportation problems, and operational information is collected in real time. However, research using public bicycle operation information data has not been processed. This study uses the daily weather data of Korea Meteorological Agency and real-time air pollution data of Korea Environment Corporation to predict the amount of daily rental bicycles. Cross- validation, principal component analysis and multiple regression analysis were used to determine the independent variables of the predictive model. Then, the study selected the elements that satisfy the significance level, constructed a model, predicted the amount of daily rental bicycles, and measured the accuracy.

GA-optimized Support Vector Regression for an Improved Emotional State Estimation Model

  • Ahn, Hyunchul;Kim, Seongjin;Kim, Jae Kyeong
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제8권6호
    • /
    • pp.2056-2069
    • /
    • 2014
  • In order to implement interactive and personalized Web services properly, it is necessary to understand the tangible and intangible responses of the users and to recognize their emotional states. Recently, some studies have attempted to build emotional state estimation models based on facial expressions. Most of these studies have applied multiple regression analysis (MRA), artificial neural network (ANN), and support vector regression (SVR) as the prediction algorithm, but the prediction accuracies have been relatively low. In order to improve the prediction performance of the emotion prediction model, we propose a novel SVR model that is optimized using a genetic algorithm (GA). Our proposed algorithm-GASVR-is designed to optimize the kernel parameters and the feature subsets of SVRs in order to predict the levels of two aspects-valence and arousal-of the emotions of the users. In order to validate the usefulness of GASVR, we collected a real-world data set of facial responses and emotional states via a survey. We applied GASVR and other algorithms including MRA, ANN, and conventional SVR to the data set. Finally, we found that GASVR outperformed all of the comparative algorithms in the prediction of the valence and arousal levels.

지식에 관한 간호결과도구의 타당성 조사 (Validation of Nursing Care Sensitive Outcomes related to Knowledge)

  • 이은주
    • 대한간호학회지
    • /
    • 제33권5호
    • /
    • pp.625-632
    • /
    • 2003
  • Purpose: The purpose of this study was to assess the importance and sensitivity to nursing interventions of four nursing sensitive nursing outcomes selected from the Nursing Outcomes Classification (NOC). Outcomes for this study were 'Knowledge: Diet', 'Knowledge: Disease Process', 'Knowledge: Energy Conservation', and 'Knowledge: Health Behaviors'. Method: Data were collected from 183 nurses working in 2 university hospitals. Fehring method was used to estimate outcome and indicators' content and sensitivity validity. Multiple and stepwise regression were used to evaluate relationships between each outcome and its indicators. Result: Results confirmed the importance and nursing sensitivity of outcomes and their indicators. Key indicators of each outcomes were found by multiple regression. 'Knowledge: Diet' was suggested for adding new indicators because the variance explained by indicators was relatively low. Not all of the indicators selected for stepwise regression model were rated for highly in Fehring method. The R² statistics of the stepwise regression models were between 18 and 63% in importance by selected indicators and between 34 and 68% in contribution by selected indicators. Conclusion: This study refined what outcomes and indicators will be useful in clinical practice. Further research will be required for the revision of outcome and indicators of NOC. However, this study refined what outcomes and indicators will be useful in clinical practice.

기상 데이터와 미세먼지 데이터를 활용한 머신러닝 기반 미세먼지 예측 모형 (Machine learning-based Fine Dust Prediction Model using Meteorological data and Fine Dust data)

  • 김혜림;문태헌
    • 한국지리정보학회지
    • /
    • 제24권1호
    • /
    • pp.92-111
    • /
    • 2021
  • 미세먼지는 질병, 산업·경제에 부정적인 영향을 미치고 있어 국민들은 미세먼지에 대해 예민하게 반응하고 있다. 따라서 미세먼지의 발생을 예측할 수 있다면, 미리 대응책을 마련할 수 있어 생활과 경제에 도움이 될 수 있다. 미세먼지의 발생은 기상과 미세먼지 배출원의 밀집 정도에 영향을 받는다. 산업부문은 미세먼지 배출량이 가장 많으며, 그 중에 산단은 공장들이 미세먼지 배출원이 되어 더 많은 미세먼지를 배출하는 문제가 있다. 본 연구는 지방도시에서 노후산업단지가 있는 지역을 선정하여, 미세먼지를 일으키는 요인을 탐색하고, 미세먼지 발생을 예측할 수 있는 예측모형을 개발하고자 한다. 기상 데이터와 미세먼지 관련 데이터를 활용하였고, 다중회귀분석을 통해 미세먼지 발생에 영향을 미치는 변수를 추출하였다. 이를 토대로 머신러닝 회귀학습기 모형으로 학습하여 예측력이 높은 모형을 추출하였고, 검증용 데이터를 이용하여 예측 모형의 성능을 검증하였다. 그 결과, 예측력이 높은 모형은 선형회귀모형, 가우스 과정 회귀모형, 서포트 벡터 머신으로 나타났으며, 훈련용 데이터의 비율과 예측력은 비례하지 않은 것으로 나타났다. 또한 예측치와 실측치 차이의 평균치는 크지 않지만, 미세먼지 실측치가 높을 때, 예측력이 다소 떨어지는 것으로 나타났다. 본 연구의 결과는 지자체 데이터 허브를 통해 기상데이터와 관련 도시 빅데이터를 결합함으로써 보다 체계적이고 정밀한 미세먼지 예측 서비스로 개발이 가능할 것이며, 스마트산단의 발전을 촉진하는 계기가 될 것이다.

다중회귀분석을 이용한 미계측 유역의 갈수지수 산정에 관한 연구 (A study on estimation of lowflow indices in ungauged basin using multiple regression)

  • 임가균;정세진;김병식;채수권
    • 한국수자원학회논문집
    • /
    • 제53권12호
    • /
    • pp.1193-1201
    • /
    • 2020
  • 본 논문에서는 미계측 유역에 적용할 수 있는 갈수지수 산정 회귀모형을 개발하고자 하였다. 30개의 중권역 유역을 대상으로 국가수자원종합관리시스템에서 제공하는 장기유출자료를 이용하여 평균 갈수량과 평균 저수량, 지속기간별 빈도별 갈수지수를 산정하였으며 이를 유역특성인자 18개와 기상특성인자 3개와의 상관 분석을 통하여 최종적으로 유역면적(A), 유역 평균 표고(H), 유역 평균 경사(S), 수계밀도(D), 유출곡선지수(CN), 연증발산량(ET), 연강수량(P)을 선정하여 다중회귀분석을 수행하여 갈수지수 회귀모형을 개발하였다. 개발된 회귀모형을 평가하기 위하여 10개의 검증유역을 미계측 유역으로 간주하여 평균제곱근오차(RMSE) 와 평균절대오차(MAE)를 이용하여 정확도를 추정하였다. 또한 기존의 평균갈수량산정 회귀모형과의 비교를 통하여 본 논문에서 개발한 모형의 우수성을 검토하였다.

중차량중량분포를 이용한 차량하중모형 개발(II) - 연행차량 효과 분석 및 모형 개발 (Development of Vehicular Load Model using Heavy Truck Weight Distribution (II) - Multiple Truck Effects and Model Development)

  • 황의승
    • 대한토목학회논문집
    • /
    • 제29권3A호
    • /
    • pp.199-207
    • /
    • 2009
  • 본 논문에서는 신뢰도기반 도로교설계기준을 위한 새로운 활하중모형을 개발하였다. 합리적 하중모형과 함께 하중의 통계적 특성의 구축은 신뢰도기반 설계기준의 개발에 매우 중요하다. 이전 논문에서는 WIM 또는 BWIM시스템을 이용하여 수집된 국내 8개 지역의 자료를 분석하여 교량수명기간동안의 예상최대중량을 구하였다. 차종별 총중량의 확률분포는 상위 20%의 자료를 이용하여 극한분포(Gumbel분포)로 가정되었으며 이 확률분포를 사용하여 교량수명기간동안의 최대중량을 예측하였다. 이 논문에서는 교량상에 두 대 이상의 차량이 동시에 재하되는 경우를 분석하였다. 여러 자료를 이용하여 동시재하의 확률을 구하였으며 이에 따른 동시재하차량의 총중량을 이전 논문과 같은 확률분포를 이용하여 구하였다. 10-200 m까지의 지간별로 예측된 하중효과를 모사할 수 있는 공칭하중모형이 제안되었다. 제안된 하중모형은 기존의 하중모형 뿐만 아니라 국외의 여러 기준들과 비교분석되었다.

단층핵 구성물질의 함량과 전단강도 사이의 상관성 분석 (Relationship between Shear Strength and Component Content of Fault Cores)

  • 윤현석;문성우;서용석
    • 자원환경지질
    • /
    • 제52권1호
    • /
    • pp.65-79
    • /
    • 2019
  • 본 연구에서는 안산암질암, 화강암 및 퇴적암에서의 단층핵 시료에 대한 직접전단시험과 입도시험 결과를 이용하여 단순회귀분석과 다중회귀분석을 실시하고, 각력 및 점토 함량과 전단강도 사이의 상관성을 분석하였다. 수직응력(${\sigma}_n=54$, 108, 162 kPa) 및 암종별로 단순회귀분석을 수행한 결과, 전단강도는 각력의 함량과 비례 관계를 보이며, 점토의 함량과 반비례 관계를 보인다. 또한, 대부분의 암종에서 전단강도는 각력보다 점토와 높은 상관성을 보이며, 수직응력이 증가할수록 각력과 점토 함량의 변화에 큰 영향을 받는 것으로 분석되었다. 각력과 점토의 함량을 동시에 고려한 다중회귀분석에서 전단강도는 점토보다 각력 함량의 변화에 더 민감하게 반응하는 것으로 나타났다. 결과적으로, 단순회귀분석과 다중회귀분석으로부터 산정된 회귀모형들의 결정계수($R^2$)를 비교 분석함으로써 암종별로 가장 적합한 회귀 모형을 제안하였고, 제안된 모형들은 0.624~0.830의 높은 결정계수를 보인다.

Optimal fractions in terms of a prediction-oriented measure

  • Lee, Won-Woo
    • Journal of the Korean Statistical Society
    • /
    • 제22권2호
    • /
    • pp.209-217
    • /
    • 1993
  • The multicollinearity problem in a multiple linear regression model may present deleterious effects on predictions. Thus, its is desirable to consider the optimal fractions with respect to the unbiased estimate of the mean squares errors of the predicted values. Interstingly, the optimal fractions can be also illuminated by the Bayesian inerpretation of the general James-Stein estimators.

  • PDF