• Title/Summary/Keyword: 다중선형회귀

Search Result 416, Processing Time 0.033 seconds

Calorie Burn Estimation Algorithm from a Accelerometer using Multiple Regression Analysis (다중회귀분석을 이용한 3축 가속도 센서기반 활동량 추정 방법)

  • Choe, Sun-Taag;Lee, Kyu Feel;Kim, Jun Ho;Cho, We-Duke
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2016.04a
    • /
    • pp.953-955
    • /
    • 2016
  • 본 논문은 다중 회귀 분석을 이용하여 3축 가속도센서기반의 활동량을 추정하는 방법을 제안한다. 본 연구를 위해 총 59명의 피 실험자가 자체 제작한 활동량계를 착용한 뒤 트레드밀에서 일정한 속도로 걷는/뛰는 동작을 수행한 신호를 수집하였다. 수집한 3축 가속도 신호의 에너지 값에서 사전에 정의한 특징들을 산출한다. 그 다음 각 특징별로 선형, 지수, 로지스틱 회귀 분석을 적용하여 적합도가 높은 특징을 선정한다. 마지막으로 산출된 회귀식들을 사용하여 다중 회귀 분석 방법으로 활동량을 추정한다. 호흡가스 대사 분석기(K4B2)를 착용한 뒤 동일한 방법으로 실험을 수행 하고 제안한 방법과 정확도를 비교한 결과 제안한 방법의 정확도는 86.38 %로 산출되었다. 이는 기존의 Kim 외 3인의 연구결과[1]보다 2.70 %, Actical의 정확도보다 4.31 % 높은 수치이다.

A study on Prediction of Simulator Sickness in Driving Simulation (자동차 모의운전환경에서 Simulator Sickness의 예측에 관한 연구)

  • 김도희
    • Proceedings of the Korea Society for Simulation Conference
    • /
    • 1998.10a
    • /
    • pp.170-173
    • /
    • 1998
  • 본 연구에서는 시뮬레이터나 그와 유사한 가상현실환경(Virtual Reality Environment ; VRE)에서 일어날 수 있는 Simulator Sickness가 어떤 사람들에게 쉽게 발생하는지를 예측하기 위하여 다중선형회귀(Multiple linear regression) 방정식으로 예측회귀모형을 제시하였다. 이 회귀모형에서의 종속변수는 김도희 외(1998)에 의해 개발된 RSSQ의 종합점수이고, 독립변수는 실제운전경력에 1을 더한 값에 나이를 곱한 값, 과거 멀미를 경험한 정도, 1주일 평균 동화상 시간, 현재의 건강상태로 되어져 있다. 이 회귀모형의 R2값은 약 0.52로 Kolasinski(1996)의 모델보다 설명력이 18% 증가하였고, 부수적인 별도의 실험을 하지 않고도 간단한 개인 신상에 관한 간단한 자료만으로도 훨씬 좋은 결과를 예측할 수 있게 되었다. 따라서 시뮬레이터나 가상현실에서 일어나는 Simulator Sickness가 어떠한 사람에게 걸리기가 쉬운지를 쉽게 예측할 수 있게 되었고, 이러한 사람들에게는 시뮬레이터나 가상현실의 이용을 자제시키거나 주의를 주어 특별관리 함으로써 시뮬레이터나 가상현실을 운영하는데 많은 도움을 줄 수 있을 것이다.

  • PDF

Effects of Multicollinearity in Logit Model (로짓모형에 있어서 다중공선성의 영향에 관한 연구)

  • Ryu, Si-Kyun
    • Journal of Korean Society of Transportation
    • /
    • v.26 no.1
    • /
    • pp.113-126
    • /
    • 2008
  • This research aims to explore the effects of multicollinearity on the reliability and goodness of fit of logit model. To investigate the effects of multicollinearity on the multinominal logit model, numerical experiments are performed. The exploratory variables(attributes of utility functions) which have a certain degree of correlations from (rho=) 0.0 to (rho=) 0.9 are generated and rho-squares and t-statistics which are the indices of goodness of fit and reliability of logit model are traced. From the well designed numerical experiments, following findings are validated : 1) When a new exploratory variable is added, some of rho-squares increase while the others decrease. 2) The higher relations between generic variables lead a logit model worse with respect to goodness of fit. 3) Multicollinearity has a tendency to produce over-evaluated parameters. 4) The reliability of the estimated parameter has a tendency to decrease when the correlations between attributes are high. These results suggest that we have to examine the existence of multicollinearity and perform the proper treatments to diminish multicollinearity when we develop logit model.

Development of Naïve-Bayes classification and multiple linear regression model to predict agricultural reservoir storage rate based on weather forecast data (기상예보자료 기반의 농업용저수지 저수율 전망을 위한 나이브 베이즈 분류 및 다중선형 회귀모형 개발)

  • Kim, Jin Uk;Jung, Chung Gil;Lee, Ji Wan;Kim, Seong Joon
    • Journal of Korea Water Resources Association
    • /
    • v.51 no.10
    • /
    • pp.839-852
    • /
    • 2018
  • The purpose of this study is to predict monthly agricultural reservoir storage by developing weather data-based Multiple Linear Regression Model (MLRM) with precipitation, maximum temperature, minimum temperature, average temperature, and average wind speed. Using Naïve-Bayes classification, total 1,559 nationwide reservoirs were classified into 30 clusters based on geomorphological specification (effective storage volume, irrigation area, watershed area, latitude, longitude and frequency of drought). For each cluster, the monthly MLRM was derived using 13 years (2002~2014) meteorological data by KMA (Korea Meteorological Administration) and reservoir storage rate data by KRC (Korea Rural Community). The MLRM for reservoir storage rate showed the determination coefficient ($R^2$) of 0.76, Nash-Sutcliffe efficiency (NSE) of 0.73, and root mean square error (RMSE) of 8.33% respectively. The MLRM was evaluated for 2 years (2015~2016) using 3 months weather forecast data of GloSea5 (GS5) by KMA. The Reservoir Drought Index (RDI) that was represented by present and normal year reservoir storage rate showed that the ROC (Receiver Operating Characteristics) average hit rate was 0.80 using observed data and 0.73 using GS5 data in the MLRM. Using the results of this study, future reservoir storage rates can be predicted and used as decision-making data on stable future agricultural water supply.

Multiple linear regression model-based voltage imbalance estimation for high-power series battery pack (다중선형회귀모델 기반 고출력 직렬 배터리 팩의 전압 불균형 추정)

  • Kim, Seung-Woo;Lee, Pyeong-Yeon;Han, Dong-Ho;Kim, Jong-hoon
    • Journal of IKEEE
    • /
    • v.23 no.1
    • /
    • pp.1-8
    • /
    • 2019
  • In this paper, the electrical characteristics with various C-rates are tested with a high power series battery pack comprised of 18650 cylindrical nickel cobalt aluminum(NCA) lithium-ion battery. The electrical characteristics of discharge capacity test with 14S1P battery pack and electric vehicle (EV) cycle test with 4S1P battery pack are compared and analyzed by the various of C-rates. Multiple linear regression is used to estimate voltage imbalance of 14S1P and 4S1P battery packs with various C-rates based on experimental data. The estimation accuracy is evaluated by root mean square error(RMSE) to validate multiple linear regression. The result of this paper is contributed that to use for estimating the voltage imbalance of discharge capacity test with 14S1P battery pack using multiple linear regression better than to use the voltage imbalance of EV cycle with 4S1P battery pack.

Abnormal air temperature prediction of South Korea using multiple linear regression model and Terra/Aqua MODIS LST (다중 선형회귀모형과 Terra/Aqua MODIS 지표면온도를 활용한 우리나라 이상기온 예측)

  • Chung, Jeehun;Lee, Yonggwan;Lee, Jiwan;Kim, Seongjoon
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2019.05a
    • /
    • pp.139-139
    • /
    • 2019
  • 지구 온난화 및 기후변화로 인해 비롯된 전 지구적인 기온 상승은 가뭄, 폭염, 한파 등의 이상 기후 현상을 야기하여 인류의 생존을 위협하는 환경 문제로 대두되고 있다. 이와 같은 기후변화 및 이상기후 현상을 이해하고 파악하기 위해서는 정확하고 상세한 기온 정보가 필수적이다. 우리나라는 기상청에서 전국 590개소의 기상관측장비로 기온 정보를 생산하고 있지만 산림이 약 70%를 차지하는 복잡한 지형을 가지고 있어 지상관측밀도의 공간적 제약이 발생해 상세하고 균일한 기온 정보 생산에 제약이 있다. 이러한 단점을 극복하기 위해 본 연구에서는 위성으로 측정한 지표면 온도(Land Surface Temperature, LST) 자료와 다중선형회귀모형(Multiple Linear Regression Model)을 활용해 두 자료간의 상관관계를 파악하고 지상기온을 예측하고자 한다. 위성자료로 Terra 및 Aqua MODIS 위성의 1000m 공간해상도를 가진 일별 LST자료 MOD11A1, MYD11A1의 Daytime 자료를 각각 2000년부터 2018년까지 총 19년의 기간에 대해 구축하였으며, 전국 92개의 기상청 관측소로부터 최고, 최저 기온 자료를 동 기간에 대해 구축하였다. LST를 이용한 이상기온 예측 알고리즘은 python을 이용해 구현하였으며 예측 결과는 실제 기온 자료를 통해 검증하였다. 또한, 예측 기온 자료의 연대별, 순별(상, 중, 하순) 분석을 실시하고, 2018년 극한 폭염 및 한파(2017년 12월~2018년 2월)의 예측 가능성을 검토하여 연구 결과에 대한 다양한 활용방안을 제시하고자 한다.

  • PDF

A Study on Estimation of Soil Moisture Multiple Linear Regression Model Using Conditional Merging and MODIS Land Surface Temperature Data (조건부 합성기법과 MODIS LST를 활용한 토양수분 다중선형 회귀모형 산정 연구)

  • Jung, Chung Gil;Lee, Ji Wan;Kim, Da Rae;Kim, Se Hun;Kim, Seong Joon
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.103-104
    • /
    • 2017
  • 본 연구에서는 다중회귀분석모형(MLRM)과 MODIS (MODerate resolution Imaging Spectroradiometer) LST (Land Surface Temperature) 자료를 이용하여 전국 공간토양수분을 산정하였다. 공간토양수분을 산정하기 위한 과정은 크게 두가지로 구분된다. 첫 번째로 기존의 MODIS LST 자료를 조건부 합성 보정기법을 적용하여 실측 LST 자료와 비교하여 위성 LST 자료가 갖고 있는 오차를 보정하였다. 그 결과, 조건부 합성 보정기법을 적용하기전 전국 71개 지상 관측지점에서 관측한 실측 LST와 MODIS LST의 R2는 전체 평균 0.70으로 어는정도 유의성 있는 상관관계를 나타냈으나 조건부 합성 보정기법을 적용한 후 실측 LST와 MODIS LST의 R2는 전체 평균 0.92로 상당히 크게 향상됨을 알 수 있었다. 두 번째로 보정된 MODIS LST를 이용하여 다중회귀분석 모형을 개발하고 토양수분을 예측하는 단계로 입력자료로 위성영상 자료와 관측자료를 융합하여 사용하였다. 위성영상 자료로는 보정된 MODIS LST와 MODIS NDV를 구축하였고 일단위 강수량 및 일조시간의 기상자료는 기상청으로부터 전국 68개 지점에 대해 구축하여 IDW 공간보간기법을 이용한 공간자료로 구축하였다. 토양수분 결과를 비교하기 위한 관측 토양수분은 자동농업기상관측(Automated Agriculture Observing System, AAOS)지점에서 2013년 1월부터 2015년 12월까지의 실측 일단위 토양수분 자료를 구축하여 사용하였다. 다중회귀분석 모형은 각각의 입력자료를 독립인자로서 조합하여 12개의 시나리오를 만들었다. 시공간적 경향을 고려하기 위하여 계절별, 토양 토성(soil texture)를 구분하여 회귀분석을 실시하였다. 관측 토양수분과 모의 토양수분을 비교한 결과 $R^2$가 0.80 (철원), 0.90 (춘천), 0.80 (수원), 0.63 (서산), 0.77 (청주), 0.82 (전주), 0.52 (순천), 0.63 (진주), 0.99 (보성)로 높은 상관성을 보였다. 본 연구에서는 토양수분을 예측하기 위한 인자 중 가장 민간함 LST를 보정하지 않는 토양수분 예측 방법은 상당한 오차를 포함하게 되어 실측 토양수분 결과와 크게 차이가 나타남을 보여주었다.

  • PDF

Fertility Evaluation of Upland Fields by Combination of Landscape and Soil Survey Data with Chemical Properties in Soil (토양 화학성과 지형 및 토양 조사자료를 활용한 밭 토양의 비옥도 평가)

  • Hong, Soon-Dal;Kim, Jai-Joung;Min, Kyong-Beum;Kang, Bo-Goo;Kim, Hyun-Ju
    • Korean Journal of Soil Science and Fertilizer
    • /
    • v.33 no.4
    • /
    • pp.221-233
    • /
    • 2000
  • Evaluation method of soil fertility by application of geographic information system (GIS) which includes landscape characteristics and soil map data was investigated from productivities of red pepper and tobacco grown on the fields with no fertilization. Total 131 fields experiments, 64 fields of red pepper and 67 fields of tobacco were conducted from 22 and 23 fields for red pepper and tobacco, respectively, located at Cheangweon and Eumseong counties in 1996, from 20 and 25 fields at Boeun and Goesan counties in 1997, and 22 and 19 fields at Jincheon and Chungju counties in 1998. All the experimental sites were selected on the basis of wide range of distribution in landscape and soil attributes. Dry weights and nutrients (N, P and K) uptakes by red pepper plant and tobacco leaves were considered as basic fertility of the soil (BFS). The BFS was estimated by twenty-five independent variables including 13 chemical properties and 12 GIS data. Twenty-five independent variables were classified by two groups, 15 quantitative variables and 10 qualitative variables, and were analyzed by multiple linear regression (MLR) of REG and GLM models of SAS. Dry weight of red pepper (DWRP) and dry weight of tobacco leaves (DWTL) every year showed high variations by five times in difference plots with minimum yield and maximum yield indicating the diverse soil fertility among the experimental fields. Evaluation for the BFS by the MLR including independent variables was better than that by simple regression showing gradual improvement by adding chemical properties, quantitative variables, and qualitative variables of the GIS. However the evaluation for the BFS by the MLR showed the better result for tobacco than red pepper. For example the variability in the DWTL by MLR was explained 34.2% by only chemical properties, 35.0% by adding quantitative variables, and 72.5% by adding both the quantitative and qualitative variables of the GIS compared with 21.7% by simple regression with $NO_3-N$ content in soil. Consequently, it is assumed that this approach by the MLR including both the quantitative and qualitative variables was available as an evaluation model of soil fertility for upland field.

  • PDF

Analysis of Accident Characteristics and Development of Accident Models in the Signalized Intersections of Cheongju and Cheongwon (지방부 신호교차로 사고특성분석 및 모형개발 (청주.청원을 중심으로))

  • Park, Byung-Ho;Yoo, Doo-Seon;Yang, Jeong-Mo;Lee, Young-Min
    • Journal of Korean Society of Transportation
    • /
    • v.26 no.2
    • /
    • pp.35-46
    • /
    • 2008
  • The purposes of this study are to analyze the characteristics and to develop the models of traffic accidents. In pursuing the above, this study gives particular attentions to developing the models(multiple linear, poisson and negative binomial regression) using the data of Cheongju and Cheongwon signalized intersections. The main results analyzed are as follows. First, the accident characteristics of rural area were defined by factor. Second, 4 accident models which are all statistically significant were developed. Finally, such the variables as $X_2$ and $X_{11}$ were evaluated to be specific variables which reflect the characteristics of rural area.

Hadi와 Simonoff의 다중이상점 식별방법의 개선과 여러 다중이상점 식별방법의 효율성 비교

  • 유종영;김현철
    • Communications for Statistical Applications and Methods
    • /
    • v.3 no.3
    • /
    • pp.11-23
    • /
    • 1996
  • 본 연구에서는 선형회귀분석에서 Hadi와 Simonoff의 다중이상점 식별방법을 수정하여 새로운 알고리즘을 제시하였다. Hadi와 Simonoff의 알고리즘 첫 단계에서 이상점일 가능성이 없는 점들의 집합을 추출할 때 가장효과와 편승효과에 영향을 받을 수 있음으로, 이 첫 단계를 수정하였다. 우리는 잔차가 일정한 분산을 갖는 정규분포에 다르다는 가정하에서 잔차의 신뢰구간을 생각하고, 이 구간안에서 잔차의 MAD가 최소인 새로운 모형을 탐색하고, 이를 이상점일 가능성이 없는 점들의 집합을 추출하는데 일용하는 새로운 알로리즘을 제시하였다. 제시된 방법은 실제자료에서 다른 방법에 비해 효율적으로 이상점을 식별할 수 있었다.

  • PDF