• 제목/요약/키워드: multiple linear regression analysis

검색결과 1,123건 처리시간 0.024초

GWR을 이용한 센서스 기반 도시범죄 특성 분석 및 예측모델 구축 (Construction of Urban Crime Prediction Model based on Census Using GWR)

  • 유영우;백태경
    • 한국지리정보학회지
    • /
    • 제20권4호
    • /
    • pp.65-76
    • /
    • 2017
  • 본 연구는 범죄와 환경과의 관계가 밀접한 영향을 미친다는 전제하에 범죄억제를 위한 정책수립 및 설계를 위한 대안마련의 사전단계로 범죄위험지역 분석과 요인, 공간적 특성이 반영된 예측모델을 제시하는 것을 주요 목적으로 수행하였다. 연구의 분석결과, H구 전체 지역에 범죄가 균등하게 분포하였을 경우와 대비하여 약 1/4 수준으로 범죄발생지역은 군집성을 나타내고 있었으며 주로 H 해수욕장 배후 상업지역에서 특정범죄(강간, 절도, 폭력)는 강한 핫스팟을 나타내었다. 결과적으로 독립변수와 종속변수의 공간적 상관관계를 고려하는 지리가중회귀모형을 이용함으로써 보다 효과적으로 적용할 수 있음을 알 수 있었다. 이러한 결과는 다중선형회귀 모형의 결과에서와 같이 연구지역 내 폐공가수가 종속변수와 단순히 부적의 관계를 가지는 것이 아니라, 지역에 따라 종속변수에 서로 다른 영향을 미치는 것을 알 수 있다.

한국 프로스포츠 선수들의 연봉에 대한 다변량적 분석 (A Multivariate Analysis of Korean Professional Players Salary)

  • 송종우
    • 응용통계연구
    • /
    • 제21권3호
    • /
    • pp.441-453
    • /
    • 2008
  • 프로스포츠 선수들의 연봉은 선수들의 개인 성적과 팀에 대한 기여도 등으로 결정된다는 가정하에 프로농구와 프로야구 선수들의 전년도 성적으로 다음해 연봉을 예측 분석하였다. 분석에 있어서 data visualization 기법을 통해 변수사이의 관계, 이상점 발견, 모형진단등을 하였다. 다중선형회귀 모형(Multiple Linear Regression)과 트리모형(Regression Tree)을 이용해서 자료를 분석하고 모델간 비교를 했으며, Cross-Validation을 이용해서 최적모델을 선택하였다. 특히, 자동으로 변수선택을 하는 stepwise regression방법을 그냥 사용하기보다는 먼저 설명변수들 사이의 관계나 설명변수와 반응변수 사이의 관계등을 조사하고 나서 이를 통해 선택된 변수들을 가지고 stepwise regression과 regression tree 방법론을 이용해서 적절한 변수 및 최종 모형을 선택하였다. 분석결과, 프로농구의 경우에는 경기당 득점, 어시스트, 자유투 성공수, 경력 등이 중요한 변수였고, 프로야구 투수의 경우에는 경력, 9이닝 당 삼진 수, 방어율, 피홈런 수 등이 중요한 변수였고, 프로야구 타자의 경우에는 경력, 안타 수, FA(자유계약)유무 여부 등이 중요한 변수였다.

유역 토지이용과 저수지 수질의 상관관계 분석 (Correlation Analysis of Water Quality According to Land Use Types of Reservoir Watershed)

  • 윤동균;정상옥
    • 한국농공학회:학술대회논문집
    • /
    • 한국농공학회 2005년도 학술발표논문집
    • /
    • pp.614-619
    • /
    • 2005
  • The object of this study was to presented regression equations for obtaining simply and quickly values of water quality items, BOD, COD, T-N, and T-P. Regression equations obtained to analyze relationships for water quality items to land use types in agricultural reservoir watersheds. In order to derive regression equations, a multiple linear regression analysis was used in this studying reservoirs. In this regression analysis, a independent values used land used types and dependent values used BOD, COD, T-N, T-P values in water quality items. The results showed that numbers of regression equation ranging above 0.90 in a multiple correlation coefficient (MCC) was not found, ranging from 0.70 to 0.90 in the MCC was 6, ranging from 0.40 to 0.70 in the MCC was 20, and ranging from 0.20 to 0.40 in the MCC was 4. The results of this study can be used as a basic information for evaluating simply and quickly water quality for proposing and designing steps in water quality policy.

  • PDF

야전데이터 기반 하푼 유도탄 정비 소요시간이 가동률에 미치는 영향 연구 (Impact of Maintenance Time of Anti-Ship Missile Harpoon on Operational Availability with Field Data)

  • 최영재;마정목
    • 한국군사과학기술학회지
    • /
    • 제23권4호
    • /
    • pp.426-434
    • /
    • 2020
  • This paper studies the impact of the maintenance time of anti-ship missile Harpoon on operational availability with real field data. The Harpoon maintenance simulation model is developed as a testbed for identifying the optimal inventory levels on operational availability. Using multiple linear regression analysis and integer programming, the optimal inventory levels of essential assemblies are suggested. Finally, the result of sensitivity analysis shows the quantitative impact of maintenance time on operational availability and inventory costs. The authors believe that this quantitative analysis can support policy decisions to decrease maintenance time of missiles.

Price Monitoring Automation with Marketing Forecasting Methods

  • Oksana Penkova;Oleksandr Zakharchuk;Ivan Blahun;Alina Berher;Veronika Nechytailo;Andrii Kharenko
    • International Journal of Computer Science & Network Security
    • /
    • 제23권9호
    • /
    • pp.37-46
    • /
    • 2023
  • The main aim of the article is to solve the problem of automating price monitoring using marketing forecasting methods and Excel functionality under martial law. The study used the method of algorithms, trend analysis, correlation and regression analysis, ANOVA, extrapolation, index method, etc. The importance of monitoring consumer price developments in market pricing at the macro and micro levels is proved. The introduction of a Dummy variable to account for the influence of martial law in market pricing is proposed, both in linear multiple regression modelling and in forecasting the components of the Consumer Price Index. Experimentally, the high reliability of forecasting based on a five-factor linear regression model with a Dummy variable was proved in comparison with a linear trend equation and a four-factor linear regression model. Pessimistic, realistic and optimistic scenarios were developed for forecasting the Consumer Price Index for the situation of the end of the Russian-Ukrainian war until the end of 2023 and separately until the end of 2024.

보행자 전용도로의 이용자 경관만족 요인분석 -분당 신도시를 중심으로- (The Analysis of User's Degree on Landscape Satisfaction Factors for Pedestrian Road -Case Study of Bun-Dang New Town-)

  • 김대현
    • 한국환경복원기술학회지
    • /
    • 제4권2호
    • /
    • pp.1-10
    • /
    • 2001
  • The purpose of this study was to investigate factors and variables which have significant effects on landscape satisfaction of urban pedestrian road in Bun-dang new town and to suggest basic information for urban pedestrian road design. These works consist of two phase. First, we tested the Hye-Cheon college students' degree of landscape satisfaction for 37 spots of urban pedestrian road and then selected 10 sports slide by the Sturges' formula. Second, we analysed factors and variables on landscape satisfaction of urban pedestrian road using the semantic differential scale method and then processed using descriptive analysis, factor analysis and multiple linear regression analysis. The major findings of this study can be summarized as follows; 1) The difference of landscape adjectives between the highest score of landscape satisfaction slide and the lowest score landscape satisfaction slide were diversity of vegetation, plenty of the shade of a tree, naturalness and cleanness. 2) Diversity of vegetation, width of road, freedom of danger and diversity of environment can be significant variables of major effects on landscape satisfaction of urban pedestrian road by using the multiple linear regression analysis. 3) Factors covering the landscape satisfaction of urban pedestrian road have been found to be Environment of urban pedestrian road and Constitution of urban pedestrian road. By using the Varimaxs' rotation factor analysis for the number of factors' cumulative percentage has been obtained as 64%. 4) Environment of urban pedestrian road and Constitution of urban pedestrian road can be significant factors of major effects on landscape satisfaction of urban pedestrian road by using the multiple linear regression analysis. In conclusion, the landscape satisfaction factors and variables of urban pedestrian road need to be considered in plan or design the urban pedestrian road.

  • PDF

실시간 수위 예측을 위한 다중선형회귀 모형의 비교 (Comparison of Different Multiple Linear Regression Models for Real-time Flood Stage Forecasting)

  • 최승용;한건연;김병현
    • 대한토목학회논문집
    • /
    • 제32권1B호
    • /
    • pp.9-20
    • /
    • 2012
  • 최근 수위 예측을 위한 개념적 기반, 수문학적, 물리적 기반 모형 등의 단점을 극복하고자 홍수예측을 위해 자료지향형 모형 중의 하나인 다중선형회귀 모형이 널리 도입되고 있다. 본 연구의 목적은 이러한 다중선형회귀 모형의 서로 다른 회귀계수 선정 방법에 따른 홍수예측 성능을 비교 검토하고 이를 통해 적절한 다중회귀 홍수예측 모형을 구축하는 것이다. 이를 위해 입력자료의 자기상관분석을 통해 독립변수의 시간 규모를 결정한 후 최소 자승법, 가중 최소 자승법, 단계별 선택법의 각기 다른 회귀계수 산정 방법을 이용한 홍수예측 모형을 구축하고 중랑천 유역의 다양한 홍수사상에 대해 적용하였다. 구축된 모형들의 성능을 평가하기 위해 평균제곱근오차, Nash-Suttcliffe 효율계수, 평균절대오차, 수정 결정계수와 같이 4개의 통계지표들을 사용하였다. 모의결과 단계별 선택법을 이용한 다중선형회귀 홍수예측 모형이 가장 정확한 예측 결과를 보였고, 최소자승법을 이용한 홍수예측 모형이 가중 최소자승법을 이용한 홍수예측 모형보다 좀 더 나은 예측 결과를 나타냈다.

Development of the Algorithm for Optimizing Wavelength Selection in Multiple Linear Regression

  • Hoeil Chung
    • Near Infrared Analysis
    • /
    • 제1권1호
    • /
    • pp.1-7
    • /
    • 2000
  • A convenient algorithm for optimizing wavelength selection in multiple linear regression (MLR) has been developed. MOP (MLP Optimization Program) has been developed to test all possible MLR calibration models in a given spectral range and finally find an optimal MLR model with external validation capability. MOP generates all calibration models from all possible combinations of wavelength, and simultaneously calculates SEC (Standard Error of Calibration) and SEV (Standard Error of Validation) by predicting samples in a validation data set. Finally, with determined SEC and SEV, it calculates another parameter called SAD (Sum of SEC, SEV, and Absolute Difference between SEC and SEV: sum(SEC+SEV+Abs(SEC-SEV)). SAD is an useful parameter to find an optimal calibration model without over-fitting by simultaneously evaluating SEC, SEV, and difference of error between calibration and validation. The calibration model corresponding to the smallest SAD value is chosen as an optimum because the errors in both calibration and validation are minimal as well as similar in scale. To evaluate the capability of MOP, the determination of benzene content in unleaded gasoline has been examined. MOP successfully found the optimal calibration model and showed the better calibration and independent prediction performance compared to conventional MLR calibration.

다중선형 회귀분석을 이용한 고립지역에서의 AADT 추정방안 연구 (Estimation of AADT Using Multiple Linear Regression in Isolated Area)

  • 김태운;오주삼
    • 대한토목학회논문집
    • /
    • 제35권4호
    • /
    • pp.887-896
    • /
    • 2015
  • 본 연구에서는 고립지역의 과거 AADT 자료와 사회 경제지표를 활용하여 장래 AADT를 추정하였다. 과거 교통량 추이 활용 시와 사회 경제지표 활용 시 장래 AADT를 추정했으며, 사회 경제지표를 활용하여 다중회귀 분석방식을 통한 장래 AADT 추정 시 높은 설명력과 낮은 오차율을 보였다. 지리적 특성별 AADT에 미치는 사회 경제지표 분석 결과 고립일반지역은 다양한 사회 경제지표가 AADT에 영향을 미쳤으며, 고립해안지역은 유류가격과 연관성을 보이는 것으로 나타났다. 고립지역의 장래 AADT 추정 모형은 $R^2$, MAPE 분석 시 우수한 것으로 나타났다. 이는 고립지역에서는 통과 교통량이 적고 교통량 변동이 적기 때문에 사회 경제지표를 활용한 장래 AADT 추정방식이 정확하다고 볼 수 있다.

다변량 선형회귀분석을 이용한 증발접시계수 산정방법 적용성 검토 (Evaluation of applicability of pan coefficient estimation method by multiple linear regression analysis)

  • 임창수
    • 한국수자원학회논문집
    • /
    • 제55권3호
    • /
    • pp.229-243
    • /
    • 2022
  • 우리나라 11개 기상관측지역의 월별 기상자료가 증발접시계수에 미치는 영향을 분석하고, 증발접시계수 산정을 위한 4가지 형태의 다변량 선형회귀모형의 적용성을 검토하였다. 개발된 증발접시계수 산정모형의 적용성을 평가하기 위해서 기존에 다른 연구자들에 의해서 제안된 6가지의 모형과 비교 평가하였다. 우리나라 11개 기상관측지역에서 증발접시계수는 1, 2, 3, 7, 11, 12월은 기온에 가장 큰 영향을 받고, 다른 월들은 일사량에 가장 큰 영향을 받는 것으로 나타났다. 전반적으로 모든 월에서 풍속과 상대습도는 기온이나 일사량과 비교해서 증발접시계수에 큰 영향을 미치지 않는 것으로 나타났다. 모든 지역과 월에서 각 지역별로 5개의 독립변수(풍속, 상대습도, 기온, 일조시간과 가조시간의 비, 일사량)를 적용하여 유도된 모형이 가장 양호한 증발량 산정 결과를 보였다. 모형 검증결과에 의하면 다변량 선형회귀분석을 적용하여 증발접시계수를 산정하는 경우 일부 지역과 월에서 제한적으로 적용할 수 있을 것으로 판단된다.