• 제목/요약/키워드: regression analysis method

검색결과 4,587건 처리시간 0.031초

회귀분석에 기초한 균등화 방법에 관한 연구 (A study on equating method based on regression analysis)

  • 조장식
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권3호
    • /
    • pp.513-521
    • /
    • 2010
  • 대부분의 대학들은 교수업적평가를 위해 강의평가제도를 실시하고 있다. 그러나 강의평가의 결과는 강좌규모, 강의형태, 개설학년, 이수구분, 평균평점 등과 같은 개설강좌의 특성에 많은 영향을 받게 된다. 따라서 이러한 각 강좌특성들이 강의평가 결과에 영향을 미치는 효과를 제거하지 않는다면, 담당교수가 강의평가 결과에 대한 공정성과 객관성을 신뢰할 수 없게 만들 정도로 심각한 편의를 갖게 된다. 따라서 강의평가의 공정성을 위해 강좌특성에 따른 편의를 제거하기 위한 사후조정된 점수가 요구된다. 따라서 본 연구에서는 단계적 변수선택법에 의한 회귀분석을 이용하여 강의평가 결과에 대한 균등화 방법을 이용하여 사후조정된 점수를 계산하는 방법을 제안한다. 그리고 제안된 방법은 기존의 방법과 비교를 하였다.

회귀분석을 활용한 옥외 절연물의 오손도 예측 (A Prediction on the Pollution Level of Outdoor Insulator with Regression Analysis)

  • 최남호;구경완;한상옥
    • 대한전기학회논문지:전기물성ㆍ응용부문C
    • /
    • 제52권3호
    • /
    • pp.137-143
    • /
    • 2003
  • The degree of contamination on outdoor insulator is ons of the most importance factor to determine the pollution level of outdoor insulation, and the sea salt is known as the most dangerous pollutant. As shown through the preceding study, the generation of salt pollutant and the pollution degree of outdoor insulator have a close relation with meteorological conditions, such as wind velocity, wind direction, precipitation and so fourth. So, in this paper, we made an investigation on the prediction method, a statistical estimation technique for equivalent salt deposit density of outdoor insulator with multiple linear regression analysis. From the results of the analysis, we proved the superiority of the prediction method in which the variables had a very close(about 0.9) correlation coefficient. And the results could be applied to establish the Pollution Prediction System for power utilities, and the system could provide an invaluable information for the design and maintenance of outdoor insulation system.

CART의 예측 성능:은행 및 보험 회사 데이터 사용 (The Prediction Performance of the CART Using Bank and Insurance Company Data)

  • 박정선
    • 한국정보처리학회논문지
    • /
    • 제3권6호
    • /
    • pp.1468-1472
    • /
    • 1996
  • 본 연구에서는 CART(Classification and Regression Tree)가 예측을 함에 있어 통계적인 기법인 discriminant analysis와 비교된다. 은행 데이터를 사용하는 경우 discriminant analysis가 더 나은 성능을 보여줬으며, 보험 회사 데이터를 사용한 경 우 CART가 더 나은 성능을 보여줬다. 이러한 모순된 결과가 데이터의 성격을 분석함 으로 해석된다. 본 연구에서는 두가지 모델 모두 사용된 매개변수들인 사전 확률, 데 이터, 타입 I/II오류 코스트, 검증 방법에 의해 성능의 차이를 보여줬다.

  • PDF

국내 화강암의 점하중강도와 일축압축강도간의 상관분석 (Correlation Between the Point-Load Strength and the Uniaxial Compressive Strength of Korean Granites)

  • 우익
    • 지질공학
    • /
    • 제24권1호
    • /
    • pp.101-110
    • /
    • 2014
  • 이 연구에서는 국내에 분포하는 화강암에 대한 점하중강도($I_{s(50)}$) 와 일축압축강도(UCS) 사이의 상관관계를 선형회귀분석을 통하여 구하였다. 이를 위하여 암석시료의 물리적 물성에 근거하여 화강암 시료를 재분류하여 세 경우에 대한 회귀분석을 수행하였다. 첫째로, 풍화등급에 따른 원점회귀분석을 수행하여 풍화에 따른 상관관계를 구하였으나 풍화등급별 시료의 개수가 부족하여 만족할만한 신뢰수준의 회귀분석결과를 얻지 못하였지만, 풍화가 진행될수록 회귀직선의 기울기가 급해지는 경향을 파악할 수 있었다. 두 번째, 전체 화강암에 대한 회귀분석을 수행하기 위하여 단순선형회귀분석과 신뢰도 및 정확도를 향상시키기 위하여 부트스트랩 리샘플링법을 이용한 단순선형회귀분석을 통하여 두 강도간의 상관관계를 구하였다. 세번째로는 유사한 물리적 물성을 지닌 화강암 시료들의 평균강도에 대한 선형회귀분석을 수행하여 상관관계를 구하였다. 이 방법들을 사용하여 구한 회귀직선방정식의 기울기는 14 내외의 값을 보이고 작은 편차를 지니고 있으며 국내 화강암에 대하여 수행한 기존 연구와 유사한 값을 보이고 있었다. 그러나 16에서 43의 범위를 지닌 y-축 절편은 큰 편차를 보이기 있었기 때문에, 점하중강도로 일축압축강도를 추정할 때에는 이러한 회귀방정식의 오차범위를 고려하여야 할 것으로 판단된다.

도시 NATM 터널에서 변위예측기술의 적용사례 연구 (A CASE STUDY ON DISPLACMENT FORECASTING METHOD IN TUNNELLING BY MATM IN URBAN AREA)

  • 정한중;조경나
    • 한국지반공학회:학술대회논문집
    • /
    • 한국지반공학회 1993년도 봄 학술회 논문집
    • /
    • pp.27-32
    • /
    • 1993
  • In tunnelling by NATM convergence data are most Importantly to ascertain the safety of tunnel. Therefore, a reliable method is required that can predict ultimate displacements by using earler displacement data. Displacement forecasting method is classified into statistical method and functional regression method. Convergence data measured in Seoul subway 5~45 site during '92.5 ~ '92.12 were analyzed by above said two methods. The analysis results of convergence data show that the functional regression method is more relieable in completely weathered rock, but the statistical method in slightly wearhred rock.

  • PDF

Determination of Research Octane Number using NIR Spectral Data and Ridge Regression

  • 정호일;이혜선;전지혁
    • Bulletin of the Korean Chemical Society
    • /
    • 제22권1호
    • /
    • pp.37-42
    • /
    • 2001
  • Ridge regression is compared with multiple linear regression (MLR) for determination of Research Octane Number (RON) when the baseline and signal-to-noise ratio are varied. MLR analysis of near-infrared (NIR) spectroscopic data usually encounters a collinearity problem, which adversely affects long-term prediction performance. The collinearity problem can be eliminated or greatly improved by using ridge regression, which is a biased estimation method. To evaluate the robustness of each calibration, the calibration models developed by both calibration methods were used to predict RONs of gasoline spectra in which the baseline and signal-to-noise ratio were varied. The prediction results of a ridge calibration model showed more stable prediction performance as compared to that of MLR, especially when the spectral baselines were varied. . In conclusion, ridge regression is shown to be a viable method for calibration of RON with the NIR data when only a few wavelengths are available such as hand-carry device using a few diodes.

벌점 스플라인 회귀모형에서의 이상치 탐지방법 (An Outlier Detection Method in Penalized Spline Regression Models)

  • 서한손;송지은;윤민
    • 응용통계연구
    • /
    • 제26권4호
    • /
    • pp.687-696
    • /
    • 2013
  • 이상치가 존재하는 경우 모형 적합의 결과가 왜곡될 수 있기 때문에 이상치 탐색은 데이터분석에 있어서 매우 중요하다. 이상치 탐지 방법은 많은 학자들에 의해 연구되어 왔다. 본 논문에서는 Hadi와 Simonoff (1993)가 제안한 직접적 이상치 탐지 방법을 벌점 스플라인 회귀모형에 적용하여 이상치를 탐지하는 과정을 제안하며 모의실험과 실제 데이터에 적용을 통하여 스플라인 회귀모형, 강건 벌점 스플라인 회귀모형과 효율성을 비교한다.

제약부 구간 선형 회귀모델에 의한 실동시간의 견적 (Estimation of the Actual Working Time by Interval Linear Regression Models with Constraint Conditions)

  • Hwang, S. G.;Seo, Y. J.
    • 한국경영과학회지
    • /
    • 제14권2호
    • /
    • pp.105-114
    • /
    • 1989
  • The actual working time of jobs, in general, is different to the standard time of jobs. In this paper, in order to analyze the actual working time of each job in production, we use the total production amount and the encessary total working time. The method which analyzes the actual working time is as follows. In this paper, we propose the interval regression analysis for obtaining an interval linear regression model with constraint conditions with respect to interval parameters. The merits of this method are the following.1) it is easy to obtain an interval linear model by solving a LP problem to which the formulation of proposed regression analysis is reduced, 2) it is easy to add constraint conditions about interval parameters, which are a sort of expert knowledge. As an application, within a case which has given certain data, the actual working time of jobs and the number of workers in a future plan are estimated through the real data obtianed from the operation of processing line in a heavy industry company. It results from the proposed method that the actual working time and the number of workers can be estimated as intervals by the interval regression model.

  • PDF

Power Failure Sensitivity Analysis via Grouped L1/2 Sparsity Constrained Logistic Regression

  • Li, Baoshu;Zhou, Xin;Dong, Ping
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권8호
    • /
    • pp.3086-3101
    • /
    • 2021
  • To supply precise marketing and differentiated service for the electric power service department, it is very important to predict the customers with high sensitivity of electric power failure. To solve this problem, we propose a novel grouped 𝑙1/2 sparsity constrained logistic regression method for sensitivity assessment of electric power failure. Different from the 𝑙1 norm and k-support norm, the proposed grouped 𝑙1/2 sparsity constrained logistic regression method simultaneously imposes the inter-class information and tighter approximation to the nonconvex 𝑙0 sparsity to exploit multiple correlated attributions for prediction. Firstly, the attributes or factors for predicting the customer sensitivity of power failure are selected from customer sheets, such as customer information, electric consuming information, electrical bill, 95598 work sheet, power failure events, etc. Secondly, all these samples with attributes are clustered into several categories, and samples in the same category are assumed to be sharing similar properties. Then, 𝑙1/2 norm constrained logistic regression model is built to predict the customer's sensitivity of power failure. Alternating direction of multipliers (ADMM) algorithm is finally employed to solve the problem by splitting it into several sub-problems effectively. Experimental results on power electrical dataset with about one million customer data from a province validate that the proposed method has a good prediction accuracy.