• Title/Summary/Keyword: 일반회귀분석

Search Result 881, Processing Time 0.03 seconds

반복측정된 포아송 자료의 GEE 분석에서 산포모수의 역할에 관한 연구

  • 박태성;신민웅
    • Communications for Statistical Applications and Methods
    • /
    • v.2 no.2
    • /
    • pp.155-165
    • /
    • 1995
  • 반복측정자료의 분석을 위해 제안된 Liang and Zeger(1986)의 회귀모형은 일반화추정식(generalized estimationg equations, GEE)을 이용하여 모형의 모수를 추정한다. 이 모형은 반복측정된 반응변수와 설명변수들과의 관계를 추정하는 것이 주된 목적이기 때문에 회귀모수는 중요한 모수로 간주되나 산포모수는 중요하지 않은 장애모수(nuisance parameters)로 간주된다. 일반적으로 GEE 분석에서 회귀모수의 추정량은 산포모수에 상관없이 일치적(consistent)으로 얻어진다고 알려져 있다. 그러나 본 논문에서는 포아송분포를 따르는 반복측정자료에 대한 사례연구와 모의 실험을 통해서 일반적으로 믿어져왔던 것과는 달리 GEE 방법이 산포모수에 민감하게 영향을 받고 있음을 보였다. 특히 산포모수의 값이 일정하지 않은 경우에는 GEE 방법이 산포모수에 민감 하게 영향을 받고 있음을 보였다. 특히 산포모수의 값이 일정하지 않은 경우에는 GEE 방법에서 밝혀진 회귀모수 추정량의 일치성에도 문제가 발생할 수 있음을 보였다.

  • PDF

Analysis of the outcome for the Korean Pro-Basketball games using Regression models (회귀모형을 이용한 한국프로농구 승부결과 분석)

  • Jhang, Hyo Jin;Kwak, Hyun;Choi, Seung Hoe
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.25 no.5
    • /
    • pp.489-494
    • /
    • 2015
  • The purpose of this paper is to analyse outcomes of Korean Pro-basketball games using regression models. Both Classic Fuzzy Regression Model and Fuzzy Regression Model applying linguistic variables were used to meet the purpose of the paper. In General Regression Analysis, in which the results of games are expressed and analyzed through score differences, a regression model is proposed considering influential variables for the score differences of the two teams. In Fuzzy Regression Analysis, the results are sorted into six different literal expressions, 'win with large margin, win with moderate margin, win with narrow margin, defeat with narrow margin, defeat with moderate margin, and defeat with large margin'. Athletic performances and team work of each teams were expressed in fuzzy number to analyse how much athletic performances and team work affect results of games. This paper referred back to 2013-2014 season data provided by KBL(Korean Basketball League) and professional columns on Korean basketball analysis.

Efficient Estimation of Regression Coefficients in Regression Model with Moving Average Process (오차항이 이동평균과정을 따르는 회귀모형에서 회귀계수의 효율적 추정에 관한 연구)

  • 송석현;이종협;김기환
    • The Korean Journal of Applied Statistics
    • /
    • v.12 no.1
    • /
    • pp.109-124
    • /
    • 1999
  • 일반적으로 오차항이 자기상관되어 있는 선형회귀 모형에서는 회귀계수에 대한 보통최소제곱추정량이 효율적이지 못 하다고 알려져 있다. 그러나 이러한 일반화선형회귀모형에서 독립변수의 형태에 따라서는 OLSE의 사용 가능성을 제시하는 모형이 있다. 본 연구에서는 오차항이 일차 이동평균 과정을 따르는 선형회귀모형에서 여러 추정량들 (GLSE, APX, MAPX)에 대한 OLSE의 상대효율함수를 유도하고 비교 분석하고자 한다. 특히 소표본에서 정확한 상대효율값을 구하여 OLSE의 효율성이 크게 떨어지지 않거나 효율성이 나은 회귀모형들을 제시한다.

  • PDF

回歸分析에 있어서의 多共線性과 名稱을 保全시키는 資料變換 技法

  • 兪浣
    • Journal of the Korean Statistical Society
    • /
    • v.8 no.2
    • /
    • pp.109-116
    • /
    • 1979
  • 두 개의 변수의 대체효과(substitution effect)를 연구하기 위하여 수요 또는 공급의 모형을 만들었을 경우 이에 관련된 변수들의 이름이 중요시 된다. 실제 관측 자료를 사용하였을 경우 흔히 일어나는 다공선성(multicollinearity) 문제를 다루기 위한 대안으로써 선형회귀선을 예로 들어 능형회귀기법(ridge regression technique)과 요인분석기법(factor analytic technique)을 소개하였으며 이에서 얻어지는 계수(coefficient)를 OLS 추정치로 설명하기 위하여 원래의 자료를 변환하였다. 실지 수요와 공급의 모형이 비선형일 경우 일반적으로 능형회귀나 요인분석을 쓰지 못한다는 점을 감안, 이러한 방법을 자료의 변환방법으로 설명함으로써 비선형모형에서도 다공선성문제를 위하여 능형회귀분석법이나 요인분석기법을 사용할 수 있도록 하였다.

  • PDF

Trend analysis of extream precipitation in Korea using Quantile Regression (Quantile Regression을 활용한 우리나라 극치강수량 경향성 분석)

  • So, Byung-Jin;Kwon, Hyun-Han;Park, Rae-Gun
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2012.05a
    • /
    • pp.369-370
    • /
    • 2012
  • 일반적으로 회귀분석의 최적화는 평균적인 개념을 확장하여 사용되어지고 있다. 평균은 관찰값들에 관한 모든 정보와 관련된 통계량으로써 많은 연구에 이용되어지고 있다. 정규분포를 이루는 모집단의 경우 평균을 사용한 추정이 바람직하지만, 이상치로 인한 분포의 꼬리가 두꺼워지는 경우 중위수(median)를 사용하는 것이 바람직하다고 알려져 있다. 강수량의 분포형태는 꼬리(tail)가 두꺼운 왜곡된 형태를 갖고 있으므로 robust 통계량인 Quantile을 이용한 강수량의 분석 및 평가를 실시하였다. 본 연구에서는 Quantile에 따른 회귀선의 변화를 이용하여 강수량의 경향성을 평가하고, 극치강수량의 변화를 보여줄 수 있는 Quantle값을 추출해 보고자 한다. 또한 bootstrap 방법을 이용하여 Quantile에 따른 회귀계수의 신뢰구간을 분석하여 회귀인자의 신뢰성을 평가하였다. 본 연구에서 적용한 Quantile Regression 기법은 회귀계수의 추정에 있어서 회귀인자의 신뢰성을 Quantile-회귀계수 그래프를 통해 분석할 수 있으며, 이상값의 영향을 저감시키는 평균과 달리 이상값의 영향을 효과적으로 분리 및 재현시킬 수 있어 극치값에 따른 변화를 효과적으로 평가할 수 있으며, robust 통계량의 특징인 분산이 적은 안정적인 추정량을 확보할 수 있다.

  • PDF

Nonlinear feature extraction for regression problems (회귀문제를 위한 비선형 특징 추출 방법)

  • Kim, Seongmin;Kwak, Nojun
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2010.11a
    • /
    • pp.86-88
    • /
    • 2010
  • 본 논문에서는 회귀문제를 위한 비선형 특징 추출방법을 제안하고 분류문제에 적용한다. 이 방법은 이미 제안된 선형판별 분석법을 회귀문제에 적용한 회귀선형판별분석법(Linear Discriminant Analysis for regression:LDAr)을 비선형 문제에 대해 확장한 것이다. 본 논문에서는 이를 위해 커널함수를 이용하여 비선형 문제로 확장하였다. 기본적인 아이디어는 입력 특징 공간을 커널 함수를 이용하여 새로운 고차원의 특징 공간으로 확장을 한 후, 샘플 간의 거리가 큰 것과 작은 것의 비율을 최대화하는 것이다. 일반적으로 얼굴 인식과 같은 응용 분야에서 얼굴의 크기, 회전과 같은 것들은 회귀문제에 있어서 비선형적이며 복잡한 문제로 인식되고 있다. 본 논문에서는 회귀 문제에 대한 간단한 실험을 수행하였으며 회귀선형판별분석법(LDAr)을 이용한 결과보다 향상된 결과를 얻을 수 있었다.

  • PDF

Long-and Short-term Relationship between Human Resources Expenditure and Management Performance in South Korea -focusing on Public District General Hospitals- (인적자원관리비용과 경영성과에 대한 장·단기 효과분석)

  • Park, Jeongwon;Yoon, Heesoo;Choi, Mankyu
    • Korea Journal of Hospital Management
    • /
    • v.26 no.3
    • /
    • pp.84-99
    • /
    • 2021
  • Purposes: 우리나라 공공의료기관들의 경영실적 보고에 따르면 대부분의 공공의료기관들이 만성적자로 인한 경영난 문제를 겪고 있는 실정이다. 이는 공공의료서비스 제공 등이 주요 원인이겠지만 그럼에도 공공의료기관들의 경영효율화 문제는 지속적으로 지적되고 있음은 공공연한 사실이다. 이에 본 연구는 고정비 성격이 강한 인적자원관리비용과 경영성과 간의 관계를 분석하여 공공의료기관의 경영성과 개선을 위한 경영적 함의를 제공하고자 하였다. Methodology: 분석자료는 2014년부터 2019년까지 39개 지역거점 공공병원의 재무자료를 이용하였고, STATA SE 12.0을 사용하여 다중회귀분석과 패널회귀분석을 실시하였다. Findings: 다중회귀분석을 통한 단면연구 결과에서는 인건비가 높을수록 경영성과가 높은 경향을(2014년 의료수익:1.523/ 2015년 의료수익: 2.002, 의료수익의료이익률: 0.002/ 2016년 의료수익: 1.223) 보였으나 패널회귀분석을 통한 종단연구 결과에서는 복리후생비가 높을수록 경영성과가 의미있게 높은 경향을(의료수익: 3.232582/ 의료수익의료이익률: 0.0014502) 보였다. 이는 인건비는 경영성과에 단기적인 효과가 있는 반면 복리후생비는 경영성과에 장기적인 효과가 있음을 반영하는 것이라고 볼 수 있다. Practical Implication: 본 연구는 이러한 결과를 기반으로 장기적인 효과가 있는 복리후생비의 중요성을 제시하고, 공공의료기관의 경영성과에 영향을 미치는 인건비와 복리후생비의 특성 파악을 통하여 효과적인 인적자원관리방법을 위한 경영적 함의를 도출하였다는 점에서 의의가 있겠다.

Comparison of Regression Coefficient Significance Test for Temporal Distribution by Multiple Regression Analysis Method (다중회귀분석 방법에 따른 시간분포 회귀식의 회귀계수 유의성 검정 비교)

  • Lee, Sung Ho;Lee, Jae Joon;Park, Jin Hee
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2019.05a
    • /
    • pp.205-205
    • /
    • 2019
  • 우리나라에서 강우의 시간분포를 위해 보편적으로 사용되고 있는 방법은 Huff 4분위법으로 강우의 시간적 분포특성을 나타내는 무차원 시간분포곡선을 제시한 것으로, 강우의 지속기간을 4분위로 구분하여 각 분위의 강우량 중 가장 큰 값이 속해 있는 구간을 선택하여 그 구간의 위치에 따라 분위를 정하는 방법이다. 현재 실무에서는 Huff의 분위별 곡선에 대한 회귀식은 지속기간 전반에 걸쳐 정확도가 높은 이유로 6차식을 적용하고 있으나, 통계 모델링에서 간결함의 원리에 따라 회귀식이 간결할 필요가 있으며, 통계적 유의수준에 기초하여 회귀계수를 결정하여야 하므로 유의성 검정 방법을 통한 검정결과를 비교할 필요가 있다. 따라서 본 연구에서는 다중회귀분석 방법에 따른 회귀계수 유의성 검정결과 비교를 위하여 구미지역의 무차원 누가우량 백분율을 이용한 시간분포 회귀식을 이용하여 유의성 검정 방법인 분산분석 방법(Analysis of Variance)과 변수선택 방법(Backward Selection)의 검정 결과를 도출 및 비교하였다. 통계프로그램인 프로그래밍 R을 이용하여 변수선택 방법 중 후방제거법 함수를 이용하여 최종 회귀식을 도출하고 또한 7차 회귀식을 분산분석을 이용한 후방제거법으로 회귀계수를 제거하는 방법으로 최종 회귀식을 산정하였다. 분산분석을 이용한 후방제거법의 유의성 검정결과는 프로그래밍 R을 이용한 후방제거법의 결과와 동일한 것으로 분석되었다. 일반적으로 설계강우량의 시간분포를 위한 방법으로 사용되고 있는 Huff의 4분위 방법의 시간분포 회귀식은 회귀계수의 유의성 검정이 이루어지고 있지 않으므로 본 연구결과를 통해 설계강우량 시간분포 회귀식의 유의성 검정방법 제시 및 결과도출과정을 통해 시간분포 회귀식 산정기법으로 활용할 수 있을 것으로 사료된다.

  • PDF

Completion of the Missing Rainfall Data by a Multi-regression method (다중회귀분석을 이용한 강우량 결측치 보정)

  • Lee, Myoung-Woo;Lee, Bong-Hee;Kim, Hung-Soo;Shim, Myung-Pil
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2006.05a
    • /
    • pp.775-779
    • /
    • 2006
  • 강우자료의 구축은 수문해석에 있어 가장 기본적이며 중요한 단계라 할 수 있다. 하지만 수문 관측 자료의 경우 결측치가 존재하여 그에 대한 보정이 필요한 경우가 종종 발생하게 된다. 따라서 수문자료의 분석을 수행하기에 앞서 우선 자료에 대한 검정을 실시하고, 결측치가 존재할 경우는 이를 보정하여 분석을 수행하여야 한다. 본 연구에서는 다변량통계기법의 하나인 다중회귀분석을 이용하여 강우 결측치를 보정하였다. 본 연구에서는 다중공선성과 자기상관에 대하여 고려한 다중회귀모형을 구성하였다. 모형의 구성시 모든 결측지점에 적용이 가능하지 않아 일반성이 떨어짐을 확인 할 수 있었지만, 모형이 구성될 경우 통계적 적합도와 유의수준을 확인 할 수 있는 장점이 있었으며, 다중회귀모형이 구성되는 경우 좋은 보정 결과를 주는 것을 확인 할 수 있었다.

  • PDF

A Study on the Treatment of Uncertainty in Linear Regression Method for Chemical Analysis (회귀식 사용에 따른 화학 분석 과정의 불확도 처리 연구)

  • Woo, Jin-Chun;Suh, JungKee;Lim, MyungChul;Park, MinSu
    • Analytical Science and Technology
    • /
    • v.16 no.3
    • /
    • pp.185-190
    • /
    • 2003
  • We applied modified least square method (MLS) and ordinary least square method (OLS) to 1st order equation for the comparison of the uncertainties calculated by these methods. The uncertainty calculated by OLS covered statistically safe interval because it was over-estimated in many cases of measurement and concentration level. But, if the uncertainty of the concentration as a reference value was comparably large (about 5% of the relative standard deviation of random scattering from the regression line and about 7% of relative standard uncertainty of reference values), then uncertainty calculated by OLS was seriously under-estimated at high concentration level. It was revealed that the calculated uncertainty didn't cover statistically safe interval at the stated confidence level. It was found that the method, MLS, described in the previously article would be valid for this calculation of uncertainty.