• 제목/요약/키워드: 다중 회귀

검색결과 3,935건 처리시간 0.033초

다중 베이즈요인에 의한 회귀모형 오차항의 자기상관 검정 (On Testing the First-order Autocorrelation of the Error Term in a Regression Model via Multiple Bayes Factor)

  • 한성실;김혜중
    • 응용통계연구
    • /
    • 제12권2호
    • /
    • pp.605-619
    • /
    • 1999
  • 본 논문은 회귀분석에서 오차항의 1차 자기상관 존재 여부 및 그 값을 검정하는 방법을 베이지안 접근법으로 제안하였다. 이 방법은 모수공간의 다중분할로 인해 얻어진 여러 가설들에 대한 다중결정문제를 다중 베이즈요인에 관한 이론과 일반화 Savage-Dickey 밀도비를 이용한 사후확률 추정법을 합성하여 개발되었다. 이 방법은 기존의 검정법들에서 가능한 검정 뿐 아니라 이들이 해결할 수 없는 자기상관에 대한 다중결정문제에도 사용이 가능한데 그 효용성이 있다. 모의실험을 통하여 제안된 검정법의 유효성을 평가하였다.

  • PDF

다중회귀분석 방법에 따른 시간분포 회귀식의 회귀계수 유의성 검정 비교 (Comparison of Regression Coefficient Significance Test for Temporal Distribution by Multiple Regression Analysis Method)

  • 이성호;이재준;박진희
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2019년도 학술발표회
    • /
    • pp.205-205
    • /
    • 2019
  • 우리나라에서 강우의 시간분포를 위해 보편적으로 사용되고 있는 방법은 Huff 4분위법으로 강우의 시간적 분포특성을 나타내는 무차원 시간분포곡선을 제시한 것으로, 강우의 지속기간을 4분위로 구분하여 각 분위의 강우량 중 가장 큰 값이 속해 있는 구간을 선택하여 그 구간의 위치에 따라 분위를 정하는 방법이다. 현재 실무에서는 Huff의 분위별 곡선에 대한 회귀식은 지속기간 전반에 걸쳐 정확도가 높은 이유로 6차식을 적용하고 있으나, 통계 모델링에서 간결함의 원리에 따라 회귀식이 간결할 필요가 있으며, 통계적 유의수준에 기초하여 회귀계수를 결정하여야 하므로 유의성 검정 방법을 통한 검정결과를 비교할 필요가 있다. 따라서 본 연구에서는 다중회귀분석 방법에 따른 회귀계수 유의성 검정결과 비교를 위하여 구미지역의 무차원 누가우량 백분율을 이용한 시간분포 회귀식을 이용하여 유의성 검정 방법인 분산분석 방법(Analysis of Variance)과 변수선택 방법(Backward Selection)의 검정 결과를 도출 및 비교하였다. 통계프로그램인 프로그래밍 R을 이용하여 변수선택 방법 중 후방제거법 함수를 이용하여 최종 회귀식을 도출하고 또한 7차 회귀식을 분산분석을 이용한 후방제거법으로 회귀계수를 제거하는 방법으로 최종 회귀식을 산정하였다. 분산분석을 이용한 후방제거법의 유의성 검정결과는 프로그래밍 R을 이용한 후방제거법의 결과와 동일한 것으로 분석되었다. 일반적으로 설계강우량의 시간분포를 위한 방법으로 사용되고 있는 Huff의 4분위 방법의 시간분포 회귀식은 회귀계수의 유의성 검정이 이루어지고 있지 않으므로 본 연구결과를 통해 설계강우량 시간분포 회귀식의 유의성 검정방법 제시 및 결과도출과정을 통해 시간분포 회귀식 산정기법으로 활용할 수 있을 것으로 사료된다.

  • PDF

주성분회귀분석에서 주성분선정을 위한 새로운 방법 (Procedure for the Selection of Principal Components in Principal Components Regression)

  • 김부용;신명희
    • 응용통계연구
    • /
    • 제23권5호
    • /
    • pp.967-975
    • /
    • 2010
  • 데이터마이닝 분야에서의 회귀모형에는 연관성이 높은 설명변수들이 포함되어 다중공선성을 유발하는 경우가 많은데, 다중공선성이 야기하는 문제를 해결하기 위하여 주성분회귀분석을 적용할 수 있다. 이 분석에서는 적절한 주성분을 선정하는 과정이 핵심인데, 기존의 선정방법들은 다중공선성을 잘 해결하지 못하거나 모형의 적합성을 저하시킨다는 지적을 받고 있다. 따라서 본 논문에서는 다중공선성 문제와 적합성 저하 현상을 동시에 해결할 수 있는 새로운 선정방법을 제안하였다. 다중공선성에 의해 최소제곱추정량의 분산이 팽창되는 문제를 주성분회귀에 의해 해결할 수 있지만, 주성분의 일부를 선정함에 따라 발생하는 편의도 동시에 통제해야 한다. 따라서 주성분회귀추정량의 평균제곱오차를 최소가 되게 하는 상태지수를 측정하고, 이 값에 영향을 미치는 주요 요인들을 컨조인트분석에 의해 파악하여 주성분 선정기준 모형을 구축하였다. 선정기준의 상한과 하한을 설정하고, 상태지수가 상한을 초과하면 해당 주성분을 제외시키고, 하한에 미달하면 해당 주성분을 포함시킨다. 그리고 상한과 하한 사이의 상태지수에 대응하는 주성분들에 대해서는 일반화선형검정을 순차적으로 적용하여 주성분을 선정하는 방법이다.

기상청 ASOS 자료를 활용한 다중회귀분석 기반의 계절 강수량 예측 (Estimation of seasonal rainfall based on multiple regression analysis using ASOS data of Korea Meteorological Administration)

  • 김철겸;이정우;이정은;김남원;김현준
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2019년도 학술발표회
    • /
    • pp.310-310
    • /
    • 2019
  • 본 연구에서는 기상청 ASOS(종관기상관측장비) 자료와 통계적 기반의 다중회귀분석모형을 이용하여 경안천 유역에 대한 봄철 강수량(3~5월 누적강수량)의 예측성을 평가하였다. 예측대상기간은 2006~2018년이며 예측인자로서 전국 96개 지점의 ASOS 자료 중 35개 기상요소에 대한 월 자료를 활용하였다. 전망기간(1~12개월)에 따라 강수량 기준 최소 1개월에서 최대 24개월까지의 지체시간을 고려하여 1~24개월 선행 ASOS 기상자료와 강수량 사이의 상관성을 분석하였다. 예측대상년도를 기준으로 과거 40년간의 자료를 이용하여 상관성 분석을 수행하였으며, 상관성이 높은 상위 30개 기상인자를 조합하여 다중회귀분석모형의 예측인자(독립변수)로 활용하였다. 예측대상년도와 전망기간에 따라 최적의 예측인자를 조합하고, 교차검증을 통하여 각각 4,000개의 다중회귀모형을 도출하여 예측범위를 산출하였다. 다중회귀모형에 의한 예측범위를 분석한 결과, 2013년 자료까지는 예측범위가 관측값을 잘 포함하고 예측값의 평균이나 중간값이 관측값과 유사하게 나타난 반면, 2014년부터는 전망기간에 따라 관측값과 예측범위의 차이가 크게 나타나는 경우도 있었다. 예측치의 중간값을 기준으로 3분위(평년 이상, 평년 수준, 평년 이하) 적중률을 분석하면, 2006~2013년에 대해서는 58.3%인 반면, 2014~2018년에 대해서는 11.2% 수준으로 나타났다.

  • PDF

주성분회귀와 고유값회귀에 대한 감도분석의 성질에 대한 연구 (A study on the properties of sensitivity analysis in principal component regression and latent root regression)

  • 신재경;장덕준
    • Journal of the Korean Data and Information Science Society
    • /
    • 제20권2호
    • /
    • pp.321-328
    • /
    • 2009
  • 회귀분석에서 설명변수들 사이에 상관이 높으면 최소제곱추정법에서 구한 회귀계수들의 정도가 떨어진다. 다중공선성이라 불리는 이 현상은 실제 자료분석에서 심각한 문제를 야기시킨다. 이 다중공선성의 문제를 극복하기 위한 여러 가지 방법이 제안되었다. 능형회귀, 축소추정량 그리고 주성분분석에 기초한 주성분회귀와 고유값회귀등이 있다. 지난 수십 년간 많은 통계학자들은 일반적인 중 회귀에서 감도분석에 관해 연구하였으며, 주성분회귀, 고유값회귀와 로지스틱 주성분회귀에 대해서도 같은 주제로 연구하였다. 이 모든 방법에서 주성분분석은 중요한 역할을 하였다. 또한, 많은 통계학자들이 주성분분석과 관련된 다변량 방법에서 감도분석에 대해 연구를 하였다. 본 연구논문에서는 주성분회귀와 고유값회귀를 소개하고, 또한 주성분회귀와 고유값회귀에서 감도분석의 방법을 소개하고, 마지막으로 이들두방법에 대한 감도분석의 성질에 대해 논의하였다.

  • PDF

하수처리장 방류수 수질예측을 위한 다중회귀분석 모델 개발 및 검증 (Development and Validation of Multiple Regression Models for the Prediction of Effluent Concentration in a Sewage Treatment Process)

  • 민상윤;이승필;김진식;박종운;김만수
    • 대한환경공학회지
    • /
    • 제34권5호
    • /
    • pp.312-315
    • /
    • 2012
  • 본 연구는 Media공법을 적용하고 있는 하수처리장의 실데이터를 활용하여 다중회귀분석을 통해 유출수질을 예측하는 모형을 구현하였다. 다중회귀분석은 2011년 1년간 데이터를 사용하였으며, 변수선택법 적용, 이상치와 영향치 제거, 변수의 로그변환에 따른 CASE별 연구를 수행하였다. 다중회귀분석으로 구축된 예측 모형으로 예측정확도를 검토한 결과, 2차침전지 유출수 $COD_{Mn}$는 0.87 이상, T-N은 0.81 이상으로 검토되었으며, 구축된 다중회귀모형을 이용하여 유출수가 방류수질기준을 초과하지 않는 운전조건의 범위를 설정할 수 있을 것으로 판단된다. 결론적으로 설정된 운전조건 범위 안에서 수질측면과 에너지 비용측면으로 하수처리장 운영시 운전자에게 적절한 운전 가이드를 제공할 수 있을 것으로 판단된다.

위성자료와 다중회귀분석법을 이용한 아시아 주요도시의 포름알데하이드 칼럼농도 추정연구 (First-time estimation of HCHO column in major cities over Asia using multiple regression with satellite data)

  • 최원이;홍현기;박준성;이한림
    • 대한원격탐사학회지
    • /
    • 제31권6호
    • /
    • pp.523-530
    • /
    • 2015
  • 본 연구에서는 다중회귀분석법과 Ozone Monitoring Instrument(OMI), Moderate Resolution Imaging Spectroradiometer(MODIS) 자료를 이용하여 2005년 1월부터 2008년 7월 사이 아시아 주요도시 지역의 포름알데하이드 층적분농도를 동북아시아에 위치한 3개도시(베이징, 서울, 도쿄)와 동남아시아에 위치한 3개도시(뉴델리, 다카, 방콕)에서 처음으로 추정하였다. 동북아시아의 3개 도시에서는 OMI로 측정된 포름알데하이드의 층적분농도($HCHO_{OMI}$)와 다중회귀분석방법으로 추정된 포름알데하이드의 층적분농도($HCHO_{MRM}$) 사이의 높은 상관성(0.78 < $R^2$ < 0.82)을 보였다. 동남아시아의 주요도시에서는 동북아시아 지역에 비해 $HCHO_{OMI}$$HCHO_{MRM}$사이의 낮은 상관성을 발견 할 수 있었다. 이외에도, 다중회귀분석법의 편중되지 않은 평가를 위하여, 다중회귀분석식을 도출해내기 위한 모델링 그룹과 다중회귀분석법의 성능을 보여줄 검증그룹으로 나누어 다중회귀분석법의 성능을 평가하였다. 본 연구는 아시아 일부 지역에서 다중회귀 분석법이 포름알데하이드 칼럼농도 추정에 있어 위성 관측이 어려울 경우 대안으로 활용될 수 있음을 제시하고 있다.

다중회귀에서 회귀계수 추정량의 특성 (Comments on the regression coefficients)

  • 강명욱
    • 응용통계연구
    • /
    • 제34권4호
    • /
    • pp.589-597
    • /
    • 2021
  • 단순회귀와 다중회귀에서 회귀계수의 의미는 차이가 있고 회귀계수의 추정값은 같지 않을 뿐 아니라 그 부호가 서로 다른 경우도 발생한다. 회귀모형에서 설명변수의 상대적 기여도의 파악은 회귀분석의 수행의 중요한 부분이다. 표준화 회귀모형에서 표준화 회귀계수는 해당 설명변수를 제외한 나머지 설명변수의 값이 고정되어있는 상황에서 설명변수가 표준편차만큼 증가하였을 때 반응변수가 표준편차를 기준으로 얼마나 변화했는가로 해석할 수 있지만 표준화 회귀계수의 크기가 각 설명변수의 상대적 중요도를 나타내는 척도라고 할 수 없음은 잘 알려져 있다. 본 논문에서는 다중회귀에서 회귀계수의 추정량을 상관계수와 결정계수의 함수로 나타내고 이를 추가적인 설명력과 추가적인 결정계수의 관점에서 생각해 본다. 또한 다양한 산점도에서의 상관계수와 회귀계수 추정값의 관계를 알아보고 설명변수가 두 개인 경우에 구체적으로 적용해 본다.

다중회귀분석을 이용한 남강댐 하류지역의 조류발생 특성 연구 (A Study on the Characteristics of Algae Occurrence in Lower Watershed of Nam River Dam by Using Multiple Regression Analysis)

  • 정우석;김영도
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2016년도 학술발표회
    • /
    • pp.126-126
    • /
    • 2016
  • 남강은 낙동강 주요 지류인 동시에 낙동강 하류지역의 유지용수, 생활, 공업, 농업용수 공급 등에 중요 역할을 하고 있어 오염원 및 수질관리가 매우 중요하다고 볼 수 있다. 최근 남강댐 하류 및 남강합류 후 낙동강 본류인 창녕함안보 지점에서의 녹조 발생이 빈번해지고 있으며, 녹조현상에 대한 관심과 우려가 높아지고 있는 실정이다. 따라서 기존 호소의 녹조관리는 '조류경보제'에 의해서 관리되고 있지만 4대강 16개의 보 건설 이후 '수질예보제'와 같이 녹조관리를 위한 제도 및 정책이 시행되면서 조류관리의 중요성이 대두되고 있다. 본 연구에서는 기존의 많은 문헌들을 참고하여 조류의 영향인자를 파악하였으며, 남강유역의 물관리 기초자료를 수집하고 구축된 데이터 기반의 각 항목별 주요항목 영향인자 분석을 위한 상관성 분석을 실시하여 영향인자별 상관관계 우선순위를 선정하여 입력변수로 이용하였다. 그에 따른 데이터 마이닝을 통한 조류 발생특성을 고려하여 예측 모형인 다중회귀분석(Multiple Regression Analysis)을 구현하였다. 회귀분석 과정에서 다중공선성이 발생하는 변수에 대해서는 모형에서 제거하였으며, 잔차분석을 통해 이상치와 영향치를 검토하여 고려하였다.

  • PDF

다중 응답 분류회귀트리를 이용한 음성 개성 변환 (Voice Personality Transformation Using a Multiple Response Classification and Regression Tree)

  • 이기승
    • 한국음향학회지
    • /
    • 제23권3호
    • /
    • pp.253-261
    • /
    • 2004
  • 본 논문에서는 음성 신호가 지니고 있는 화자 의존적 특징 변수를 변환 시키는 음성 개성 변환 기법이 새롭게 제안되었다. 제안된 방법은 성도 전달 함수의 특성을 반영하는 켑스트럼 벡터와 여기 신호의 특성을 반영하는 피치 값을 변환 대상 변수로 삼았으며, 이들에 대한 변환 기법으로 다중 응답 분류 회귀 트리를 사용하였다. 다중 응답 분류 회귀 트리는 기존의 분류 회귀 트리를 다차원 확장시킨 형태로서, 반응값이 벡터 형태로 존재하는 분류 회귀 트리를 의미한다. 본 논문에서는 기존의 코드북 메핑 방법과 비교하여 제안된 기법의 성능을 평가하였으며, 분류 회귀 트리에 입력되는 관찰값을 다양하게 변화시켜 트리의 복잡도와 변환 성능을 정량적으로 분석하였다. 네 명의 화자를 이용한 음성 개성 변환 실험에서, 기존의 코드북 메핑과 비교하여 객관적으로 우수한 성능을 나타내었으며, 청취 테스트에서도 변환음이 목표로 하는 화자의 음성과 유사함을 관찰할 수 있었다.