• 제목/요약/키워드: 제한이 있는 회귀모형

검색결과 58건 처리시간 0.027초

제한조건이 있는 선형회귀 모형에서의 베이지안 변수선택 (Bayesian Variable Selection in Linear Regression Models with Inequality Constraints on the Coefficients)

  • 오만숙
    • 응용통계연구
    • /
    • 제15권1호
    • /
    • pp.73-84
    • /
    • 2002
  • 계수에 대한 부등 제한조건이 있는 선형 회귀모형은 경제모형에서 가장 흔하게 다루어지는 것 중의 하나이다. 이는 특정 설명변수에 대한 계수의 부호를 음양 중 하나로 제한하거나 계수들에 대하여 순서적 관계를 주기 때문이다. 본 논문에서는 이러한 부등 제한이 있는 선형회귀 모형에서 유의한 설명변수의 선택을 해결하는 베이지안 기법을 고려한다. 베이지안 변수선택은 가능한 모든 모형의 사후확률 계산이 요구되는데 본 논문에서는 이러한 사후확률들을 동시에 계산하는 방법을 제시한다. 구체적으로 가장 일반적인 모형의 모수에 대한 사후표본을 깁스 표본기법을 적용시켜 얻은 후 이를 이용하여 모든 가능한 모형의 사후확률을 계산하고 실제적인 자료에 본 논문에서 제안된 방법을 적용시켜 본다.

베타회귀분석 방법을 이용한 건강 관련 삶의 질 자료 분석 (Analysis of health-related quality of life using Beta regression)

  • 장은진
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권3호
    • /
    • pp.547-557
    • /
    • 2017
  • 건강 관련 삶의 질 자료는 정규분포를 따르지 않고 치우친 분포를 보이며, 등분산 가정을 만족하지 않는 경우가 대부분이다. 또한 건강 관련 삶의 질 자료는 범위가 정해져 있는 자료이며, 건강한 상태를 나타내는 경우 최대값을 가지는 천장효과가 있는 자료이다. 본 연구에서는 건강 관련 삶의 질 자료인 EQ-5D에 대해 선형회귀모형과 베타회귀모형, 그리고 평균과 정밀도에 대한 하위모형을 가지고 있는 확장된 베타회귀모형을 이용하여 예측모형을 개발하고 모형의 예측 정확도를 비교하였다. 선형회귀모형에 비해 확장된 베타회귀모형의 예측 정확도가 높기는 하지만 신뢰구간이 겹치고 있기 때문에 확장된 베타회귀모형의 정확도가 더 높다고 할 수는 없다. 하지만 확장된 베타회귀모형은 공변량에 따라 분산이 달라지는 부분을 설명할 수 있으며 선형회귀모형이 제한된 범위를 벗어난 값을 예측하는 부분을 개선할 수 있다. 따라서 범위가 제한되고 이분산이 있는 치우친 자료에 대해 공변량들이 평균 및 정밀도에 영향을 주는 정도를 동시에 고려하는 확장된 베타회귀모형은 건강 관련 삶의 질 자료인 EQ-5D를 분석하는 방법으로 적절하다고 할 수 있다.

딜또는노딜 게임에서 딜금액 결정 모형 (Deal price model in Deal-or-No-Deal game)

  • 송설희;안수한
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권4호
    • /
    • pp.697-703
    • /
    • 2014
  • 본 논문에서 다루는 딜또는노딜 게임은 미국 NBC 방송국의 인기 오락 프로그램으로 여러 개의 단계로 구성되어 있다. 본 논문에서는 각 단계에서 제시되는 딜금액 결정 모형을 제한이 있는 회귀모형과 이차계획법을 이용하여 규명한다. 최종적으로 딜금액 결정 모형식과 관련하여 각 단계별로 선형식을 유도하고 딜금액이 선형식으로부터 얻어지는 값을 반올림한 정수값과 일치함을 시뮬레이션 자료를 이용하여 밝혔다.

동적 다중선형회귀 모형을 이용한 한반도 수문기상인자 산정 (Estimation of Hydrometeorologic Parameters using Dynamic Multiple Linear Regression Model)

  • 조현곤;김백조;임윤진;김광섭
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2016년도 학술발표회
    • /
    • pp.286-286
    • /
    • 2016
  • 기후변화를 고려한 위한 미래 수자원 계획은 신뢰성 있는 수문기상인자의 산정을 통한 수자원 영향 평가 결과로 수립되는 것이 중요하다. 본 연구에서는 DHSVM모형과 TOPLATS모형에서 생산된 결과를 가지고 제약조건을 가지는 다중선형회귀 모형을 통하여 2012년-2014년 동안의 한반도 유역에 대한 수문기상인자를 산정하였다(Fig. 1). 다중선형회귀 모형은 하나의 종속변수의 변화를 설명하기 위하여 두 개 이상의 독립변수를 사용하는 모형으로 일반적으로 다중선형회귀 모형의 회귀 계수는 음의 값을 가질 수 있으므로 본 연구의 적용을 위하여 검정지점에 대하여 산정된 음의 회귀계수 값이 그대로 적용될 경우 적합하지 않으므로 회귀 계수에 제약조건을 부여하였다. 제한된 회귀 계수의 범위는 0-1사이를 가진다. 동적 다중선형 모형의 구성은 광릉 GCK, GDK 지점자료를 활용하였다.

  • PDF

나이브 베이즈 분류와 기상예보자료 기반의 농업용 저수지 저수율 전망을 위한 저수율 예측 다중선형 회귀모형 개발 (Development of Multiple Linear Regression Model to Predict Agricultural Reservoir Storage based on Naive Bayes Classification and Weather Forecast Data)

  • 김진욱;정충길;이지완;김성준
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2018년도 학술발표회
    • /
    • pp.112-112
    • /
    • 2018
  • 최근 이상기후로 인한 국부적인 혹은 광역적인 가뭄이 빈번하게 발생하고 있는 추세이며 발생횟수 뿐 아니라 가뭄 심도 및 지속기간이 과거보다 크게 증가하여 그에 따른 피해가 커질 것으로 예측되고 있다. 특히, 2014~2015년도의 유례없는 가뭄으로 인해 저수지 용수공급이 제한되면서 많은 농가들이 피해를 입었다. 본 연구의 목적은 전국 농업용 저수지를 대상으로 기상청 3개월 예보자료를 활용 할 수 있는 농업용 저수지 저수율 다중선형 회귀 모형을 개발하여 저수율 전망정보를 생산하는 것이다. 본 연구에서는 전국에 적용 가능한 저수율 다중선형 회귀 모형개발을 위해 5개의 기상요소(강수량, 최고기온, 최저기온, 평균기온, 평균풍속)와 관측 저수지 저수율을 활용했다. 기상자료는 2002년부터 2017년까지의 기상청 63개 지상관측소로부터 기상관측자료를 수집하였다. 본 연구에서는 저수율 전망 단계를 세 단계로 나누었다. 첫 번째 단계로 농어촌공사에서 전국 511개 용수구역을 대상으로 군집분석 및 의사결정나무 분석을 통해 제시한 65개 대표저수지를 대상으로 기상자료 및 관측 저수율 자료를 이용하여 다중선형 회귀분석을 실시하였다. 수집한 기상요소와 저수율을 독립변수로 하여 월별 회귀식을 산정한 결과 결정계수($R^2$)는 0.51~0.95로 나타났다. 두 번째 단계로 대표저수지의 회귀분석 결과를 전국의 저수지로 확대하기 위해 나이브 베이즈 분류법을 적용하여 전국 3098개의 저수지를 65의 군집으로 분류하고 각각의 군집에 해당되는 월별 회귀식을 산정하였다. 마지막으로 전국 저수지로 산정된 회귀식과 농업 가뭄 예측을 위해 기상청의 GS5(Global Seasonal Forecasting System 5) 3개월 예보자료를 수집하여 회귀식에 적용해 2017년 전국 저수지의 3개월 저수율 전망정보를 생산하였다. 본 연구의 전국 저수지 군집결과 기반의 저수율 전망기술은 2017년도 관측 저수율과 비교한 결과 유의한 상관성을 나타냈으며 이 결과는 추후 농업용 저수지의 물 공급 및 농업가뭄 전망 자료로서 이용이 가능할 것으로 판단된다.

  • PDF

퍼지 및 신경망이론을 이용한 도시부 신호교차로 교통사고예측모형 개발 (Development of Traffic Accident Frequency Prediction Model in Urban Signalized Intersections with Fuzzy Reasoning and Neural Network Theories)

  • 강영균;김장욱;이수일;이수범
    • 한국도로학회논문집
    • /
    • 제13권1호
    • /
    • pp.69-77
    • /
    • 2011
  • 본 연구는 신호교차로 교통사고예측모형 구축 과정 중 일반적으로 제한된 변수의 선정 및 모형의 구축에만 주로 초점이 맞추어진 기존 방법론의 문제점을 개선하고, 자료조사 및 수집 과정에서 발생하는 자료의 불확실한 상태를 인정하면서 자료의 불확실성을 최소화하여 이용할 수 있는 방법론을 개발하는데 연구의 주안점을 두었다. 퍼지추론이론과 신경망이론을 이용한 모형을 구축하였고, 마지막으로 구축된 퍼지추론이론 모형 및 신경망이론 모형과 기존 회귀모형인 포아송 회귀모형간의 통계적인 검증과 실제 Data를 이용한 모형의 적정성을 검토하였다. 모형의 통계적인 검증시 기존모형에 비해 퍼지추론모형과 신경망이론모형이 더 설명력이 높은 것으로 나타났고, 검증에서도 퍼지추론이론과 신경망이론이 적절한 것으로 나타났으며 기존모형보다 사고건수를 예측하는 설명력이 높은 것으로 입증되었다. 본 연구에서 개발된 모형은 계획 및 운영단계에서 신호교차로의 안전성을 측정하는데 활용될 수 있으며, 궁극적으로는 신호교차로에서 교통사고를 줄이는데 기여할 수 있을 것으로 판단된다.

한국기업의 가치평가모형 구축에 관한 실증적 연구

  • 김철중
    • 재무관리논총
    • /
    • 제7권1호
    • /
    • pp.71-98
    • /
    • 2001
  • 본 연구는 절대가치 추정방법인 EVA모형과 FCFF모형, 그리고 상대가치 추정방법인 PER모형, PBR모형 및 PSR모형의 한국기업에의 적합성을 검증하는 것을 목표로 하고 있다. 분석대상기간은 1992년$\sim$1996년까지 5년 간으로 하였으며 수익률 자료를 획득할 수 있고 괴리율을 계산할 수 있는 207개 기업을 전체 표본기업으로 선정하였다. 절대가치평가모형에 의한 집단간 차이분석에서는 EVA모형과 FCFF모형 모두 집단간에 유의적인 차이를 보이는 것으로 나타났다. 그리고 상대가치평가모형에 의한 집단간 차이분석에서는 PBR모형과 PSR모형은 분석기간 동안 집단간에 유의적인 차이를 보이는 것으로 나타났다. PER모형의 경우에는 재무제표 공시일 이전에 이미 반영되고 공시일 이후에는 차이를 보이지 않는 것으로 나타났다. 회귀분석 결과 주식수익률은 산업평균수익률인 Rc와 FCFF모형에 의한 괴리율과 강한 유의적인 관계를 갖고 PBR모형에 의한 괴리율과는 약한 유의적인 관계를 갖는 다는 것을 확인할 수 있었다. 이상의 연구결과는 절대가치 추정방법인 FCFF모형과 상대가치 추정방법인 PBR모형에 의한 기업평가모형이 제한적이지만 한국주식시장에서 어느 정도 적합성을 가질 수 있다(재무제표 공시일 기준)는 가능성을 보여주고 있다.

  • PDF

비선형 앙상블 모형을 이용한 수문량 예측 (Hydrologic Variable Prediction Using Nonlinear Ensemble Model)

  • 권현한;김민지;김장경;나봉길
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2011년도 학술발표회
    • /
    • pp.359-359
    • /
    • 2011
  • 기존 수자원계획에 있어서 수문량 예측은 매우 제한적으로 활용되고 있는 실정으로서 최근 기후변화 및 이상기후로 기인하는 기상학적 불확실성 증가에 대해서 효과적으로 대응 하기가 어렵다. 본 연구에서는 기상인자를 활용한 수문변량 예측기법을 개발하고자 하며 국내에 수문자료가 충분한 지역에 대해서 모형의 적합성과 타당성을 평가하고자 한다. 대부분의 수문변량은 해수면온도, 해수면기압, 바람장 등 Large Scale의 기상학적 특성과 연관성을 가지고 있으며 선행시간을 가지고 수문순환에 영향을 주고 있다. 수문변량과 기상학적 변량사이에는 일반적으로 비선형 관계를 가지고 있는 것으로 알려지고 있으며 이러한 비선형 관계를 효과적으로 예측하기 위해서 본 연구에서는 비선형 예측모형을 개발 하고자 한다. 최근 비선형 예측모형에서 불확실성을 고려한 모형에 대한 연구가 활발히 진행되고 있으며 특히, 다중 모형을 사용한 Ensemble 개념의 예측모형 도입이 이루어지고 있다. 본 연구에서는 국내 다목적댐 유입량 및 강수량에 대해서 최적 기상변량을 도출하고 이를 활용한 비선형 Ensemble 예측모형을 개발하였다. 일반적인 선형 회귀분석 모형에 비해 기상현상과 수문현상에 비선형성을 효과적으로 재현할 수 있는 장점을 확인할 수 있었으며 이와 더불어 예측결과에 대한 불확실성을 제공함으로서 신뢰성 있는 수자원 계획을 위한 기초자료로서 활용이 가능할 것으로 판단된다.

  • PDF

재입원 예측 모형 개발에 관한 연구 (A Study on the Development of Readmission Predictive Model)

  • 조윤정;김유미;함승우;최준영;백설경;강성홍
    • 한국산학기술학회논문지
    • /
    • 제20권4호
    • /
    • pp.435-447
    • /
    • 2019
  • 불필요한 재입원을 예방하기 위해서는 재입원 확률이 높은 집단을 집중적으로 관리할 필요가 있다. 이를 위해서는 재입원 예측모형의 개발이 필요하다. 재원예측 모형을 개발하기 위해 1개 대학병원의 2016년에서 2017년의 2년간의 퇴원요약환자 데이터를 수집하였다. 이때 재입원 환자는 연구 기간 내에 2번 이상 퇴원한 환자라 정의 하였다. 재입원환자의 특성을 파악하기 위해 기술통계와 교착분석을 실시하였다. 재입원 예측 모형개발은 데이터마이닝 기법인 로지스틱회귀모형, 신경망, 의사결정모형을 이용하였다. 모형평가는 AUC(Area Under Curve)를 이용하였다. 로지스틱회귀모형이 AUC가 0.81로 가장 우수하게 나옴에 따라 본 연구에서는 로지스틱 회귀모형을 최종 재입원 예측 모형으로 선정을 하였다. 로지스틱회귀모형에서 선정된 재입원에 영향을 끼치는 주요한 변수는 성별, 연령, 지역, 주진단군, Charlson 동반질환지수, 퇴원과, 응급실 경유 여부, 수술여부, 재원일수, 총비용, 보험종류 등이었다. 본 연구에서 개발한 모형은 1개병원의 2년치 자료이므로 일반화하기에는 제한점이 있다. 추후에 여러 병원 장기간의 데이터를 수집하여 일반화 할 수 있는 모형을 개발하는 것이 필요하다. 더 나아가 계획에 없던 재입원 까지 예측을 할 수 있는 모형을 개발하는 것이 필요하다.

고혈압 약물치료율의 지역 간 변이에 관한 연구 (A Study on The Regional Variation of Hypertension Medication Rate)

  • 석향숙;강성홍
    • 디지털융복합연구
    • /
    • 제11권9호
    • /
    • pp.255-265
    • /
    • 2013
  • 본 연구는 고혈압 약물치료율의 지역 간 변이요인을 규명하고 이를 지역별 맞춤형 고혈압 환자 관리 사업계획을 수립할 수 있는 기초자료로 활용하기 위해 수행되었다. 자료는 지역사회건강조사 자료, 통계청 자료, 국민건강보험공단 자료를 수집하였으며 지리적 가중 회귀분석 기법을 이용하여 분석하였다. 고혈압 약물치료율의 지역 간 변이요인을 분석한 결과 지역 간 고혈압 약물치료율에 영향을 미치는 요인은 지역의 양호한 주관적 건강수준 인지율, 의료급여자의 비율, 인구10만명당 보건기관 수로 나타났다. 지리적 가중 회귀모형에 따라 고혈압 약물치료율에 영향을 미치는 주요 변수로 구성된 총 230개의 지역별 회귀모형이 산출되었다. 그럼에도 불구하고 모형의 설명력이 높지 않는 등 연구의 제한점이 있었다. 따라서 고혈압 환자의 실제 투약순응도를 반영한 후속연구가 필요할 것이다.