• 제목/요약/키워드: 회귀 모형

검색결과 3,363건 처리시간 0.032초

방향성을 고려한 공간적 조건부 자기회귀 모형 (Directional conditionally autoregressive models)

  • 경민정
    • 응용통계연구
    • /
    • 제29권5호
    • /
    • pp.835-847
    • /
    • 2016
  • 공간통계 방법 중 지역에 대한 어떤 집합체 자료나 평균자료들을 분석하는데 일반적으로 공간적 자기회귀(conditionally autoregressive) 모형을 사용한다. 공간적 자기회귀 모형에 정의되는 공간적 이웃 소지역들은 중점의 거리나 근접성으로 정의된다. Kyung과 Ghosh (2010)는 방향에 따라서 이웃간 자기상관성의 크기가 다른 공간적 확장 모형을 제시하였다. 제안된 방향적 조건부 자기회귀(directional conditionally autoregressive) 모형은 고유 이방성을 모형화하여 기존의 CAR과정을 일반화한다. 제시한 방향적 조건부 자기회귀모형의 최대우도 추정량의 특성에 대해 설명하였고, 스코틀랜드 그레이터 글래스고우의 로그변환된 부동산 가격에 적용하여 조건부 자기회귀모형과 비교하였다.

관측 수위자료를 이용한 하류 홍수위 예측기법 (Forecasting Technique of Downstream Water Level using the Observed Water Level)

  • 김상문;최흥식
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.354-354
    • /
    • 2017
  • 홍수예경보는 발생되는 홍수의 규모와 시간을 가능한 정확하고 빠르게 예측하여 홍수에 대한 위험성을 사전에 알리고자 하는데 목적이 있다. 따라서 하천범람에 따른 피해를 최소화하기 위한 홍수예경보는 일정시간의 선행시간을 확보하는 것이 매우 중요하다. 본 연구에서는 현재 하천에서 측정되고 있는 수위 관측 자료를 이용하여 하류의 수위를 예측하였다. 수위 예측을 위해 다중회귀모형 및 신경망 모형을 한강의 제1지류인 횡성댐 상류 섬강 시험유역에 적용하였다. 다중회귀모형 및 신경망 모형의 학습에는 섬강 시험유역의 2002년부터 2010년까지의 수위 관측 자료를 이용하였으며, 학습된 모형을 이용하여 30분 이내에 발생 가능한 수위를 예측하였다. 모의 결과 신경망 수위예측모형의 결정계수는 0.967으로 나타났으며, 다중회귀수위예측 모형의 결정계수는 0.815로 나타나 신경망을 이용한 수위예측모형이 다중회귀모형보다 좀 더 나은 예측 결과를 나타내는 것을 확인할 수 있었다. 본 연구결과는 향후 중소하천에서 선행시간을 확보한 홍수 예경보 구축에 활용할 수 있을 것으로 판단된다.

  • PDF

국면전환 임계 자기회귀 분석을 위한 베이지안 방법 비교연구 (A Comparison Study of Bayesian Methods for a Threshold Autoregressive Model with Regime-Switching)

  • 노태영;조성일;이령화
    • 응용통계연구
    • /
    • 제27권6호
    • /
    • pp.1049-1068
    • /
    • 2014
  • 자기회귀 모형(autoregressive model)은 일변량(univaraite) 시계열자료의 분석에서 널리 사용되는 방법 중 하나이다. 그러나 이 방법은 자료에 일정한 추세가 있다고 가정하기 때문에 자료에 분절(structural break)이 존재할 때 적절하지 않을 수 있다. 이러한 문제점을 해결하기 위한 방법으로 국면전환(regime-switching) 모형인 임계자기회귀 모형(threshold autoregressive model)이 제안되었는데 최근 지연 모수(delay parameter)을 포함한 이 국면전환(two regime-switching) 모형으로 확장되어 많은 연구가 활발히 진행되고 있다. 본 논문에서는 이 국면전환 임계자기회귀 모형을 베이지안(Bayesian) 관점에서 살펴본다. 베이지안 분석을 위해 모수적 임계자기 회귀 모형 뿐만 아니라 디리슐레 과정(Dirichlet Process) 사전분포를 이용하는 비모수적 임계자기 회귀 모형을 고려하도록 한다. 두 가지 베이지안 임계자기 회귀 모형을 바탕으로 사후분포를 유도하고 마코프 체인 몬테 카를로(Markov chain Monte Carlo) 방법을 통해 사후추론을 실시한다. 모형 간의 성능을 비교하기 위해 모의실험을 통한 자료 분석을 고려하고, 더 나아가 한국과 미국의 국내 총생산(Gross Domestic Product)에 대한 실증적 자료 분석을 실시한다.

모형 선택 기준들에 대한 LASSO 회귀 모형 편의의 영향 연구 (A study on bias effect of LASSO regression for model selection criteria)

  • 유동현
    • 응용통계연구
    • /
    • 제29권4호
    • /
    • pp.643-656
    • /
    • 2016
  • 고차원 자료(high dimensional data)는 변수의 수가 표본의 수보다 많은 자료로 다양한 분야에서 관측 또는 생성되고 있다. 일반적으로, 고차원 자료에 대한 회귀 모형에서는 모수의 추정과 과적합을 피하기 위하여 변수 선택이 이루어진다. 벌점화 회귀 모형(penalized regression model)은 변수 선택과 회귀 계수의 추정을 동시에 수행하는 장점으로 인하여 고차원 자료에 빈번하게 적용되고 있다. 하지만, 벌점화 회귀 모형에서도 여전히 조율 모수 선택(tuning parameter selection)을 통한 최적의 모형 선택이 요구된다. 본 논문에서는 벌점화 회귀 모형 중에서 대표적인 LASSO 회귀 모형을 기반으로 모형 선택의 기준들에 대한 LASSO 회귀 추정량의 편의가 어떠한 영향을 미치는지 모의실험을 통하여 수치적으로 연구하였고 편의의 보정의 필요성에 대하여 나타내었다. 실제 자료 분석에서의 영향을 나타내기 위하여, 폐암 환자의 유전자 발현량(gene expression) 자료를 기반으로 바이오마커 식별(biomarker identification) 문제에 적용하였다.

비대칭 라플라스 분포를 이용한 분위수 회귀 (Quantile regression using asymmetric Laplace distribution)

  • 박혜정
    • Journal of the Korean Data and Information Science Society
    • /
    • 제20권6호
    • /
    • pp.1093-1101
    • /
    • 2009
  • 분위수 회귀모형은 확률변수들 사이에 확률적인 관계구조를 포함한 함수 모형을 좀 더 완벽하게 추정하도록 제공한다. 본 논문에서는 함수 추정에 로버스트하다고 알려져 있는 서포트벡터기계 기법과 이중벌칙커널기계를 이용하여 분위수 회귀모형을 추정하고자 한다. 이중벌칙커널기계는 고차원의 입력변수에 대한 분위수 회귀가 요구될 때 분위수 회귀모형을 잘 추정한다고 알려져 있다. 또한 본 논문에서는 광범위한 형태의 분위수 회귀모형 추정을 위해서 정규분포보다 비대칭 라플라스 분포를 이용한다. 본 논문에서 제안한 모형은 분위수 회귀모형 추정을 위해서 서포트벡터기계 기법에 이중벌칙커널기계를 이용하여 각각의 평균과 분산을 동시에 추정한다. 평균과 분산함수 추정을 위해 사용된 커널함수의 모수들은 최적의 값을 찾기 위해 일반화근사 교차타당성을 이용한다.

  • PDF

비율자료 모델링을 위한 베이지안 베타회귀모형의 비교 연구 (A study on Bayesian beta regressions for modelling rates and proportions)

  • 이정인;김재오;조성일
    • 응용통계연구
    • /
    • 제37권3호
    • /
    • pp.339-353
    • /
    • 2024
  • 비율자료와 같이 반응변수가 제한된 구간에 속하는 경우 비대칭성이나 이분산성의 문제들로 인해 정규성 가정을 기반으로 하는 회귀모형의 적용은 부정확한 결과가 도출될 수 있다. 이러한 경우 대안으로 베타회귀모형이 고려된다. 베타회귀모형은 베타분포를 평균과 정밀도 모수로 재모수화 하였을 때, 반응변수가 베타분포를 따른다는 가정하에 평균과 정밀도에 대한 하위모형을 갖는 회귀모형으로 자료의 이분산성을 쉽게 고려할 수 있다. 본 연구에서는 두 가지 실증분석에서 비율자료에 베타회귀모형을 적합하여 분석하고자 한다. 특히, 제6기 국민 건강조사자료를 통해 흡연율과 커피 섭취와의 연관성을, COVID-19 자료를 기반으로 미국의 지역 특성들과 누적 사망률의 연관성을 고찰한다. 각 분석에서는 보통최소제곱 회귀모형과 베타회귀모형 및 확장된 베타회귀모형을 적용하여 최적의 모형을 선택하고 결과를 해석한다. 분석의 결과는 비율자료에서 베타회귀모형 및 확장된 베타회귀모형 적용의 적절성을 입증한다.

이상치가 존재하는 단순회귀모형에서 Rice 추정량에 관해서 (On Rice Estimator in Simple Regression Models with Outliers)

  • 박천건
    • 응용통계연구
    • /
    • 제26권3호
    • /
    • pp.511-520
    • /
    • 2013
  • 이상치가 존재하는 회귀모형에서 이상치를 탐색하거나 로버스트 추정량에 대한 연구는 매우 중요하다. 이러한 연구는 leave-one-out를 이용하여 회귀계수를 추정하고 잔차를 이용하여 오차 분산을 추정하여 이상치를 탐색하는데 있다. 본 연구는 회귀모형에서 회귀계수를 추정하지 않고 오차 분산을 추정할 수 있는 Rice 추정량의 적용을 소개한 것이다. 특히, 단순회귀모형에서 이상치의 유무에 따라 Rice 추정량의 통계적 성질을 비교하고 이상치 탐색에 있어 어떤 장점이 있는지를 탐색한 연구이다.

신경망모형을 이용한 아파트 가격 모형에 관한 연구

  • 홍한국
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2009년도 춘계학술대회 미래 IT융합기술 및 전략
    • /
    • pp.220-226
    • /
    • 2009
  • 본 연구는 회귀모형을 부정하기보다는 새로운 모형을 도입하여, 회귀모형의 문제점을 극복하고 회귀모형과 상호보완적인 모형을 소개하고자 본 연구를 수행하였다. 현재까지 인공지능 분야에서 널리 이용되어 왔던 신경망모형(Neural Network Model)은 입력변수가 불완전하고 변동폭이 넓은 경우에도 해석이 가능하며, 데이터 수가 적거나 불규칙한 경우라도 사례의 반복학습을 통해 오차를 줄여나가기 때문에, 데이터 수에 민감한 영향을 받는 회귀모형보다 정밀한 산정이 가능하다(박우열, 차정환, 강경인, 2002). 이러한 신경망모형에 아파트 특성들을 도입하여 아파트 가격을 정밀하고 유효하게 예측하는 것은 아파트 가격에 대한 연구 분야에 큰 의미가 있다. 그리고 주택에 관한 기존 연구와 신규 연구에 신경망모형이 활용될 수 있으리라 판단된다.

  • PDF

신경망모형을 이용한 아파트 가격 모형에 관한 연구

  • 홍한국
    • 한국품질경영학회:학술대회논문집
    • /
    • 한국품질경영학회 2010년도 춘계학술대회
    • /
    • pp.379-385
    • /
    • 2010
  • 본 연구는 회귀모형을 부정하기보다는 새로운 모형을 도입하여, 회귀모형의 문제점을 극복하고 회귀모형과 상호보완적인 모형을 소개하고자 본 연구를 수행하였다. 현재까지 인공지능 분야에서 멀리 이용되어 왔던 신경망모형 (Neural Network Model)은 입력변수가 불완전하고 변동 폭이 넓은 경우에도 해석이 가능하며, 데이터 수가 적거나 불규칙한 경우라도 사례의 반복학습을 통해 오차를 줄여나가기 때문에, 데이터 수에 민감한 영향을 받는 회귀모형보다 정밀한 산정이 가능하다(박우열, 차정환, 강경인, 2002). 이러한 신경망모형에 아파트 특성들을 도입하여 아파트 가격을 정말하고 유효하게 예측하는 것은 아파트 가격에 대한 연구 분야에 큰 의미가 있다. 그리고 주택에 관한 기존 연구와 신규 연구에 신경망모형이 활용될 수 있으리라 판단된다.

  • PDF

영과잉 음이항회귀 모형을 이용한 보험설계사들의 이직횟수 적합 (Fit of the number of insurance solicitor's turnovers using zero-inflated negative binomial regression)

  • 전희주
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권5호
    • /
    • pp.1087-1097
    • /
    • 2017
  • 본 연구는 계수자료 (count data)를 반응변수로 갖는 포아송회귀 모형, 음이항회귀 모형, 영과잉 포아송회귀 모형, 영과잉 음이항회귀 모형의 4 모형의 비교를 통해 보험 설계사들의 이직횟수 적합을 위한 최적모형을 찾고자 한다. 보험설계사 이직횟수의 분산이 평균보다 큰 과대산포가 존재하고 0인 경우의 비중이 높을 경우에 영과잉 음이항회귀 모형을 적합하는 것이 타당함을 보여주고 보험 설계사들의 이직횟수에 영향을 주는 요인을 규명하고자 한다. 로그우도값, AIC, SBC 등을 고려하여 보험설계사 이직횟수 적합을 최적의 모형은 영과잉 이항모형과 음이항회귀모형의 결합인 영과잉 음이항 모형이 선택되었다. 영과잉 이항모형에 포함된 변수로는 성별, 총 보험설계사 근무연월, 교차모집 설계사 등록, 보유고객 수, 소속회사 유형이었고, 음이항회귀 모형에 포함된 변수로는 직무만족, 조직몰입, 채널경영만족, 총 보험설계사 근무연월, 현 직장에서 근무연월, 소속회사 유형이었다. 영과잉 음이항회귀 모형의 적합결과, 이직횟수에 유의한 영향을 주는 요인으로는 현 직장에서 근무연월, 총 보험설계사 근무연월, 소속회사 유형, 채널경영만족, 직무만족 순으로 나타났다.