• 제목/요약/키워드: 회귀분석 방법

검색결과 3,605건 처리시간 0.039초

방향성 공간적 조건부 자기회귀 모형의 베이즈 분석 방법 (Bayesian analysis of directional conditionally autoregressive models)

  • 경민정
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권5호
    • /
    • pp.1133-1146
    • /
    • 2016
  • 공간통계 방법 중 지역에 대한 어떤 집합체 자료나 평균자료들을 분석하는데 일반적으로 공간적 자기회귀 (conditionally autoregressive) 모형을 사용한다. 공간적 자기회귀 모형에 정의되는 공간적 이웃 소지역들은 중점의 거리나 근접성으로 정의된다. Kyung과 Ghosh (2009)는 방향에 따라서 이웃간 자기상관성의 크기가 다른 확장된 공간 모형을 제시하였다. 제안된 방향적 조건부 자기회귀 (directional conditionally autoregressive) 모형은 고유 이방성을 모형화하여 기존의 CAR과정을 일반화한다. 제시한 방향적 조건부 자기회귀모형의 모수추정으로 마르코프 체인 몬테 카를로 방법을 기반으로 한 베이즈 추정법을 제시한다. 제시한 모형을 스코틀랜드 그레이터 글래스고우의 로그변환된 부동산 가격에 적용하여 조건부 자기회귀모형과 비교하였다.

학생정보를 이용한 대졸 취업에 미치는 영향력 분석 (Determinants of job finding using student's characteristic information)

  • 조장식
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권5호
    • /
    • pp.849-856
    • /
    • 2011
  • 본 논문은 K-대학교 졸업생들의 취업여부에 미치는 영향력을 분석하기 위해 입학, 재학 및 개인특성 관련 변수들을 사용하였다. 이를 위해 모수적인 방법인 로지스틱 회귀분석을 사용하여 독립변수들의 주효과를 분석하였다. 또한 회귀분석 방법에서 독립변수들의 주효과 결과에 대한 보완으로, 비모수적인 방법인 의사결정나무 분석을 통하여 취업여부에 영향을 주는 독립변수들의 상호작용효과를 분석하였다. 먼저 회귀분석결과, 입학관련 변수들 중에서는 외국어영역 점수가 높을수록 취업확률이 높게 나타났으며, 재학 관련 변수들 중에서는 평균평점이 높을수록 취업확률이 높게 나타났다. 그리고 계열은 예체능계열에 비해서 자연계열이 취업확률이 높게 나타났으며, 개인특성 관련 변수들은 졸업 당시 연령이 작을수록 취업확률이 높게 나타났으며, 졸업시기는 8월 졸업생들에 비해서 2월 졸업생들이 취업확률이 높은 것으로 나타났다. 한편, 의사결정나무분석 결과에서는 졸업시기가 2월이면서 평균평점이 3.51점보다 높으면서 연령이 26.51세보다 작고 자연계열인 경우 취업률이 특히 높게 나타났다. 또한 졸업시기가 8월이면서 예체능계열의 졸업생인 경우 취업률이 특히 낮은 것으로 나타났다.

국채선물을 이용한 채권포트폴리오의 VECM과 VAR모형에 의한 헤지

  • 한성윤;임병진;원종현
    • 재무관리논총
    • /
    • 제8권1호
    • /
    • pp.231-252
    • /
    • 2002
  • 2000년 7월부터 채권시가평가의 실행으로 채권운용자들도 채권포트폴리오의 위험을 채권선물을 이용하여 통제하거나 감소시키기 위해 헤지를 하여야 한다. 이때 헤지비율을 추정하는 방법으로는 전통적 회귀분석모형, 백터오차수정모형(Vector Error Correction Model : VECM)과 VAR모형(Vector AutoRegressive Model)이 있다. 전통적인 회귀분석모형에 의하여 추정된 헤지비율은 시계열자료의 불안정성(nonstationary) 등으로 인하여 잘못 추정될 가능성이 있어 면밀한 검토와 분석 후 사용하여야 한다. 시계열자료의 불안정성으로 말미암아 야기되는 문제점들을 개선할 수 있는 모형으로서 VECM과 VAR모형이 널리 이용되고 있다. 따라서 본 연구는 VECM과 VAR모형을 사용하여 추정된 헤지비율과 전통적 회귀분석모형을 사용하여 추정한 헤지비율을 비교하여 어떤 모형으로 추정한 헤지비율이 더 정확한지를 평가하는데 목적을 두고 있다. 즉, 본 연구는 KTB 현 선물의 헤징에 대한 연구로 2000년 1월 4일부터 2001년 7월 27일까지 385일간의 KTB 현 선물 자료와 불룸버그 국채지수를 대상으로 VECM 및 VAR모형과 전통적 회귀분석모형에 의한 헤지비율을 추정하고 각 모형의 설명력과 예측력을 비교하고자 한다. 이 연구의 실증분석 결과, KTB 현물가격과 KTB 선물가격간, 블룸버그 국채지수와 KTB 선물가격간에는 공적분 관계가 존재하며, VECM 및 VAR와 전통적 회귀분석모형을 이용하여 추정한 최적헤지비율의 크기는 대동소이(大同小異)하며, 전통적 회귀분석방법을 이용하는 것이 VECM과 VAR모형을 이용할 때 보다 설명력과 예측력이 우월한 것으로 나타났다.

  • PDF

회귀분석을 통한 BFI 성격 데이터와 위치 데이터의 관계 분석 (Analysis of the relationship between BFI Personality Data and Location Data through Regression)

  • 김승연;송하윤
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.352-355
    • /
    • 2014
  • 심리학 연구에 따르면, 인간은 각자의 성격에 따라 이동패턴이 변화한다고 한다. 하지만 실험적 근거가 아닌, 어디까지나 가설로만 사용되어 왔다. 우리의 연구에서는 이런 가설을 증명하기 위해 실제 실험 참가자를 모집하였고, 각 참가자들의 GPS데이터와 BFI성격 데이터를 수집하였다. 그리고 BackProgagation Network를 이용하여, 새로운 위치 데이터를 추론하고, 이렇게 추론된 결과를 바탕으로 회귀분석을 하여, 실제 사람의 성격과 위치 데이터간의 관계를 통계적인 방법에 의해서 보여줄 것이다. 논문의 내용 중 첫 번째로 우리가 지금까지 한 선행 연구에 대해서 설명한다. 여기서 어떻게 참가자를 모집했으며, 각 GPS정보와 BFF성격 정보를 BPN에 학습시키는지 보여줄 것이다. 두 번째로 선행 연구에서 만든 BPN을 바탕으로 어떻게 회귀분석을 하는지 보여줄 것이며, 세 번째로 회귀분석을 통해 나온 통계적인 데이터를 분석하고, 거기에서 의미를 해석할 것이다.

로지스틱 회귀분석을 활용한 한강권역 홍수위험 예보기법 개발 (Flood Risk Forecasting using Logistic Regression for the Han River Basin)

  • 이선미;최영제;이재응
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.354-354
    • /
    • 2021
  • 2020년은 장마기간이 49일간 지속됨에 따라 침수, 산사태 등 많은 홍수피해가 발생하였다. 특히 서울에서는 한강 본류의 수위가 급격하게 증가함에 따라 둔치 및 도로 침수 피해가 발생하였다. 이처럼 하천의 수위증가로 인한 홍수피해에 대응하기 위해 홍수통제소 및 기초지자체에서는 홍수특보를 발령한다. 이 홍수특보는 수위관측소 지점별 계획홍수량의 50 %, 70 % 이상의 홍수량이 발생할 경우 홍수주의보와 홍수경보가 발령되며, 이 기준은 각 권역별로 동일하다. 하지만 2017년 의정부시에서는 중랑천 수위증가로 인해 주변 지역에 침수피해가 발생하였지만, 이때 홍수량은 계획홍수량 대비 약 30 %에 불과하였다. 이처럼 한강권역 내 하천수위 증가로 인한 홍수피해는 계획홍수량의 50 % 이내에서 발생하기도 한다. 이에 본 연구에서는 한강권역을 대상으로 현재 2단계로 발령되는 홍수특보를 3단계로 세분화하고자 하였다. 단계별 홍수량 위험기준을 산정하기 위해 과거 홍수피해 발생 이력이 있는 한강권역 내 43개의 수위관측소 지점을 선정하였으며, 지점별 홍수기 동안의 홍수량 및 피해액 자료를 수집하였다. 각 단계별 홍수량 기준을 산정하기 위해서는 로지스틱 회귀분석 방법을 활용하여 피해발생 확률을 산정하였다. 1단계 기준은 계획홍수량 대비 홍수량 비율과 홍수피해 발생여부를 고려한 이항 로지스틱 회귀분석 모델을 구축한 후 3계 도함수에 적용하여 홍수피해 발생확률이 급격하게 증가하는 특이점을 산정하였다. 2단계와 3단계 기준은 다항 로지스틱 회귀분석 중 계층형 로지스틱 회귀분석을 활용하여 지점별 피해액 비율이 60 ~ 80 %, 80 ~ 100 % 구간에 속할 확률을 산정하고, 1단계와 동일한 방법으로 특이점을 산정하였다. 그 결과 지점별로 기존 제공되고 있는 홍수특보 기준을 과거 발생한 홍수피해를 고려하여 세분화할 수 있었으며, 이 결과는 지역별 홍수피해 저감대책에 활용될 수 있을 것으로 판단된다.

  • PDF

희소 투영행렬 획득을 위한 RSR 개선 방법론 (An Improved RSR Method to Obtain the Sparse Projection Matrix)

  • 안정호
    • 디지털콘텐츠학회 논문지
    • /
    • 제16권4호
    • /
    • pp.605-613
    • /
    • 2015
  • 본 논문은 패턴인식에서 자주 사용되는 투영행렬을 희소화하는 문제를 다룬다. 최근 임베디드 시스템이 널리 사용됨에 따라 탑재되는 프로그램의 용량이 제한받는 경우가 빈번히 발생한다. 개발된 프로그램은 상수 데이터를 포함하는 경우가 많다. 예를 들어, 얼굴인식과 같은 패턴인식 프로그램의 경우 고차원 벡터를 저차원 벡터로 차원을 축소하는 투영행렬을 사용하는 경우가 많다. 인식성능 향상을 위해 영상으로부터 매우 높은 차원의 고차원 특징벡터를 추출하는 경우 투영행렬의 사이즈는 매우 크다. 최근 라소 회귀분석 방법을 이용한 RSR(rotated sparse regression) 방법론[1]이 제안되었다. 이 방법론은 여러 실험을 통해 희소행렬을 구하는 가장 우수한 알고리즘 중 하나로 평가받고 있다. 우리는 본 논문에서 RSR을 개선할 수 있는 세 가지 방법론을 제안한다. 즉, 학습데이터에서 이상치를 제거하여 일반화 성능을 높이는 방법, 학습데이터를 랜덤 샘플링하여 희소율을 높이는 방법, RSR의 목적함수에 엘라스틱 넷 회귀분석의 패널티 항을 사용한 E-RSR(elastic net-RSR) 방법을 제안한다. 우리는 실험을 통해 제안한 방법론이 인식률을 희생하지 않으며 희소율을 크게 증가시킴으로써 기존 RSR 방법론을 개선할 수 있음을 보였다.

시뮬레이션과 회귀분석을 연계한 적응형 공정의사결정방법 (Adaptive Process Decision-Making with Simulation and Regression Models)

  • 이병훈;윤성욱;정석재
    • 한국시뮬레이션학회논문지
    • /
    • 제23권4호
    • /
    • pp.203-210
    • /
    • 2014
  • 본 연구는 생산공정운영시 발생하는 담당자의 의사결정 지원을 위한 학습형 공정 의사결정 시스템 구축방법에 대한 것이다. 먼저 추출 및 누적된 각 공정 별 이력 데이터에서, 주요한 주요자원(Critical Resource)을 단계적 회귀법에 따라 선정한다. 선정된 주요자원을 독립변수로 취급하여 담당자의 의사결정 대상이 되는 공정운영 성과를 종속변수로 하는 회귀모형을 산출하고, 해당 주요자원으로 구성된 시뮬레이션 모형을 설계한다. 메타휴리스틱 방법을 통하여 의사결정 시점의 생산계획 및 목적에 대한 시뮬레이션 분석을 실행하고, 복수 대안 및 가능해(기대성과)를 산출한다. 각각의 대안에서 주요자원 별 회귀모형을 구성하는 분석 값을 회귀식에 대입하고, 여기에서 얻어지는 값과 시뮬레이션 분석에 의해 산출된 가능해 간의 비교를 통하여 그 차이가 가장 작은 대안을 최적대안으로 선정하고 실제 공정운영 의사결정에 반영하여 생산을 실시한다. 이때 발생하는 공정 이력 데이터들은 이후 의사결정을 위한 회귀모형에 피드백 된다.

저류함수모형의 매개변수 보정과 홍수예측 (2) 홍수예측방법의 비교 연구 (Parameter Calibration of Storage Function Model and Flood Forecasting (2) Comparative Study on the Flood Forecasting Methods)

  • 김범준;송재현;김형수;홍일표
    • 대한토목학회논문집
    • /
    • 제26권1B호
    • /
    • pp.39-50
    • /
    • 2006
  • 홍수를 예측하기 위해서 국내 5대강 유역의 홍수통제소는 저류함수모형을 사용하고 있으며 현재까지 홍수예측에 대한 많은 연구가 이루어지고 있다. 이에 본 논문에서는 현재 홍수통제소에서 사용되고 있는 저류함수모형과 과거의 강우-수위 관계를 이용한 회귀분석(regression analysis), 그리고 인공신경망(artificial neural network)을 이용하여 홍수를 예측하고 이를 비교, 분석하고자 하였다. 저류함수모형의 경우는 홍수통제소의 대표매개변수와 보정된 최적(평균)매개변수를 적용하였다. 그리고 회귀분석과 인공신경망은 1995~2001년까지의 홍수사상 중 4개의 홍수사상을 선택하여 회귀계수를 구하고 역전파(backpropagation) 알고리즘을 사용하여 학습을 시켰다. 그 결과 저류함수모형의 경우 최적 매개변수를 이용하였을 때 기존의 홍수통제소에서 사용하고 있는 대표매개변수보다 예측이 개선되었으며, 회귀분석의 방법인 다중회귀분석, Robust 회귀분석, Stepwise 회귀분석을 이용한 홍수예측은 비교적 정확한 결과를 얻을 수 있었다. 역전파 알고리즘을 사용한 인공신경망의 경우도 회귀분석을 이용한 홍수예측보다는 다소 못하였지만 정확한 결과를 얻을 수 있었다.

대형 데이터에서 VIF회귀를 이용한 신속 강건 변수선택법 (Fast robust variable selection using VIF regression in large datasets)

  • 서한손
    • 응용통계연구
    • /
    • 제31권4호
    • /
    • pp.463-473
    • /
    • 2018
  • 연구에서는 선형회귀모형을 가정한 대형 데이터에서의 변수선택 알고리즘을 다룬다. 방법의 속도와 강건성에 주안점을 둔 여러 알고리즘들이 제안되었다. 그 중에서 streamwise 회귀 접근법을 사용한 VIF회귀는 신속하고 정확하게 수행된다. 그러나 VIF회귀는 최소제곱방법에 의해 모형이 추정되므로 이상치에 민감하다. 변수선택방법의 강건성을 높이기 위해 가중 추정치를 사용한 강건측도가 제안되었으며 강건 VIF회귀도 제안되었다. 본 연구에서는 잠재적 이상치를 탐지하여 제거한 후 VIF회귀를 수행하는, 빠르고 강건한 변수선택 방법을 제안한다. 제안된 방법은 모의실험과 데이터 분석 통해 다른 방법들과 비교된다.

회귀분석에서 설명변수와 반응변수 간의 시차를 파악하는 딥러닝 모델 (A Deep Learning Model for Identifying The Time Lag Between Explanatory Variables and Response Variable in Regression Analysis)

  • 김채현;류의림;이기용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.868-871
    • /
    • 2021
  • 기후, 경영, 경제 등 여러 분야의 회귀분석에서 설명변수가 반응변수에 일정 시차를 두고 영향을 미치는 경우들이 많다. 하지만 지금까지 대부분의 회귀분석은 설명변수가 반응변수에 즉각적으로 영향을 미치는 경우만을 가정하고 있으며, 설명변수와 반응변수 간에 존재하는 시차를 탐색하는 연구는 거의 이루어지지 않았다. 그러나 보다 정확한 회귀분석을 위해서는 설명변수와 반응변수 간에 존재하는 시차를 파악하는 것이 중요하다. 본 논문은 회귀분석 데이터가 주어졌을 때 설명변수와 반응변수 간에 존재하는 시차를 파악하는 딥러닝 모델을 제안한다. 제안하는 딥러닝 모델은 설명변수의 과거 값들 중 어떤 값이 현재 반응변수에 가장 큰 영향을 미치는지를 노드 간 가중치로 표현하고, 회귀모델의 오차를 최소화하는 가중치를 탐색한다. 훈련이 끝나면 이 가중치들을 사용하여 각 설명변수와 반응변수 간에 존재하는 시차를 파악한다. 실험을 통해 제안 방법은 시차를 고려하지 않는 기존 회귀모델에 비해 시차까지 고려함으로써 오차가 1/100 수준에 불과한 더 정확한 회귀모델을 찾을 수 있음을 확인하였다.