• 제목/요약/키워드: 분산회귀

검색결과 756건 처리시간 0.026초

다중선형회귀경험식과 머신러닝모델의 2차원 횡 분산계수 예측성능 평가 (Performance Evaluation of Multilinear Regression Empirical Formula and Machine Learning Model for Prediction of Two-dimensional Transverse Dispersion Coefficient)

  • 이선미;박인환
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.172-172
    • /
    • 2022
  • 분산계수는 하천에서 오염물질의 혼합능을 파악할 수 있는 대표적인 인자이다. 특히 하수처리장 방류수 혼합예측과 같이 횡 방향 혼합에 대한 예측이 중요한 경우, 하천의 지형적, 수리학적 특성을 고려한 2차원 횡 분산계수의 결정이 필요하다. 2차원 횡 분산계수의 결정을 위해 기존 연구에서는 추적자실험결과로부터 경험식을 만들어 횡 분산계수 산정에 사용해왔다. 회귀분석을 통한 경험식 산정을 위해서는 충분한 데이터가 필요하지만, 2차원 추적자 실험 건수가 충분치 않아 신뢰성 높은 경험식 산정이 어려운 상황이다. 따라서 본 연구에서는 SMOTE기법을 이용하여 횡분산계수 실험데이터를 증폭시켜 이로부터 횡 분산계수 경험식을 산정하고자 한다. 또한 다중선형회귀분석을 통해 도출된 경험식의 한계를 보완하기 위해 다양한 머신러닝 기법을 적용하고, 횡 분산계수 산정에 적합한 머신러닝 기법을 제안하고자 한다. 기존 추적자실험 데이터로부터 하폭 대 수심비, 유속 대 마찰유속비, 횡 분산계수 데이터 셋을 수집하였으며, SMOTE 알고리즘의 적용을 통해 회귀분석과 머신러닝 기법 적용에 필요한 데이터그룹을 생성했다. 새롭게 생성된 데이터 셋을 포함하여 다중선형회귀분석을 통해 횡 분산계수 경험식을 결정하였으며, 새로 제안한 경험식과 기존 경험식에 대한 정확도를 비교했다. 또한 다중선형회귀분석을 통해 결정된 경험식은 횡 분산계수 예측범위에 한계를 보였기 때문에 머신러닝기법을 적용하여 다중선형회귀분석에 대한 예측성능을 평가했다. 이를 위해 머신러닝 기법으로서 서포트 벡터 머신 회귀(SVR), K근접이웃 회귀(KNN-R), 랜덤 포레스트 회귀(RFR)를 활용했다. 세 가지 머신러닝 기법을 통해 도출된 횡 분산계수와 경험식으로부터 결정된 횡 분산계수를 비교하여 예측 성능을 비교했다. 이를 통해 제한된 실험데이터 셋으로부터 2차원 횡 분산계수 산정을 위한 데이터 전처리 기법 및 횡 분산계수 산정에 적합한 머신러닝 절차와 최적 학습기법을 도출했다.

  • PDF

분산성(分散性) 변화(變化)가 주가(株價)에 미치는 영향(影響)과 분산성(分散性)의 평균회귀속도(平均回歸速度)에 관한 실증적(實證的) 연구(硏究)

  • 이상빈;옥기율
    • 재무관리연구
    • /
    • 제9권1호
    • /
    • pp.111-133
    • /
    • 1992
  • 본 연구는 미국과 일본의 주식시장(株式市場)을 연구대상으로 하여 주식시장에서의 분산성(分散性) 변화(變化)의 시점(時點)을 찾고 이 분산성 변화가 주가(株價)에 미치는 영향(影響)과 분산성의 평균회귀속도(平均回歸速度)에 대해 실증적으로 살펴보았다. 분산성(分散性)의 비교구간을 월 단위, 주 단위 및 하루 단위로 하여 분산성(分散性)이 변화(變化)한 시점을 찾고 이 변화 시점을 기준으로 하여 각 단위구간(單位區間)에서의 분산성(分散性) 변화(變化)에 대한 주가(株價)의 반응을 분석하였다. 또한 각 단위구간별로 분산성(分散性)이 변화(變化)한 시점(時點)이후로 이 분산성 변화 블럭 다음의 블럭에 대한 투자자의 반응도 살펴봄으로써 분산성(分散性) 변화(變化)의 평균회귀과정(平均回歸過程)(mean-reverting process) 및 평균으로의 회귀가 얼마나 빨리 되는가의 여부를 알아보았다. 분산성(分散性) 증가(增加)나 분산성(分散性) 감소(減少)와 같은 분산성 변화가 주가(株價)에 미치는 영향은 분산성(分散性) 비교 구간의 장단기(長短期)에 따라 다른 결과를 보였다.

  • PDF

일반화혼합회귀 추정량과 베이지안 회귀추정량의 비교

  • 김주성;김영권
    • Communications for Statistical Applications and Methods
    • /
    • 제3권3호
    • /
    • pp.1-9
    • /
    • 1996
  • 본 논문에서는 일반화 회귀모형의 회귀모수${\beta}$에 대한 사전정보의 형태에 따른 각 추정량들에 대하여 연구하였다. 먼저 사전정보가 ${\beta}$에 대한 사전분포로 주어지는 경우에 해당하는 베이지안 회귀추정량을 제시하였고, 다른 하나는 ${\beta}$에 대한 사전정보모형으로 선형회귀모형식이 주어진 경우의 일반화 혼합회귀추정량에 대하여 연구하였다. 두가지 경우로부터 얻어진 각 추정량의 정도를 알아보기 위하여 각 추정량의 공분산행렬을 이 용하여 서로 비교하여 보았다. 각 추정량의 분산비들을 이용하여 일반적으로 일반화 혼합회귀추정량이 베이지안 회귀추정량들보다 비교적 작은 분산값을 가진다는 결론을 얻었다.

  • PDF

시간의 흐름에 따른 무조건부 주가분산과 주가형성

  • 이일균
    • 재무관리논총
    • /
    • 제14권1호
    • /
    • pp.41-56
    • /
    • 2008
  • 주식 수익률이 정상적 과정이 아니라 비정상적 과정에 의해서 생성되고 있다는 사실이 여러 실증 분석에서 제시되고 있다. 시계열의 평균이 시간의 흐름에 따라 변하면 이 시계열은 비정상적 과정에 의하여 생성된다. 시간의 흐름에 따라 평균이 변하는 비정상 시계열은 단위근과 공적분에 의하여 시계열의 운동을 모형화하고 있다. 한편 시계열의 비정상성은 분산이 시간의 흐름에 따라 변할 때에도 발생한다. 시간의 흐름에 따라 무조건부 분산은 변하지 않고 있지만 이용 가능한 정보 집합을 조건으로 하는 조건부 분산이 변하는 경우도 있다. 이 같은 성질을 가진 주가 시계열은 자기회귀 조건부 이분산(ARCH) 계통의 과정으로 모형화하고 있다. 그러나 무조건부 분산이 시간의 흐름에 따라 변하면 ARCH 계통은 중대한 모형정립과오(misspecification)에 직면하게 된다. 따라서 본 논문은 무조건부 분산이 시간의 흐름에 따라 변할 때 자기 회귀 과정의 모수를 추정하는 방법을 검토하고, 이 방법을 한국 종합주가 지수에 적용하여 자기회귀 과정의 모수를 추정하였다. 이 방법에 의하여 추정된 2계 자기회귀 과정의 모수값 중 상수항과 제1계 항의 계수는 통상 최소자승법에 의한 값과 유사하다. 그러나 제2계 항 모수의 값은 양자가 상당히 다르다. 최소자승에 의한 제2계 값이 과대 추정되고 있다.

  • PDF

회귀 문제에서 예측값들의 분산을 줄이기 위한 딥뉴럴 네트워크 구조 연구 (A study on the architecture of a deep neural network to reduce the variance of predicted values in a regression problem)

  • 김종환;여도엽
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.11-14
    • /
    • 2022
  • 본 논문에서는 회귀 문제에서 예측값들의 분산을 줄이기 위한 딥뉴럴 네트워크 구조를 제안한다. 일반적인 회귀 문제에서 딥뉴럴 네트워크 학습 시, 하나의 입력에 대한 레이블 값을 이용하여 학습한다. 본 눈문에서는 하나의 입력에 대한 레이블 값뿐만 아니라 두 입력에 대한 레이블 값들의 차이를 학습시키는 딥뉴럴 네트워크 구조를 제안한다. 통계학 이론을 통하여 예측값들의 분산이 줄어든다는 것을 증명한다. 또한, 배관 곡관의 감육두께를 예측하는 문제를 통해 제안된 네트워크의 성능을 검증한다. 일반적인 딥뉴럴 네트워크 구조를 이용하였을 때에 비하여 제안한 네트워크 구조를 이용하였을 때, 회귀 문제의 예측값들의 분산이 감소함을 확인한다.

  • PDF

분산 시간지연 회귀신경망을 이용한 피치 악센트 자동 인식 (Automatic Recognition of Pitch Accent Using Distributed Time-Delay Recursive Neural Network)

  • 김성석
    • 한국음향학회지
    • /
    • 제25권6호
    • /
    • pp.277-281
    • /
    • 2006
  • 본 논문에서는 시간지연 회귀신경회로망을 이용한 음절 레벨에서의 피치 악센트 자동 인식 방법을 제안한다. 시간지연 회귀 신경회로망은 두 종류의 동적 문맥정보를 표현한다. 시간지연 회귀신경회로망의 시간지연 입력 노드는 시간 축 상의 피치 및 에너지 궤도를 표현하고, 회귀 노드는 피치 악센트의 특성을 반영하는 문맥 정보를 표현한다. 본 논문에서는 이러한 시간지연 회귀신경회로망을 두 가지 형태로 구성하여 피치 악센트 자동 인식에 적용한다. 하나의 형태는 단일 시간지연 회귀 신경회로망에서 복수 개의 운율 특정파라미터 (피치, 에너지, 지속시간)를 입력 노드에 함께 공급하여 피치 악센트 인식을 수행하고, 다른 하나는 분산 시간지연 회귀 신경회로망을 이용하여 피치 악센트 인식을 수행한다. 분산 시간지연 회귀 신경회로망은 여러 개의 시간지연 회귀 신경회로망으로 구성되고, 각 시간지연 회귀 신경회로망은 단일 운율 특징 파라미터만으로 학습된다. 분산 시간지연 회귀 신경회로망의 인식결과는 개별 시간지연 회귀 신경회로망의 출력 값의 가중치 합으로 결정된다. 화자 독립 피치 악센트 인식 실험을 위해 보스톤 라디오 뉴스 코퍼스 (BRNC)를 사용하였다. 실험결과, 분산 시간지연 회귀 신경회로망은 83.64%의 피치 악센트 인식률을 보였다.

패널회귀모형에서 회귀계수 추정량의 설계기반 성질 (Design-based Properties of Least Square Estimators in Panel Regression Model)

  • 김규성
    • 한국조사연구학회지:조사연구
    • /
    • 제12권3호
    • /
    • pp.49-62
    • /
    • 2011
  • 본 논문에서는 패널회귀모형에서 회귀계수 추정량으로 일반최소제곱추정량과 가중최소 제곱추정량의 설계기반 성질을 고찰한다. 회귀계수의 최소제곱추정량을 선형화하여 일반최소제곱추정량의 근사편향, 근사분산, 그리고 근사평균제곱오차의 수식과, 가중최소제곱추정량의 근사분산 수식을 유도한 후, 모의실험을 통하여 두 추정량의 근사분산 및 근사평균 제곱오차의 크기를 수치적으로 비교한다. 모의실험에서는 한국복지패널 3개년 데이터를 모집단으로 간주하고, 가구소득 변수를 관심변수로 하며 가구와 가구주 관련 7개 변수를 설명변수로 하는 유한모집단 회귀계수를 고려한다. 두 추정량의 설계기반 성질을 비교하기 위하여 표본수를 50에서 1,000까지 50 간격으로 설정하여 일반최소제곱추정량의 근사편향, 근사분산 그리고 가중최소제곱추정량의 근사분산을 계산한다. 모의실험을 통하여 다음과 같은 경향을 확인하였다. 첫째, 표본의 크기가 커지면 일반최소제곱추정량의 평균제곱오차가 가중최소제곱추정량의 분산보다 커진다. 둘째, 일반최소제곱추정량의 평균제곱오차를 가중최소제곱추정량의 분산으로 나눈비(ratio)는 설명변수에 따라 크기가 다르게 나타나고, 일반최소제곱추정량의 편향이 클수록 큰 값을 보인다. 셋째, 분산만 비교하면 일반최소제곱추정량의 분산이 가중최소제곱추정량의 분산보다 대부분의 경우에 더 작게 나타난다.

  • PDF

표본조사에서 일반회귀 추정량의 활용 (General Regression Estimators in Survey Sampling)

  • 김규성
    • 한국조사연구학회지:조사연구
    • /
    • 제5권2호
    • /
    • pp.49-70
    • /
    • 2004
  • 표본조사에서 사용 가능한 보조변수가 있는 경우에 추정의 효율을 높이기 위하여 보조변수를 활용하는 방법이 다각적으로 개발되어 왔다. 이 논문은 보조변수를 효과적으로 이용하는 방법 중의 하나인 일반회귀추정량에 대한 개괄적인 고찰이다. 일반회귀추정량의 출현부터 분산추정법의 제안까지 이론전개 과정을 살펴보았으며, 보정추정량 및 QR추정량과의 관련성을 통하여 일반회귀추정량의 성질을 알아보았다. 특히 분산추정에서 통상적인 설계기반 분산추정량이 가지는 조건부 성질의 약점을 보완하기 위하여 가중잔차기법을 사용하는 과정을 살펴보았다. 층화표집이나 집략표집과 같은 복합설계에서 활용할 수 있는 일반회귀추정량의 형태를 소개하였고, 마지막으로 일반회귀추정량의 장단점, 그리고 향후 이론적인 발전방향 및 실용적인 발전방향을 언급하였다.

  • PDF

다중회귀분석 방법에 따른 시간분포 회귀식의 회귀계수 유의성 검정 비교 (Comparison of Regression Coefficient Significance Test for Temporal Distribution by Multiple Regression Analysis Method)

  • 이성호;이재준;박진희
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2019년도 학술발표회
    • /
    • pp.205-205
    • /
    • 2019
  • 우리나라에서 강우의 시간분포를 위해 보편적으로 사용되고 있는 방법은 Huff 4분위법으로 강우의 시간적 분포특성을 나타내는 무차원 시간분포곡선을 제시한 것으로, 강우의 지속기간을 4분위로 구분하여 각 분위의 강우량 중 가장 큰 값이 속해 있는 구간을 선택하여 그 구간의 위치에 따라 분위를 정하는 방법이다. 현재 실무에서는 Huff의 분위별 곡선에 대한 회귀식은 지속기간 전반에 걸쳐 정확도가 높은 이유로 6차식을 적용하고 있으나, 통계 모델링에서 간결함의 원리에 따라 회귀식이 간결할 필요가 있으며, 통계적 유의수준에 기초하여 회귀계수를 결정하여야 하므로 유의성 검정 방법을 통한 검정결과를 비교할 필요가 있다. 따라서 본 연구에서는 다중회귀분석 방법에 따른 회귀계수 유의성 검정결과 비교를 위하여 구미지역의 무차원 누가우량 백분율을 이용한 시간분포 회귀식을 이용하여 유의성 검정 방법인 분산분석 방법(Analysis of Variance)과 변수선택 방법(Backward Selection)의 검정 결과를 도출 및 비교하였다. 통계프로그램인 프로그래밍 R을 이용하여 변수선택 방법 중 후방제거법 함수를 이용하여 최종 회귀식을 도출하고 또한 7차 회귀식을 분산분석을 이용한 후방제거법으로 회귀계수를 제거하는 방법으로 최종 회귀식을 산정하였다. 분산분석을 이용한 후방제거법의 유의성 검정결과는 프로그래밍 R을 이용한 후방제거법의 결과와 동일한 것으로 분석되었다. 일반적으로 설계강우량의 시간분포를 위한 방법으로 사용되고 있는 Huff의 4분위 방법의 시간분포 회귀식은 회귀계수의 유의성 검정이 이루어지고 있지 않으므로 본 연구결과를 통해 설계강우량 시간분포 회귀식의 유의성 검정방법 제시 및 결과도출과정을 통해 시간분포 회귀식 산정기법으로 활용할 수 있을 것으로 사료된다.

  • PDF

잔차 수정을 이용한 불연속 분산함수의 비모수적 추정 (Nonparametric estimation of the discontinuous variance function using adjusted residuals)

  • 허집
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권1호
    • /
    • pp.111-120
    • /
    • 2016
  • 대부분의 불연속 회귀함수의 커널추정량은 알고 있거나 추정된 불연속점을 기준으로 자료를 분리하여 각각을 독립적으로 회귀함수를 적합하고 있다. 회귀모형에서 분산함수가 불연속점을 가지고 있을 때에도 잔차제곱들을 이용하여 위와 같은 불연속 회귀함수의 커널추정법을 활용하고 있다. Kang 등 (2000)은 $M{\ddot{u}}ller$ (1992)의 불연속점과 점프크기 커널추정량을 이용하여 반응변수의 표본을 연속인 회귀함수로부터 표본인 것처럼 수정하여 불연속 회귀함수를 추정하였다. 본 연구에서는 불연속 분산함수를 추정하기 위하여 Kang 등 (2000)의 방법을 이용한다. Kang과 Huh (2006)의 분산함수의 불연속점과 점프크기 추정량으로 잔차제곱들을 수정하고, 수정된 잔차제곱들을 이용하여 불연속 분산함수 커널추정량을 제안할 것이다. 제안된 추정량의 적분제곱오차의 수렴속도를 보여주고 모의실험을 통하여 기존의 추정량과 제안된 추정량을 비교하고자 한다.