• 제목/요약/키워드: 비모수적 회귀

검색결과 105건 처리시간 0.023초

회귀나무 모형을 이용한 패널데이터 분석 (Panel data analysis with regression trees)

  • 장영재
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권6호
    • /
    • pp.1253-1262
    • /
    • 2014
  • 회귀나무 (regression tree)는 독립변수로 이루어진 공간을 재귀적으로 분할하고 해당 영역에서 종속변수의 최선의 예측값을 찾고자 하는 비모수적 방법론이다. 회귀나무 모형이 제안된 이래 로지스틱 회귀나무모형이나 분위수 회귀나무모형과 같이 유연하고 다양한 모형적합을 위한 연구가 진행되어 왔다. 최근에 들어서는 Sela와 Simonoff (2012)의 RE-EM 알고리즘, Loh와 Zheng (2013)의 GUIDE 등 패널데이터와 관련하여 진일보한 나무모형 알고리즘도 제안되었다. 본 논문에서는 각 알고리즘을 소개하고 특징을 살펴보는 한편, 실험 데이터를 생성하여 평균제곱오차 (mean squared error)를 바탕으로 예측력을 비교하였다. 분석결과, RE-EM 알고리즘의 예측력이 상대적으로 우수하게 나타났다. 이 알고리즘을 통해 기업경기실사지수 업종별 패널자료를 분석한 결과 최근의 업황에 가장 큰 영향을 미치는 요소는 매출 실적으로 나타났으며 매출 상위 그룹의 경우 비제조업이 제조업에 비해 업황에 대한 판단이 긍정적인 것으로 나타났다.

오차항이 SAR(1)을 따르는 공간선형회귀모형에서 일반화 최대엔트로피 추정량에 관한 연구 (Generalized Maximum Entropy Estimator for the Linear Regression Model with a Spatial Autoregressive Disturbance)

  • 전수영;임성섭
    • Communications for Statistical Applications and Methods
    • /
    • 제16권2호
    • /
    • pp.265-275
    • /
    • 2009
  • 지역적 공간의 특성을 고려한 공간선형회귀모형을 다루는 대부분의 연구들에서 사용되고 있는 자료는 완전한 상태임을 고려하고 있다. 하지만 공간선형회귀모형을 정확히 추론함에 있어서 완전한 자료가 사용 가능한 경우는 그다지 많지가 않은 것이 현실이다. 만약 이러한 상황을 고려하지 않고 통계적 추론을 할 경우 잘못된 결론이 도출될 수 있다. 본 연구에서는 오차항이 일차 공간자기상관을 따르는 공간선형회귀모형에서 자료가 불완전한 상태 일 경우 일반화 최대엔트로피 형식을 이용하여 미지의 모수를 추정하는 방법을 제안하였고 몬테카를로 모의실험을 통하여 여러 전통적인 추정량들과 효율성을 비교하였다. 그 결과, 자료가 불완전한 상태에서 일반화 최대엔트로피 추정량이 다른 추정방법들에 비해 효율적인 추정치를 제공하였다.

국내 기계등급구조재의 허용응력 분석 (Analysis of Allowable Stresses of Machine Graded Lumber in Korea)

  • 홍정표;오정권;박주생;한연중;방성준;김철기;이전제
    • Journal of the Korean Wood Science and Technology
    • /
    • 제43권4호
    • /
    • pp.456-462
    • /
    • 2015
  • KS F 3020-침엽수구조용재 기준에 따라 국산 소나무(Pinus densiflora) $38{\times}140{\times}3600mm$ 구조용 제재목 365개에 대하여 기계등급구분을 실시하고, 휨허용응력을 산출하여 현재 적용되는 KS기준허용응력과 비교 분석하였다. 휨허용응력 계산을 위하여 5% 휨강도 하한값을 75% 신뢰수준의 비모수적 방법, 2-parameter 그리고 3-parameter Weibull 분포를 가정한 모수적 방법, 휨강도-휨탄성계수 직선회귀 방법, 총 4가지 분석방법을 사용하여 결정하였다. 기계등급 E8, E9, E10 만이 비모수적 방법의 통계 처리가 가능한 자료 수를 얻었으며, 휨강도-휨탄성계수 직선회귀 방법은 이론적으로 모든 등급에 대한 5% 하한값 결정이 가능함을 보여주었다. 결정된 등급별 휨허용응력은 기준허용응력에 비하여 모두 낮은 값을 나타내었으며 이것은 과소설계의 위험성이 있는 것으로 현행 기계등급구분체계의 문제점으로 파악되었다. 이러한 문제는 구조설계 신뢰성과 관련하여 반드시 개선되어야 할 것으로, 휨강도-휨탄성계수 조합 등급 도입이 필요할 것으로 생각되었다.

모수적 궤적 기반의 분절 HMM을 이용한 연속 음성 인식 (Continuous Speech Recognition based on Parmetric Trajectory Segmental HMM)

  • 윤영선;오영환
    • 한국음향학회지
    • /
    • 제19권3호
    • /
    • pp.35-44
    • /
    • 2000
  • 본 논문에서는 음성 패턴을 효율적으로 모델링하고자 분절 특징(segmental feature)을 이 용하여 은닉 마코프 모델(hidden markov model)의 일반적인 형식에 기반한 새로운 모수적 궤적 모델 (parametric trajectory model)을 제안한다. 일반적으로 벡터의 열로써 표현되는 분절은 관측 열의 궤적(trajectory)으로 표현된다. 이 궤적은 연속적인 프레임들의 전이 정보(transitional information)를 표현하는 디자인 행렬을 이용하여 얻어지며, 다항식의 회귀 함수(polynomial regression function)로써 나타낼 수 있다. 이러한 궤적을 HMM에 적용하기 위해서 프레임 특징 대신 분절의 특성 을 표현하는 궤적으로 대치하고 우도(likelihood) 계산에 궤적들의 비교에 의한 확률 값을 반영시켜야 한다. 본 논문에서는 궤적간의 유사도를 측정하는 분절 우도(segment likelihood)와 모델을 구성하는 궤적변수의 추정 알고리즘을 제안한다. 임의의 분절에 대한 관측 확률은 제안된 분절 우도와 궤적의 추정 오차(estimation error of trajectories)의 곱으로써 표현된다. 궤적의 추정 오차는 상태에서 주어진 분절 우도의 가중치로 표현될 수 있으며, 이 가중치는 궤적과 대응되는 분절의 적합도를 표현하는 확률을 나타낸다. 본 논문에서 제 안된 모델은 일반적 인 HMM과 모수적 궤적 모델의 일반화(generalization) 또는 확장(extension) 모델로 생각될 수 있다. 본 모델의 성능을 평가하기 위하여 TIMIT 데이터에 기반한 실험을 한 결과, 분절 길이(segment length)와 회귀 차수(regression order)가 변할수록 일반적인 HMM에 비하여 뚜렷한 성능향상이 있음을 알 수 있었다.

  • PDF

TAR-GARCH 모형을 이용한 국내 주가 자료 분석 (TAR-GARCH processes as Alternative Models for Korea Stock Prices Data)

  • 황선영;김은주
    • 응용통계연구
    • /
    • 제13권2호
    • /
    • pp.437-445
    • /
    • 2000
  • 국내 주가시계열을 분석하기 위해 기존의 비선형시계열모형인 분계점을 가진 자기외귀모형(TAR)과 일반화 이분산자기회귀모형(GARCH)을 비교 분석한 후, 이 두가지 모형을 결합시킨 새로운 모형 TAT-GARCH모형을 제안하였다. 이 모형은 그 자체로도 이론적인 관삼의 대상이 되어 연관된 모수추정 기법을 제시하였고 국내 개별 주가시계열 자료의 분석에 있어서 제안된 모형이 기존의 모형들 보다 상대적으로 더 좋은 예측치를 제공할 수 있음을 특정 9개 회사의 주가분석을 통해 알아보았다.

  • PDF

선형보간법에 의한 자료 희소성 해결방안의 문제와 대안 (Robust Interpolation Method for Adapting to Sparse Design in Nonparametric Regression)

  • 박동련
    • 응용통계연구
    • /
    • 제20권3호
    • /
    • pp.561-571
    • /
    • 2007
  • 국소선형회귀모형의 추정량은 좋은 특성을 가지고 있는 추정량으로서 가장 흔히 사용되는 비모수적 회귀모형의 추정량이라고 하겠다. 이러한 국소선형 추정량이 자료가 희박한 구간에서는 심하게 왜곡된 추정결과를 보이는 문제가 있으며, Hall과 Turlach(1997)이 제안한 선형보간법이 이러한 문제에 대한 매우 효과적인 해결방안이라는 것은 잘 알려진 사실이다. 그러나 Hall과 Turlach가 제안한 선형보간법이 이상값에 매우 취약하다는 사실은 아직 지적된 적이 없는 문제이다. 이 논문에서는 이상값의 영향력을 감소시킬 수 있는 수정된 선형보간법에 의한 유사자료의 생성방법을 제안하고, 그 특성을 모의실험을 통하여 기존의 방법과 비교하였다.

시간-종속적 공변량이 포함된 이분형 반복측정자료의 GEE를 이용한 분석에서 결측 체계에 따른 회귀계수 추정방법 비교 (Comparison of GEE Estimation Methods for Repeated Binary Data with Time-Varying Covariates on Different Missing Mechanisms)

  • 박보람;정인경
    • 응용통계연구
    • /
    • 제26권5호
    • /
    • pp.697-712
    • /
    • 2013
  • 다시점 자료 연구에서 일반화추정방정식은 가상관행렬을 잘못 가정하더라도 모수의 일치추정량을 도출하므로 많이 이용된다. 하지만, 결측 체계가 완전임의결측이 아닌 경우에는 편의추정량을 제공하고, 시간-종속적 공변량이 포함된 경우에는 가상관행렬에 따라 회귀계수 추정값이 다르게 도출될 수 있는 문제점이 있다. 결측 체계가 임의결측인 경우에 발생하는 문제를 해결하기 위해 가중 방법과 다중대체 방법을 사용하는 것이 제안되었다. 본 논문에서는 시간-종속적 공변량이 포함된 이분형 반복측정자료를 GEE를 이용하여 분석할 때 다양한 결측 체계에서 일반화추정방정식 방법, 가중 방법, 다중대체 방법의 회귀계수 추정에 대한 로버스트성과 정확성을 모의실험을 통하여 비교해 보았다. 세 가지 방법 모두에서 시간-종속적 공변량의 회귀계수가 시간-독립적 공변량의 회귀계수에 비해 가상관행렬에 따라 추정값의 차이가 크게 나타났다. 다른 두 방법에 비해 다중대체 방법이 가상관행렬의 형태에 대해 더 로버스트하고 편의도 작은 추정치를 도출하였다.

결측이 있는 이산형 공변량에 대한 Cox비례위험모형의 패턴-혼합 모델 (Pattern-Mixture Model of the Cox Proportional Hazards Model with Missing Binary Covariates)

  • 육태미;송주원
    • 응용통계연구
    • /
    • 제25권2호
    • /
    • pp.279-291
    • /
    • 2012
  • 공변량에 결측이 발생한 Cox 비례위험 모형을 적합할 때, 결측이 발생하는 개체를 모두 제거한 후 분석을 실시한다면 정보 손실에 의해 비효율적이고 결측의 발생 메커니즘이 완전 임의 결측(missing completely at random; MCAR)이 아니라면 모수의 추정값에 편향이 발생할 수 있다. Cox 비례위험 회귀모형의 공변량에 결측이 있는 경우 적용할 수 있는 여러 가지 방법들이 제안되어져 왔으나 이 분석들은 선택모델(selection model)에 기반하고 있다. 본 연구에서는 Little (1993)이 제안한 패턴-혼합 모델(pattern-mixture model)을 사용하여 Cox 비례위험 회귀모형에서 생존시간과 결측 메커니즘의 결합분포를 모델화 하고, 여러 가지 제약에 근거한 생존 분석의 결과를 비교하였다. 모의실험을 통해서 패턴-혼합 모델의 제약(restrictions)에 따른 모수 추정의 민감도를 확인하였고 결측을 무시한 채 분석한 결과 및 선택모형에 근거한 분석결과와 비교하였다. 패턴-혼합 모델의 제약에 따라 공변량의 결측으로 인한 모수 추정의 민감성 정도를 쥐백혈병 자료 예제를 통해 설명하였다.

비선형 회귀모형에서 오차의 분산에 따른 예비검정 추정방법 (Preliminary test estimation method accounting for error variance structure in nonlinear regression models)

  • 유혜원;임창원
    • 응용통계연구
    • /
    • 제29권4호
    • /
    • pp.595-611
    • /
    • 2016
  • 일반적으로 독성학 또는 약리학에서는 자료를 분석할 때 Hill Model과 같은 비선형 회귀모형을 사용한다. 비선형 회귀모형에서 모수의 추정량과 그것의 불확실성(uncertainty)에 대한 측도의 추정은 오차의 분산 구조에 영향을 받게 된다. 따라서 자료가 등분산인지 혹은 이분산인지에 따라 사용하여야 할 추정 방법이 달라져야 한다. 그러나 일반적으로 자료를 실제로 분석하기 전에는 오차의 분산구조에 대해서 잘 알 수 없다. 그러므로 오차의 분산구조에 로버스트한 추정 방법을 개발하는 것은 중요한 문제이다. 본 논문에서는 예비검정 방법을 기반으로 한 비선형 회귀모형에서의 모수 추정 방법을 제안하였다. 오차 분산의 등분산성에 대한 간단한 예비검정의 결과에 따라 보통 최소제곱 추정(ordinary Least Square Estimation) 방법과 반복 가중 최소제곱 추정(iterative weighted least square estimation) 방법을 사용하는 추정량을 정의하였다. 제안된 추정량은 모의실험 연구를 통하여 기존의 표준적인 추정량들과 그 성능을 비교하였다. 또한 미국의 National Toxicology Program으로부터 얻어진 실제자료를 사용하여 추정 방법들을 비교하였다.

가변계수 측정오차 회귀모형 (Varying coefficient model with errors in variables)

  • 손인석;심주용
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권5호
    • /
    • pp.971-980
    • /
    • 2017
  • 가변계수 회귀모형은 회귀계수의 동적변화를 모형화함으로써 종속변수와 입력변수의 관계에 대한 쉬운 해석이 가능하고 회귀계수의 변동성도 추정할 수 있는 장점을 지니고 있으므로, 여러 과학 분야에서 많은 주목을 받고 있다. 본 논문에서 입력변수와 출력변수의 오차를 효과적으로 고려한 가변계수 오차모형을 제안한다. 가변계수가 평활변수의 알려지지 않은 형태의 비선형함수이므로 이를 추정하기 위하여 커널 방법을 사용한다. 제안된 모형의 성능에 영향을 미치는 초모수의 최적값을 구하기 위하여 일반화 교차타당성 방법 또한 제안한다. 제안된 방법은 모의자료와 실제자료를 이용한 수치적 연구를 통하여 평가된다.