• 제목/요약/키워드: 혼합회귀모형

검색결과 81건 처리시간 0.03초

일반화혼합회귀 추정량과 베이지안 회귀추정량의 비교

  • 김주성;김영권
    • Communications for Statistical Applications and Methods
    • /
    • 제3권3호
    • /
    • pp.1-9
    • /
    • 1996
  • 본 논문에서는 일반화 회귀모형의 회귀모수${\beta}$에 대한 사전정보의 형태에 따른 각 추정량들에 대하여 연구하였다. 먼저 사전정보가 ${\beta}$에 대한 사전분포로 주어지는 경우에 해당하는 베이지안 회귀추정량을 제시하였고, 다른 하나는 ${\beta}$에 대한 사전정보모형으로 선형회귀모형식이 주어진 경우의 일반화 혼합회귀추정량에 대하여 연구하였다. 두가지 경우로부터 얻어진 각 추정량의 정도를 알아보기 위하여 각 추정량의 공분산행렬을 이 용하여 서로 비교하여 보았다. 각 추정량의 분산비들을 이용하여 일반적으로 일반화 혼합회귀추정량이 베이지안 회귀추정량들보다 비교적 작은 분산값을 가진다는 결론을 얻었다.

  • PDF

혼합회귀모형에서 콤포넌트 및 설명변수에 대한 벌점함수의 적용 (Joint penalization of components and predictors in mixture of regressions)

  • 박종선;모은비
    • 응용통계연구
    • /
    • 제32권2호
    • /
    • pp.199-211
    • /
    • 2019
  • 주어진 회귀자료에 유한혼합회귀모형을 적합하는 경우 적절한 성분의 수를 선택하고 선택된 각각의 회귀모형에서 의미있는 예측변수들의 집합을 선택하며 동시에 편의와 변동이 작은 회귀계수 추정치들을 얻는 것은 매우 중요하다. 본 연구에서는 혼합선형회귀모형에서 성분의 개수와 회귀계수에 벌점함수를 적용하여 적절한 성분의 수와 각 성분의 회귀모형에 필요한 설명변수들을 동시에 선택하는 방법을 제시하였다. 성분에 대한 벌점은 성분들의 로그값에 SCAD 벌점함수를 적용하였고 회귀계수들에는 SCAD와 더불어 MCP 및 Adplasso 벌점함수들을 사용하여 가상자료와 실제자료들에 대한 결과를 비교하였다. SCAD-SCAD 벌점함수 조합과 SCAD-MCP 조합의 경우 기존의 Luo 등 (2008)의 방법에서 문제가 되었던 과적합 문제를 해결함과 동시에 선택된 성분의 수와 회귀계수들을 효과적으로 선택하였으며 회귀계수들의 추정치에 대한 편의도 크지 않았다. 본 연구는 성분의 수가 알려져 있지 않은 회귀자료에서 적절한 성분의 수와 더불어 각 성분에 대한 회귀모형에서 모형에 필요한 예측변수들을 동시에 선택하는 방법을 제시하였다는데 의미가 있다고 하겠다.

결측 공변량을 갖는 혼합회귀모형에서의 EM 알고리즘 (The EM algorithm for mixture regression with missing covariates)

  • 김형민;함건희;서병태
    • 응용통계연구
    • /
    • 제29권7호
    • /
    • pp.1347-1359
    • /
    • 2016
  • 혼합회귀모형은 반응 변수와 공변량 사이의 관계를 규명하는 유용한 통계적 모형으로 여러 분야에서 사용되어지고 있다. 하지만 실제로 혼합회귀모형을 이용하여 분석을 하는 과정에서 공변량이 결측값을 포함하는 문제는 흔하게 발생하며, 발생하는 결측의 유형 또한 다양하게 나타난다. 이러한 경우에 있어서 본 논문에서는 최대우도추정량을 구하기 위한 EM 알고리즘을 제안하고자 한다. 제안된 EM 알고리즘의 효용성을 모의실험을 통해 확인하였으며 또한 사례연구를 통해 제시된 방법이 어떻게 사용될수 있는지와 그 효용성을 함께 확인하였다.

혼합모형의 구간추정을 위한 PROC MIXED의 활용

  • 박동준
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2005년도 춘계 학술발표회 논문집
    • /
    • pp.1-6
    • /
    • 2005
  • SAS의 PROC MIXED는 ANOVA 추정량보다 더 다양한 잔차최대우도추정법 또는 최대우도추정법으로 모수들을 추론할 수 있다. 혼합모형에 속하는 불균형중첩오차구조를 갖는 선형회귀모형에서 랜덤효과에 해당되는 그룹간의 분산과 고정효과에 해당되는 회귀계수들에 대한 신뢰구간을 구하기 위하여 대표본인 경우와 소표본인 경우에 대하여 PROC MIXED를 사용한다. 시뮬레이션을 실행한 결과, 대표본인 경우에는 모수들의 신뢰구간을 구하기 위하여 PROC MIXED를 활용할 수 있지만, 소표본인 경우에는 PROC MIXED를 사용할 경우, 그룹간 분산과 회귀계수 가운데 하나인 절편항에 대한 신뢰구간은 시뮬레이터된 신뢰계수가 명시한 신뢰계수를 지키지 못하는 것을 보인다.

  • PDF

하천에서 농도곡선-유하거리 상관성 기반 회귀적 물질혼합 예측 기법 (Development of a regressive prediction method of solute transport in rivers based on relation between breakthrough curve and travel distance)

  • 김병욱;서일원
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.45-45
    • /
    • 2022
  • 산업화에 따른 화학물질 사용량의 증가는 담수로의 유해화학물질 유출사고의 위험을 증가시키며, 이러한 사고는 하천수 수질과 수환경 생태계에 심각한 위해와 손상을 야기한다. 이러한 수질사고 발생시 신속 대응을 위해, 하천에 유입된 물질의 거동을 신속하게 예측하는 것이 필요하며 이 경우 1차원 추적모형이 주로 사용된다. 1차원 물질혼합 모형은 하천을 하나의 유선으로 보며, 복잡한 하천흐름의 시스템을 현상학적으로 해석하고, 오염물질의 이송 및 혼합 메카니즘을 모델 매개변수에 반영하여 모형화한다. 이러한 매개변수들은 직접적으로 측정하기 어려우며, 이론에 기반한 매개변수 산정 기법이 구축되지 않은 실정이다. 따라서 대부분의 연구에서는 추적자 실험을 실시하여 유한한 하천구간에서 추적자의 시간-농도곡선(Breakthrough curve, BTC)을 취득하고, 이를 통하여 대상 구간의 매개변수를 역산하는 최적화 기법에 의존하고 있다. 하지만, 모든 하천구간에 대하여 추적자 실험을 수행하여 데이터를 확보하는 것이 어렵기 때문에 최적화 기법의 적용성에 한계가 있다. 본 연구는 흐름정보가 제공되지 않은 미계측 하천구간에서 BTC를 신속하게 예측할 수 있는 회귀모형을 구축하는 것을 목표로 한다. 국내 하천에서 수행한 4회의 추적자 실험으로부터 취득한 28개 구간 케이스의 데이터에 대하여 농도곡선 전처리를 수행하고 14개의 통계적 특징을 추출하였으며, 계측된 흐름특성과의 상관관계를 분석하였다. 분석 결과, 대상 구간에서의 BTC의 변화가 추적자의 유하거리에 매우 높은 상관관계를 보였으며, 이를 이용하여 회귀모형을 제시하였다. 제안된 회귀모형을 적용하여 하류의 지점에서의 BTC를 예측하였으며, 1차원 이송-분산 방정식과 하천저장대모형을 활용한 예측결과와 비교하여 검증하였다. 그 결과, BTC의 변화특성을 활용한 회귀적 예측이 하천 지형 및 흐름의 변동성이 작은 구간에서 1차원 혼합모형들을 이용한 예측보다 더 높은 정확도를 보였으며, 이러한 장점은 장거리 예측에서 더 분명하게 나타났다.

  • PDF

Density Estimation of Mixture Normal Distribution with Binned Data Using Nonlinear Regression

  • 나영호;오창혁
    • 한국데이터정보과학회:학술대회논문집
    • /
    • 한국데이터정보과학회 2004년도 춘계학술대회
    • /
    • pp.127-130
    • /
    • 2004
  • 혼합정규분포에서 얻어진 히스토그램 자료에서 모수의 추정은 EM 알고리즘 혹은 스프라인 방법이 흔히 이용되고 있다. 본 논문에서는 히스토그램 자료를 비선형회귀모형으로 적합하는 방법을 제시하고, 시뮬레이션으로 제시된 방법과 EM 알고리즘 방법을 비교하였다.

  • PDF

비모수 베이지안 겉보기 무관 회귀모형 (A nonparametric Bayesian seemingly unrelated regression model)

  • 조성일;석인혜;최태련
    • 응용통계연구
    • /
    • 제29권4호
    • /
    • pp.627-641
    • /
    • 2016
  • 본 논문에서는 겉보기 무관 회귀모형을 고려하고 디리크레 프로세스 혼합모형을 오차항의 분포로 하는 비모수 베이지안 방법을 제안한다. 제안된 모형을 바탕으로 사후분포를 유도하고 디리크레 프로세스 혼합모형의 붕괴깁스표집 방법을 통해 마코프 체인 몬테 칼로 알고리듬을 구성하고 사후추론을 실시한다. 모형의 성능을 비교하기 위해 모의실험을 실시하고, 더 나아가 한국지역의 강수량 예측에 대한 실제 자료에 적용해 본다.

비선형 혼합효과모형에서의 로버스트 능형회귀 방법과 정량적 고속 대량 스크리닝 자료에의 응용 (Robust ridge regression for nonlinear mixed effects models with applications to quantitative high throughput screening assay data)

  • 유지선;임창원
    • 응용통계연구
    • /
    • 제31권1호
    • /
    • pp.123-137
    • /
    • 2018
  • 비선형 혼합효과 모형은 다양한 분야에서 반복 측정 자료를 분석할 때 주로 사용된다. 비선형 혼합효과 모형은 개체 내 변동(intra-individual variation)에 대해 고려하는 제 1단계 개별수준모델(individual-level model)과 개체간 변동(inter-individual variation)에 대해 고려하는 제 2단계 개체군모델(population model)의 두 단계로 구성되어 있다. 비선형 혼합효과 모형의 첫 번째 단계인 개별수준모델은 비선형 회귀모형의 모수를 추정하는 것으로 일반적인 비선형 회귀모형과 같고, 주로 보통최소제곱추정 방법을 사용하여 모수를 추정한다. 그러나 최소제곱추정방법은 가정된 비선형 함수가 자료에 의해 명시적으로 드러나지 않는 경우 모수의 추정값과 그 표준오차가 극단적으로 커지는 문제가 발생할 수 있다. 본 논문에서는 최근에 비선형 회귀모형에서 제안된 능형회귀(ridge regression) 방법을 비선형 혼합효과 모형의 제 1단계 개별수준모델에 도입함으로써 이러한 문제를 해결할 수 있는 새로운 추정방법을 제안하였다. 제안된 추정량은 모의실험 연구를 통하여 기존의 표준적인 추정량과 그 성능을 비교하였다. 또한 미국의 National Toxicology Program으로부터 얻어진 정량적 대량고속 스크리닝(quantitative high throughput screening) 실제 자료를 사용하여 추정 방법들을 비교하였다.

0이 팽창된 포아송 회귀모형을 이용한 기부회수 자료의 재분석 (The Reanalysis of the Donation Data Using the Zero-Inflated Possion Regression)

  • 김인영;박태규;김병수
    • 응용통계연구
    • /
    • 제22권4호
    • /
    • pp.819-827
    • /
    • 2009
  • 김인영 등 (2006)은 두 개 포아송 분포의 혼합모형에 기초한 회귀모형으로써 2002년 (사)볼런티어 21에서 실시한 설문조사 자료를 분석하여 우리나라 개인들이 기부한 횟수에 영향을 미치는 유의적 변수들을 식별하였다. 본고에서는 김인영 등 (2006)에서도 언급하였듯이 기부횟수 0의 관찰 빈도와 예측 빈도간 차이가 유독 큰 점을 감안하여, 0이 팽창된 포아송(zero inflated Poisson: ZIP)을 기존의 두 개의 포아송 혼합분포에 추가하여 일종의 세 개 포아송 혼합분포 형태로 모집단 분포를 구성하며 동 모형의 회귀모형으로써 기부횟수 자료를 재분석하고자 한다. 회귀계수에 대한 추정은 두 단계 EM 알고리즘으로 이루어 졌고, 유의적 설명 변수의 검색은 김인영 등 (2006)과 같았으나 본 연구에서는 고정된 령(零)군의 비율을 0.201로 추정할 수 있었으며, 두 가지 유의적 설명변수인 소득과 자원봉사 중에서 자원봉사가 기부 횟수를 늘리는 안정적 도구 변수로써 작용할 수 있음을 보고하고 있다.

PROC MIXED를 활용한 혼합모형의 신뢰구간추정 (Interval Estimation in Mixed Model by Use of PROC MIXED)

  • 박동준
    • 응용통계연구
    • /
    • 제19권2호
    • /
    • pp.349-360
    • /
    • 2006
  • SAS의 PROC MIXED를 사용하면 일반적인 ANOVA 추정량뿐만 아니라 더 많은 장점을 갖는 제한최대우도추정법 또는 최대우도추정법으로 모수들을 추론할 수 있다. 혼합모형에 속하는 불균형중첩오차구조를 갖는 선형회귀모형에서 랜덤효과와 관련된 그룹간 분산의 신뢰 구간과 고정효과에 해당되는 회귀 계수들에 대 한 신뢰구간을 구하기 위하여 세 가지 크기를 갖는 표본에 대하여 PROC MIXED를 사용하였다. 모의실험을 실행한 결과, 대표본인 경우에는 모수들의 신뢰 구간을 구하기 위하여 PROC MIXED를 활용할 수 있지만, 소표본인 경우에는 PROC MIXED를 사용할 경우, 그룹간 분산의 신뢰 구간과 회귀계수 가운데 절편항의 신뢰구간은 주어진 신뢰계수를 지키지 못하는 것을 보인다.