• 제목/요약/키워드: 회귀분석 방법

검색결과 3,610건 처리시간 0.031초

주성분회귀분석을 이용한 한국프로야구 순위 (Predicting Korea Pro-Baseball Rankings by Principal Component Regression Analysis)

  • 배재영;이진목;이제영
    • Communications for Statistical Applications and Methods
    • /
    • 제19권3호
    • /
    • pp.367-379
    • /
    • 2012
  • 야구경기에서 순위를 예측하는 것은 야구팬들에게 관심의 대상이 된다. 이러한 순위를 예측하기 위해서 2011년 한국프로야구 기록 자료를 바탕으로 산술평균방법, 가중평균방법, 주성분분석방법, 주성분회귀분석 방법을 제시한다. 표준화를 통한 산술평균, 상관계수를 이용한 가중평균과 주성분 분석을 이용해서 순위를 예측하고, 최종모형으로 주성분회귀분석 모형이 선택되었다. 주성분 분석으로 축약된 변수를 이용해서 회귀분석을 실시하여, 투수부분, 타자부분, 투수와 타자부분의 순위예측 모형을 제안한다. 예측된 회귀모형을 통해서 2012년도 순위 예측이 가능하다.

중회귀 모형을 이용한 일최고 오존 농도 예측성 검토에 관한 연구 (Prediction of Daily Maximum Ozone Concentration using Multi-Regression)

  • 김영은;조석연
    • 한국대기환경학회:학술대회논문집
    • /
    • 한국대기환경학회 1999년도 추계학술대회 논문집
    • /
    • pp.203-204
    • /
    • 1999
  • 대기질의 통계예측모형은 주로 오존 농도 예측에 사용된다. 통계예측 방법은 중회귀 모형, 신경망 모형, Fuzzy 논리 모형 등이 있다. 중회귀 모형은 종래 통계분석 방법으로 예전부터 많이 사용되고 있는 방법인 반면에 신경망 모형과 Fuzzy 논리 모형은 최근에 개발되어 적용가능성을 검토 중인 방법이다. 국내외 연구결과에 의하면 각 방법에 의한 고농도 오존 예측성은 크게 다르지 않았다. 국내에서는 중회귀 모형과 신경망 모형이 적용되었는데, 상관계수는 0.6-0.7저도로 보고되었다.(중략)

  • PDF

고속액체 크로마토그래피에서 PAH분자의 구조에 따른 용리시간 예측 (Prediction of Retention Time for PAH Molecule in HPLC)

  • 김영구
    • 대한화학회지
    • /
    • 제44권2호
    • /
    • pp.102-108
    • /
    • 2000
  • 고속액체크로마트그래피에서 RAH분자들이 상대적 용리시간을 다변량선형회귀분석과 인공신경망분석방법을 사용하여 학습시킨 후, 시험 세트의 상대적 용리시간을 예측하였다. PAH의 QSRR에서 주요한 설명인자는 분자연결지수($^1X_v,\;^2X_v$),길이와 폭의 비율(L/B) 및 분자 쌍극자 모멘트(D)이었다, 슬롯 모델과 관계깊은 L/B은 인공신경망분석방법에서는 적절한 설명인자로 작용하나, 다변량회귀분석에서는 그러하지 못하다. 시험세트에서 용리시간 예측도를 나타내주는 분산은 각각 인공신경망분석방법에서 0.0099, 다변량회귀분석방법에서 0.0114이었다. 인공신경망분석방법이 다변량회귀분석보다 더 좋은 결과를 보여준다.

  • PDF

가중치 산출방법에 따른 고객만족도지수의 비교 (Comparison of Customer Satisfaction Indices Using Different Methods of Weight Calculation)

  • 이상준;김용태;김성윤
    • 디지털융복합연구
    • /
    • 제11권12호
    • /
    • pp.201-211
    • /
    • 2013
  • 본 연구는 다양한 가중치 산출방법을 적용하여 각 차원별 가중치 및 고객만족도지수를 비교하고 시사점을 밝혀보고자 한다. 이를 위해 가중치 산출방법을 주관적 방법과 통계적 방법으로 구분하고, 다시 주관적 방법은 고정총합법, 그리고 통계적 방법은 상관분석, 회귀분석, 주성분분석, 요인분석, 구조방정식으로 세분화하였다. 연구결과 주관적 방법과 통계적 방법에 의한 가중치는 서로 차이가 있는 것으로 나타났고, 분석방법에 따른 가중치의 순위는 유사한 패턴으로 구분되었다. 그리고 가중치 산출방법에 따른 각 차원별 가중치는 큰 편차를 보여 차원간의 변별력 및 안정성에 차이를 나타냈다. 마지막으로 다양한 가중치 산출방법에 따른 고객만족도지수는 구조방정식, 회귀분석, 상관분석, 산술평균, 주성분분석, 고정총합법, 요인분석의 순으로 높게 나타났고, 각 방법론에 따른 고객만족도지수는 통계적으로 유의한 차이가 있는 것으로 나타났다.

가중치 부여 방법에 따른 가중 비선형 회귀 쌍곡선법의 침하 예측 정확도 분석 (Settlement Prediction Accuracy Analysis of Weighted Nonlinear Regression Hyperbolic Method According to the Weighting Method)

  • 곽태영;우상인;홍성호;이주형;백성하
    • 한국지반공학회논문집
    • /
    • 제39권4호
    • /
    • pp.45-54
    • /
    • 2023
  • 설계 단계에서의 침하 예측은 주로 이론적 침하 예측 방법에 의해 수행되지만, 정확도의 문제로 인해 시공 단계에서는 주로 시간에 따른 침하량 계측 결과를 토대로 장래 침하량을 예측하는 계측 기반 침하 예측 방법을 적용하고 있다. 계측 기반 침하 예측 방법 중에서도 쌍곡선법이 주로 쓰이고 있으나 기존의 쌍곡선법은 정확도가 떨어지며 통계적 측면에서 한계점이 명확하기 때문에, 가중 비선형 회귀 분석 기반의 쌍곡선법이 제안된 바 있다. 본 연구에서는 가중 비선형 회귀 쌍곡선법에 두 가지 가중치 부여 방식을 적용하여 침하 예측 정확도를 비교 분석하였다. 부산 신항에 위치한 두 현장에서 측정한 지표침하판 데이터를 활용했으며, 회귀분석 구간을 전체 데이터에 30, 50, 70%로 설정해 나머지 구간의 침하를 예측했다. 그 결과, 가중치 부여 방식과 무관하게 쌍곡선법 기반의 침하 예측 방법은 모두 회귀 분석 구간이 증가할수록 정확도가 높게 나타났으며, 가중 비선형 회귀 쌍곡선법을 통해 기존 선형 회귀 쌍곡선법 보다 정확하게 침하를 예측할 수 있었다. 특히 더 작은 회귀분석 구간이 적용되었음에도 가중 비선형 회귀 쌍곡선법이 기존 선형 회귀 쌍곡선법에 비해 높은 침하 예측 성능을 보여, 가중 비선형 회귀 쌍곡선법을 통해 훨씬 빠르고 정확하게 침하량을 예측할 수 있음을 확인했다.

回歸分析에 있어서의 多共線性과 名稱을 保全시키는 資料變換 技法

  • 兪浣
    • Journal of the Korean Statistical Society
    • /
    • 제8권2호
    • /
    • pp.109-116
    • /
    • 1979
  • 두 개의 변수의 대체효과(substitution effect)를 연구하기 위하여 수요 또는 공급의 모형을 만들었을 경우 이에 관련된 변수들의 이름이 중요시 된다. 실제 관측 자료를 사용하였을 경우 흔히 일어나는 다공선성(multicollinearity) 문제를 다루기 위한 대안으로써 선형회귀선을 예로 들어 능형회귀기법(ridge regression technique)과 요인분석기법(factor analytic technique)을 소개하였으며 이에서 얻어지는 계수(coefficient)를 OLS 추정치로 설명하기 위하여 원래의 자료를 변환하였다. 실지 수요와 공급의 모형이 비선형일 경우 일반적으로 능형회귀나 요인분석을 쓰지 못한다는 점을 감안, 이러한 방법을 자료의 변환방법으로 설명함으로써 비선형모형에서도 다공선성문제를 위하여 능형회귀분석법이나 요인분석기법을 사용할 수 있도록 하였다.

  • PDF

클래스 간 메소드 위치 결정 방법의 비교 (Comparative Analysis of Determination of Method Location between Classes)

  • 정영애;박용범
    • 한국콘텐츠학회논문지
    • /
    • 제6권12호
    • /
    • pp.80-88
    • /
    • 2006
  • 객체지향 패러다임에서 객체의 속성, 동작, 객체사이의 관계를 표현하는 클래스의 구성요소들에 대한 연관관계를 측정하는 응집도는 다양하게 연구되어 왔다. 리팩토링 분야에서도 개발자의 경험이나 직감에 의한 수동분석에서 자동분석에 이르기까지 다양한 연구가 제안되어 왔다. 리팩토링을 자동으로 수행하기 위해서는 수행여부를 결정짓는 객관적 판단기준에 대한 검증이 필요하다. 본 논문에서는 참조관계를 고려한 여섯 개의 메소드 위치 결정 요인과 메소드 위치에 대한 관계를 분석하기 위한 방법으로 로지스틱 회귀분석과 신경망을 사용할 것을 제안하였다. 실험 결과, 로지스틱 회귀 분석은 97%, 신경망은 90% 이상의 예측율을 보였으며, 로지스틱 회귀분석이 신경망을 이용한 방법보다 더 우수한 예측결과를 보였다. 또한 두 방법 모두 90% 이상의 예측율로 여섯 개의 메소드 위치 결정 요인이 리팩토링 무브 메소드의 객관적 판단기준으로 적용될 수 있음을 보였다.

  • PDF

데이터마이닝 기법을 활용한 한국인의 고위험 음주 예측모형 개발 연구 (Developing the high-risk drinking predictive model in Korea using the data mining technique)

  • 박일수;한준태
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권6호
    • /
    • pp.1337-1348
    • /
    • 2017
  • 본 연구는 질병관리본부에서 실시한 전국 규모의 자료인 지역사회건강조사 2014년 자료를 이용하여 고위험 음주자들의 특성 및 요인을 파악하고 고위험 음주 예측모형을 개발했다. 예측모형 개발은 데이터마이닝 방법 중 로지스틱 회귀분석, 의사결정나무, 신경망 분석 3가지 방법을 적용했으며, 로지스틱 회귀분석의 주요 결과로는 40대 남자의 위험도가 높았고, 사무직과 판매서비스직의 위험도가 높았다. 특히 현재 흡연자인 경우 고위험 음주 위험도가 높았다. 3가지 방법 중 AUROC (area under a receiver operation characteristic curve) 측면에서 신경망 분석과 로지스틱 회귀분석이 가장 높게 나타났다. 또한 고위험 음주 예방을 위한 우선 관리 대상자를 선정함에 있어 신경망 분석과 로지스틱 회귀분석으로 개발된 예측모형의 사후확률을 기초로 두 가지 모형 모두 예측분포의 상위 10%인 집단에 해당되는 경우를 선정한 결과 신경망 분석이나 로지스틱 회귀모형 1가지 모형으로 적용하는 것보다 반응률 및 향상도가 다소 개선되는 것으로 나타났다. 본 연구에서 개발된 고위험 음주 예측모형과 우선 관리 대상자 선정 방법은 문제적 음주 예방 및 개선 교육, 절주 프로그램 개발 등에 보다 세분화되고 효과적인 건강관리 서비스를 제공을 위한 기초자료가 될 수 있을 것이다.

다목적 댐의 월강우량 회귀분석에 의한 가뭄위험 평가 (Drought risk assessment by monthly precipitation regression in multipurpose dams)

  • 박창언;김다래
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2016년도 학술발표회
    • /
    • pp.263-263
    • /
    • 2016
  • 기후변화 등에 따른 가뭄위험을 평가하기 위한 다양한 방법이 연구되어 왔으며, 기상학적인 가뭄이나 생물학적인 가뭄 등으로 정의되는 가뭄지수들이 개발되어졌다. 그러나 궁극적으로 가뭄의 판정은 수원으로부터 더 이상의 용수를 공급할 수 없는 상황에 처해졌을 때 비로소 결정되는 것이므로, 수원공의 가뭄위험에 대한 평가가 우선적일 것으로 판단된다. 본 연구에서는 수도권의 생공용수 공급을 책임지고 있다고 해도 과언이 아닌 다목적댐인 소양강댐과 충주댐의 가뭄위험을 평가하기 위하여 월강우량 자료로부터 특정시기의 저수율을 예측할 수 있는 방법을 개발하도록 하였다. 월강우량 변화에 따른 저수율의 변화양상을 예측하기 위하여 저수지 유입량과 방류량에 따른 물수지 분석이 정교하게 이루어져야 하지만, 실질적으로 상류에 또 다른 댐이 존재하는 상황에서 유입량을 정확하게 예측하는 것도 어렵지만 수시로 상황에 따라 이루어지는 방류량을 적절히 예측하는 것은 거의 불가능하므로, 물수지 분석에 의한 저수율 예측은 어느 정도의 불확실성을 가질수밖에 없을 것으로 판단되어 댐 관리관행에 따라 나타나는 월강우량과 저수율 사이의 회귀분석을 통하여 일정한 법칙을 만들 수 있는지 시도하였다. 다목적 댐인 소양강댐과 충주댐의 1984-2013년의 일별 저수율 자료로부터 저수율 관리관행을 파악할 수 있었는데, 다목적 댐인 관계로 호우시의 홍수피해 예방을 위하여 6월말에는 25-35% 정도의 저수율을 유지하도록 관리가 이루어지고 있었으며 호우가 발생된 이후에는 일정량을 수시로 방류하여 다음 호우를 준비하고 있는 것으로 나타났다. 또한 각 댐의 최저 저수율은 3월말 - 4월에 발생하는 것으로 나타났으며, 4월과 5월에 일정 정도의 강우량만 존재한다면 가뭄피해는 발생하지 않는 것으로 나타났다. 이와 같은 저수율 관리 관행을 적용하여 예측되는 강우량 패턴에 따른 저수율 변화를 예측하기 위하여 월강우량 자료와 4월 1일 기준의 저수율 자료 사이의 회귀분석을 실시하여 전년의 7월부터 당해 3월까지의 월강우량으로부터 4월 1일의 저수율을 예측할 수 있는 의미 있는 결과를 도출하였다. 이러한 결과는 기후변화 등에 따른 미래에 예측되는 월강우량 자료로부터 각 댐의 4월 1일 기준 저수율 자료를 예측할 수 있으며, 4월 및 5월의 월강우량과 함께 분석함으로써 가뭄위험을 평가할 수 있는 한 방법으로 적절한 활용이 가능할 것으로 판단된다.

  • PDF

희귀 사건 로지스틱 회귀분석을 위한 편의 수정 방법 비교 연구 (Comparison of Bias Correction Methods for the Rare Event Logistic Regression)

  • 김형우;고태석;박노욱;이우주
    • 응용통계연구
    • /
    • 제27권2호
    • /
    • pp.277-290
    • /
    • 2014
  • 본 연구에서는 로지스틱 회귀 모형을 이용하여 보은 지방의 산사태 자료를 분석하였다. 5000 지역의 관측치 가운데 단 9개만이 산사태 발생 지역이므로 이 자료는 희귀 사건 자료로 간주될 수 있다. 로지스틱 회귀 분석 모형이 희귀사건 자료에 적용될 때 주요 이슈는 회귀 계수 추정치에 심각한 편의 문제가 생길 수 있다는 것이다. 기존에 두 가지의 편의 수정 방법이 제안되었는데, 본 논문에서는 시뮬레이션을 통해 정량적으로 비교 연구를 진행하였다. Firth(1993)의 방식이 다른 방법에 비해 우수한 성능을 보였으며, 이항 희귀 사건을 분석하는 데 있어서 매우 안정된 결과를 보여주었다.