• 제목/요약/키워드: 중회귀분석모형

검색결과 836건 처리시간 0.034초

정상 비모수 자기상관 오차항을 갖는 회귀분석에 대한 비교 연구 (A comparison study on regression with stationary nonparametric autoregressive errors)

  • 유규상
    • 응용통계연구
    • /
    • 제29권1호
    • /
    • pp.157-169
    • /
    • 2016
  • 이 논문에서는 비선형 자기회귀 과정을 따르는 오차항을 포함한 회귀모형에서 계수추정법의 비교를 다룬다. 비교를 위해 통상적 최소제곱추정량, 일반화 최소제곱추정량, 모수적 회귀오차 수정법, 비모수적 회귀오차 추정법을 비교하였다. 본 논문에서는 또한 비선형 자기회귀모형의 성질을 전형적인 몇가지 비선형자기회귀 모형을 예를 들어 설명한다. 비교연구의 결과 네 가지 추정량 중에 모든 상황에서 최선인 추정량은 존재하지 않았으나 비모수 회귀오차 수정 방법이 일반적으로 우수한 성능을 보임을 알 수 있다.

통계적 분류방법을 이용한 문화재 정보 분석

  • 강민구;성수진;이진영;나종화
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2009년도 춘계학술대회 미래 IT융합기술 및 전략
    • /
    • pp.120-125
    • /
    • 2009
  • 본 논문에서는 통계적 분류방법을 이용하여 문화재 자료의 분석을 수행하였다. 분류방법으로는 선형판별분석, 로지스틱회귀분석, 의사결정나무분석, 신경망분석, SVM분석을 사용하였다. 각각의 분류방법에 대한 개념 및 이론에 대해 간략히 소개하고, 실제자료 분석에서는 "지역별 문화재 통계분석 및 모형개발 연구 1차(2008)"에 사용된 자료 중 익산시 자료를 근거로 매장문화재에 대한 분류방법별 적합모형을 구축하였다. 구축된 모형과 모의실험의 결과를 통해 각각의 적합모형에 대한 비교를 수행하여 모형의 성능을 비교하였다. 분석에 사용된 도구로는 최근 가장 관심을 갖는 R-project를 사용하였다.

  • PDF

기업부도예측을 위한 통합알고리즘

  • 배재권;김진화
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2006년도 춘계학술대회
    • /
    • pp.195-202
    • /
    • 2006
  • 본 연구에서는 보다 효과적인 기업부도예측을 위하여, 동계적 방법과 인공지능 방법을 결합한 통합모형을 제시하였다. 이를 위하여 통계적인 모형 중에서 가장 널리 활용되고 있는 다변량 판별분석, 로지스틱 회귀분석과 인공 지능적인 방법으로서 최근 널리 사용되고 있는 인공신경망, 규칙유도기법, 베이지안 망의 5가지 방법론을 통합한 Voting with Performance & Weights from ANN(WP-ANN) 통합모형을 제시하였다. 실험결과, 본 연구에서 제안한 WP-ANN 통합모형은 다변량 판별분석, 로지스탁 회귀분석, 인공신경망, 규칙유도기법, 베이지안 망 등의 단일모형과 비교한 결과 가장 예측정확성이 유수한 것으로 나타났다. 따라서 본 연구를 통해 기업부도예측에 있어서 WP-ANN 통합모형이 기존의 모형들에 비해 우수한 예측정확성을 나타냄을 알 수 있었다.

  • PDF

글로벌 기후지수와의 원격상관을 이용한 경안천 유역의 월 강수량 예측 (Forecasting monthly precipitation of Gyeongan-cheon watershed using teleconnection with global climate indices)

  • 김철겸;이정우;이정은;김남원;김현준
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2019년도 학술발표회
    • /
    • pp.314-314
    • /
    • 2019
  • 가뭄대응 및 이수분야 활용을 위한 장기 기상예측정보 확보를 위해, 경안천 유역을 대상으로 전구기후지수의 원격상관 패턴을 이용하여 통계적 기반의 다중회귀모형을 구성하고 월 강수량의 예측가능성을 평가하였다. 예측인자로서 미국 NOAA에서 제공하는 기후지수 중 총 37개의 지수에 대해 1948~2018년의 월 자료를 이용하였으며, 예측대상인 경안천 월 강수량은 1966~2018년의 유역평균 강수량 자료를 활용하였다. 각 기후지수별 1~24개월 선행자료와 예측대상년도 월 강수량과의 상관분석을 통해 상관성이 높은 기후자료를 선별하여 다중회귀모형의 독립변수로 적용하였다. 예측대상년도를 기준으로 과거 40년의 자료(월 강수량 및 월 기후지수)를 보정자료와 검정자료로 구분(20년씩 무작위로 추출)하고, 보정기간에 대해 도출된 회귀모형 중 검정기간을 대상으로 예측성이 좋은 100개의 회귀모형을 선별하여 예측대상기간에 대한 예측모형으로 활용하였다. 2006~2018년에 대해 전망기간별(1개월, 3개월, 6개월, 12개월)로 각 월별 100개 회귀모형으로 부터의 예측값(예측치의 범위)이 실제 관측치를 포함하는 경우를 월별로 분석한 결과 10월이 가장 높고(83%), 11월(81%), 1월(79%), 8월(77%), 6월(75%), 12월(71%)의 순으로 높게 나타났으며, 상대적으로 7월(29%)과 3월(44%)의 예측성이 낮은 것으로 나타났다. 통계적 모형의 특성상 전망기간에 따른 예측의 정확도는 비례하지 않았다. 예측치의 편차는 크지 않지만 예측성이 낮게 나타나는 기간(3월, 2월)과 예측성은 높지만 예측범위가 크게 나타나는 기간(8월, 6월)에 대해서는 예측모형의 재검토 및 다양한 규모의 유역에 대한 적용을 통해 예측인자 추가 및 보완 등을 수행할 예정이다.

  • PDF

데이터마이닝 기법을 활용한 한국인의 고위험 음주 예측모형 개발 연구 (Developing the high-risk drinking predictive model in Korea using the data mining technique)

  • 박일수;한준태
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권6호
    • /
    • pp.1337-1348
    • /
    • 2017
  • 본 연구는 질병관리본부에서 실시한 전국 규모의 자료인 지역사회건강조사 2014년 자료를 이용하여 고위험 음주자들의 특성 및 요인을 파악하고 고위험 음주 예측모형을 개발했다. 예측모형 개발은 데이터마이닝 방법 중 로지스틱 회귀분석, 의사결정나무, 신경망 분석 3가지 방법을 적용했으며, 로지스틱 회귀분석의 주요 결과로는 40대 남자의 위험도가 높았고, 사무직과 판매서비스직의 위험도가 높았다. 특히 현재 흡연자인 경우 고위험 음주 위험도가 높았다. 3가지 방법 중 AUROC (area under a receiver operation characteristic curve) 측면에서 신경망 분석과 로지스틱 회귀분석이 가장 높게 나타났다. 또한 고위험 음주 예방을 위한 우선 관리 대상자를 선정함에 있어 신경망 분석과 로지스틱 회귀분석으로 개발된 예측모형의 사후확률을 기초로 두 가지 모형 모두 예측분포의 상위 10%인 집단에 해당되는 경우를 선정한 결과 신경망 분석이나 로지스틱 회귀모형 1가지 모형으로 적용하는 것보다 반응률 및 향상도가 다소 개선되는 것으로 나타났다. 본 연구에서 개발된 고위험 음주 예측모형과 우선 관리 대상자 선정 방법은 문제적 음주 예방 및 개선 교육, 절주 프로그램 개발 등에 보다 세분화되고 효과적인 건강관리 서비스를 제공을 위한 기초자료가 될 수 있을 것이다.

다중회귀분석을 이용한 남강댐 하류지역의 조류발생 특성 연구 (A Study on the Characteristics of Algae Occurrence in Lower Watershed of Nam River Dam by Using Multiple Regression Analysis)

  • 정우석;김영도
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2016년도 학술발표회
    • /
    • pp.126-126
    • /
    • 2016
  • 남강은 낙동강 주요 지류인 동시에 낙동강 하류지역의 유지용수, 생활, 공업, 농업용수 공급 등에 중요 역할을 하고 있어 오염원 및 수질관리가 매우 중요하다고 볼 수 있다. 최근 남강댐 하류 및 남강합류 후 낙동강 본류인 창녕함안보 지점에서의 녹조 발생이 빈번해지고 있으며, 녹조현상에 대한 관심과 우려가 높아지고 있는 실정이다. 따라서 기존 호소의 녹조관리는 '조류경보제'에 의해서 관리되고 있지만 4대강 16개의 보 건설 이후 '수질예보제'와 같이 녹조관리를 위한 제도 및 정책이 시행되면서 조류관리의 중요성이 대두되고 있다. 본 연구에서는 기존의 많은 문헌들을 참고하여 조류의 영향인자를 파악하였으며, 남강유역의 물관리 기초자료를 수집하고 구축된 데이터 기반의 각 항목별 주요항목 영향인자 분석을 위한 상관성 분석을 실시하여 영향인자별 상관관계 우선순위를 선정하여 입력변수로 이용하였다. 그에 따른 데이터 마이닝을 통한 조류 발생특성을 고려하여 예측 모형인 다중회귀분석(Multiple Regression Analysis)을 구현하였다. 회귀분석 과정에서 다중공선성이 발생하는 변수에 대해서는 모형에서 제거하였으며, 잔차분석을 통해 이상치와 영향치를 검토하여 고려하였다.

  • PDF

저류함수모형의 매개변수 보정과 홍수예측 (2) 홍수예측방법의 비교 연구 (Parameter Calibration of Storage Function Model and Flood Forecasting (2) Comparative Study on the Flood Forecasting Methods)

  • 김범준;송재현;김형수;홍일표
    • 대한토목학회논문집
    • /
    • 제26권1B호
    • /
    • pp.39-50
    • /
    • 2006
  • 홍수를 예측하기 위해서 국내 5대강 유역의 홍수통제소는 저류함수모형을 사용하고 있으며 현재까지 홍수예측에 대한 많은 연구가 이루어지고 있다. 이에 본 논문에서는 현재 홍수통제소에서 사용되고 있는 저류함수모형과 과거의 강우-수위 관계를 이용한 회귀분석(regression analysis), 그리고 인공신경망(artificial neural network)을 이용하여 홍수를 예측하고 이를 비교, 분석하고자 하였다. 저류함수모형의 경우는 홍수통제소의 대표매개변수와 보정된 최적(평균)매개변수를 적용하였다. 그리고 회귀분석과 인공신경망은 1995~2001년까지의 홍수사상 중 4개의 홍수사상을 선택하여 회귀계수를 구하고 역전파(backpropagation) 알고리즘을 사용하여 학습을 시켰다. 그 결과 저류함수모형의 경우 최적 매개변수를 이용하였을 때 기존의 홍수통제소에서 사용하고 있는 대표매개변수보다 예측이 개선되었으며, 회귀분석의 방법인 다중회귀분석, Robust 회귀분석, Stepwise 회귀분석을 이용한 홍수예측은 비교적 정확한 결과를 얻을 수 있었다. 역전파 알고리즘을 사용한 인공신경망의 경우도 회귀분석을 이용한 홍수예측보다는 다소 못하였지만 정확한 결과를 얻을 수 있었다.

확률회귀모형을 이용한 고속도로의 사고요인 분석

  • 이기영;이용택
    • 도로교통
    • /
    • 통권94호
    • /
    • pp.51-64
    • /
    • 2003
  • 본 연구는 사고요인과 사고모형의 문헌고찰을 통해 고속도로를 주행하는 버스와 화물차의 사고모형을 개발하고 그 적용방안에 대해 고찰하고자 수행되었다. 고속도로 사고 중 대형차로 인한 차량당 사고율은 승용차보다 월등히 높아 사고의 심각성을 나타내고 있으며, 따라서 이에 대한 별도의 검토가 필요한 시점에 와 있다. 특히 본 연구에 활용된 자료는 비집계된 사상자수로 구간자료를 집합화함으로써 발생하는 문제점을 해소할 수 있다. 모형의 분석기법으로 국내의 경우, 대부분 단순회귀식으로 사고모형을 개발, 적용하여 왔으나 사고수와 사상자수의 특성상 이산적 확률변수로 해석하여 포아송분포와 음이항분포로 적용하는 것이 바람직하다. 따라서 본 연구에서는 버스와 화물차의 사고유형별로 적합한 사고 모형을 개발하여 이로 인한 인사사고 요인에 대한 영향을 분석하고 그 적용방안을 제시하였다. 이러한 연구는 도로설계, 운영, 교통법규, 교통행정 등의 분야에서 거시적인 정책적 방향성을 제시하리라 판단된다. 특히 본 연구는 고속도로 운영주체인 한국도로공사의 고속도로사고조서를 바탕으로 사고유형별 사고모형을 개발, 적용한 것으로 고속도로의 안정성 향상을 위한 제반 정책 수립에 기초자료로 활용될 것으로 기대된다.

  • PDF

모형 선택 기준들에 대한 LASSO 회귀 모형 편의의 영향 연구 (A study on bias effect of LASSO regression for model selection criteria)

  • 유동현
    • 응용통계연구
    • /
    • 제29권4호
    • /
    • pp.643-656
    • /
    • 2016
  • 고차원 자료(high dimensional data)는 변수의 수가 표본의 수보다 많은 자료로 다양한 분야에서 관측 또는 생성되고 있다. 일반적으로, 고차원 자료에 대한 회귀 모형에서는 모수의 추정과 과적합을 피하기 위하여 변수 선택이 이루어진다. 벌점화 회귀 모형(penalized regression model)은 변수 선택과 회귀 계수의 추정을 동시에 수행하는 장점으로 인하여 고차원 자료에 빈번하게 적용되고 있다. 하지만, 벌점화 회귀 모형에서도 여전히 조율 모수 선택(tuning parameter selection)을 통한 최적의 모형 선택이 요구된다. 본 논문에서는 벌점화 회귀 모형 중에서 대표적인 LASSO 회귀 모형을 기반으로 모형 선택의 기준들에 대한 LASSO 회귀 추정량의 편의가 어떠한 영향을 미치는지 모의실험을 통하여 수치적으로 연구하였고 편의의 보정의 필요성에 대하여 나타내었다. 실제 자료 분석에서의 영향을 나타내기 위하여, 폐암 환자의 유전자 발현량(gene expression) 자료를 기반으로 바이오마커 식별(biomarker identification) 문제에 적용하였다.

한국 소비자원 의료분야 처리금액에 대한 시계열 분석 (Time series analysis for the amount of medicine from the Korea Consumer Agency)

  • 강희송;권숙희;이성덕
    • 응용통계연구
    • /
    • 제36권1호
    • /
    • pp.21-32
    • /
    • 2023
  • 한국 소비자원의 의료 분야 처리금액 자료에 대한 시계열 모형을 이용한 실증 분석을 연구하였다. 의료분야 처리금액 시계열 자료는 상담 처리금액, 피해 구제금액, 분쟁 조정 처리금액으로 나뉜 3개 변수를 사용하였고 분석에 사용된 시계열 모형은 ARIMA 모형, 벡터 자기회귀 모형 그리고 전이 함수를 이용한 시계열 모형이다. 이들 중 전이 함수를 이용한 시계열 모형이 단기 예측면에서 가장 우수한 예측력을 보였고 벡터자기회귀 모형도 변수간 영향력과 기간을 파악하는데 유용한 정보를 제공하였다.