• 제목/요약/키워드: 중회귀분석모형

검색결과 840건 처리시간 0.029초

학년진급률에 따른 학생수 예측방법 (The methods of forecasting for the number of student based on promotion proportion)

  • 김종태
    • Journal of the Korean Data and Information Science Society
    • /
    • 제20권5호
    • /
    • pp.857-867
    • /
    • 2009
  • 본 연구는 학년 (연령) 진급에 따른 인구증감률에 대하여 전국 학생수를 예측하는 다양한 방법들을 제시하고, 제시된 예측 모형들을 이용하여 출생아들이 고3학생이 되는 18년 후인 2026까지의 학생수를 예측하는 것이다. 이동평균과 시계열모형, 회귀분석 등 다양한 예측모형들이 사용되었고, 적합 척도들을 이용하여 이들의 오차들을 측정하였다. 예측오차를 측정하는 도구들을 기준으로 제시된 예측방법들 중 이동평균에 의한 방법은 쉽고 단순한 장점을 지니면서도 기존에 예측되어진 한국교육개발원의 예측결과 뿐 아니라 회귀분석 및 시계열예측의 고등기법들의 결과들 보다 예측 능력이 우수한 것으로 나타났다.

  • PDF

소비자물가지수의 시계열모형 연구 (Analysis of time series models for consumer price index)

  • 이훈자
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권3호
    • /
    • pp.535-542
    • /
    • 2012
  • 소비자물가지수는 국가의 중요한 경제 척도 중의 하나이다. 본 연구에서는 4개 도시, 서울, 부산, 대구, 광주지역의 소비자물가지수를 연구하였다. 자료는 모두 통계청에서 발췌하였고, 기간은 1998년-2011년 월별자료이며, 시계열분석 기법인 자기회귀오차모형으로 분석하였다. 소비자물가 분석을 위한 설명변수는 9가지 경제변수인 경기동행지수, 미국환욜, 생산자물가지수, 원유수입단가, 원유수입물량, 국제경상수지, 수입물가지수, 실업율, 화폐통화량을 사용하였다. 분석 결과, 자기회귀오차모형으로 각 지역별 소비자물가지수를 46%-52% 정도 설명할 수 있다.

로지스틱회귀분석 모델을 활용한 도시철도 사상사고 사고예측모형 개발에 대한 연구 (Study on Accident Prediction Models in Urban Railway Casualty Accidents Using Logistic Regression Analysis Model)

  • 진수봉;이종우
    • 한국철도학회논문집
    • /
    • 제20권4호
    • /
    • pp.482-490
    • /
    • 2017
  • 본 연구는 사고심각도 분류 및 예측을 위한 철도사고조사 통계기법에 관한 연구이다. 그동안의 선형 회귀분석은 사고 심각도 분석에 어려움이 있었으나 로지스틱회귀분석은 이를 보완할 수 있었다. 데이터마이닝 기법인 로지스틱회귀분석을 활용, 서울지하철(5~8호선) 역사 내 전도사고 중 에스컬레이터 전도사고 발생에 영향을 주는 사고예측 모형 변수는 사고자 연령, 음주여부, 사고 당시상황 및 행동, 핸드레일 잡음 여부였다. 분석의 정확도는 76.7%로 설명되었고 분석방법 결과에 따르면 정확도와 유의수준 측에서 로지스틱회귀분석 방법이 도시철도 사상사고 예측모형을 개발하는데 유용한 데이터마이닝 기법으로 판단된다.

경쟁 위험 회귀 모형의 이해와 추정 방법 (Estimation methods and interpretation of competing risk regression models)

  • 김미정
    • 응용통계연구
    • /
    • 제29권7호
    • /
    • pp.1231-1246
    • /
    • 2016
  • 경쟁위험에 대한 연구 중 주로 쓰이는 방법은 Cause-specific 위험 모형과 subdistribution을 이용한 비례 위험 모형 방법이다. 그 이후에도 많은 모형이 제시되었지만, 추정 방법 면에서 설명력이 부족하거나 알고리즘으로 구현하기 어려운 단점을 가지고 있어서 잘 활용되고 있지 않다. 이 논문에서는 Cause-specific 위험 모형, subdistribution을 이용한 비례 위험 모형과 비교적 최근에 제시된 이항 회귀 모형(direct binomial model), 절대 위험 회귀 모형(absolute risk regression model), Eriksson 등 (2015)의 비례 오즈 모형(proportional odds model)을 소개하고 추정 방법을 간단히 설명하고자 한다. 각 모형에 대하여 SAS와 R을 이용한 활용 방법을 제시하고, 두 가지 경쟁위험이 존재하는 데이터를 R을 이용하여 분석하였다.

다중회귀를 이용한 대구시 주거지역의 오존농도 예측

  • 이정환;최성우;최혁
    • 한국환경과학회:학술대회논문집
    • /
    • 한국환경과학회 2006년도 추계 학술발표회 발표논문집
    • /
    • pp.117-118
    • /
    • 2006
  • 본 연구에서는 2001년부터 2005년까지의 최근 5년간의 대구시 보건환경연구원의 대기질 자동측정망 자료와 대구기상대의 기상자료를 이용하여 다중회귀분석을 통하여 대구시 주거 지역의 오존농도를 예측하였다. 대구시 주거지역의 고농도 오존은 측정소별로 대명동은 총 327회 중 153회(46.79%), 신암동은 총 310회 중 143회(46.13%), 만촌동은 총 262회 중 140회(53.44%)로 기온과 일사량이 증가하는 5, 6월에 주로 많이 발생하였다. 다중회귀분석 결과 각 측정소별로 수정된 $R^2$는 각각 0.611, 0.655, 0.624으로 양호한 회귀 모형을 나타내었다.

  • PDF

자기회귀모형에서의 로버스트한 모수 추정방법들에 관한 연구 (A Comparison of Robust Parameter Estimations for Autoregressive Models)

  • 강희정;김순영
    • Journal of the Korean Data and Information Science Society
    • /
    • 제11권1호
    • /
    • pp.1-18
    • /
    • 2000
  • 본 논문에서는 가장 많이 사용되는 시계열 모형중의 하나인 자기회귀모형에서 모수를 추정하는 방법으로 최소 절대 편차 추정법(least absolute deviation estimation)을 포함한 로버스트한 추정방법 (robust estimation)의 사용을 제안하고 모의 실험을 통하여 이러한 방법들을 기존의 최소 제곱 추정 방법과 예측의 관점에서 비교 검토하여 시계열 자료분석에서의 로버스트한 모수 추정 방법의 유효성을 확인해 보고자 한다.

  • PDF

기상자료를 이용한 마늘 생산량 추정 (Garlic yields estimation using climate data)

  • 최성천;백장선
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권4호
    • /
    • pp.969-977
    • /
    • 2016
  • 야외에서 재배되는 주요 채소류의 생산에 대한 기상변화의 영향력이 점차 커지고 있다. 기상변화로 인한 농작물 생산량의 변화는 공급과 수요의 불안정과 물가안정의 불안요소로 작용하고 있다. 본 논문에서는 패널회귀모형을 이용하여 기상상태에 따른 마늘의 생산량을 추정하였다. 2006년부터 2015년까지의 마늘 주산지 15곳의 10a당 마늘 생산량과 해당 지역의 기상자료를 사용하였다. 7가지 기상요인 (평균기온, 평균최저기온, 평균최고기온, 누적강수량, 누적일조시간, 평균상대습도, 평균지면온도)의 월별 (1월-12월)자료인 총 84개 기상변수중 다중회귀분석 단계선택방법을 통하여 7가지 기상변수를 선택하여 패널회귀모형에 사용하였다. 고정효과 모형과 확률효과 모형을 구분하는 하우스만 검정을 통하여 확률효과 모형으로 분석한 결과 평균최고기온 (1월), 누적강수량 (3월, 10월), 누적일조시간 (4월, 10월)등이 마늘 생산량 추정에 유의한 변수로 나타났다. 또한 연도별로 추정된 생산량 추정값의 추이가 실제 생산량과 동일한 추세를 보이고 있어 제안된 패널 회귀 모형이 잘 적합됨을 확인할 수 있다.

통신서비스산업 예측모형 예측력 비교 분석 (The Comparative Evaluations of Telecommunications Service Forecasting Models for Forecating Performance)

  • 조상섭;정동진
    • 전자통신동향분석
    • /
    • 제17권3호통권75호
    • /
    • pp.80-86
    • /
    • 2002
  • 본 연구는 현재 통신서비스 산업에서 가장 많이 사용하고 있는 5개 예측모형(단순 성장 모형, 단순 Logistic 모형, Gompertz 모형, 확장 Bass 모형, 시간 변동 Bass 모형)을 이용한 초고속 인터넷 가입자에 대한 예측력을 비교 평가하는 데 있다. 예측모형의 추정 방법으로 비선형 회귀방정식(nonlinear regression)을 사용하여 추정의 효율성을 높였다. 예측력 비교분석 기준은 (i) 포화점에 대한 타당성 (ii) 모수에 대한 통계적 유의성 (iii) 실제치 대비 예측치에 대한 AAD 기준을 통하여 예측모형의 예측력을 비교 평가하였다. 본 연구에서 실시한 방법론에 따라 다섯 가지 통신서비스 예측모형의 예측력을 분석한 결과 가장 작은 AAD를 나타낸 예측모형은 Log-Logistic 모형으로 나타났으며, 가장 큰 AAD를 나타낸 예측모형은 단순 Logistic 모형으로 나타났다. 또한 AAD 기준에서 보면 일반적으로 많이 사용하고 있는 Gompertz 예측모형과 Bass 모형 중에서는 Gompertz 예측모형이 더 우월한 것으로 나타났다.

경기도 수원시 미세먼지 농도의 시계열모형 연구 (Analysis of time series models for PM10 concentrations at the Suwon city in Korea)

  • 이훈자
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권6호
    • /
    • pp.1117-1124
    • /
    • 2010
  • 미세먼지 농도는 국가의 중요한 환경 척도 중의 하나이다. 본 연구에서는 경기도 남부에 위치한 수원시 2003년-2009년 미세먼지 농도를 주위에서 쉽게 구할 수 있는 대기자료와 기상자료를 이용하여 자기회귀오차모형으로 월별로 분석하였다. 미세먼지 농도 분석을 위한 대기자료는 이산화황, 이산화질소, 일산화탄소, 오존 등을 사용했고, 기상자료로는 일 최고온도, 풍속, 상대습도, 강수량, 일사량, 운량을 사용하였다. 분석 결과, 자기회귀오차모형으로 월별 미세먼지 농도를 13%-49% 정도 설명할 수 있다.

인공신경망을 이용한 부실기업예측모형 개발에 관한 연구

  • 정윤;황석해
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1999년도 춘계공동학술대회: 지식경영과 지식공학
    • /
    • pp.415-421
    • /
    • 1999
  • Altman의 연구(1965, 1977)나 Beaver의 연구(1986)와 같은 전통적 예측모형은 분석자의 판단에 따른 예측도가 높은 재무비율을 선정하여 다변량판별분석(MDA: multiple discriminant analysis), 로지스틱회귀분석 등과 같은 통계기법을 주로 이용해 왔으나 1980년 후반부터 인공지능 기법인 귀납적 학습방법, 인공신경망모형, 유전모형 둥이 부실기업예측에 응용되기 시작했다. 최근 연구에서는 인공신경망을 활용한 변수 및 모형개발에 관한 보고가 있다. 그러나 지금까지의 연구가 주로 기업의 재무적 비율지표를 고려한 모형에 치중되었으며 정성적 자료인 비재무지표에 대한 검증과 선정이 자의적으로 이루어져온 경향이었다. 또한 너무 많은 입력변수를 사용할 경우 다중공선성 문제를 유발시킬 위험을 내포하고 있다. 본 연구에서는 부실기업예측모형을 수립하기 위하여 정량적 요인인 재무적 지표변수와 정성적요인인 비재무적 지표변수를 모두 고려하였다. 재무적 지표변수는 상관분석 및 요인분석들을 통하여 유의한 변수들을 도출하였으며 비재무적 지표변수는 조직생태학내에서의 조직군내 조직사멸과 관련된 생태적 과정에 대한 요인들 중 조직군 내적요인으로 조직의 연령, 조직의 규모, 조직의 산업밀도를 도출하여 4개의 실험집단으로 분류하여 비재무적 지표변수를 보완하였다. 인공신경망은 다층퍼셉트론(multi-layer perceptrons)과 역방향 학습(back-propagation )알고리듬으로 입력변수와 출력변수, 그리고 하나의 은닉층을 가지는 3층 퍼셉트론(three layer perceptron)을 사용하였으며 은닉충의 노드(node)수는 3개를 사용하였다. 입력변수로 안정성, 활동성, 수익성, 성장성을 나타내는 재무적 지표변수와 조직규모, 조직연령, 그 조직이 속한 산업의 밀도를 비재무적 지표변수로 산정하여 로지스틱회귀 분석과 인공신경망 기법으로 검증하였다. 로지스틱회귀분석 결과에서는 재무적 지표변수 모형의 전체적 예측적중률이 87.50%인 반면에 재무/비재무적 지표모형은 90.18%로서 비재무적 지표변수 사용에 대한 개선의 효과가 나타났다. 표본기업들을 훈련과 시험용으로 구분하여 분석한 결과는 전체적으로 재무/비재무적 지표를 고려한 인공신경망기법의 예측적중률이 높은 것으로 나타났다. 즉, 로지스틱회귀분석의 재무적 지표모형은 훈련, 시험용이 84.45%, 85.10%인 반면, 재무/비재무적 지표모형은 84.45%, 85.08%로서 거의 동일한 예측적중률을 가졌으나 인공신경망기법 분석에서는 재무적 지표모형이 92.23%, 85.10%인 반면, 재무/비재무적 지표모형에서는 91.12%, 88.06%로서 향상된 예측적 중률을 나타내었다.

  • PDF