• 제목/요약/키워드: 단계적 선형회귀 분석

검색결과 99건 처리시간 0.028초

항공 LiDAR 자료를 이용한 산림재적추정 모델 개발 - 봉화군 춘양면 애당리 혼효림을 대상으로 - (Development of Forest Volume Estimation Model Using Airborne LiDAR Data - A Case Study of Mixed Forest in Aedang-ri, Chunyang-myeon, Bonghwa-gun -)

  • 조승완;김용구;박주원
    • 한국지리정보학회지
    • /
    • 제20권3호
    • /
    • pp.181-194
    • /
    • 2017
  • 본 연구의 목적은 산림재적 현장자료와 항공 LiDAR 자료 기반의 산림재적 추정을 위한 회귀모델의 개발이다. 추정 모델은 경상북도 봉화군 지역에서 임의추출법에 의해 선정된 30개의 원형 표본지로부터 산출한 표본지별 산림재적을 반응변수로 하고, 항공 LiDAR 원자료로부터 개별 표본지의 고도분포 백분위수(Height Percentiles, HP) 및 층위 단위 점 개체수 백분율(Height Bin, HB)을 추출하여 예측변수로 사용하여 구성하였다. 단순선형회귀분석, 이차 다항회귀분석 및 단계적 회귀분석 방법을 이용한 다중회귀분석을 실시하여 적합모델들의 후보들을 도출하였으며, 검증을 위하여 각 모델별로 교차 타당성 검증을 실시하여 PRESS 통계치를 구하였다. 모델의 $R^2$ 및 PRESS을 비교하여 적합성을 검토한 결과, $HB_{5-10}$, $HB_{15-20}$, $HB_{20-25}$, $HBgt_{25}$의 다중회귀모델의 $R^2$이 0.509로 가장 높고, $HP_{25}$ 단순회귀모델의 PRESS 값이 122.352으로 가장 낮은 것으로 나타났다. 수직구조가 복잡한 우리나라 산림재적을 추정하는 모델로는 다양한 수직적 정보를 포함하고 있는 $HB_{5-10}$, $HB_{15-20}$, $HB_{20-25}$, $HBgt_{25}$이 상대적으로 보다 적합하다고 사료된다.

기계학습을 활용한 대학생 학습결과 예측 연구 (A Study on the Prediction of Learning Results Using Machine Learning)

  • 김연희;임수진
    • 한국콘텐츠학회논문지
    • /
    • 제20권6호
    • /
    • pp.695-704
    • /
    • 2020
  • 최근 교육분야에 IT의 활용이 증가하고 이를 통한 학습결과 예측에 대한 연구가 진행되고 있다. 본 연구에서는 학습분석을 참고하여 학습결과에 영향을 미칠 수 있는 학습활동 데이터를 수집하였다. 조사에 참여한 학생은 1062명으로, 조사는 2018년 10월부터 12월까지 충청남도 소재의 4년제 종합 사립대학인 A대학에서 진행되었다. 먼저 기계 학습의 예측 변인들의 타당성 확보를 위하여 학습결과에 대한 개인·학업·행동요인으로 모형을 구성하여 위계적 회귀 분석을 실시하였다. 위계적 회귀 분석의 모형이 유의하였고, 단계별로 설명력(R2)이 증가하는 것으로 나타나 투입된 변수들이 적절한 것으로 나타났다. 또한 기계학습의 선형 회귀분석방법을 통해 투입한 학습활동 변수가 학습 결과를 얼마나 예측할 수 있는지 확인하였으며, 오차율은 약 8.4%로 수집되었다.

조건부 합성기법과 MODIS LST를 활용한 토양수분 다중선형 회귀모형 산정 연구 (A Study on Estimation of Soil Moisture Multiple Linear Regression Model Using Conditional Merging and MODIS Land Surface Temperature Data)

  • 정충길;이지완;김다래;김세훈;김성준
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.103-104
    • /
    • 2017
  • 본 연구에서는 다중회귀분석모형(MLRM)과 MODIS (MODerate resolution Imaging Spectroradiometer) LST (Land Surface Temperature) 자료를 이용하여 전국 공간토양수분을 산정하였다. 공간토양수분을 산정하기 위한 과정은 크게 두가지로 구분된다. 첫 번째로 기존의 MODIS LST 자료를 조건부 합성 보정기법을 적용하여 실측 LST 자료와 비교하여 위성 LST 자료가 갖고 있는 오차를 보정하였다. 그 결과, 조건부 합성 보정기법을 적용하기전 전국 71개 지상 관측지점에서 관측한 실측 LST와 MODIS LST의 R2는 전체 평균 0.70으로 어는정도 유의성 있는 상관관계를 나타냈으나 조건부 합성 보정기법을 적용한 후 실측 LST와 MODIS LST의 R2는 전체 평균 0.92로 상당히 크게 향상됨을 알 수 있었다. 두 번째로 보정된 MODIS LST를 이용하여 다중회귀분석 모형을 개발하고 토양수분을 예측하는 단계로 입력자료로 위성영상 자료와 관측자료를 융합하여 사용하였다. 위성영상 자료로는 보정된 MODIS LST와 MODIS NDV를 구축하였고 일단위 강수량 및 일조시간의 기상자료는 기상청으로부터 전국 68개 지점에 대해 구축하여 IDW 공간보간기법을 이용한 공간자료로 구축하였다. 토양수분 결과를 비교하기 위한 관측 토양수분은 자동농업기상관측(Automated Agriculture Observing System, AAOS)지점에서 2013년 1월부터 2015년 12월까지의 실측 일단위 토양수분 자료를 구축하여 사용하였다. 다중회귀분석 모형은 각각의 입력자료를 독립인자로서 조합하여 12개의 시나리오를 만들었다. 시공간적 경향을 고려하기 위하여 계절별, 토양 토성(soil texture)를 구분하여 회귀분석을 실시하였다. 관측 토양수분과 모의 토양수분을 비교한 결과 $R^2$가 0.80 (철원), 0.90 (춘천), 0.80 (수원), 0.63 (서산), 0.77 (청주), 0.82 (전주), 0.52 (순천), 0.63 (진주), 0.99 (보성)로 높은 상관성을 보였다. 본 연구에서는 토양수분을 예측하기 위한 인자 중 가장 민간함 LST를 보정하지 않는 토양수분 예측 방법은 상당한 오차를 포함하게 되어 실측 토양수분 결과와 크게 차이가 나타남을 보여주었다.

  • PDF

GWR을 이용한 센서스 기반 도시범죄 특성 분석 및 예측모델 구축 (Construction of Urban Crime Prediction Model based on Census Using GWR)

  • 유영우;백태경
    • 한국지리정보학회지
    • /
    • 제20권4호
    • /
    • pp.65-76
    • /
    • 2017
  • 본 연구는 범죄와 환경과의 관계가 밀접한 영향을 미친다는 전제하에 범죄억제를 위한 정책수립 및 설계를 위한 대안마련의 사전단계로 범죄위험지역 분석과 요인, 공간적 특성이 반영된 예측모델을 제시하는 것을 주요 목적으로 수행하였다. 연구의 분석결과, H구 전체 지역에 범죄가 균등하게 분포하였을 경우와 대비하여 약 1/4 수준으로 범죄발생지역은 군집성을 나타내고 있었으며 주로 H 해수욕장 배후 상업지역에서 특정범죄(강간, 절도, 폭력)는 강한 핫스팟을 나타내었다. 결과적으로 독립변수와 종속변수의 공간적 상관관계를 고려하는 지리가중회귀모형을 이용함으로써 보다 효과적으로 적용할 수 있음을 알 수 있었다. 이러한 결과는 다중선형회귀 모형의 결과에서와 같이 연구지역 내 폐공가수가 종속변수와 단순히 부적의 관계를 가지는 것이 아니라, 지역에 따라 종속변수에 서로 다른 영향을 미치는 것을 알 수 있다.

종확산계수에 관한 연구 : II. 새로운 종확산계수 추정식 개발 (Analysis of Longitudinal Dispersion Coefficient : Part II. Development of New Dispersion Coefficient Equation)

  • 서일원;정태성
    • 물과 미래
    • /
    • 제28권4호
    • /
    • pp.195-204
    • /
    • 1995
  • 본 연구에서는 자연하천에서 수집하기 용이한 수리량 자료로부터 종확산계수를 추정하는 공식을 개발하였다. 차원해석을 수행하여 물리적 의미를 가진 변수를 선정한 후, 종확산계수를 추정하는 회귀식을 유도하기 위하여 비선형 다중회귀방법의 하나인 One-Step Huber 방법을 적용하였다. I 단계 연구에서 분석한 바 있는 미국 전역의 26개 하천 59지점의 수리 및 농도자료를 사용하여 새로운 종확산계수 추정식을 개발하였다. 59지점의 자료중 35지점은 종확산계수를 추정하는 회귀식을 유도하는 데 사용하고, 나머지 24지점을 사용하여 유도한 회귀식을 검증하였다. 기존의 공식과 비교한 결과, 본 연구에서 개발한 추정식이 자연하천의 확산 특성을 보다 정확하게 설명할 수 있음이 밝혀졌다.

  • PDF

사무소용 빌딩의 부하종별 전력소비특성 분석 및 수용률 기준 정립에 관한 연구 (Recommended Practice for o Reasonable Design Demand Factor and Analysis of Power Consumption Characteristics by Loads in Office Buildings)

  • 김세동;이진
    • 조명전기설비학회논문지
    • /
    • 제19권3호
    • /
    • pp.111-118
    • /
    • 2005
  • 사무소용 빌딩과 같은 전력다소비 건물에서는 전력의 효율적 이용에 의한 에너지절감을 위해서 설계 단계부터 합리적인 전기설비 설계가 요청되고 있다. 본 연구에서는 사무소용 빌딩을 중심으로 부하종류별 전력소비특성을 조사 분석하였고, 전기설계사무소의 설계단계에서 적용하는 수용률값을 조사하였다. 조사된 자료의 전체 특징과 중심적인 경향을 알아보기 위해서 평균값, 표준편차, 최대값, 최소값, 중앙값 등의 특징파라메터를 분석하였고, 회귀분석을 통한 선형적인 방법과 비선형적인 방법으로 그 경향을 확인하였다. 그 결과 합성 수용률/부등률 평균값은 $46.4[\%]$로 나타나 전력용변압기는 용량에 있어서 많은 여유를 가지고 있는 것으로 나타났다. 이를 토대로 변전설비 용량의 합리적인 설계를 위하여 부하종별 수용률 기준(안)을 제시하였고, 변전설비용량 산정에 필요한 자료를 데이터 베이스화하였다.

병원용 건물의 부하종별 전력소비특성 분석 및 수용률 기준 정립에 관한 연구 (Recommended Practice for a Reasonable Design Demand Factor and Analysis of Power Consumption Characteristics by loads in Hospitals)

  • 유상봉;김세동
    • 조명전기설비학회논문지
    • /
    • 제21권6호
    • /
    • pp.77-84
    • /
    • 2007
  • 병원용 건물과 같은 전력다소비 건물에서는 전력의 효율적 이용에 의한 에너지절감을 위해서 설계 단계부터 합리적인 전기설비 설계가 요청되고 있다. 본 연구에서는 병원용 건물 32개소를 선정하여 부하종류별 전력소비특성을 조사 분석하였고, 9개소의 전기설계사무소로부터 설계단계에서 적용하는 수용률값을 조사하였다. 조사된 자료의 전체 특징과 중심적인 경향을 알아 보기 위해서 평균값, 표준편차, 최대값, 최소값, 중앙값 등의 특징파라메터를 분석하였고, 회귀분석을 통한 선형적인 방법과 비선형적인 방법으로 그 경향을 확인하였다. 그 결과 합성 수용률 평균값은 47.5[%]이었으며, 전력용변압기는 용량에 있어서 많은 여유를 가지고 있는 것으로 나타났다. 이를 토대로 변전 설비용량의 합리적인 설계를 위하여 부하종별 수용률 기준(안)을 제시하였고, 변전설비용량 산정에 필요한 자료를 데이터베이스화하였다.

소비자 사이의 중고 태블릿PC 거래 가격의 통계적 예측 (Statistical Prediction of Used Tablet PC Transaction Price among Consumers)

  • 고영희;김소형;정유진
    • 산업융합연구
    • /
    • 제20권12호
    • /
    • pp.179-186
    • /
    • 2022
  • 본 연구에서는 태블릿PC 중고제품의 거래 시, 판매자와 구매자 모두에게 판매가격을 제시할 수 있는 예측모형을 개발하는 것을 목표로 한다. 모형 개발을 위하여 실제 태블릿PC 중고거래 데이터와 제품에 대한 상세 정보를 추가 수집한 데이터를 사용하였다. 데이터 분석을 통하여 여러 가지 예측모형을 개발하였으며, 이 중 태블릿PC 중고가격 예측 성능이 가장 뛰어난 모형을 최종 예측모형으로 선택하였다. 구체적으로 중고 태블릿의 판매가격을 종속변수로 하고, 통합된 데이터에서 판매가격과 연관성이 있는 변수들을 독립변수로 한 다중선형회귀모형, 교호작용을 포함한 다중선형회귀모형, 그리고 각 모형에서 단계적 변수 선택법을 통해 얻은 모형들을 고려하였다. 이들 모형 중 교차타당성을 통해 최종적으로 예측 성능이 가장 뛰어난 모형을 태블릿PC 중고가격을 예측하는 모형으로 선택하였다. 본 연구를 통하여 중고제품 판매가격을 예측하고 판매자와 구매자에게 적절한 중고 거래 가격을 제시해 볼 수 있을 것이다.

문헌 단위 인용 네트워크 내 인용과 중심성 지수 간 관계 추정에 관한 연구 (Curve Estimation among Citation and Centrality Measures in Article-level Citation Networks)

  • 유소영
    • 정보관리학회지
    • /
    • 제29권2호
    • /
    • pp.193-204
    • /
    • 2012
  • 이 연구에서는 인용 및 동시인용 문헌 네트워크에서의 중심성 지수를 사용한 추론 통계 적용의 첫 번째 단계로써 이들 간 관계의 선형성을 살펴보고자 하였다. 703개의 문헌 동시인용 네트워크를 활용하여 인용 빈도, 연결정도 중심성, 인접 중심성, 매개 중심성 간의 4가지 주요 관계의 패턴을 살펴본 결과, 모든 인용 및 중심성 간 관계가 선형모델보다는 비선형적 모델로 더 잘 설명될 수 있음을 통계적으로 확인되었다. 따라서 이들 간의 인과관계에 대한 다중회귀분석과 같은 추론 통계 분석의 기반이 되는 선형성을 확보하기 위해서는 논리적인 기준에 근거한 데이터 변환이나 실제값을 구간값으로 변환하는 과정이 필요하다고 할 수 있다.

보조 혼합 샘플링을 이용한 베이지안 로지스틱 회귀모형 : 당뇨병 자료에 적용 및 분류에서의 성능 비교 (Bayesian logit models with auxiliary mixture sampling for analyzing diabetes diagnosis data)

  • 이은희;황범석
    • 응용통계연구
    • /
    • 제35권1호
    • /
    • pp.131-146
    • /
    • 2022
  • 로지스틱 회귀 모형은 다양한 분야에서 범주형 종속 변수를 예측하거나 분류하기 위한 모형으로 많이 사용되고 있다. 로지스틱 회귀 모형에 대한 전통적인 베이지안 추론 기법으로 메트로폴리스-헤이스팅스 알고리즘이 많이 사용되었지만, 수렴의 속도가 느리고 제안 분포에 대한 적절성을 보장하기 어렵다. 따라서, 본 논문에서는 모형에 대한 베이지안 추론 방법으로 Frühwirth-Schnatter와 Frühwirth (2007)에서 제안된 보조 혼합 샘플링(auxiliary mixture sampling) 기법을 사용하였다. 이 방법은 모형의 선형성과 정규성을 만족시키기 위해 두 단계에 거쳐 잠재변수를 도입하며, 결과적으로 깁스 샘플링을 통한 추론을 가능하게 한다. 제안한 모형의 효과를 검증하기 위해 2020년 지역사회 건강조사 당뇨병 자료에 적용하여 메트로폴리스-헤이스팅스를 사용한 모형과 추론 결과를 비교 분석하였다. 또한, 다양한 분류 모형들과 본 논문에서 제안한 모형의 분류 성능을 비교한 결과 제안된 모형이 분류 분석에서도 좋은 성능을 보이는 것을 확인할 수 있었다.