• 제목/요약/키워드: 주성분 회귀모형

검색결과 42건 처리시간 0.03초

기상 빅데이터를 활용한 신재생 에너지 발전량 예측 모형 연구 (Renewable Energy Generation Prediction Model using Meteorological Big Data)

  • 강미영
    • 한국전자통신학회논문지
    • /
    • 제18권1호
    • /
    • pp.39-44
    • /
    • 2023
  • 태양광, 풍력 등의 신재생 에너지는 기상조건 및 환경변화에 민감한 자원이다. 설치위치 및 구조에 따른 설비의 발전량이 달라질 수 있기 때문에 정확한 발전량 예측은 중요하다. 기상 빅데이터를 활용하여 주성분 분석을 기반으로 데이터 전처리 과정을 진행하여 신재생 에너지 발전량 예측 시 영향을 미치는 피처간의 관계를 모니터링하였다. 또한, 본 연구에서는 영향을 미치는 민감도에 따라 데이터셋을 재구성하여 머신러닝 모델에 적용하여 예측도를 테스트하였다. 제안한 모형을 사용하여 신재생 에너지를 대상으로 기상환경에 따라 에너지 발전량을 예측하고 해당 시점의 실제 생산 값과 비교함으로써 랜덤 포레스트 회귀 분석을 적용한 에너지 발전량 예측에 대한 성능을 확인하였다.

호우 위험도 평가를 이용한 피해예측 (Damage Prediction Using Heavy Rain Risk Assessment)

  • 김종성;최창현;이종소;김형수
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.154-154
    • /
    • 2017
  • 전 세계적인 기후변동과 기후변화의 영향으로 대규모 인명 및 재산피해를 유발하는 자연재난의 빈도와 강도가 증가하고 있다. 이렇게 변화하는 상황에서 효율적인 대책을 수립하기 위해서는 재해에 노출된 특성을 지역적 특성과 함께 고려하여 지역별로 재해에 위험한 정도를 평가하는 것이 선행되어지고, 재난 피해 발생전에 피해 지역 및 범위를 예측하는 것이 필요하다고 판단된다. 따라서 본 연구에서는 국내 자연재난 피해의 65% 이상을 차지하는 호우피해를 대상으로 PSR(Pressure-State-Response) 구조를 이용하여 호우피해위험지수(Heavy rain Damage Risk Index, HDRI)를 제안하여 호우 위험도를 평가하고자하였다. 또한 도출된 지역별 위험등급에 따른 호우피해 예측함수를 개발하여 재해발생 전에 개략적인 피해의 범위를 예측하고자 하였다. 먼저 지역별 호우 위험도 평가를 위해 압력지표, 현상지표, 대책지표를 구축하고, 주성분분석을 이용하여 평가지표를 결정하였다. 결정된 평가지표를 동일한 가중치를 부여하여 호우피해위험지수를 도출하였다. 분석결과, 경기도 31개 지자체 중에서 가장 안전한 1등급인 지자체는 15개의 지자체로 나타났으며, 2등급인 지자체는 7개, 3등급인 지자체는 9개로 분류되었다. 지자체별 호우 위험도 등급에 따라서 재해기간별 총강우량, 재해일수, 선행강우량(1~5일), 지속시간별 최대강우량(1~24시간) 등의 자료를 설명변수로 구축하였고, 다중회귀모형과 주성분분석을 활용하여 예측함수를 개발하였다. 등급별 호우피해 예측함수는 N-RMSE가 12~18%로 호우피해를 적절하게 예측하는 것으로 평가되었다. 본 연구를 통해 지자체별 호우피해위험도 등급을 파악 할 수 있으며, 평가된 호우피해위험도 등급별로 호우피해 예측함수 개발을 통해 사전에 호우피해 발생 및 규모를 파악할 수 있게 되었다. 따라서 본 연구의 결과는 각 지자체 및 관련 부처에서 효과적인 방재체계를 수립하는데 있어 기초자료로 활용될 수 있을 것으로 판단된다.

  • PDF

함수회귀분석을 통한 교통량 예측 (Functional regression approach to traffic analysis)

  • 이인주;이영경
    • 응용통계연구
    • /
    • 제34권5호
    • /
    • pp.773-794
    • /
    • 2021
  • 교통량 예측은 지방 행정의 의사결정에 매우 중요한 정보를 제공한다. 교통량 예측을 통해 교통혼잡비용을 줄이고 지역경제를 활성화 함으로써 사회적, 경제적 이익을 창출할 수 있다. 교통량은 미지의 확률적 규칙하에서 시간의 흐름에 따라 궤적을 가지며 변화하는 함수데이터의 일종이다. 본 논문에서는 세 가지 함수회귀모형을 이용하여 과거에 관측된 교통량 궤적을 기반으로 미래의 관측되지 않은 교통량 궤적을 예측하는 방법을 제시한다. 본 논문에서 소개하는 세가지 방법은 전국 고속도로 영업소 중 서울, 춘천, 강릉 세 개 영업소에서 수집된 고속도로 영업소 데이터에 적용한다. 각 영업소 별로 세가지 방법의 예측오차를 비교함으로써 영업소별 최적 교통량 예측모형을 찾는다.

딥러닝을 활용한 산지습지 수위 예측 모형 개발 (Development of Water Level Prediction Models Using Deep Neural Network in Mountain Wetlands)

  • 김동현;김정욱;곽재원;아이미;김종성;김형수
    • 한국습지학회지
    • /
    • 제22권2호
    • /
    • pp.106-112
    • /
    • 2020
  • 습지는 수문, 환경, 생태학적으로 중요한 기능 및 역할을 하며, 특히 습지 내의 수위는 습지의 기능과 환경 등 다양한 분석을 위해 필수적인 자료이다. 그러나 습지는 수위자료를 측정하지 않는 미계측 지역이 많기 때문에, 수위 예측에 대한 연구는 매우 미흡한 실정이다. 따라서 본 연구에서는 습지의 수위를 예측하기 위해 다중회귀분석, 주성분회귀분석, 인공신경망, DNN을 활용하여 수위 예측모형을 개발하였다. 대상지역으로 경상남도 양산시에 위치한 금정산 산지습지를 선정하였고, 2017년 4월부터 2018년 7월까지의 수위 측정자료를 종속변수로 사용하였다. 수문자료와 기상자료를 독립변수로 사용하였다. 예측력 평가결과 최종 모형으로 선정된 DNN을 활용한 수위 예측모형의 예측력 평가결과 RMSE는 6.359, NRMSE는 18.91%로 비교적 산지습지의 수위를 잘 예측하는 것으로 나타났다. 본 연구결과를 활용한다면 기존의 미비하였던 미계측 지점의 수위를 활용한 습지유지 및 관리 기법 개발에 기초자료로 사용할 수 있을 것으로 판단된다.

한국프로야구에서 타자력 지수 제안 (Alternative hitting ability index for KBO)

  • 홍종선;김재영;신동식
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권3호
    • /
    • pp.677-687
    • /
    • 2016
  • 야구 타자의 능력을 측정하는 많은 세이버메트릭스 통계량들 중에서 WAR은 미국프로야구에서 가장 많이 사용하는 통계량이다. 그러나 한국프로야구 자료에는 수비에 관련된 변수에 포함된 야구장 요인, 포지션조정 그리고 리그 조정 통계량들이 존재하지 않으므로 WAR을 한국프로야구에 적용하는 데에는 문제가 있다. 본 연구에서는 타자의 능력을 측정하는 대안적인 세이버메트릭스 통계량을 제안하여 미국프로야구 뿐만 아니라 한국프로야구에서도 동시에 사용할 수 있도록 한다. 본 연구에서 제안한 타자력 지수 모형은 한국프로야구와 미국프로야구 타자들에 대한 다섯 종류의 통계량을 사용하여 개발한다. 우선 2015년도 최소 규정 타석을 만족한 미국프로야구 타자들의 자료를 바탕으로 타자력 지수 모형을 개발한다. 미국프로야구 타자들의 WAR과 비교하면서 본 연구에서 제안한 타자력 지수의 능력의 타당성을 검토한다. 다음으로 이 모형을 2015년도 한국프로야구 자료에 적용하여 한국형 타자력 지수를 제안한다. 한국프로야구 타자력 지수를 서로 다른 팀별, 나이별, 포지션별로 통계적으로 분석하고, 타자력 지수와 그들의 연봉과의 선형관계성을 토론한다. 연봉에 관한 회귀모형의 신뢰영역을 바탕으로 연봉책정의 적절함에 따라 46명의 타자를 세 그룹으로 할당하고, 세 그룹에 속한 연봉을 다양한 인자에 대하여 통계적으로 탐색한다.

기후변화 시나리오를 적용한 산사태 피해면적 변화 예측 (Predicting Landslide Damaged Area According to Climate Change Scenarios)

  • 유송
    • 한국농림기상학회지
    • /
    • 제25권4호
    • /
    • pp.376-386
    • /
    • 2023
  • 기후변화로 인해 우리나라의 산사태 피해는 지속적으로 증가하고 있다. 사방사업 등 산사태 피해저감을 효과적으로 수립하기 위해서는 기후변화 영향을 고려하여 장기간의 산사태 위험도를 추정할 필요가 있다. 이 연구에서는 다변량 회귀분석을 통해 기후변화에 따른 산사태 피해면적의 변화를 예측하였다. 1980-2010 년의 산사태 피해면적과 강우관측자료를 학습자료로 적용하여 다변량 회귀모형을 구축하였다. 이때 강우관측자료를 통해 SSP 시나리오에서는 제공하는 7가지 강우인자를 추출하였다. 이후 분산팽창지수로 다중공선성을 검정하고 주성분 분석을 통해 차원을 축소하여 2개의 주성분을 독립변인으로 하여 산사태 피해면적 추정 모형을 도출하였다. 기후변화 시나리오를 활용하여 2030-2100년까지의 산사태 피해면적 변화를 추정한 결과, 산사태 피해면적은 1981년-2010년의 연평균 산사태 면적의 최대 2배 이상으로 증가하는 것으로 나타났다. 이 연구의 결과는 미래 기후변화를 고려한 산사태 피해저감 대책 수립 및 보강의 필요성을 제시하는 기초자료로 활용 가능할 것으로 보인다.

고속도로의 주행속도예측 및 주행환경만족도 모형 개발에 관한 연구 (Development of Predicting Models of the Operating Speed and Operating environment Satisfaction Model in Expressways)

  • 김장욱;장일준;김정현;이수범
    • 대한교통학회지
    • /
    • 제27권2호
    • /
    • pp.117-131
    • /
    • 2009
  • 고속도로이용자가 주행할 때 도로기하구조를 정확하게 파악하지 못하면, 도로이용자는 자신의 감각과 인식에 의존해 판단을 내리게 되기 때문에 고속도로의 주행성을 평가할 때 설계자와는 다른 판단을 내리게 될 수도 있다. 따라서 도로이용자의 기대심리를 만족시키면서 안전성, 쾌적성 등을 확보하기 위해서는 정확한 주행속도를 예측할 필요가 있다. 또한, 고속도로의 기하구조적인 주행성뿐만 아니라 도로이용자가 이러한 구성요소의 조화에 의해 느끼는 감성적 측면에서의 주행환경만족도에 대한 인식의 변화를 파악할 필요가 있다. 이에 본 연구에서는 주행속도 예측모형 구축하기 위해 6개 고속도로(경부, 서해안, 영동, 남해, 중앙, 호남)를 대상으로 주행속도에 영향을 미치는 요인을 크게 선형요소, 교통운영특성 요소로 분류하였다. 주행속도에 영향을 미치는 요인을 대상으로 다중회귀를 이용한 주행속도예측모형 구축 및 검증 결과, 통계적으로 모두 적합한 것으로 나타났다. 또한, 본 연구에서는 고속도로 이용자를 대상으로 개별면접 설문조사를 통해 수집된 주행환경만족도 이미지 데이터를 바탕으로 수량화 제II류 및 주성분분석을 실시하여 고속도로 주행환경만족도에 대한 영향 요인을 규명하였다. 또한 수량화 제I류 및 구조방정식을 이용하여 사회인식 및 고속도로 이용자의 실제인식의 변화가 고려된 고속도로의 주행환경만족도 모형을 구축하였다. 본 연구에서 구축된 모형을 통해 주행속도와 같은 정량적인 요인뿐만 아니라 도로이용자가 느끼는 고속도로의 주행환경만족도와 같은 정성적인 요인에 대한 결과도 제시할 수 있어서 도로이용자가 느끼는 변화된 교통 환경과 인식여부가 반영된 고속도로의 주행성을 평가할 수 있다는 데에 그 의의가 있다.

다변량 형질의 유전연관성에 대한 주성분을 이용한 회귀방법와 다변량 비모수 추세검정법의 비교 (Comparison of Principal Component Regression and Nonparametric Multivariate Trend Test for Multivariate Linkage)

  • 김수영;송혜향
    • 응용통계연구
    • /
    • 제21권1호
    • /
    • pp.19-33
    • /
    • 2008
  • 연속 형질(quantitative trait)에 영향을 미치는 유전자를 알아내기 위해 형제 쌍의 자료를 수집하여, 주로 이용되는 Haseman과 Elston (1972)의 최소제곱 회귀검정법으로 분석하는데 이는 단일 형질에 대한 분석법이다. 현실적으로 여러 형질들이 복잡하게 단일유전자 좌위(single locus)와 연관되어 있어 함께 수집하게 되는 경우에는, 이러한 연관된 여러 형질을 동시에 분석하는 유전연관성 검정법(linkage test)이 절실히 필요한 실정이다. Amos 등 (1990)은 주성분(principal component) 선형모형을 이용하여 Haseman과 Elston (1972)방법을 둘 이상의 형질의 다변량 분석법으로 확장시켰다. 그러나 이 검정방법은 통계량의 분포를 알 수 없기에 아직 제 1종 오류가 제대로 통제되지 못하는 문제를 가지고 있다. 본 논문에서는 이러한 다변량 형질 자료의 연관성검정에 있어 단일변량에 대한 비모수 추세검정법을 다변량 자료에 대한 분석법으로 확장시킨 통계량을 사용할 것을 제안한다. Amos 등 (1990)이 제안한 방법과 다변량 추세검정 통계량을 모의실험으로 생성한 연속형 형질자료에 적용하였을 때, 다변량 추세검정 통계량은 Amos 등 (1990) 방법에서의 여러 문제점이 발생되지 않을 뿐만 아니라 모의실험에서 제 1종 오류가 정해진 유의수준에 가까운 것을 확인하였고, 검정적이 더 높음을 볼 수 있었다.

분광 다양성을 고려한 초분광 영상 기반 부유사 농도 계측 기법 개발 (Development of Suspended Sediment Concentration Measurement Technique Based on Hyperspectral Imagery with Optical Variability)

  • 권시윤;서일원
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.116-116
    • /
    • 2021
  • 자연 하천에서의 부유사 농도 계측은 주로 재래식 채집방식을 활용한 직접계측 방식에 의존하여 비용과 시간이 많이 소요되며 점 계측 방식으로 고해상도의 시공간 자료를 측정하기엔 한계가 존재한다. 이러한 한계점을 극복하기 위해 최근 위성영상과 드론을 활용하여 촬영된 다분광 혹은 초분광 영상을 통해 고해상도의 부유사 농도 시공간분포를 측정하는 기법에 대한 연구가 활발히 진행되고 있다. 하지만, 다른 하천 물리량 계측에 비해 부유사 계측 연구는 하천에 따라 부유사가 비균질적으로 분포하여 원격탐사를 통해 정확하고 전역적인 농도 분포를 재현하기는 어려운 실정이다. 이러한 부유사의 비균질성은 부유사의 입도분포, 광물특성, 침강성 등이 하천에서 다양하게 분포하기 때문이며 이로 인해 부유사는 지역별로 다양한 분광특성을 가지게 된다. 따라서, 본 연구에서는 이러한 영향을 고려한 전역적인 부유사 농도 예측 모형을 개발하기 위해 실내 실험을 통해 부유사 특성별 고유 분광 라이브러리를 구축하고 실규모 수로에서 다양한 부유사 조건에 대한 초분광 스펙트럼과 부유사 농도를 측정하는 실험을 수행하였다. 실제 부유사 농도는 광학 기반 센서인 LISST-200X와 샘플링을 통한 실험실 분석을 통해 계측되었으며, 초분광 스펙트럼 자료는 초분광 카메라를 통해 촬영한 영상에서 부유사 계측 지점에 대한 픽셀의 스펙트럼을 추출하여 구축하였다. 이렇게 생성된 자료들의 분광 다양성을 주성분 분석(Principle Component Analysis; PCA)를 통해 분석하였으며, 부유사의 입도 분포, 부유사 종류, 수온 등과의 상관관계를 통해 분광 특성과 가장 상관관계가 높은 물리적 인자를 규명하였다. 더불어 구축된 자료를 바탕으로 기계학습 기반 주요 특징 선택 알고리즘인 재귀적 특징 제거법 (Recursive Feature Elimination)과 기계학습기반 회귀 모형인 Support Vector Regression을 결합하여 초분광 영상 기반 부유사 농도 예측 모형을 개발하였으며, 이 결과를 원격탐사 계측 연구에서 일반적으로 사용되어 오던 최적 밴드비 분석 (Optimal Band Ratio Analysis; OBRA) 방법으로 도출된 회귀식과 비교하였다. 그 결과, 기존의 OBRA 기반 방법은 비선형성을 증가시켜도 좁은 영역의 파장대만을 고려하는 한계점으로 인해 부유사의 다양한 분광 특성을 반영하지 못하였으며, 본 연구에서 제시한 기계학습 기반 예측 모형은 420 nm~1000 nm에 걸쳐 폭 넓은 파장대를 고려함과 동시에 높은 정확도를 산출하였다. 최종적으로 개발된 모형을 적용해 다양한 유사 조건에 대한 부유사 시공간 분포를 매핑한 결과, 시공간적으로 고해상도의 부유사 농도 분포를 산출하는 것으로 밝혀졌다.

  • PDF

주성분 분석과 다중회귀모형을 사용한 자동차 건조 공정의 히트펌프 건조기 소모 전력 분석 (Analyses of Power Consumption of the Heat Pump Dryer in the Automobile Drying Process by using the Principal Component Analysis and Multiple Regression)

  • 이창용;송근수;김진호
    • 산업경영시스템학회지
    • /
    • 제38권1호
    • /
    • pp.143-151
    • /
    • 2015
  • In this paper, we investigate how the power consumption of a heat pump dryer depends on various factors in the drying process by analyzing variables that affect the power consumption. Since there are in general many variables that affect the power consumption, for a feasible analysis, we utilize the principal component analysis to reduce the number of variables (or dimensionality) to two or three. We find that the first component is correlated positively to the entrance temperature of various devices such as compressor, expander, evaporator, and the second, negatively to condenser. We then model the power consumption as a multiple regression with two and/or three transformed variables of the selected principal components. We find that fitted value from the multiple regression explains 80~90% of the observed value of the power consumption. This results can be applied to a more elaborate control of the power consumption in the heat pump dryer.