• 제목/요약/키워드: 비선형 다중회귀분석

검색결과 130건 처리시간 0.03초

풍속 예측 보정을 위한 Genetic Programing 탐색 기법의 개선 (Improvement of Search Method of Genetic Programing for Wind Prediction MOS)

  • 오승철;서기성
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2015년도 제46회 하계학술대회
    • /
    • pp.1349-1350
    • /
    • 2015
  • 풍속은 다른 기상요소들보다 순간 변동이 심하고 국지성이 강하여 수치 예보 모델만으로 예측의 정확성을 높이기가 어렵다. 기상청의 단기 풍속 예보는 전 지구적 통합 예보모델인 UM(Unified Model)의 예측값에 MOS(Model Output Statictics)를 통한 보정을 수행하며, 보정식의 생성에 다중선형회귀분석 방법을 사용한다. 본 연구자는 유전프로그래밍(Genetic Programming)을 이용한 비선형 회귀분석 기반의 보정식 생성을 통하여 이를 개선한 바 있는데, 본 연구에서는 보다 향상된 성능을 얻기 위하여 GP 기법 측면에서 Automatically Defined Functions과 다군집(Multiple Populations) 수행을 통해 성능을 높이고자 한다.

  • PDF

통합 비교차 다중 분위수회귀나무 모형을 활용한 AI 면접체계 자료 분석 (Analysis of AI interview data using unified non-crossing multiple quantile regression tree model)

  • 김재오;방성완
    • 응용통계연구
    • /
    • 제33권6호
    • /
    • pp.753-762
    • /
    • 2020
  • 본 연구는 대한민국 육군이 선도적으로 도입하고자 노력하고 있는 AI 면접체계의 자료를 통합 비교차 다중 분위수 회귀나무 모형(unified non-crossing multiple quantile tree; UNQRT)을 활용하여 분석한 것이다. 분위수 회귀가 일반적인 선형회귀에 비하여 많은 장점을 가지지만, 선형성 가정은 여전히 많은 현실 문제해결에 있어 지나치게 강한 가정이다. 선형성을 완화한 모형의 하나인 기존 나무모형 기반의 분위수 회귀는 추정된 분위수 함수별로 교차하는 문제와 분위수별로 나무모형을 제시하여 해석력을 저하시키는 문제가 있다. 통합 비교차 다중 분위수회귀나무 모형은 비교차 제약식을 부여한 상태로 다중 분위수 함수를 동시에 추정함으로서 분위수 함수의 교차 문제를 해결하며, 극단 분위수에서 안정된 결과를 기대할 수 있고, 하나의 통합된 나무모형을 제시하여 우수한 해석력이 있다. 본 연구에서는 통합 비교차 다중 분위수회귀나무 모형을 활용하여 육군 AI 면접체계의 결과와 기존 인사자료간 관계를 충분히 탐색하여 의미있는 다양한 결과를 도출하였다.

기계학습 기반의 토양함수 예측 기법 개발 (용담댐 시험유역을 중심으로) (Estimating soil moisture using machine learning approach: A Case Study to Yongdam watershed)

  • 응웬딘휘;권현한
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2018년도 학술발표회
    • /
    • pp.167-167
    • /
    • 2018
  • 토양수분은 토양에 포함된 평균 수분량을 나타내며 수문 순환 관점에서 매우 중요한 수문변량 중 하나이다. 본 연구에서는 대표적인 기계학습 방법인 Support Vector Machine (SVM)을 이용한 토양 함수 예측 기법을 개발하고자 하며, 예측인자로서 원격 탐측 기반의 토양함수자료, 강수량, 온도 등을 활용하고자 한다. SVM은 Kernel 함수를 이용하여 복잡한 비선형 관계를 선형 가정을 통해서 해석하는 기계학습 방법으로서 전역모델(global model)로서 다양한 수문기상분야에 적용이 이루어지고 있다. SVM의 장점은 일정 부분의 오차를 허용함으로서 모형의 일반화 측면에서 기존 인공신경망(artificial neural network, ANN)에 비해 우수한 성능을 나타내며, 특히 예측모형으로서 적용성이 매우 크다. 본 연구에서는 과거 토양 함수 자료와 강수, 온도, 위성 관측 기반 정보 등을 이용하여 모형을 적합시키고 이를 미계측 유역으로 확장하는데 연구의 목적이 있으며, 본 연구를 통해 제안된 모형은 용담댐 시험유역을 대상으로 적용되며 기존 ANN 모형 및 다중회귀분석 결과와 비교를 통해 모형의 적합성을 평가하고자한다.

  • PDF

주·야간 교통사고의 특성 및 사고모형 비교분석 -청주시 4지 신호교차로를 중심으로 - (Comparative Analysis on the Characteristics and Models of Traffic Accidents by Day and Nighttime in the Case of Cheongju 4-legged ignalized Intersections)

  • 유두선;오상진;김태영;박병호
    • 대한토목학회논문집
    • /
    • 제28권2D호
    • /
    • pp.181-189
    • /
    • 2008
  • 본 연구는 주간과 야간의 교통사고 특성과 사고모형을 비교 분석하는데 그 목적이 있다. 이를 위해 본 연구에서는 청주시 4지 신호교차로를 중심으로 주 야간 교통사고의 차이를 검증하고, 주야간별 다중선형, 다중비선형 과 포아송 및 음이항회귀모형을 개발하는데 중점을 두고 있다. 분석된 주요 연구결과는 다음과 같다. 첫째, 사고특성 분석을 통해 주간과 야간 사고의 차이점이 파악되었다. 둘째, 통계적으로 설명력이 높은 주 야간 총 12개의 사고모형이 개발되었다. 마지막으로 공통변수와 특정변수를 활용하여 주야간 사고모형의 차이가 비교 분석되었다.

기본적인 연관평가기준 전부를 고려한 비선형 회귀모형에 의한 연관성 규칙 수의 결정 (Non-linear regression model considering all association thresholds for decision of association rule numbers)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권2호
    • /
    • pp.267-275
    • /
    • 2013
  • 데이터 마이닝 기법들 중에서도 연관성 규칙은 가장 최근에 개발된 기법으로 대용량 데이터베이스에서 각 항목들 간의 관련성을 찾아내며, 두 항목간의 관계를 명확히 수치화함으로써 두 개 이상의 항목간의 관련성을 표시하여 주기 때문에 현장에서 직접 적용이 가능하다. 일반적으로 연관성 규칙 생성 여부를 판단할 때, 각 항목간의 연관성을 반영하는 기준인 지지도, 신뢰도, 향상도 등의 흥미도 측도를 활용하게 된다. 실제적으로 연관성 규칙의 수를 결정하기 위해서는 이들 흥미도 측도들의 평가기준을 정하기 위해 반복적으로 조정 과정을 거쳐야 한다. 본 논문에서는 이러한 문제를 해결하기 위해 연관성 평가기준 모두를 일반적으로 많이 활용되고 있는 비선형 회귀모형에 적용하여 연관성 규칙의 수를 추정하는 방안을 강구하였다. 또한 분산팽창계수를 이용하여 다중공선성 문제를 진단하는 동시에 분산분석 결과와 수정 결정계수를 이용하여 각 모형의 기여도를 비교하여 가장 바람직한 회귀 모형을 구하였다.

Pennsylvania주 옥수수 재배 토양의 질소공급능력 평가 (N-supplying Capability Evaluation of Corn Field Soils in Pennsylvania)

  • 홍순달
    • 한국토양비료학회지
    • /
    • 제31권4호
    • /
    • pp.359-367
    • /
    • 1998
  • 미국 Pennsylvania주 옥수수 재배 토양의 질소공급능력을 1986년부터 3년간 수행되었던 47개 토양의 화학성 및 정밀 토양도 속성들과의 회귀분석으로 평가 비교하였다. 질소공급능력과 가장 밀접한 상관을 보인 화학성은 $NO_3-N$ 함량($R^2=0.518$)이었으나 질소공급능력에 대한 표준화 편회귀계수는 년차간 변이를 보이며 0.578로 다른 성질들과 큰 차이를 보이지 않았다. 질소공급능력에 대한 다중선형 회귀분석은 단순 회귀분석에 비하여 양호한 평가를 보였으며 화학성들에 의한 결정계수는 $R^2=0.599$, 화학성과 Ap층 깊이의 정량적 지표들에 의한 계수는 $R^2=0.698$, 정량적 지표들과 정성적 지표들에 의한 계수는 $R^2=0.839$로 증가되었다. 이는 다중선형 회귀모델식이 단순 회귀모델식보다 토양의 질소공급능력을 보다 신뢰성 있게 평가할 수 있는 접근방법임을 보여주었다.

  • PDF

다중선형회귀모델 기반 고출력 직렬 배터리 팩의 전압 불균형 추정 (Multiple linear regression model-based voltage imbalance estimation for high-power series battery pack)

  • 김승우;이평연;한동호;김종훈
    • 전기전자학회논문지
    • /
    • 제23권1호
    • /
    • pp.1-8
    • /
    • 2019
  • 본 논문에서는 18650 원통형 NCA 리튬이온 배터리로 구성된 고출력 직렬 배터리로 다양한 C-rate의 전기적 특성을 테스트한다. 테스트를 통해 추출한 14S1P 배터리 팩의 방전 용량 데이터와 4S1P 배터리 팩의 EV cycle 데이터를 통해 C-rate의 변화에 따른 전기적 특성을 분석한다. 분석을 통해 얻은 데이터를 기반으로 C-rate에 따른 방전용량 실험의 셀 간 전압 편차와 EV cycle 실험의 셀 간 전압 편차를 다중선형회귀 모델로 추정하여 선형적인 특징을 가진 데이터와 비선형적인 특징을 가진 데이터에 대한 각각의 추정성능을 검증한다. 모델의 추정성능을 검증하기 위해 추정 데이터와 실제 데이터의 RMSE를 구해 알고리즘의 정확성을 평가한다. 논문의 결과는 14S1P 배터리 팩의 방전 용량의 셀 간 전압 불균형과 4S1P 배터리 팩의 EV cycle의 셀 간 전압 불균형 중 선형적인 데이터인 방전 용량의 셀 간 불균형 데이터의 추정 성능이 더 뛰어난 것을 검증하는데 기여한다.

한강 유역의 형태학적 특성과 강우-유출의 상관분석 (Morphometric Characteristics and Correlation Analysis with Rainfall-runoff in the Han River Basin)

  • 이지행;이웅희;최흥식
    • 대한토목학회논문집
    • /
    • 제38권2호
    • /
    • pp.237-247
    • /
    • 2018
  • 유역 특성은 유역과 하도망의 지형학적인 구성에 대한 특성을 반영하는 것으로 유출 특성에 영향을 준다. 본 연구에서는 유역의 형태학적 특성과 유출의 관계를 분석하기 위해 한강 유역의 19개 하천의 27개 지점을 대상으로 유역 형태학적 특성을 Arc-map을 이용하여 구하였다. 하천 형태학적 특성은 선형, 면적, 기복 측면으로 구분하여 산정하였고, 강우에 의한 유역의 반응인 연평균 유출률은 실측 강수량과 유출량 자료를 이용하여 산정하였다. 각각의 형태학적 매개변수에 대한 상관을 도식화하고, 상관특성을 분석하였다. 길이비, 형상계수, 형상인자, 면적비, 기복비, 함몰도에 의한 연간 유출률에 대한 다중 회귀분석식을 제시하였고, 결정계수는 0.691로 나타났다. 실측과 회귀분석식에 의해 계산된 연간 유출률과의 RMSE와 MAPE는 각각 0.09, 11.61%로 나타나 비교적 정확히 예측하였다.

서울시 통행시간 변화의 요인분석: 생활시간조사자료를 중심으로 (Analysis of Factors Affecting Travel Time Change Using the Time Use Survey Data in Seoul)

  • 구자헌;추상호
    • 한국ITS학회 논문지
    • /
    • 제17권1호
    • /
    • pp.1-16
    • /
    • 2018
  • 생활패턴의 변화는 통행의 목적을 변화시키기 때문에 궁극적으로 통행패턴의 변화를 야기한다. 이에 따라 본 연구에서는 1999년부터 2014년까지 통계청에서 조사한 생활시간조사자료를 활용하여 연도별 통행시간에 영향을 미치는 요인을 분석하고자 한다. 가구관련, 개인관련, 시간관련 변수들을 고려한 통행시간에 관한 다중선형회귀모형을 구축하였으며, 요일별 차이를 보기위해 주중과 주말을 분리하여 추정하였다. 모형 추정 결과, 가구관련, 개인관련, 시간관련 변수가 통행시간에 영향을 미치는 것으로 분석되었다. 가구관련변수의 경우 개인관련변수에 비해 비교적 적은 변수들이 유의한 것으로 나타났는데, 이는 통행이 개인특성에 더 큰 영향을 받기 때문인 것으로 판단된다. 각 활동시간들은 통행시간에 양의 영향을 미치는 것으로 분석되어 통행이 파생수요임을 나타내고 있다. 또한 여가활동시간이 가장 큰 영향력이 있는 것으로 도출되어, 여가를 위한 통행시간이 타활동에 비해 증가하는 것으로 분석되었다.

OMI 위성자료를 활용한 서울 지표 이산화질소 혼합비 추정 연구 (Estimation of surface nitrogen dioxide mixing ratio in Seoul using the OMI satellite data)

  • 김대원;홍현기;최원이;박준성;양지원;류재용;이한림
    • 대한원격탐사학회지
    • /
    • 제33권2호
    • /
    • pp.135-147
    • /
    • 2017
  • 본 연구에서는 처음으로 한반도 서울지역에서 OMI (Ozone Monitoring Instrument) 센서로 관측된 대류권 이산화질소 칼럼농도를 이용하여 OMI 센서의 관측시간인 13:45에서의 월 평균 및 일별 위성 지표 이산화질소 혼합비를 추정하였다. 본 연구에서는 세 가지 회귀모델들이 이용되었다. 첫 번째 회귀모델(M1)은 OMI 대류권 이산화질소 칼럼농도와 지점 측정값과의 선형회귀를 통한 회귀계수로 구성되어있다. 두번째 회귀모델(M2)은 OMI 대류권 이산화질소 칼럼농도와 AIRS (Atmospheric Infrared Sounder) 센서로 관측한 행성경계층 높이, 온도, 압력 자료 모두가 반영된 회귀모델이다. 세 번째 회귀모델(M3M, M3D)은 다중회귀모델로서 앞서 고려된 이산화질소 칼럼농도와 행성경계층 높이와 다양한 기상변수를 추가적으로 반영하는 회귀모델이다. 본 연구에서는 2009년에서 2011년까지를 회귀모델의 훈련기간으로 하여서 각 회귀식의 회귀계수를 도출하였으며 2012년도는 검증기간으로서 훈련기간에 도출된 회귀모델들의 성능을 평가하였다. 회귀모델들로 추정된 월 평균 지표 이산화질소 혼합비와 지점 관측소에서 지점 측정장비로 측정된 월평균 지표 이산화질소 혼합비와 가장 높은 상관성(avg. R = 0.77)을 보이는 회귀분석방법은 다중회귀분석방법(M3M)이다. 또한, 회귀모델들로 추정된 13:45에서의 일 지표 이산화질소 혼합비와 지점 관측소에서 지점장비로 측정된 지표 이산화질소 혼합비와 가장 좋은 상관성(avg. R = 0.55)을 보인 것도 다중회귀분석방법(M3D)이다. 회귀모델들로 추정된 지표 이산화질소 혼합비는 지점 측정값에 비해 과소추정 되는 경향이 나타났다. 회귀모델들로 추정된 지표 이산화질소 혼합비를 평가하기 위해 지점 측정값과의 RMSE (Root Mean Square Error), mean bias, MAE (Mean Absolute Error), percent difference와 같은 통계분석을 실시하였다. 본 연구는 위성을 통한 지표 이산화질소 혼합비 산출 가능성을 보여준다.