• Title/Summary/Keyword: 회귀분석기법

Search Result 1,079, Processing Time 0.035 seconds

GSSHA 지하수 모의를 위한 대수층 깊이 공간 분포 기법 연구

  • Jea-Whan Shin;Tae-Hee Yoon;Young-Seok Lee;Suk-Hwan Jang
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2023.05a
    • /
    • pp.522-522
    • /
    • 2023
  • 지하수 시스템의 방출은 저지대 강에서 건조기에 흐르는 하천 유지유량의 원천이 된다. 수자원 분야에서 분포형 모형이 도입되며 수문 분석의 고도화가 이루어지고 있는 오늘날에도, 아직 대수층 깊이 등 지하수관련 매개변수에 대한 연구는 미진한 실정이다. 본 연구는 분포형 모형의 지하수 관련 매개변수 중 지형자료에 해당하는 대수층 깊이의 물리적인 분포형태를 예측하고, 지하수 모의결과를 검토하여 해당 기법의 적용성을 확인하였다. 본 연구에서는 북측의 미계측 유역을 포함한 소양강 유역을 연구대상 지역으로 설정하였고, 정밀한 분포형 모형인 GSSHA(Gridded Surface Hydrologic Analysis)를 활용하였다. 대수층 깊이 추정 방법은 크게 세가지 시나리오로 구분하여 모의를 진행하였다. 유역의 지하수 데이터를 통해 도출된 대수층깊이 등분포(시나리오1), 지표 고도와 대수층 깊이의 선형 반비례 관계를 가정한 선형 회귀식(시나리오2), 동일한 가정을 두고 Log차원에서 회귀식을 적용한 경우(시나리오 3). 위 3가지 시나리오를 통해 산정된 유출량과, 지하수 수위 등을 소양강댐 유입량 자료 및 유역 내 6개 지하수 관측소를 대상으로 결과를 비교하여 적용성을 확인하였다. 시나리오별 유출량 모의 오차평가 결과, 관측 첨두 유량을 가장 잘 반영하고 있는 기법은 일반적으로 선행 연구에서 많이 활용하고 있는 등분포형 기법으로 분석되었으며, 과소·과대 모의된 정도를 나타내는 지표와 모형의 효율성을 나타내는 지표는 선형 회귀분석 기법이 가장 우수한 결과로 분석되었다. 따라서, 대수층 깊이를 등분포하여 모의하던 기존 방식에 비해 지면고도-대수층깊이 간의 반비례 관계를 적용하는 방식이 지하수 모의에 있어서 보다 합리적일 것으로 판단된다. 향후 임의의 인자와 대수층 깊이간의 정밀한 회귀관계를 도출한다면 더욱 합리적이고 신뢰성 높은 결과를 얻을 수 있을것으로 기대된다. 또한 유역 단위의 지하수 모의가 정밀하게 이루어진다면 최근 많은 관심이 집중되는 하천 유지유량과 건기 유출 등의 연구 분야에도 많은 기여를 할 수 있을 것으로 기대된다.

  • PDF

Voice Personality Transformation Using a Multiple Response Classification and Regression Tree (다중 응답 분류회귀트리를 이용한 음성 개성 변환)

  • 이기승
    • The Journal of the Acoustical Society of Korea
    • /
    • v.23 no.3
    • /
    • pp.253-261
    • /
    • 2004
  • In this paper, a new voice personality transformation method is proposed. which modifies speaker-dependent feature variables in the speech signals. The proposed method takes the cepstrum vectors and pitch as the transformation paremeters, which represent vocal tract transfer function and excitation signals, respectively. To transform these parameters, a multiple response classification and regression tree (MR-CART) is employed. MR-CART is the vector extended version of a conventional CART, whose response is given by the vector form. We evaluated the performance of the proposed method by comparing with a previously proposed codebook mapping method. We also quantitatively analyzed the performance of voice transformation and the complexities according to various observations. From the experimental results for 4 speakers, the proposed method objectively outperforms a conventional codebook mapping method. and we also observed that the transformed speech sounds closer to target speech.

깁스표본기법을 이용한 설명변수 선택문제에서 사전분포의 설정-선형회귀모형을 중심으로-

  • 박종선;남궁평;한숙영
    • Communications for Statistical Applications and Methods
    • /
    • v.4 no.2
    • /
    • pp.333-343
    • /
    • 1997
  • 선형회귀분석에서 변수의 선택문제는 최적의 모형을 찾는데 아주 중요한 부분을 차지한다. George와 McCulloch(1993)는 계층적 베이즈 모형과 깁스표본법을 이용하여 선형회귀모형에서 변수를 선택하는 문제를 고려하였다. 이 논문에서는 George와 McCulloch의 모형을 바탕으로 각각의 설명변수가 모형에 포함될 사전확률을 객관적인 기준에 의하여 결정하는 문제를 고려하여 보았다.

  • PDF

Bilateral Symmetry Averaging and Simple Regression Analysis for Robust Face Detection Against Illumination Variation (조명 변화에 강인한 얼굴 검출을 위한 좌우대칭 평균화와 단순회귀분석 보정기법)

  • Cho, Chi-Young;Kim, Soo-Hwan
    • The Journal of the Korea Contents Association
    • /
    • v.6 no.12
    • /
    • pp.21-28
    • /
    • 2006
  • In a face detection system based on template matching, histogram equalization or log transform is applied to an input image for the intensity normalization and the image improvement. It is known that they are noneffective in improving an image with intensity distortion by illumination variation. In this paper, we propose an efficient image improvement method using a simple regression analysis combined with a bilateral symmetry average for images with intensity distortion by illumination variation. Experimental results show that our method delivers the detection performance better than previous methods and also remarkably reduces the number of face candidates.

  • PDF

Dynamic graphic approach for regression diagnostics system (REDS) (동적그래픽스에 의한 회귀진단시스템(REDS)의 구현)

  • 유종영;안기수;허문열
    • The Korean Journal of Applied Statistics
    • /
    • v.10 no.2
    • /
    • pp.241-251
    • /
    • 1997
  • Several studies have bee down on the work of dynamic graphical methods for regression diagnostics. The main propose of the methods were to investigate (1) the effects of change of data, or (2) the effects of change of regression coefficients on the regression models. But, by contrast, we can also investigate the effects of change of regression residuals on the regression model. This method can be used in fitting better a certain set of observations to a regression model than the other observations. Our research team approaches regression diagnostics by using dynamic graphics (REDS), and we introduce REDS in this thesis.

  • PDF

건강 관련 삶의 질의 사회인구학적 상관요인에 대한 공간분석

  • Jo, Dong-Gi
    • Korea journal of population studies
    • /
    • v.32 no.3
    • /
    • pp.1-20
    • /
    • 2009
  • 본 연구는 지리정보시스템(GIS)과 지리적 가중 회귀(GWR)를 이용하여 건강 관련 삶의 질(HRQoL)의 사회인구학적 상관요인에 대한 공간분석을 시도한다. 관찰의 독립성과 오차의 동분산성을 가정하는 전통적 회귀분석과 달리, 지리적 가중 회귀분석은 속성정보뿐만 아니라 공간정보를 활용하는 공간분석 기법이다. 분석모형은 건강 관련 삶의 질을 종합적으로 측정하는 EQ-5D를 종속변수로 하고 지역의 사회인구학적 특성인 노령인구비율, 조이혼율, 병상수, 재정자주도를 독립변수로 하여 구성하였다. 종속변수는 질병관리본부에서 실시한 <지역사회건강조사>의 자료를 이용하였고, 독립변수는 통계청 온라인 DB에 수록된 지역별 자료를 이용하였다. 모형을 추정해 본 결과 전반적으로 사회적 특성보다는 노령인구비율이나 조이혼율과 같은 인구학적 특성이 건강 관련 삶의 질에 더 많은 영향을 미치는 것으로 나타났다. 공간적 변이를 고려하는 지역모형은 전역모형에서 드러나지 않았던 중요한 유형을 보여주는데, 노령인구비율 변수와 조이혼율 변수의 지역별 추정치를 지도상으로 살펴본 결과 변수들의 효과가 공간적 위치에 따라 차이를 보인다는 점이 확인되었다. 분석 결과는 또한 지리적 가중 회귀분석이 전통적 회귀분석에 비해 공간적 자기상관의 문제를 극복하고 모형의 부합도를 증가시킨다는 것을 보여준다.

Probabilistic Runoff Analysis using Ensemble Technoque with Localization Method (앙상블 기반 지역화 기법을 이용한 확률론적 유출량 분석)

  • Lee, Han-Yong;Jang, Suk-Hwan;Lee, Jae-Kyoung;Jo, Jun-Won
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2019.05a
    • /
    • pp.207-207
    • /
    • 2019
  • 최근 우리나라는 지역 특성 및 기후변화의 영향으로 인해 수문학적 요소의 변동성이 커지고 수자원의 지속적인 관리에 있어 유출량은 중요한 문제로 여겨지고 있다. 특히 일부 소하천 또는 접경지역과 같은 미계측유역은 수문학적 요소에 대한 자료가 부족하고 수문모형의 초기치 설정과 과거 유출량 자료를 통하여 최적화한 매개변수를 결정해야하므로 장기유출분석이 어렵다. 본 연구의 적용유역으로 미계측유역인 임진강상류 유역에 대한 유출량 추정을 위해 계측 유역의 자료를 활용하여 모형의 매개변수 등을 추정하는 지역화 기법인 다중선형회귀분석과 공간근접분석을 활용하여 유출량을 산정 및 검증하였다. 또한, 확률론적 예측이 가능한 앙상블 기법 적용을 통한 유출량 예측을 하였고, 이를 예측 정확성 평가지표를 통해 효율성 검토를 수행하여 미계측유역의 유출량에 대해 확률론적 예측을 수행하였다. 대표적 지역화 기법의 적용성을 검토한 결과, 계측유역을 통해 다중선형회귀분석과 공간근접분석을 abcd 모형에 적용하였다. 모의유출량을 산정하고 실측 유출량과 비교 분석 결과 모의정확성이 높게 분석되었다. 이와 같은 검증 결과를 토대로 미계측유역의 유출량을 추정하였다. 또한, 지역화 기법을 앙상블 기법에 적용하여 확률론적 유출량 예측의 효율성을 검토하였다. 적용유역과 같은 지류를 포함하고 있는 임진강하류 유역을 대상으로 수행하였다. 검증기간(2013년~2017년) 동안의 월 예측 유출량 앙상블 생성을 위해 과거 강우량와 증발량(1988년~2012년) 자료를 사용하였으며, 지역화 기법을 적용한 abcd 모형을 이용하였다. 예측 유출량의 정확성 평가를 실시하였으며, 정확성이 비교적 높게 분석되었다. 이와 같은 결과를 토대로 미계측유역의 확률론적 유출량을 예측하였다. 따라서, 대표적 지역화 기법을 앙상블 기법에 적용하여 확률론적 유출량을 예측할 경우 보다 정확한 유출량 예측이 가능하다.

  • PDF

Prediction of classified snow damage using DPSIR and multiple regression analysis (DPSIR 및 다중회귀분석을 이용한 등급별 대설피해 예측)

  • Hyeong Joo Lee;Hyeon Bin Jang;Gunhui Chung
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2023.05a
    • /
    • pp.426-426
    • /
    • 2023
  • 대설은 일반적으로 해양과 대륙의 온도차가 큰 지역, 바다·호수와 같이 상대적으로 따뜻한 곳이 인접해 있어 기단 변질이 잘 일어나는 지역, 산악에 의해 습윤한 공기가 강제 상승되는 지역에서 자주 발생한다. 우리나라는 찬 대륙고기압 공기가 해수 온도 차로 눈 구름대가 만들어지거나, 고기압 가장자리에서 한기를 동반한 상층 기압골이 우리나라 상공을 통과하면서 대설이 발생한다. 최근 우리나라에서 빈번하게 발생하는 대설피해는 직접피해와 간접피해로 나뉘며, 이에 따라 사회·경제적으로 막대한 피해를 야기한다. 우리나라 대설피해양상은 지역적 특성, 방재 대책, 대처능력 등에 따라 달라지는 것이 특징이며, 지역적으로 다르게 발생하는 대설피해를 효과적으로 대비할 수 있는 연구가 필요하다. 따라서 본 연구에서는 지역적 특성을 고려한 차등화된 대설 피해를 예측하는 연구를 진행하고자 하였다. 본 연구에서는 기상요소 및 사회·경제적 요소 등을 입력자료로 활용하고, DPSIR 분석을 통해 Red Zone, Orange Zone, Yellow Zone, Green Zone으로 위험 등급을 분류 및 등급 별 대설피해 예측기법을 개발하였다. 최종적으로 1994년부터 2020년까지의 과거 대설 피해액 자료와 다중회귀분석을 이용하여 기법을 개발하였고, 기법의 예측력 평가를 위해 RMSE와 RMSE를 표준화한 NRMSE의 두 가지 통계 지표를 사용하여 평가하였다. 모형별 예측력 평가 결과 Yellow 등급 모형이 가장 우수한 예측력을 보였다. 추후 본 연구결과를 통해 대설피해 범위를 예측하는 연구가 진행된다면 사전에 대설피해에 대한 대응방안 수립과 지역별제설 우선순위를 결정할 수 있는 지표가 개발될 것으로 기대된다.

  • PDF

A new approach to estimate the link travel time by using AVL technology (AVL을 이용한 구간통행시간 산출기법 개발)

  • 김성인;이영호;남기효
    • Journal of Korean Society of Transportation
    • /
    • v.17 no.2
    • /
    • pp.91-103
    • /
    • 1999
  • 이 연구는 자동 차량위치 측정기법(Automatic Vehicle Location, AVL)을 이용해서 수집한 교통상황자료를 가지고 구간 통행시간을 산출하는 알고리즘을 개발한다. AVL기법을 이용하는 경우, 처리해야 할 자료량이 많아서 실시간에 정보를 산출하는 것이 힘들다. 따라서 이 연구는 처리해야 할 자료량을 가능한 한 줄이고 자료량이 적은 경우에도 효율적인 구간통행시간을 산출하는 알고리즘을 제시한다. 이 연구의 방법론은 크게 4가지인데, 첫째, 해석 기법, 둘째, 회귀분석, 셋째, 인공지능 및 전문가 시스템, 넷째, 통계분석이다. 이 방법론을 이용해서 세 단계 알고리즘을 개발하는데, 첫째는 실시간 분석통계 알고리즘, 둘째는 과거자료분석 알고리즘, 셋째는 자료응합 알고리즘이다. 이 알고리즘 가운데 자료융합 알고리즘 결과가 산출하고자 하는 구간 통행시간이다. 실시간 분석통계 알고리즘은 연속하는 세 개 구간의 통행 패턴을 이용해서 가운데 구간의 통행시간을 산출하는 방법을 제시한다. 또 실시간 분석통계 알고리즘으로 산출하지 못한 구간은 인접구간 상관도 정보를 이용해서 구간통행시간을 추정한다. 과거자료분석 알고리즘은 회귀분석을 이용해서 시간대별 통행시간 평균과 분산을 구하고, 이 결과를 바탕으로 인접구간 상관도 정보를 오프라인으로 구하는 알고리즘이다. 자료융합 알고리즘은 2가지 단계를 거치는데, 그것은 실시간 자료융합과 최종 자료융합이다. 실시간 자료융합은 실시간에 가까운 자료원의 실시간 분석통계 알고리즘 결과 패턴과 인접구간 상관도 정보를 이용한 구간통행시간 추정 결과를 이용해서 패턴에 따라 다른 방법으로 융합을 하는 알고리즘을 개발한다. 최종 자료융합은 실시간 자료융합 결과와 회귀분석 결과의 패턴을 이용해서 구간 통행시간을 산출한다. 이 연구를 기존 연구와 비교할 때, 세 가지 독차성이 있다. 첫째는 연속하는 세 구간 통행 패턴을 분석하였기 때문에 기존의 노드의존 방식을 탈피하였다는 점이다. 따라서 자료량이 적은 경우도 믿을만한 통행시간을 산출할 수 있다는 것이다. 둘째는 인접구간 상관도 정보를 구간통행시간 산출에 이용하였기 때문에 자료를 효율적으로 이용할 수 있다는 점이다. 셋째는 자료원 패턴을 분류하고 전문가 시스템을 이용하여 자료융합 하였기 때문에 수행속도가 빠르고, 신뢰성있는 정보를 제공한다는 점이다. 이 연구는 개발한 알고리즘 정확도를 검증하기 위해서 두 가지 검증방법을 이용하였다. 첫째는 시뮬레이션을 이용한 것이고, 둘째는 실제 주행조사 분석을 이용한 것이다. 두 가지 검증 결과는 알고리즘 정확도를 보여준다.

  • PDF

Development of Variable Selection Technique using Stepwise Regression and Data Envelopment Analysis (단계적 회귀법과 자료봉합분석을 이용한 변수선택기법의 개발)

  • Jeong, Min-Eui;Yu, Song-Jin
    • Journal of KIISE:Software and Applications
    • /
    • v.41 no.8
    • /
    • pp.598-604
    • /
    • 2014
  • In this paper, we develop stepwise regression data envelopment model to select important variables. We formulate null hypothesis to understand the importance of each variable and use Kruskal-Wallis test for this purpose. If the Kruskal-Wallis test does reject the null hypothesis this will imply there is significant fluctuation in the efficiency score relative to base model. And therefore we have to further check the pair of variables that causes the fluctuation in order to determine its importance using Conover-Inman test. The proposed models helps understand the extent of misclassification decision making units as efficient/inefficient when variables are retained or discarded alongside provides useful managerial prescription to make improvement strategies.