• 제목/요약/키워드: 회귀분석기법

검색결과 1,079건 처리시간 0.031초

회귀분석과 딥러닝의 예측 정확성에 대한 비교 그리고 딥러닝 모델 최적화를 위한 기법들의 중요성에 대한 실증적 분석 (Comparison of Prediction Accuracy Between Regression Analysis and Deep Learning, and Empirical Analysis of The Importance of Techniques for Optimizing Deep Learning Models)

  • 조민호
    • 한국전자통신학회논문지
    • /
    • 제18권2호
    • /
    • pp.299-304
    • /
    • 2023
  • 인공지능 기법 중에서 딥러닝은 많은 곳에서 사용되어 효과가 입증된 모델이다. 하지만, 딥러닝 모델이 모든 곳에서 효과적으로 사용되는 것은 아니다. 이번 논문에서는 회귀분석과 딥러닝 모델의 비교를 통하여 딥러닝 모델이 가지는 한계점을 보여주고, 딥러닝 모델의 효과적인 사용을 위한 가이드를 제시하고자 한다. 추가로 딥러닝 모델의 최적화를 위해 사용되는 다양한 기법 중, 많이 사용되는 데이터 정규화와 데이터 셔플링 기법을 실제 데이터를 기반으로 비교 평가하여 딥러닝 모델의 정확성과 가치를 높이기 위한 기준을 제시하고자 한다.

크리깅 기법을 이용한 단양군의 산림 탄소저장량 추정 - 지상부 바이오매스를 대상으로 - (Estimating Forest Carbon Stocks in Danyang Using Kriging Methods for Aboveground Biomass)

  • 박현주;신휴석;노영희;김경민;박기호
    • 한국지리정보학회지
    • /
    • 제15권1호
    • /
    • pp.16-33
    • /
    • 2012
  • 본 연구에서는 크리깅 기법 중 가장 일반적으로 사용되고 있는 정규 크리깅(ordinary kriging)과 여러 보조 자료를 활용한 회귀 모델에 크리깅 기법을 결합한 형태인 회귀 크리깅(regression kriging)을 이용하여 지상부 바이오매스의 탄소저장량 추정을 시도하였다. 분석 결과 단양군의 산림 탄소저장량은 정규 크리깅의 경우 3,459,902 tonC, 회귀 크리깅의 경우 3,384,581 tonC로 추정되었으며 회귀 크리깅에 이용된 회귀 모델의 결정계수는 0.1033으로 나타났다. 표본점을 임상별로(활엽수림, 침엽수림&혼효림) 층화하여 회귀 크리깅을 수행한 경우에는 탄소저장량은 3,336,206 tonC로 가장 낮게 추정되었으며 회귀 모델의 결정 계수는 각각 0.35, 0.18로 표본점 전체를 이용했을 때보다 높은 값을 보였다. 각 기법의 교차 검증(cross validation) 결과 표본점 전체를 이용한 회귀 크리깅의 RMSE(22.32 ton/ha)가 가장 낮았으나 기법간의 차이(0.23 ton/ha)는 크지 않은 것으로 나타났다.

Fuzzy Regression 기법을 이용한 산지하천 유역 홍수량 산정 (Estimate of Flood Discharge using Fuzzy Regression in Mountainous Watershed)

  • 김승주;최창원;이재응
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2011년도 학술발표회
    • /
    • pp.25-25
    • /
    • 2011
  • 우리나라는 국토의 60% 이상이 산지로 이루어져 있다. 최근 산지하천 유역에서 발생한 홍수와 토석류 등에 의해 많은 인적 물적 피해가 발생하고 있다. 현재 산지하천 유역은 유량자료에 비해 강우관측 자료는 비교적 많이 축적되어있으며, 최근에는 레이더를 이용한 강우관측도 지속적으로 이루어져 강우특성을 분석하는 것은 용이하다. 이에 비해서 산지하천 유역의 하천 유량에 대한 자료는 부족하거나 자료가 있더라도 결측치가 많고 보유연한이 분석에 필요한 만큼 충분하지 못하다. 또한 산지하천 유역의 유출특성을 분석하기 위해서는 강우관측 자료와 수위자료로부터 환산된 유량자료가 필수적인 인자이나 산지하천 유역의 수위관측소는 설치 및 유지관리 등의 어려움으로 인하여 유량자료가 상대적으로 부족한 실정이다. 이와 같은 제약을 해소하기 위해서는 많은 비용과 시간이 소요되므로 단 시간 내에 해결하는 것은 쉬운 일이 아니다. 따라서 유역의 물리적 특성을 이용하여 임의의 지점의 설계홍수량을 손쉽고, 정확하게 산정할 수 있다면 산지유역의 홍수와 토석류에 의해 발생하는 홍수 피해에 대한 대책을 마련하는데 큰 도움이 될 것이다. 일반적인 통계적 회귀분석은 여러 분야에서 널리 적용되고 있으나, 산지하천 유역의 강우-유출해석의 경우 관측자료의 수가 적고 발생하는 사상이 애매한 경우가 많아 일반적인 통계학적 선형 회귀분석을 적용하는 데 어려움이 많다. 이와 같은 어려움을 해결하기 위해 본 연구에서는 fuzzy regression 기법을 사용하였다. Fuzzy regression 기법의 하나인 possibilistic 모형을 사용하여 주어진 관측값과 산정값의 오차를 최소화함으로써 모형의 fuzziness를 최소화하였다. fuzzy regression 기법을 사용하면 변수들 간의 애매한 관계를 쉽게 해석하고 관측값과 산정값의 오차를 최소화하여 연구목적에 적합한 결과를 도출할 수 있다. 산지유역에서 발생하는 홍수는 많은 인명 및 재산피해뿐 아니라 사회 및 경제적 측면, 환경 및 생태계 그리고 인간의 정신적인 측면까지도 깊이 영향을 미친다. 따라서 본 연구에서 제안한 fuzzy regression 기법을 사용한 홍수량 산정기법을 통해 임의 지점의 빈도별 설계홍수량을 보다 신속하고 정확하게 산정하여 수공구조물의 설계에 적용하면 집중호우에 의해 발생하는 피해를 최소할 할 수 있을 것으로 기대된다.

  • PDF

이산화질소 배출에 의한 대기오염의 사회적 비용

  • 조준모;유완식
    • 자원ㆍ환경경제연구
    • /
    • 제6권1호
    • /
    • pp.111-128
    • /
    • 1996
  • 본 연구는 대기오염물질인 이산화질소와 인체의 호흡기질환과의 반응도를 실증분석하고, 이 반응도를 이용해 이산화질소의 대기오염으로 인한 사회적 비용을 계산하는 것이다. 사람들이 대기오염에 노출되었을 때 발생하는 질환의 피해를 측정하기 위하여 손실함수(damage function)를 설정하고, 이를 회귀분석기법(regression technique)을 이용해 추정한 결과 이산화질소는 호흡기질환에 상당히 유의적인 영향을 미쳤고, 1994년 한해 동안 배출된 이산화질소량이 발생시킨 사회적 비용은 약 8조 2천 억원이었다.

  • PDF

국내 홍수빈도해석 지침서 수립을 위한 연구 (A Study on a Flood Frequency Analysis Guideline for Korea)

  • 김영오;성장현;서승범;이경택
    • 한국방재학회:학술대회논문집
    • /
    • 한국방재학회 2010년도 정기 학술발표대회
    • /
    • pp.53.2-53.2
    • /
    • 2010
  • 국내 홍수빈도해석 지침서 제공을 위한 기초 연구로서 미국 홍수빈도해석 지침서인 Bulletin 17B과 같이 국내 적합한 홍수빈도해석 기법을 제시하고자 하였다. 홍수빈도해석 지침서의 핵심은 확률분포형과 매개변수 추정법을 제시하는 것이며 이에 GEV(Generalized Extreme Value), GLO(Generalized Logistic) 분포, B-GLS(Bayesian Generalized Least Square) 기법을 대상으로 다양한 연구를 수행하였다. B-GLS 기법을 이용하여, 국내 대유역에 골고루 위치하며 댐의 영향을 받지 않는 31개 지점의 연최대 일유량 시계열의 L-변동계수(L-moment coefficient variation)와 L-왜도계수(L-moment coefficient skewness)를 추정할 수 있는 회귀모형을 제안하였다. 위 회귀모형을 구성하기 위한 유역특성으로는 유역면적, 유역경사, 유역평균강우 등을 사용하였다. Bayesian-GLS(B-GLS) 적용 결과를 OLS(Ordinary Least Square) 및 B-GLS 기법에서 지점간의 상관관계를 고려하지 않는 Bayesian-WLS(Weighted Least Square)와 비교 평가하여 그 우수성을 입증하였다. 따라서 본 연구에서 제안된 B-GLS에 의한 지역회귀모형은 국내의 미계측유역이나 또는 관측 길이가 짧은 계측유역의 홍수빈도분석을 위해 매우 유용할 것으로 기대된다. 또한 수행된 연구의 내용을 공론화하는 노력이 계속된다면 공감대가 형성된 가이드라인을 제정되는데 일조를 하리라 확신한다.

  • PDF

회귀용 Support Vector Machine의 성능개선을 위한 조합형 학습알고리즘 (Hybrid Learning Algorithm for Improving Performance of Regression Support Vector Machine)

  • 조용현;박창환;박용수
    • 정보처리학회논문지B
    • /
    • 제8B권5호
    • /
    • pp.477-484
    • /
    • 2001
  • 본 논문에서는 회귀용 support vector machine의 성능 개선을 위한 모멘텀과 kernel-adatron 기법이 조합형 학습알고리즘을 제안하였다. 제안된 학습알고리즘은 supper vector machine의 학습기법인 기술기상승법에 발생하는 최적해로의 수렴에 따란 발진을 억제하여 그수렴속도를 좀 더 개선시키는 모멘텀의 장점과 비선형 특징공간에서의 동작과 구현의 용이성을 갖는 kernel-adatorn 알고리즘의 장점을 그대로 살린 것이다. 제안된 알고리즘의 support vector machine을 1차원과 2차원 비선형 함수 회귀에 적용하여 시뮬레이션한 결과, 학습속도에 있어서 2차 프로그래밍과 기존의 kernel-adaton 알고리즘보다 더 우수하고, 회귀성능면에서도 우수한 성능이 있음을 확인하였다.

  • PDF

데이터마이닝을 통한 고객관리데이터의 분석 (아파트고객 세분화를 중심으로) (Ananlyzing Customer Management Data by Datamining (Focused on Apartment Customer Classification))

  • 백신정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.69-72
    • /
    • 2004
  • 기업간의 경쟁이 심화되고 정보의 중요성에 대한 인식이 확대되어 가는 상황에서 다량의 데이터로부터 가치 있는 데이터를 추출하는 CRM 데이터 마이닝은 중대한 관심사가 아닐 수 없다. 본 연구는 데이터마이닝의 여러 활용 분야 중 고객세분화를 위해 최근 많이 사용되고 있는 데이터마이닝 기법인 로지스틱 회귀분석, 의사결정나무, 신경망 알고리즘 기법들을 비교하며, 이를 실제 아파트 고객의 데이터를 이용하여 검증하고자 한다. 따라서, 아파트 고객 세분화를 위한 데이터마이닝 수행시 기법 선택의 기준과 비교 평가의 기준을 제시하는 데 연구목적 있다.

  • PDF

질적변수에 대한 계량화를 통한 사면붕괴 예측모형 (Prediction Modeling through Quantification for Qualitative Variables)

  • 나종화;유혜경;남은미;조완섭
    • 한국산업정보학회논문지
    • /
    • 제14권5호
    • /
    • pp.281-288
    • /
    • 2009
  • 본 논문에서는 수량화 방법과 AHP(Analytic Hierarchy Process) 기법을 사용하여 산사태 발생에 대한 통계적 예측모형을 구축하는데 목적이 있다. 수량화(Quantification) 방법은 질적변수에 수량을 부여하는 통계적 방법으로, 기 조사된 자료에 기반하여 분석을 수행하는 방법이다. 본 논문에서는 서구의 다변량분석 기법인 정준상관분석의 결과를 토대로 수량화 과정을 구체적으로 제안한다. 데이터에 기반한 수량화 방법과는 팔리 AHP 기법은 일종의 다기준 의사결정을 위해 사용되는 기법으로, 설문자료에 기반한 분석법이다. 실제자료에 대한 분석으로 산사태 발생여부를 측정한 자료(한국지질자원연구원 제공)와 전문가 설문을 통해 수집된 자료를 이용하였다. 이들 자료에 대해 수량화 분석과 AHP분석을 통해 산사태 발생여부를 예측할 수 있는 두 종류의 평가표와 함께 로지스틱 회귀를 통한 통계적 예측모형을 개발하였으며, 두 모형간의 성능비교와 안정성 평가를 수행하였다.

지역 단위 조사연구와 공간정보의 활용 : 지리정보시스템과 지리적 가중 회귀분석을 중심으로 (GIS and Geographically Weighted Regression in the Survey Research of Small Areas)

  • 조동기
    • 한국조사연구학회지:조사연구
    • /
    • 제10권3호
    • /
    • pp.1-19
    • /
    • 2009
  • 본 연구는 조사연구의 과정에서 활용 가능한 공간분석의 유용성을 지리정보시스템(GIS)과 공간적 이질성을 고려하는 지리적 가중 회귀분석(GWR)을 통해 탐색한다. 많은 사회현상은 공간적 차원을 포함하고 있으며, GIS, GPS 단말장치, 온라인 위치기반 서비스의 발달로 위치정보의 수집과 활용이 용이해짐에 따라 조사연구의 과정에서 공간정보를 활용하는 분석이 이전보다 훨씬 더 용이해지고 있다. 관찰의 독립성과 오차의 동분산성을 가정하는 전통적 회귀분석은 공간적 의존성을 분석하지 못한다. GWR 분석은 속성정보뿐만 아니라 공간정보를 활용하는 공간분석 기법으로서, 공간적으로 근접한 사례들은 유사성을 가진다는 가정에 따라 지리적 가중함수를 활용한다. A 기초자치단체 주민들을 대상으로 한 조사연구 자료를 공간정보와 결합시킨 후 간단한 행정만족도 모형을 추정해 본 결과, 지리적 가중 회귀분석은 전통적 회귀분석에 비해 공간적 자기상관의 문제를 극복하고 모형의 부합도를 증가시키는 것으로 나타났다. GWR 결과를 GIS와 결합시켜 독립변수 효과의 공간적 변이를 시각화시켜 봄으로써, 변수들의 효과와 관계를 더 자세하고 풍부하게 이해할 수 있다. 나아가서 이 기법은 특정 변수의 효과가 예외적으로 낮거나 높은 지역을 더 쉽게 밝혀냄으로써 정책방안을 모색하는 데에도 유용하게 활용될 수 있다.

  • PDF

유역 및 기상상태를 고려한 단위도의 Clark 매개변수 평가 (Evaluation of the Clark Unit Hydrograph Parameters Depending on Basin and Meteorological Condition)

  • 유철상;이지호;김기욱
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2006년도 학술발표회 논문집
    • /
    • pp.1845-1849
    • /
    • 2006
  • 본 연구에서는 관측자료에 나타난 Clark 단위도의 매개변수를 검토하고 그 변동성을 평가하였다. 강우-유출과정에 영향을 미치는 유역 및 기상 특성인자들을 확률밀도함수로 정량화하였고, 유역의 집중시간 및 저류상수를 호우사상의 특성 및 유역의 조건을 고려하여 다변량 회귀분석을 실시하였다. 이를 Monte Carlo 모의기법에 적용하여 유역평균 저류상수 및 집중시간에 대한 신뢰구간을 추정하였다. 또한 신뢰구간을 좁히기 위한 방안으로 관측된 집중시간 및 저류상수를 Bootstrap 기법으로 처리하였다. 그 결과 유역을 대표하는 유출특성의 결정에는 관측 강우-유출사상의 수가 어느 정도 확보된다고 하더라도 여전히 높은 불확실성을 피하기 힘들다는 것이다. 집중시간의 경우는 그 분포가 상당히 왜곡된 형태여서 단순한 산술평균은 상당히 왜곡된 추정치를 제시할 가능성이 높다. 단순히 관측치를 이용한 경우보다 Monte Carlo 모의기법에 의한 경우 신뢰구간이 2-3배정도 좁게 나타났다. 어느 정도 신뢰도 있는 집중시간 및 저류상수의 추정을 위해서는 최소 10여개 대략 20개 정도 이상의 호우사상이 필요할 것으로 판단된다. 본 연구의 목적은 주어진 유역을 대표할 수 있는 집중시간 및 저류상수를 결정하고자 하는 것이다. 따라서 본 연구에서의 방법론을 적용하여 관측자료가 존재하는 다양한 유역에서의 집중시간 및 저류상수를 결정하고, 이를 지형인자 유역특성을 고려하여 회귀분석하는 경우 보다 정도 있는 경험식의 개발도 가능할 것이다.

  • PDF