• 제목/요약/키워드: 회귀분석기법

검색결과 1,082건 처리시간 0.031초

인간활동 및 기후변화로 인하여 변화되는 유량의 정량적 분리 (Quantitative separation of discharge impacted by human activities and climate change)

  • 김상욱;김형배
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2016년도 학술발표회
    • /
    • pp.165-165
    • /
    • 2016
  • 장기적인 수자원 계획의 수립이나 수공구조물을 설계함에 있어 수문학적 순환은 매우 중요하다. 그러나 수문학적 순환은 인간활동과 기후변화의 요인으로 인하여 시간 및 공간에 따라 항상 변화되기 때문에 특정지점에서의 유량도 수문학적 순환의 변동으로 인하여 변화된다. 따라서 본 연구에서는 특정 지점에서 취득된 과거 유량자료를 이용하여 기후변화와 인간활동에 의해 변화되는 유량을 정량적으로 분리할 수 있는 두 가지 기법을 개발하였다. 인간활동에 의해 변화되는 유량(인간활동 유량변동)에 영향을 미치는 요인으로는 인구 증가, 토지이용 변화 등을 들 수 있고, 기후변화에 의해 변화되는 유량(기후변화 유량변동)에 영향을 미치는 요인으로는 온난화로 인한 강수, 기온, 습도 등의 변화를 들 수 있다. 이러한 요인으로 인한 유량의 변동을 분석하기 위해서는 먼저 관측된 자료가 가지고 있는 변동점을 분석하여 변동점 이전 구간을 비영향구간(non-impacted period), 이후 구간을 영향구간(impacted period) 로 나누어야 하는데 이를 위하여 이중누가곡선, 선형회귀분석, Mann-Kendall 검정, Pettitt 검정을 이용하였다. 인간활동 및 기후변화 유량변동을 정량적으로 분리함에 있어서는 두 가지 분석기법이 사용될 수 있다. 즉 인간활동 유량변동을 먼저 분석한 이후 기후변화 유량변동을 산정하는 기법을 적용할 수도 있고 반대로 기후변화 유량변동을 먼저 산정한 이후 인간활동 유량변동을 산정할 수도 있는데 본 연구에서는 두 가지 기법을 모두 적용하여 그 결과를 비교하였다. 인간활동 유량변동을 먼저 산정하는 기법을 적용하기 위해서 비영향구간에 대해 SWAT-CUP을 활용하여 보정된 SWAT 모형을 구축하여 결과의 산정에 활용하였으며, 기후변화 유량변동을 먼저 산정하는 기법을 적용하기 위해서는 영향구간에 대해 민감도 분석 기법 중의 하나인 Budyko 분석을 활용하였다. 본 연구에서 개발된 두 가지 기법을 이용하여 인간활동 및 기후변화 유량변동을 정량적으로 산정하여 비교함에 있어 한강 유역의 소양강댐 상류유역과 섬강유역을 대상으로 과거 관측자료를 취득하여 연구를 수행하였다. 소양강댐 상류유역과 섬강유역의 변화된 유량에 대해서 기후변화로 인한 영향의 비율이 높은지 인간활동으로 인한 영향의 비율이 높은지를 파악함으로써 궁극적으로 두 유역에서의 인간활동과 기후변화로 인해 발생된 유량의 변화 요인을 정량적으로 분리하여 파악할 수 있었다. 그러므로 이와 같은 연구를 활용하여 수문학적 순환 관계에 있어 앞으로 어떠한 요인이 유량변동에 많은 영향을 미치는지 예측하여 미래에 변화하는 유량에 대해 계획하고 수공구조물을 설계함에 있어 활용될 수 있는 설계지침을 제시할 수 있었다.

  • PDF

커터수명지수 예측을 위한 다중선형회귀분석과 트리 기반 머신러닝 기법 적용 (Application of Multiple Linear Regression Analysis and Tree-Based Machine Learning Techniques for Cutter Life Index(CLI) Prediction)

  • 홍주표;고태영
    • 터널과지하공간
    • /
    • 제33권6호
    • /
    • pp.594-609
    • /
    • 2023
  • TBM 공법은 굴착면 안정성 확보 및 주변환경에 비치는 영향을 최소화하기 때문에 도심지나 하·해저터널 등에서 적용 사례가 증가하는 추세이다. 디스크 커터의 수명을 예측하는 대표적인 모델 중 NTNU모델은 커터수명지수(Cutter Life Index, CLI)를 주요 매개 변수로 활용하지만 복잡한 시험절차와 시험장비의 희귀성으로 측정에 어려움이 있다. 본 연구에서는 다중선형회귀분석과 트리 기반의 머신러닝 기법으로 암석물성을 활용하여 CLI를 예측하였다. 문헌 조사를 통해 암석의 일축압축강도, 압열인장강도, 등 가석영함량과 세르샤 마모지수 등을 포함한 데이터베이스를 구축하였고 파생변수를 계산하여 추가하였다. 다중선형회귀분석은 통계적 유의성과 다중공선성을 고려하여 입력 변수를 선정하였고 머신러닝 예측 모델은 변수 중요도를 기반으로 입력 변수를 선정하였다. 학습용과 검증용 데이터를 8:2로 나누어 모델 간 예측 성능을 비교한 결과 XGBoost가 최적의 모델로 선정되었다. 본 연구에서 도출된 다중선형회귀모델과 XGBoost모델을 선행 연구와 예측 성능을 비교하여 타당성을 확인하였다.

연관성 규칙 수의 추정을 위한 일반적인 비선형 회귀모형에서의 표준화 향상도 활용 방안 (Generally non-linear regression model containing standardized lift for association number estimation)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권3호
    • /
    • pp.629-638
    • /
    • 2016
  • 최근에 많이 활용되고 있는 데이터 분석을 위한 연관성 규칙 마이닝은 대용량 데이터베이스에 많이 활용되고 있는 서 두 항목간의 관계를 측도화 함으로써 두 개 이상의 항목간의 관련성을 표시하여 주는 기법이다. 연관성 규칙의 여부를 판단하기 위한 연관성 평가 기준에는 지지도, 신뢰도, 그리고 향상도 등이 있으며, 이들 세 가지 기준을 이용하여 연관성 규칙 생성 여부를 판단하게 된다. 이에 대한 기존의 연구 결과는 결정함수를 이용하는 방법과 회귀모형을 이용하는 방법으로 분류할 수 있다. 회귀모형을 이용하여 수행한 연구에는 지지도와 신뢰도에 의한 모형, 세 가지 평가 기준의 쌍에 의한 모형, 표준화 향상도를 포함한 세 가지 평가 기준의 쌍에 의한 모형, 그리고 세 가지 평가 기준 전부를 고려한 모형 등이 있다. 본 논문에서는 기존의 연구를 확장하는 의미에서 표준화 향상도를 포함한 세가지 평가 기준 전부를 고려한 비선형 회귀모형을 이용하여 연관성 규칙의 수를 추정하는 방안에 대해 강구하고자 한다. 또한 분산분석에서의 F 통계량과 수정 결정계수를 이용하여 각 모형의 유의한 정도를 비교하는 동시에 분산팽창계수에 의한 공선성 문제를 진단함으로써 가장 유용한 회귀 모형을 탐색하고자 한다.

인구구조 공간분포 특성에 관한 유전자 알고리즘 적용방안 (The Applicability of the Genetic Algorithm on Spatial Distribution of Demographic Characteristics)

  • 최내영;이경윤
    • 대한공간정보학회지
    • /
    • 제18권3호
    • /
    • pp.49-56
    • /
    • 2010
  • 본고에서 적용한 유전자 알고리즘(GenAlg)은 다윈의 유전적 진화이론에 기반한 적정해 탐색기법으로써 공간연구에 있어서도 다양한 응용연구가 선행된 바 있다. 본 연구는 최근 신도시 개발과 함께 택지개발사업 등이 활발히 진행되고 있는 화성시 동부권을 사례대상지로 GIS 툴을 이용하여 격자인구자료를 구축하고 자연환경변수와 함께 개발 촉진형 및 규제형 용도지역지구 지정현황 등 주요 인구동태 결정요인에 관한 공간정보를 구축한 다음 GenAlg 모형을 추정하고 이를 동일 설명변수를 사용한 회귀분석 결과와 비교해 봄으로써 GenAlg기법의 유용성을 정량적으로 비교분석해 보았다. 분석결과 회귀분석과 유사하게 설명변수들에 대해 비교적 일관되고 설득력 있는 계수 값들이 도출되었고 이로써 GenAlg모형은 적자생존의 유전학적 원리를 기반으로 도시현상과 관련한 제반 문제의 적정해를 찾는 유용한 학제적 탐색기법임을 확인할 수 있었다.

상관적분 기법의 프랙탈 차원 추정을 통한 기후관측소 밀도 분석에 관한 연구 (A study on the density analysis of climatological stations using the correlation integral method in the fractal dimension)

  • 김희경;이영섭
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권1호
    • /
    • pp.53-62
    • /
    • 2013
  • 현재 세계기상기구에 등록되어 있는 우리나라 기후관측소는 11개 지점이다. 11개 지점의 분포를 보면 지리적으로 균일하지 못하고 대부분이 해안에 위치하는 편중된 분포를 보이고 있다. 따라서 기후관측소 자료를 바탕으로 하는 전국 기후자료 생산 및 특성 산출을 위해서는 관측소 밀도에 관한 분석을 통해 기후자료 분포에 대한 균형도의 측정이 필요하다. 본 연구에서는 상관적분 기법을 이용한 프랙탈 차원의 추정을 통해 우리나라 기후관측소 밀도를 측정하였다. 상관적분 기법 적용시 회귀분석을 통하여 추정된 회귀계수로 프랙탈 차원을 추정한다. 추정된 프랙탈 차원을 이용해 전국의 기상관서들 중 지리적으로 기후관측소 구성의 균형도를 가장 높여 줄 수 있는 기후관측소 후보지점을 선정하였다. 이 때 후보지점을 순차적으로 선택하는 방식과 조합의 형태로 여러 후보지점을 한 번에 선택하는 방식으로 각각 최적의 후보지점들을 선택하였다.

국내 갈수량 산정에 대한 재고 (Reconsideration on the low flow estimation in Korea)

  • 조탁근;김영오;이길성
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2006년도 학술발표회 논문집
    • /
    • pp.829-833
    • /
    • 2006
  • 갈수량(low flow)은 과거 자연상태 하천에서 갈수기에 흘렀던 유량으로서 자연과 사람이 공유할 수 있는 최소한의 유량이며, 이수측면에서 하천수의 공급능력을 평가하여 취수량을 설정하는 기준 유량이다. 일본과 국내에서는 지금까지 일유량의 유황곡선(flow duration curve)을 분석하여 평균갈수량, 기준갈수량 등을 결정하고 이를 갈수량의 지표로 이용하여 왔다. 그러나 미국과 영국 등에서는 7일 동안의 유량을 통계분석하여 만든 10년빈도 7일 최저유량$(7Q_{10})$을 갈수량 지표로 사용하고 있다. 본 연구에서는 위의 두 지표를 실험을 통해 비교하여 서로의 장단점을 우선 고찰하여 보았다. 갈수량 산정을 위해서는 과거의 관측 유량자료가 필요하나 국내에는 수위 관측시설이 한정되어 있을 뿐 아니라 홍수기에 비해 갈수기 자료가 턱없이 부족하여 갈수량 산정에 많은 어려움을 겪고 있다. 국내에서는 대부분 유역면적을 이용한 비유량법으로 계측유역으로부 터 미계측유역의 갈수량을 산정하고 있다. 본 연구에서는 미계측유역(ungauged basin)의 갈수량을 산정하기 위한 방법으로 지역회귀기법(regional regression method)을 국내에 적용하여 보았다. 이를 위해 9개 수위관측소 유역과 7개 댐 유역의 과거 유량자료를 이용하였으며, 교차검증(cross validation)을 통해 갈수량 산정결과의 정확도 검증을 실시하였다.

  • PDF

시화지역 실트질 지반에서 강제치환심도 예측식 산정 (Prediction Equation of Compulsory Replacement Depth of Silty Layer in Sihwa Region)

  • 박영;임희대
    • 한국지반공학회논문집
    • /
    • 제27권9호
    • /
    • pp.55-66
    • /
    • 2011
  • 강제치환공법은 다른 연약지반 처리공법에 비하여 시공이 단순하고 경제성이 우수하나 현재까지 정확한 이론적 산정기법이 정립되어 있지 않기 때문에 치환심도의 예측이 제대로 이루어지지 않고 있는 실정이다. 본 연구에서는 대다수의 예측식이 지지력을 기반으로 한 내용에서 관점을 바꾸어 액성한계 및 자연함수비에 근거한 새로운 형태의 예측식을 제안하였다. 예측식은 현장에서 관측된 계측결과와 확인보링에 근거하고, 지역성을 대변하기 위해 시화지역의 실트/점토의 특성을 분석한 자료로부터 관계식을 도출하였으며, 이를 회귀분석기법을 적용하여 최종 예측식을 도출하였다.

소프트웨어 개발비용을 추정하기 위한 FFP 기반 모델 (A FFP-based Model to Estimate Software Development Cost)

  • 박주석;정기원
    • 정보처리학회논문지D
    • /
    • 제10D권7호
    • /
    • pp.1137-1144
    • /
    • 2003
  • 소프트웨어 규모를 측정하기 위한 기존의 기능점수 기법은 관리정보 시스템에 적합하도록 구성되어 있으나 최근의 실시간 및 내장형 시스템의 적용성 확장에 따라 완전기능점수(FFP, Full Function Point) 기법이 제안되었다. 그러나, FFP 기반의 소프트웨어 규모 측정 방법에 관한 많은 연구는 이루어지고 있으나, FFP로 측정된 소프트웨어 규모에 대한 개발비용을 추정할 수 있는 모델 연구는 미흡한 실정이다. 본 논문은 FFP로 실제 개발된 소프트웨어의 완전기능점수를 기반으로 소프트웨어 개발에 투입될 노력을 추정하는 선형 회귀분석 모델과 거듭제곱 회귀분석 모델을 평가하여 가장 적합한 모델로써 거듭제곱 모델을 선정하였다. 선정된 거듭제곱 모델을 적용할 경우 가장 근사치의 소프트웨어 개발비용을 추정할 수 있음을 보였다.

로지스틱 회귀분석과 퍼지 기법을 이용한 산사태 취약성 지도작성: 보은군을 대상으로 (Landslide susceptibility mapping using Logistic Regression and Fuzzy Set model at the Boeun Area, Korea)

  • 알-마문;장동호
    • 한국지형학회지
    • /
    • 제23권2호
    • /
    • pp.109-125
    • /
    • 2016
  • This study aims to identify the landslide susceptible zones of Boeun area and provide reliable landslide susceptibility maps by applying different modeling methods. Aerial photographs and field survey on the Boeun area identified landslide inventory map that consists of 388 landslide locations. A total ofseven landslide causative factors (elevation, slope angle, slope aspect, geology, soil, forest and land-use) were extracted from the database and then converted into raster. Landslide causative factors were provided to investigate about the spatial relationship between each factor and landslide occurrence by using fuzzy set and logistic regression model. Fuzzy membership value and logistic regression coefficient were employed to determine each factor's rating for landslide susceptibility mapping. Then, the landslide susceptibility maps were compared and validated by cross validation technique. In the cross validation process, 50% of observed landslides were selected randomly by Excel and two success rate curves (SRC) were generated for each landslide susceptibility map. The result demonstrates the 84.34% and 83.29% accuracy ratio for logistic regression model and fuzzy set model respectively. It means that both models were very reliable and reasonable methods for landslide susceptibility analysis.

쉴드 TBM 굴진 주요 영향인자분석 및 굴진율 예측모델 제시 (Study on the effective parameters and a prediction model of the shield TBM performance)

  • 조선아;김경열;류희환;조계춘
    • 한국터널지하공간학회 논문집
    • /
    • 제21권3호
    • /
    • pp.347-362
    • /
    • 2019
  • 도심지 터널 공사가 많아지면서 이에 따른 소음, 진동, 교통불편 및 민원 저감을 위해 TBM 굴착이 증가하고 있다. 그러나 이러한 추세에도 불구하고 국내 TBM 공동구 설계 및 시공을 위한 기준들은 대부분 해외기술(일본, 독일 등)을 이용하고 있어 국내환경을 고려하지 못하고 있다. 특히, 공동구 TBM 설계의 주요 기준이 되는 굴진율은 대부분 일축압축강도만으로 산정되며 이마저도 실제 현장 특성과 맞지 않아 개선이 필요하다. 본 연구에서는 국내 현장에 적합한 굴진율을 예측하기 위해 수행되었다. 이를 위해 시공 중인 소단면 쉴드 TBM 굴착 현장의 지반 및 굴진데이터를 수집하고 상관관계 분석을 통해 굴진율에 영향을 미치는 주요인자를 파악하였다. 도출된 영향인자들은 통계적 분석기법을 기반으로 한 다중선형 회귀분석에 적용되어 굴진율을 예측하는 회귀식의 예측변수로 이용되었다. 결과적으로 회귀분석을 통해 도출된 회귀식은 일축압축강도와 절리간격을 예측변수로 추정되었으며, 해외 경험식과 비교하여 국내현장 굴진율의 예측 정확도가 높은 것으로 나타났다. 다만, 이 회귀식을 타 국내 현장에 적용할 경우 예측오차가 다소 증가하였다. 회귀식이 갖는 이와 같은 적용 한계를 개선하기 위해서는 추가적인 연구를 통해 현장조건에 제약을 받지 않는 굴진율 예측모델 도출이 필요할 것으로 보인다.