• 제목/요약/키워드: 다중회귀분석

검색결과 3,755건 처리시간 0.046초

회귀분석을 이용한 최심신적설 추정식 개발 (Estimation of Maximum Fresh Snow Depth using Regression Analysis)

  • 박희성;정건희
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2016년도 학술발표회
    • /
    • pp.205-205
    • /
    • 2016
  • 우리나라의 겨울철 자연재해 중 대설에 의한 피해가 발생하는 빈도가 증가하고 있는 가운데 그 피해를 예측하고 대비하기 위한 연구들이 다수 진행되고 있다. 강설은 일단위로 측정하며, 매일 새롭게 내린 강설의 양인 최심신적설과 기존에 녹지 않고 쌓여 있던 깊이까지를 고려한 최심적설로 구분된다. 우리나라의 경우에는 갑작스럽게 내린 폭설에 의한 피해가 대부분이므로 최심신적설량을 예측하는 것이 매우 중요하다. 이에 본 연구에서는 다중회귀분석을 이용해 우리나라의 최심신적설량을 추정하기 위한 식을 개발하였다. 다중회귀분석을 위한 독립변수로는 해당 일에 예측된 강수량, 일평균기온, 일최고기온, 일최저기온을 사용하였으며, 강수량과 일평균기온의 상호작용을 고려할 수 있도록 모형을 구성하였다. 모형의 개발에는 전국 74개 기상관측소의 최심신적설 자료를 관측소 단위로 전체 자료의 2/3을 무작위로 추출하여 이용하였으며, 추출되지 않고 남은 1/3의 자료를 이용해 모형에 대한 검증을 실시하였다. 그 결과 상호작용항이 포함되지 않은 다중선형회귀모형에 비해 상호작용을 고려한 다중회귀모형의 예측력이 훨씬 우수하게 나타났다. 강수량과 기온이 정확하게 예측된다면 개발된 추정식을 이용해 간편하게 최심신적설량을 예측할 수 있어, 폭설에 대한 대비에 활용할 수 있을 것으로 판단된다.

  • PDF

다중회귀분석을 이용한 남강댐 하류지역의 조류발생 특성 연구 (A Study on the Characteristics of Algae Occurrence in Lower Watershed of Nam River Dam by Using Multiple Regression Analysis)

  • 정우석;김영도
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2016년도 학술발표회
    • /
    • pp.126-126
    • /
    • 2016
  • 남강은 낙동강 주요 지류인 동시에 낙동강 하류지역의 유지용수, 생활, 공업, 농업용수 공급 등에 중요 역할을 하고 있어 오염원 및 수질관리가 매우 중요하다고 볼 수 있다. 최근 남강댐 하류 및 남강합류 후 낙동강 본류인 창녕함안보 지점에서의 녹조 발생이 빈번해지고 있으며, 녹조현상에 대한 관심과 우려가 높아지고 있는 실정이다. 따라서 기존 호소의 녹조관리는 '조류경보제'에 의해서 관리되고 있지만 4대강 16개의 보 건설 이후 '수질예보제'와 같이 녹조관리를 위한 제도 및 정책이 시행되면서 조류관리의 중요성이 대두되고 있다. 본 연구에서는 기존의 많은 문헌들을 참고하여 조류의 영향인자를 파악하였으며, 남강유역의 물관리 기초자료를 수집하고 구축된 데이터 기반의 각 항목별 주요항목 영향인자 분석을 위한 상관성 분석을 실시하여 영향인자별 상관관계 우선순위를 선정하여 입력변수로 이용하였다. 그에 따른 데이터 마이닝을 통한 조류 발생특성을 고려하여 예측 모형인 다중회귀분석(Multiple Regression Analysis)을 구현하였다. 회귀분석 과정에서 다중공선성이 발생하는 변수에 대해서는 모형에서 제거하였으며, 잔차분석을 통해 이상치와 영향치를 검토하여 고려하였다.

  • PDF

특허분석을 활용한 항해 시스템 기술예측

  • 박은주;정중식
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2015년도 춘계학술대회
    • /
    • pp.50-52
    • /
    • 2015
  • 특허는 기술에 대한 광범위한 정보를 포함하고 있다. 기존의 기술예측은 정량적분석으로 시도되었지만 특허분석을 활용하여 정성적분석을 실시하였다. 특허분석을 시행하기 위하여 R 프로그램을 이용하여 주성분분석과 다중선형회귀분석을 실행하였다. 주성분분석과 다중선형회귀분석을 통하여 키워드를 추출하고 추출된 키워드를 통해 기술예측을 실시한다.

  • PDF

하수처리장 방류수 수질예측을 위한 다중회귀분석 모델 개발 및 검증 (Development and Validation of Multiple Regression Models for the Prediction of Effluent Concentration in a Sewage Treatment Process)

  • 민상윤;이승필;김진식;박종운;김만수
    • 대한환경공학회지
    • /
    • 제34권5호
    • /
    • pp.312-315
    • /
    • 2012
  • 본 연구는 Media공법을 적용하고 있는 하수처리장의 실데이터를 활용하여 다중회귀분석을 통해 유출수질을 예측하는 모형을 구현하였다. 다중회귀분석은 2011년 1년간 데이터를 사용하였으며, 변수선택법 적용, 이상치와 영향치 제거, 변수의 로그변환에 따른 CASE별 연구를 수행하였다. 다중회귀분석으로 구축된 예측 모형으로 예측정확도를 검토한 결과, 2차침전지 유출수 $COD_{Mn}$는 0.87 이상, T-N은 0.81 이상으로 검토되었으며, 구축된 다중회귀모형을 이용하여 유출수가 방류수질기준을 초과하지 않는 운전조건의 범위를 설정할 수 있을 것으로 판단된다. 결론적으로 설정된 운전조건 범위 안에서 수질측면과 에너지 비용측면으로 하수처리장 운영시 운전자에게 적절한 운전 가이드를 제공할 수 있을 것으로 판단된다.

주성분 회귀모형을 이용한 과학기술 지식생산함수 추정 (Estimation of S&T Knowledge Production Function Using Principal Component Regression Model)

  • 박수동;성웅현
    • 기술혁신학회지
    • /
    • 제13권2호
    • /
    • pp.231-251
    • /
    • 2010
  • 과학기술 R&D 활동의 대표적 성과인 SCI 논문과 특허의 생산에 영향을 미치는 요인은 연구비, 연구원수, 지식스톡(R&D스톡, 논문스톡, 특허스톡 등), 연구환경, 개방화 정도, 인적자본, GDP 등 다양하다. 일반적인 회귀모형을 이용하여 논문 또는 특허의 생산에 영향을 미치는 요인을 추정하면 생산요인들 간에 다중공선성 문제가 발생하여 추정의 오류가 발생한다. 본 논문에서는 과학기술 지식생산에 영향을 미치는 요인들 간의 다중공선성 문제를 해결하기 위해 주성분 회귀모형을 이용하였다. SCI 논문을 산출로 가정한 과학생산성과와 특허를 산출로 가정한 기술생산성과에 영향을 미치는 요인을 회귀모형과 주성분 회귀모형을 이용하여 3가지 사례를 대상으로 비교 분석하였다. 일반 회귀모형을 이용하여 SCI 논문과 특허의 생산에 영향을 미치는 요인들을 분석한 결과, 요인들간에 다중공선성이 매우 높게 나타났고, 그 결과 회귀계수와 추정과 검정에 오류가 발생되었다. 반면 주성분 회귀모형을 이용하여 분석한 결과 다중공선성문제가 해결되어, 개별 생산요인에 대한 효과를 적절하게 추정할 수 있었다. 본 논문에서 제안한 주성분 회귀모형을 이용한 과학기술 지식생산함수 추정방법은 다중공선성이 강한 소수의 생산요소를 포함한 회귀분석에서 유용하게 적용될 수 있을 것이다.

  • PDF

다중회귀 분석을 이용한 영화 흥행 예측 (Predicting Financial Success of a Movie Using Multiple Regression Analysis)

  • 정회윤;양형정
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2013년도 제48차 하계학술발표논문집 21권2호
    • /
    • pp.275-278
    • /
    • 2013
  • 영화의 흥행 요소를 파악하여 영화의 흥행 여부를 예측하는 것은 영화의 수익성 부분에서 아주 중요하다. 영화 시장이 과거와는 다르게 증가함에 따라, 다양한 영화 흥행에 관한 예측 연구들이 개발되었다. 본 논문에서는 영화 흥행 요소들을 수집하고 다중회귀 분석을 통해서 유의수준을 만족하는 흥행 요소들을 선택한다. 그 후, 이러한 요소들을 예측 방법들의 입력값으로 사용하여 영화 흥행을 예측한다. 성능을 비교하기 위해 본 논문에서 제안한 방법과 현재 개발된 영화 흥행 예측 방법(다중회귀, 의사결정트리, 인공신경망)들을 정확도와 평균제곱근오차를 통해 예측 모형의 성능을 비교한다. 그 결과, 다중 회귀 분석을 통해 유의한 흥행요소들만을 고려한 예측 방법의 정확도가 모든 흥행 요소들을 고려한 예측 방법보다 평균 8.2% 향상되었고, 현재까지 개발된 영화 흥행 예측 방법보다 더 높은 예측 성능을 보여준다.

  • PDF

다중회귀분석을 이용한 대규모 비탈면의 위험도 평가 (Risk Assesment for Large-scale Slopes Using Multiple Regression Analysis)

  • 이종건;장범수;김용수;석재욱;문준식
    • 한국지반공학회논문집
    • /
    • 제29권11호
    • /
    • pp.99-106
    • /
    • 2013
  • 본 연구에서는 일반국도 상에 존재하는 2종 비탈면 104개소에 대해 상태평가 항목과 상태평가 등급의 연관성을 분석하고, 평가항목을 고려한 다중회귀분석을 통해 안전등급을 예측할 수 있는 회귀모형을 제시하였다. 분석결과, 사면경사와 강우 및 지하수의 평가항목은 상태평가 등급과의 연관성이 낮은 것으로 분석되었다. 또한, 다중회귀분석을 통해 제시된 회귀모형은 절취상태, 강우 및 지하수의 항목을 판단하기 어려운 조건에서 활용이 가능한 것으로 판단된다.

기상청 ASOS 자료를 활용한 다중회귀분석 기반의 계절 강수량 예측 (Estimation of seasonal rainfall based on multiple regression analysis using ASOS data of Korea Meteorological Administration)

  • 김철겸;이정우;이정은;김남원;김현준
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2019년도 학술발표회
    • /
    • pp.310-310
    • /
    • 2019
  • 본 연구에서는 기상청 ASOS(종관기상관측장비) 자료와 통계적 기반의 다중회귀분석모형을 이용하여 경안천 유역에 대한 봄철 강수량(3~5월 누적강수량)의 예측성을 평가하였다. 예측대상기간은 2006~2018년이며 예측인자로서 전국 96개 지점의 ASOS 자료 중 35개 기상요소에 대한 월 자료를 활용하였다. 전망기간(1~12개월)에 따라 강수량 기준 최소 1개월에서 최대 24개월까지의 지체시간을 고려하여 1~24개월 선행 ASOS 기상자료와 강수량 사이의 상관성을 분석하였다. 예측대상년도를 기준으로 과거 40년간의 자료를 이용하여 상관성 분석을 수행하였으며, 상관성이 높은 상위 30개 기상인자를 조합하여 다중회귀분석모형의 예측인자(독립변수)로 활용하였다. 예측대상년도와 전망기간에 따라 최적의 예측인자를 조합하고, 교차검증을 통하여 각각 4,000개의 다중회귀모형을 도출하여 예측범위를 산출하였다. 다중회귀모형에 의한 예측범위를 분석한 결과, 2013년 자료까지는 예측범위가 관측값을 잘 포함하고 예측값의 평균이나 중간값이 관측값과 유사하게 나타난 반면, 2014년부터는 전망기간에 따라 관측값과 예측범위의 차이가 크게 나타나는 경우도 있었다. 예측치의 중간값을 기준으로 3분위(평년 이상, 평년 수준, 평년 이하) 적중률을 분석하면, 2006~2013년에 대해서는 58.3%인 반면, 2014~2018년에 대해서는 11.2% 수준으로 나타났다.

  • PDF

비자동회귀 다중 디코더 기반 한국어 형태소 분석 (Non-autoregressive Multi Decoders for Korean Morphological Analysis)

  • 조성민;송현제
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.418-423
    • /
    • 2022
  • 한국어 형태소 분석은 자연어 처리의 기초가 되는 태스크이므로 빠르게 결과를 출력해야 한다. 기존연구는 자동회귀 모델을 한국어 형태소 분석에 적용하여 좋은 성능을 기록하였다. 하지만 자동회귀 모델은 느리다는 단점이 있고, 이 문제를 극복하기 위해 비자동회귀 모델을 사용할 수 있다. 비자동회귀 모델을 한국어 형태소 분석에 적용하면 조화롭지 않은 시퀀스 문제와 토큰 반복 문제가 발생한다. 본 논문에서는 두 문제를 해결하기 위하여 다중 디코더 기반의 한국어 형태소 분석을 제안한다. 조화롭지 않은 시퀀스는 다중 디코더를 적용함으로써, 토큰 반복 문제는 두 개의 디코더에 서로 어텐션을 적용하여 문제를 완화할 수 있다. 본 논문에서 제안한 모델은 세종 형태소 분석 말뭉치를 대상으로 좋은 성능을 확보하면서 빠르게 결과를 생성할 수 있음을 실험적으로 보였다.

  • PDF

시강우량 다중회귀분석에 의한 첨두유량 예측 (Peak discharge prediction by multiple regression analysis using hourly precipitation data)

  • 박창언
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.380-380
    • /
    • 2017
  • 유역에서 발생되는 유출량의 크기를 예측하는 것은 홍수피해를 대비하기 위한 가장 기초적인 활동으로 이루어지며, 이를 위하여 많은 수문모형들이 개발되어 활용되어지고 있다. 이러한 수문모형의 적용을 위해서는 먼저 해당 유역을 재현할 수 있는 매개변수의 보정이 이루어져야 하며 적절한 정도 이상의 검정결과를 확보하여야만 적용이 가능하다. 그러나, 유역 내의 각종 수문특성을 모형의 매개변수로 자세히 나타내는 것은 쉬운 작업이 아니며, 특히 정해진 기간 내에 적용해야 하는 유역이 다수인 경우에는 더욱 힘든 작업이 될 수밖에 없다. 기후변화에 따라 예견되는 강우량 발생 시나리오를 바탕으로 남한 일대의 홍수영향을 지자체별로 평가하기 위한 작업에서는 각 지자체별 많은 소유역에서의 적절한 수문모형 매개변수를 개별적으로 찾아내는 것은 사실상 불가능할 것으로 예견되어, 기후변화 시나리오에서 주어지는 시간별 강우량 자료를 활용하여 첨두유량을 예측할 수 있는 통계적인 방법을 적용하였다. 홍수영향을 평가하기 위하여는 수문곡선 자체보다는 첨두유량의 크기가 더 중요할 것으로 판단되어, 홍수통제소에 제공하는 각 유량관측지점의 유량자료와 시간별 강우량자료로부터 단위 호우사상별 첨두유량과 일정 시간간격 강우량 사이의 다중회귀분석을 통하여 첨두유량 예측 가능성을 확인하였다. 다중회귀분석을 위한 시간간격별 강우량은 각 강우사상에 대하여 첨두유량 발생 직전의 1시간~12시간의 1시간 간격, 1일, 2일, 3일, 5일, 10일 등 17가지의 시간간격 동안의 강우량 자료를 찾아 다중회귀분석에 활용하였으며, 2006년부터 2015년까지 최근 10년 동안의 홍수통제소 자료를 활용하였다. 대상지역은 경기도 남부의 너부대교, 경안교, 복하교, 수직교 수위관측소지점으로 선정하였으며, 일정 크기 이상의 첨두유량 자료를 선별하여 해당 기간에 대한 강우량 자료를 준비하고, 유출량의 크기별로 분류하여 절반의 호우사상은 매개변수 보정에 그리고 나머지 절반의 호우사상은 모형의 검정에 사용하였다. 매개변수 보정결과는 $R^2$ 값이 0.87~0.96을 보이는 등 첨두유량의 예측에 충분히 적용가능한 것으로 판단되었으며, 보정되어진 매개변수로 실시한 검정에서는 0.76~0.85의 $R^2$ 값을 보였다. 본 연구의 결과를 바탕으로, 충분한 유량자료와 시간별 강우량자료만 준비된다면 첨두유량을 예측할 수 있는 회귀방정식으로 이루어진 간단한 모형을 구성할 수 있으며, 이를 활용하여 임의로 주어지는 시간별 강우량 자료를 활용하여 첨두유량의 예측이 가능할 것으로 판단되었다.

  • PDF