• 제목/요약/키워드: 회귀분석 모델

검색결과 1,503건 처리시간 0.037초

다중선형회귀경험식과 머신러닝모델의 2차원 횡 분산계수 예측성능 평가 (Performance Evaluation of Multilinear Regression Empirical Formula and Machine Learning Model for Prediction of Two-dimensional Transverse Dispersion Coefficient)

  • 이선미;박인환
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.172-172
    • /
    • 2022
  • 분산계수는 하천에서 오염물질의 혼합능을 파악할 수 있는 대표적인 인자이다. 특히 하수처리장 방류수 혼합예측과 같이 횡 방향 혼합에 대한 예측이 중요한 경우, 하천의 지형적, 수리학적 특성을 고려한 2차원 횡 분산계수의 결정이 필요하다. 2차원 횡 분산계수의 결정을 위해 기존 연구에서는 추적자실험결과로부터 경험식을 만들어 횡 분산계수 산정에 사용해왔다. 회귀분석을 통한 경험식 산정을 위해서는 충분한 데이터가 필요하지만, 2차원 추적자 실험 건수가 충분치 않아 신뢰성 높은 경험식 산정이 어려운 상황이다. 따라서 본 연구에서는 SMOTE기법을 이용하여 횡분산계수 실험데이터를 증폭시켜 이로부터 횡 분산계수 경험식을 산정하고자 한다. 또한 다중선형회귀분석을 통해 도출된 경험식의 한계를 보완하기 위해 다양한 머신러닝 기법을 적용하고, 횡 분산계수 산정에 적합한 머신러닝 기법을 제안하고자 한다. 기존 추적자실험 데이터로부터 하폭 대 수심비, 유속 대 마찰유속비, 횡 분산계수 데이터 셋을 수집하였으며, SMOTE 알고리즘의 적용을 통해 회귀분석과 머신러닝 기법 적용에 필요한 데이터그룹을 생성했다. 새롭게 생성된 데이터 셋을 포함하여 다중선형회귀분석을 통해 횡 분산계수 경험식을 결정하였으며, 새로 제안한 경험식과 기존 경험식에 대한 정확도를 비교했다. 또한 다중선형회귀분석을 통해 결정된 경험식은 횡 분산계수 예측범위에 한계를 보였기 때문에 머신러닝기법을 적용하여 다중선형회귀분석에 대한 예측성능을 평가했다. 이를 위해 머신러닝 기법으로서 서포트 벡터 머신 회귀(SVR), K근접이웃 회귀(KNN-R), 랜덤 포레스트 회귀(RFR)를 활용했다. 세 가지 머신러닝 기법을 통해 도출된 횡 분산계수와 경험식으로부터 결정된 횡 분산계수를 비교하여 예측 성능을 비교했다. 이를 통해 제한된 실험데이터 셋으로부터 2차원 횡 분산계수 산정을 위한 데이터 전처리 기법 및 횡 분산계수 산정에 적합한 머신러닝 절차와 최적 학습기법을 도출했다.

  • PDF

딥러닝 기반 시추장비 이상 예측 및 진단 모델 개발 연구 (A Study on the Development of Anomaly Detection Prediction Model for Deep Learning-Based Drilling Equipment)

  • 한동권;김민수;권순일;최정호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 춘계학술발표대회
    • /
    • pp.404-407
    • /
    • 2021
  • 석유개발 현장에서 시추장비의 고장으로 인한 장비교체 및 시추시간 증가는 막대한 비용소모를 발생시킨다. 본 논문은 딥러닝 기반의 시추장비 중 드릴비트의 동력을 구동시키는 디젤엔진의 고장 요소를 분류하고 이 요소에 따른 고장여부를 판별하는 딥러닝 기반의 이상 예측 및 진단 모델을 개발하였다. 또한 제안한 모델의 우수성을 확인하기 위해 로지스틱 회귀분석 분류모델과의 예측성능 비교분석도 수행하였다.

반응표면분석법을 이용한 박판 알루미늄 합금의 저입열 Pulse MIG 용접 변수 최적화에 관한 연구 (Study on the Optimization of Low Heat-Input Pluse MIG Welding Process for Aluminum Alloy sheets using the response surface methodology(RSM))

  • 김재성;황지혜;최동순;이보영
    • 한국전산구조공학회:학술대회논문집
    • /
    • 한국전산구조공학회 2010년도 정기 학술대회
    • /
    • pp.624-627
    • /
    • 2010
  • 최근 자동차 업계서는 차량의 온실가스 배출량을 줄이고 연비를 개선시킬 수 있는 방법 중의 하나로 경량화 소재를 사용하여 차체의 중량을 줄이는 연구가 활발히 진행 중에 있다. 특히 알루미늄 합금의 경우 기존 강재에 비해 비중이 낮아 가볍고 부식에 대한 저항성이 높아 많이 사용되어지고 있는 추세이다. 본 연구에서는 먼저, 저입열 용접공정을 적용하여 용접 변수와 토치의 각도에 따른 인장강도 특성을 비교하여 적정 용접 범위를 산정하였으며, 인장강도와 비드형상의 관계를 다중 회귀 분석을 이용하여 비드 예측 회귀 모델을 제시하였다. 또한 호감도 함수를 적용한 반응표면분석법을 이용하여 자동차 생산 현장에서 겹치기 용접 이음부의 강건한 용접 품질을 가질 수 있는 최적용접 공정 조건을 도출할 수 있는 효과적인 방법을 제안하고자 한다.

  • PDF

의사결정규칙을 이용한 복합 질환의 예측 (Prediction of complex disease using Decision Rules)

  • 김명기;김승현;위규범
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.593-596
    • /
    • 2007
  • 복합 질환과 관련된 임상데이터에 대한 예측 모델을 회귀분석, 신경망, 또는 MDR과 같은 방법을 이용하여 분석할 경우 데이터의 차원 문제(Dimensionality Problem)가 발생할 수 있다. 엔트로피(Entropy)를 이용한 의사결정규칙 방법은 이러한 데이터의 차원 문제를 줄이고 의사결정규칙의 결과를 바로 해석할 수 있다는 점에서 질환 예측 모델을 만드는데 유용하다. 본 논문에서는 천식과 관련된 임상데이터를 사용하여 예측 모델을 구성하고 결과를 분석한다.

  • PDF

지각된 가치와 사회적 영향이 공유경제 이용의도에 미치는 영향: 사회적자본의 조절효과를 중심으로

  • 김소영;박상혁
    • 한국벤처창업학회:학술대회논문집
    • /
    • 한국벤처창업학회 2019년도 춘계학술대회
    • /
    • pp.103-107
    • /
    • 2019
  • 최근 에어비앤비나 우버와 같은 협력적 소비 기반의 비즈니스모델을 가진 공유경제가 성장하고 있다. 본 논문은 공유경제에 대한 개념을 정의하고, 이용의도에 미치는 영향을 분석하였다. 본 논문은 경제적, 기능적, 경험적, 사회적 가치를 포함한 4가지 지각된 가치와 주관적 규범, 이미지, 사회적 임계점을 구성하는 3가지 사회적 영향이 공유경제 이용의도에 미치는 영향을 알아보고 신뢰와 사회적 규범, 네트워크와 사회구조를 포함한 사회적자본의 조절효과에 관심을 두고 있다. 가설을 검증하고자 온라인과 오프라인에서 설문조사를 실시하였고, 지각된 가치와 사회적 영향이 공유경제 이용의도에 미치는 영향을 알아보고자 변수별로 다중회귀분석을 실시하였다. 또한 사회적자본의 조절효과를 알아보기 위하여 위계적인 회귀분석을 실시하였다. 다중회귀분석 결과는 다음과 같다. 지각된 가치 중 경제적, 경험적 가치는 공유경제 이용의도에 영향을 미치는 것으로 나타났다. 위계적인 회귀분석의 결과에서 사회적자본은 지각된 가치와 사회적 영향의 공유경제 이용의도 관계에 있어 조절적인 영향을 미치는 것으로 나타났다. 본 연구는 지각된 가치를 통합적 분석, 기존 공유경제 연구에서 자주 다뤄지지 않았던 사회적 영향과 사회적자본의 요인을 다룬 점에 의미가 있지만, 설문조사 결과의 한계가 있었기에 향후 새로운 연구 방향성을 제시할 수 있다.

  • PDF

아파트 신축공사의 건설폐기물 발생량 예측 회귀모델 (A Regression Model for Estimating Solid Wastes of Apartment Construction)

  • 김성훈;박성수;박성철;엄익준;구교진
    • 한국건설관리학회:학술대회논문집
    • /
    • 한국건설관리학회 2004년도 제5회 정기학술발표대회 논문집
    • /
    • pp.329-334
    • /
    • 2004
  • 건설현장의 환경관리가 강화되고 있는 방향으로 나아가고 있는 상황에서 기업의 입장에서는 좀더 효율적인 건설현장 환경관리가 필요하며, 건설폐기물의 관리는 그 중 가장 중요한 부분을 차지할 것이다. 부적절한 건설폐기물 처리에 의한 환경오염 및 환경파괴문제를 최소하기 위하여 발생량 데이터베이스 구축과 건설폐기물 발생량 예측방법이 필요하다. 바로 이러한 건설폐기물 발생량의 현실적인 예측을 위한 회귀모델을 제시하는 것을 본 연구의 목적으로 한다. 이 회귀모델은 건설공사의 실행예산을 작성하는 단계에서 폐기물 발생량을 좀더 정확하게 예측함으로써 효율적인 건설현장 환경관리가 가능하게 해주는 하나의 방법으로 제시하고자 한다. 건설회사들이 폐기물 발생량에 대해 지속적인 관심을 가진다면, 꾸준한 실적데이터 데이터베이스화를 통한 회귀모델로도 사전에 어느 정도 폐기물 발생량을 정확하게 예측할 수 있을 것이다. 이처럼 방법론적인 관점에서 하나의 모델을 제시했다는 데 연구 의의를 찾을 수 있을 것이다.

  • PDF

로그 회귀분석 및 CART를 활용한 수력사업의 CDM 승인여부 예측 모델에 관한 연구 (Predicting the success of CDM Registration for Hydropower Projects using Logistic Regression and CART)

  • 박종호;구본상
    • 한국건설관리학회논문집
    • /
    • 제16권2호
    • /
    • pp.65-76
    • /
    • 2015
  • 청정개발체제(CDM) 사업은 신재생에너지사업의 보조를 통해 지구온난화 가스의 감축을 꾀하는 대표적인 국가 및 기업 간 배출권 거래(cap and trade)제도이다. 재래식 발전 방식에 비해 수익성이 낮은 태양광, 풍력, 수력 등의 사업이 CDM 사업으로 승인을 받으면 매년 탄소배출권(CER)을 제공받고, 이의 판매를 통해 발생한 추가 수익으로 인해 사업 타당성이 향상될 수 있다. 그러나 CDM 사업으로 인정받기 위해서는 환경적, 기술적, 경제적 추가성(Additionality)를 입증해야 하는데, 해당 적용 기술, 베이스라인 측정 방법론, 온실 가스 감축량, 사업 내부 수익률(IRR) 등 다수의 변수에 따라 결과가 달라지기 때문에 사전적으로 승인여부를 파악하기가 어렵다. 본 연구에서는 신재생에너지로 분류되는 수력 사업의 CDM 승인여부를 예측할 수 있는 모델을 개발하는 것을 목표로 하였다. 구체적으로 UNFCCC에서 제공하는 수력 사업 데이터를 활용하여 로그 회귀분석 및 CART 분석을 실시하여 예측모델을 개발하였으며 이와 함께 승인 여부에 유의하게 영향을 미치는 핵심 인자들을 파악하였다. 구축된 로그 회귀 및 CART 예측모델은 AUC가 각각 0.7674 및 0.7231로 예측 정확성이 비교적 높게 나왔다. 또한 수력 사업에서는 온실가스 저감량 대비 투자액, 시간당 발전량 및 내부수익률이 승인여부에 유의한 변수들로 파악되었고, 이에 비해 특정 기술이나 측정 방법론은 영향이 없는 것으로 드러났다. 즉, 특정 기술을 불문하고 온실가스를 투자 대비 가장 효율적으로 저감하는 사업과 수력사업들 중 상대적으로 소규모로 진행되는 사업이 CDM 사업으로 승인될 가능성이 높다는 것으로 해석된다.

풍속 예측 보정을 위한 Genetic Programing 탐색 기법의 개선 (Improvement of Search Method of Genetic Programing for Wind Prediction MOS)

  • 오승철;서기성
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2015년도 제46회 하계학술대회
    • /
    • pp.1349-1350
    • /
    • 2015
  • 풍속은 다른 기상요소들보다 순간 변동이 심하고 국지성이 강하여 수치 예보 모델만으로 예측의 정확성을 높이기가 어렵다. 기상청의 단기 풍속 예보는 전 지구적 통합 예보모델인 UM(Unified Model)의 예측값에 MOS(Model Output Statictics)를 통한 보정을 수행하며, 보정식의 생성에 다중선형회귀분석 방법을 사용한다. 본 연구자는 유전프로그래밍(Genetic Programming)을 이용한 비선형 회귀분석 기반의 보정식 생성을 통하여 이를 개선한 바 있는데, 본 연구에서는 보다 향상된 성능을 얻기 위하여 GP 기법 측면에서 Automatically Defined Functions과 다군집(Multiple Populations) 수행을 통해 성능을 높이고자 한다.

  • PDF

딸기 수경 재배 환경에서의 다중 선형 회귀 모델 기반의 양액 적정 흡수량 분석 연구 (An Analysis Study for Optimal Uptake of Nutrient Solution Based on Multiple Linear Regression Model in Strawberry Hydroponic Environments)

  • 임종현;이명배;조현욱;신창선;박장우;조용윤
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.578-580
    • /
    • 2019
  • 우리 나라의 딸기 수경재배 면적은 2002년 5ha로 시작해서, 2007년에는 84ha, 2012년에는 317ha, 2017년에 1,575ha로 매년 30% 이상 급속하게 성장하고 있다. 이런 경향은 수경재배가 토양재배보다 작업이 용이하여 노동시간이 절약되며, 수량을 더 많이 생산할 수 있기 때문이다. 하지만, 공급양액을 배액으로 흘려버리는 비순환식 수경재배 방식이 증가 하면서 환경오염을 유발시킬 뿐만 아니라 수경재배 운영비용의 증가를 가져오고 있다. 본 논문은 작물 생장에 최적화된 양액공급을 위해 상관관계 분석 및 다중 선형 회귀 모델 기반의 딸기 수경재배 환경에서의 최적 양액 흡수량을 분석하고 추정해 보았다. 분석 결과, 수경재배 환경정보(일사량, 온도, 습도, CO2 등)를 대상으로 일사량 및 온도가 습도 및 CO2에 비해 딸기재배를 위한 양액 흡수량에 더 큰 영향을 주는 것으로 분석되었고, 다중 선형 회귀 모델을 통한 회귀식의 R-Square값은 0.358으로 나타났다.

통신 소프트웨어의 프로그램 결함과 복잡도의 관련성 분석을 위한 회귀분석 모델 (Regression Analysis of the Relationships between Complexity Metrics and Faults on the Telecommunication Program)

  • 이경환;정창신;황선명;조병규;박지훈;김강태
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권11호
    • /
    • pp.1282-1287
    • /
    • 1999
  • 통신 프로그램은 고도의 신뢰성과 기능성, 확장성, 그리고 유지 보수성이 필요하다. 프로그램 테스트의 결과와 McCabe의 Complexity를 측정한 데이타를 가지고 회귀모델을 만들고 그 신뢰성을 분석함으로서 프로그램의 결함과 복잡도의 관련성을 평가한다.본 연구에서 사용한 통신 프로그램은 500개 블록이 59가지 기능을 수행하는 교환 기능 중에서 복잡도가 너무 많아서 통계 처리의 bias가 될 블록을 제외하고 394 블록을 선정하여 SAS에 의해서 통계 분석을 하고 회귀 분석 모델을 설계하였다. t 분포에 의하여 방정식의 유의성 수준을 검증하고 프로그램의 결함수에 가장 큰 영향을 주고 있는 복잡도가 McCabe의 복잡도와 설계 복잡도 임을 밝혀냈다. 이 연구 결과에 의해서 설계 정보 및 유지 보수 정보를 얻을 수 있다. Abstract Switching software requires high reliability, functionality, extendability and maintainability. For doing, software quality model based on MaCabe's complexity measure is investigated. It is experimentally shown using regression analysis the program fault density depends on the complexity and size of the function unit. The software should be verified and tested if it satisfies its requirements with automated analysis tools. In this paper we propose the regression model with the test data.The sample program for the regression model consists of more than 500 blocks, where each block compose of 10 files, which has 59 functions of switching activity.Among them we choose 394 blocks and analyzed for 59 functions by testing tools and SAS package. We developed Regression Analysis Model and evaluated significant of the equation based on McCabe's cyclomatic complexity, block design complexity, design complexity, and integration complexity.The results of our experimental study are that number of fault are under the influence of McCabe's complexity number and design complexity.