• 제목/요약/키워드: 통계적 회귀모델

검색결과 136건 처리시간 0.026초

주성분분석을 이용한 소프트웨어 개발노력 추정능력 향상 (Improving Estimation Ability of Software Development Effort Using Principle Component Analysis)

  • 이상운
    • 정보처리학회논문지D
    • /
    • 제9D권1호
    • /
    • pp.75-80
    • /
    • 2002
  • Putnam은 소프트웨어 프로젝트에 참여하는 인력이 Rayleigh 분포를 따르는 SLIM 모델을 제시하였다. 이 모델에서 인력분포를 얻기 위해서는 총 개발노력과 개발 난이도를 추정해야 한다. 프로젝트 개발에 참여할 것인지 여부를 결정하기 위해서는 소프트웨어 생명주기의 초기단계에서 이 모수들을 보다 적확히 추정하는 것이 필요하다. Putnam은 시스템 속성들 중 강한 상관관계가 있는 변량을 제거하고 나머지 변량들만으로 총 개발노력과 개발 난이도를 추정하였다. 그러나 통계적 방법에 따라 변량들이 다르게 선택되며 모델의 성능에 차이가 발생한다. 본 논문은 Putnam 방법 대신 주성분분석을 이용하여 최적의 시스템 속성을 선택하였다. 모델의 성능분석 결과 주성분분석 방법이 Putnam의 방법보다 9.85% 성능향상을 보였다. 또한, 제안된 모델은 단순하고 쉽게 구현할 수 있다.

머신러닝 학습 알고리즘을 이용한 광주천 수질 분석에 대한 예측 모델 연구 (A Study on the Prediction Model for Analysis of Water Quality in Gwangju Stream using Machine Learning Algorithm)

  • 정유정;이정재
    • 한국전자통신학회논문지
    • /
    • 제19권3호
    • /
    • pp.531-538
    • /
    • 2024
  • 수질 환경의 중요성이 강조되고 있는 가운데 광주광역시 도시 하천의 수질개선을 위한 수질 지표는 수생 생태계에 영향을 미치는 중요한 요소로 정확한 예측이 필요하다. 본 연구에서는 XGBoost와 LightGBM 머신러닝 알고리즘을 활용하여 광주천의 중요한 지점인 하류 평촌교(PyeongchonBr)와 상류 방학교(BangHakBr_Gwangjucheon1) 수계의 수질 검사 항목 중 통계적 검증 결과 유의미한 항목인 질소(TN), 질산염(NO3), 암모니아 양(NH3) 세 가지 수질 지표를 예측하는 연구를 수행하였고, 회귀 모델 평가 지표인 RMSE를 이용하여 예측 모델의 성능을 평가하였다. 수계별 개별적인 모델을 구현하여 교차 검증 후 성능을 비교한 결과, XGBoost 모델이 뛰어난 예측 능력을 보였다

통계 분석을 통한 산사태 토석류 전이규준 모델 (A Statistical Mobilization Criterion for Debris-flow)

  • 윤석;이승래;강신항;박도원
    • 한국지반공학회논문집
    • /
    • 제31권6호
    • /
    • pp.59-69
    • /
    • 2015
  • 최근 들어 집중호우로 인한 산사태 및 토석류 피해가 종종 발생하고 있다. 이에 따라 산사태 재해 예측에 관한 연구 중 산사태 민감도 분석과 토석류 위험도 분석 관련 연구는 활발하게 진행되어 왔지만, 사면 지역에 적용하기 적합한 전이 분석 관련 연구는 부족한 실정이다. 본 연구에서는 판별분석과 로지스틱 회귀 분석과 같은 통계적 방법을 이용하여 실제 토석류가 발생했던 지역에서 추출한 지형학적 인자, 지질학적 인자 등을 토대로 토석류 전이규준을 제시하였다. 10개의 지형학적 및 지질학적 인자가 독립변수로 사용되었으며 실제 466개소(비전이: 228개소, 전이: 238개소)의 토석류 비전이 및 전이 데이터가 수집되었다. 우선, Fisher의 판별 분석이 수행되었으며, 수행 결과 실제경우와 91.6%의 분류 정확도를 보였다. 하지만 전이와 비전이 두 그룹간의 공분산 동질성이 만족되지 않았으며 또한 독립변수들이 정규분포를 보이지도 않았다. 두 번째로 이항 로지스틱 회귀분석이 수행되었으며, 분석 결과 92.3%의 분류 정확도를 나타냈으며 모든 통계적 조건들도 유의하게 나타났다. 따라서 이항 로지스틱 회귀 분석을 이용한 전이 규준은 토석류 재해 발생 여부를 예측하는데 효과적으로 사용될 수 있을 것으로 판단된다.

공간적 자기상관성과 관내사전투표와 본투표의 투표율: 제21대 총선 서울시 동별 분석 (Spatial Autocorrelation and the Turnout of the Early Voting and Regular Voting: Analysis of the 21st General Election at Dong in Seoul)

  • 임성학
    • 의정연구
    • /
    • 제26권2호
    • /
    • pp.113-140
    • /
    • 2020
  • 이 연구는 공간적 자기상관성(spatial autocorrelation)이라는 개념을 사용해 한국 선거를 처음으로 분석했다는 점에서 의미가 있다. 공간적 자기상관성이란, 공간상의 한 위치에서 발생하는 사건은 그 주변 지역에서 발생하는 사건과는 상관관계가 높다는 것을 의미한다. 제21대 총선 서울지역의 투표율을 관내 사전투표율과 본투표율로 나누고 투표율의 공간적 패턴이 나타나는지 살펴보았다. 기존의 연구가 선거구 단위를 토대로 분석한 것이 대부분이고 개인자료를 사용한 것이라면 이 연구에서는 좀 더 하위 단위인 읍면동 단위를 기준으로 분석했고 공간자료와 집합자료를 사용해 분석하였다. 본투표율의 모란 I (Moran's I) 지수는 0.261로 꽤 높은 공간적 자기상관성을 보인 반면 관내사전투표율의 지수는 0.095로 낮아 통계적 유의성이 있음에도 불구하고 공간적 자기상관성이 거의 없는 것으로 나타났다. 공간적 자기상관성이 강하게 나타난 본투표율을 OLS 회귀모델과 공간통계모델로 비교해 분석해보았다. 일반 회귀모델에서 결정계수인 R2가 0.585261에서, 공간오차모델에서는 0.656631로 상승하여 약 7퍼센트포인트의 설명력 증가를 볼 수 있어 공간통계모델이 설명력이 높다는 사실을 알 수 있었다. 가장 흥미로운 결과는 관내사전투표율과 본투표율의 관계인데, 관내사전투표율이 높은 동은 본투표율이 낮게 나오고, 관내사전투표율이 2% 정도 올라가면 본투표율은 약 1% 정도 떨어지는 것으로 조사되었다. 이 연구에서는 관내사전투표율과 본투표율에 영향을 미치는 변수는 매우 다르고, 관내사전투표율의 상승폭이 본투표율 하락폭과 다르다는 점에서 투표편의제공에 따른 분산효과로만 볼 수 없다는 것을 알 수 있어 기존 연구와 차별성을 가진다.

지질조건에 따른 자연사면 토층의 투수계수 산정모델 제안 (Proposal of Models to Estimate the Coefficient of Permeability of Soils on the Natural Terrain considering Geological Conditions)

  • 전덕찬;송영석;한신인
    • 지질공학
    • /
    • 제20권1호
    • /
    • pp.35-45
    • /
    • 2010
  • 본 연구에서는 10여년 동안 국내 산사태 발생지역 및 인근 미발생지역에서 채취된 자연사면에서의 토층을 대상으로 획득된 약 1,150여개소의 토질시험결과를 토대로 지질조건에 따른 토층의 평균 물성치를 산정하고, 통계적인 분석을 실시하여 지질조건별 투수계수에 대한 간편식을 제안하였다. 투수계수는 화강암지역과 이암지역에서 큰 것으로 나타났으며, 세립토함유량은 이암지역과 편마암지역에서 큰 것으로 나타났다. 지질조건에 따른 토층의 투수계수를 산정하기 위해서 상관성 분석을 실시한 결과 종속변수를 투수계수로 하고 독립변수를 세립토함유량, 함수비, 건조단위중량 및 간극비로 선정하였다. 회귀분석결과 지질조건별 제안된 선형회귀식에서는 공통적으로 세립토함유량 및 간극비가 가장 많이 포함되었다. 제안된 선형회귀식을 검증하기 위하여 타 지역의 토층을 대상으로 수행된 투수계수 측정결과와 선형회귀식으로 예측된 결과를 서로 비교하였다. 비교결과 일부 측정된 결과와 예측된 결과가 차이가 있는 것으로 나타났으나, 그 차이는 비교적 작은 것으로 나타났다. 본 연구에서 제안된 지질조건별 투수계수 산정을 위한 선형회귀식은 국내 지반을 대상으로 적용이 가능할 것으로 판단되나, 추후 지속적인 검증 및 수정이 필요할 것으로 판단된다.

개략적 일정추정표 기반 소프트웨어 개발노력과 일정 추정 (Estimation of Software Development Efforts and Schedule Based on A Ballpark Schedule Estimation Table)

  • 박영목
    • 인터넷정보학회논문지
    • /
    • 제8권4호
    • /
    • pp.105-117
    • /
    • 2007
  • 프로젝트 관리자는 입찰 또는 개발을 성공하기 위해 비용과 일정을 프로젝트 초기 단계에서 보다 정확히 추정해야만 한다. 평균적으로 대부분의 프로젝트들이 수행하고 있는 명목상의 개발기간은 경험법칙, 선형함수 추정경험 또는 개략적 일정 추정표로부터 유도할 수 있다. 명목상 개발기간에는 다양한 경험법칙이 존재하며, 선형함수 모델은 충분한 정보를 제공하지 못하여 특정 규모의 프로젝트에 적합한 개발노력과 일정을 결정하기 어렵다. 본 논문은 개략적 일정 추정표로부터 개발노력과 일정을 유도하는 통계적 회귀분석 모델을 제시하였다. 먼저, 개략적 일정 추정표에서 제시하고 있는 최대 단축기간, 효율적 개발기간과 명목상 개발기간을 재정의 하였다. 다음으로 개발노력과 기간과의 관계를 고찰하고, 개략적 일정추정표에 제시되지 않은 특정 규모의 소프트웨어에 대한 개발노력 추정 모델과 개발노력에 따른 일정을 보다 정확히 추정할 수 있는 모델을 제시하였다. 제시된 회귀분석 모델은 기존의 방법들과 비교하여 상대오차를 최대 2%까지 줄이는 효과를 얻었다. 또한, 특정 규모의 소프트웨어에 대해서도 개발노력과 일정을 추정할 수 있었다.

  • PDF

반응 표면 분석법을 이용한 일체형 흡착제의 합성 조건 최적화 (Optimization of Synthesis Condition of Monolithic Sorbent Using Response Surface Methodology)

  • 박하은;노경호
    • 공업화학
    • /
    • 제24권3호
    • /
    • pp.299-304
    • /
    • 2013
  • Box-Behnken design (BBD) 방법은 일체형 흡착제의 합성조건을 최적화하기 위해 사용되었다. 단량체(monomer)의 양(mL), 가교제(crosslink)의 양(mL), porogen의 양(mL)에 대한 효과를 조사했다. 실험 값은 여러 회귀분석 및 통계적인 방법에 의해 2차 다항 방정식을 얻었다. 이 모델의 결정계수($R^2$)는 0.9915이고 결정계수의 p value는 0.0001보다 작은 값으로 모델이 매우 유의미하다는 것을 나타낸다. RSM 모델에 의해 예측된 최적의 일체형 흡착제 합성조건은 단량체의 양 0.30 mL, 가교제의 양 1.40 mL, porogen의 양 1.47 mL이고 이 조건 아래서 합성된 일체형 흡착제의 양은 2120.15 mg이다. 이 결과는 이 모델이 적절하다는 것을 나타내었다.

도시경관 진단을 위한 평가모델 및 지표개발 연구 - 서울시를 중심으로 - (A Study on the Evaluative Models and Indicators for Diagnosis of Urban Visual Landscape - Focusing on Seoul City -)

  • 김승주;임승빈
    • 한국조경학회지
    • /
    • 제37권1호
    • /
    • pp.78-86
    • /
    • 2009
  • 본 연구는 경관계획 수립에 앞서 해당 도시의 주요 경관자원을 객관적인 기준으로 평가하고, 평가결과를 토대로 도시경관의 수준을 진단하여 향후 수립되는 경관계획의 방향설정에 기여하고자 도시경관 진단을 위한 평가모델 및 평가지표를 도출하고자 하였다. 이를 위해 도시 전체의 경관을 다루고 있는 경관계획 관리 연구사례의 경관구성요소를 비교 분석하여 거시적 경관 구성요소 중 수치화가 가능한 요소를 대상으로 물적지표를 추출하고, 해당 지역에 거주하는 시민을 대상으로 경관미 값을 평가하여 경관미 평균값을 종속변수로, 물적지표를 독립변수로 회귀분석을 통해 통계적으로 유의성이 검증된 회귀모델과 지표를 도출하고자 하였다. 본 연구의 결과는 다음과 같다. 첫째, 도시경관에 영향을 줄 수 있다고 판단되며, 수치화가 가능한 데이터들로서 범용화가 가능한 통계량으로 서울시 통계DB를 참고하여 공원전체면적률, 공원시가지면적률, 1인당 공원면적, 녹지전체면적률, 녹지시가지면적률, 녹지율, 하천전체면적률, 하천시가지면적률, 개발제한구역전체면적률, 개발제한구역시가지면적률, 상업지역전체면적률, 상업지역시가지면적률, 공업지역전체면적률, 공업지역시가지면적률, 공장용지전체면적률, 공장용지시가지면적률, 20층 이상 아파트단지 개소, 광로 연장비율 등 총 18개의 물적지표를 선정하였다. 둘째, 통계분석을 통해 통계적 유의성이 검증된 회귀모델의 공통적인 독립변수로 도출된 녹지전체면적률, 공원전체면적률, 20층 이상 아파트 단지 개소를 도시경관 진단을 위한 최종 평가지표로 선정하였다. 셋째, 녹지전체면적률, 공원전체면적률, 20층 이상 아파트 단지 개소의 표준화계수를 토대로 경관미 값에 녹지전체면적률이 가장 영향을 많이 미치는 것으로 나타났으며, 20층 이상 아파트단지 개소는 경관미 값과 부의 상관관계를 갖는 것으로 나타났다. 이와 같은 결과는 경관계획 관리의 방향을 제시해 주는 기초적인 자료가 될 것으로 판단되며, 향후 물적지표의 추가개발과 대상지 추가조사로 더욱 종합적인 경관미 예측모델과 평가지표 개발이 예상된다.

UV/$TiO_2$/HAP 시스템에서 Sulfamethoxazole의 흡착과 광촉매반응에 대한 동역학적 및 통계적 해석 (Kinetic and Statistical Analysis of Adsorption and Photocatalysis on Sulfamethoxazole Degradation by UV/$TiO_2$/HAP System)

  • 천석영;장순웅
    • 한국지반환경공학회 논문집
    • /
    • 제13권5호
    • /
    • pp.5-12
    • /
    • 2012
  • 항생제는 환경에 지속적인 노출과 저항성으로 인해 우려물질로 간주되고 있다. 항생제의 제한적인 생분해능에 따른 하수처리장에서의 불완전한 제거와 광범위한 사용으로 인해 상대적으로 많은 양이 환경에 방류되고 있는 실정이다. 이에 본 연구에서는 다양한 촉매(Titanium dioxide; $TiO_2$, Hydroxyapatite; HAP)를 통해 항생제의 하나인 sulfamethoxazole의 동역학적 흡착과 광촉매반응에 대해 연구하였으며, 부가적으로 통계적 분석방법인 반응표면법(RSM)을 이용하여 UV/$TiO_2$/HAP 시스템에서의 운전인자의 영향을 살펴보았다. 동역학적 연구결과로 $TiO_2$/HAP의 흡착반응은 유사 2차 반응을 따르는 것으로 나타났으며, 입자내 확산 모델의 적용 결과, 반응속도 상수는 각각 $TiO_2$=$0.064min^{-1}$, HAP=$0.2866min^{-1}$$TiO_2$/HAP=$0.3708min^{-1}$으로 나타났다. RSM의 결과로는 ANOVA에서의 회귀항의 유의성이 나타났으며(P-value<0.05) 높은 결정계수 값($R^2$=96.2%, $R^2_{Adj}$=89.3%)이 나타나 이차 회귀모델의 예측이 만족스러운 것으로 관찰되었다. 그리고 Y(SMX 제거율, %)에 대해 예측된 최적 조건들은 코드화된 인자 기준으로 각각 $x_1$(SMX의 초기농도)=-0.7828, $x_2$(촉매의 양)=0.9974 그리고 $x_3$(반응시간)=0.5738로 나타났다. 입자내 확산 모델과 광촉매 산화 반응의 결과에 따르면 $TiO_2$/HAP 공정이 일반적인 고도산화공정에 비해 효율적인 것으로 관찰되었다.

수도권(首都圈)에 있어서 도시교통발생특성(都市交通發生特性)과 그 예측모형(豫測模型) (Characteristics and Forecasting Models of Urban Traffic Generation in Seoul Metropolitan Area)

  • 김대웅;김언동
    • 대한토목학회논문집
    • /
    • 제6권2호
    • /
    • pp.45-55
    • /
    • 1986
  • 본(本) 연구(硏究)는 도시교통계획(都市交通計劃)에서 장래교통발생예측시(將來交通發生豫測時) 항상 문제(問題)로 되는 설명변수선택(說明變數選擇)의 애매성(曖昧性)을 해결(解決)하기 위하여 교통발생(交通發生)의 설명지표(說明指標)를 제안(提案)하는 동시(同時)에 최량(最良)의 도시교통발생(都市交通發生) Model을 작성(作成)하였다. 제안(提案)된 설명지표(說明指標)를 사용(使用)하여 목적별(目的別) 교통발생중회귀(交通發生重回歸) 모델을 작성(作成)하고, 단일변수(單一變數)로 설명(說明)이 가능(可能)한 것은 교통발생(交通발生)의 비손성(非負性)을 확보(確保)하기 위하여 단회귀(單回歸)모델로 수정(修正)하였다. 그러나 다변수(多變數)가 도입(導入)되어도 설명(說明)이 불충분(不充分)한 목적별(目的別) 교통(交通)(등교집중(等校集中)과 자유목적(自由目的)의 발생(發生)모델)은 동질(同質)의 토지이용활동(土地利用活動)으로부터 발생(發生)하는 교통(交通)의 발생특성(發生特性)이 유이(類似)함에 주목(注目)하여 각(各) zone을 특성별(特性別)로 분류(分類)하고 zone 군별(群別)로 교통발생(交通發生) 모델을 작성(作成)하여 통계적(統計的)으로 유의성(有意性)을 검토(檢討)하였다. 그리고 장래교통발생예측(將來交通發生豫測)은 단순(單純)하면서도 예측정도(豫測精度)의 제고(提高)가 바람직하므로 토지이용활동별(土地利用活動別)로 교통발생원단위(交通發生原單位)를 작성(作成)하고 안정성(安定性)을 고찰(考察)하여 교통발생예측시(交通發生豫測時) 실용가능(實用可能)한 원단위(原單位)를 제안(提案)하였다.

  • PDF