• 제목/요약/키워드: 주성분회귀분석

검색결과 152건 처리시간 0.028초

주성분분석을 이용한 소프트웨어 개발노력 추정능력 향상 (Improving Estimation Ability of Software Development Effort Using Principle Component Analysis)

  • 이상운
    • 정보처리학회논문지D
    • /
    • 제9D권1호
    • /
    • pp.75-80
    • /
    • 2002
  • Putnam은 소프트웨어 프로젝트에 참여하는 인력이 Rayleigh 분포를 따르는 SLIM 모델을 제시하였다. 이 모델에서 인력분포를 얻기 위해서는 총 개발노력과 개발 난이도를 추정해야 한다. 프로젝트 개발에 참여할 것인지 여부를 결정하기 위해서는 소프트웨어 생명주기의 초기단계에서 이 모수들을 보다 적확히 추정하는 것이 필요하다. Putnam은 시스템 속성들 중 강한 상관관계가 있는 변량을 제거하고 나머지 변량들만으로 총 개발노력과 개발 난이도를 추정하였다. 그러나 통계적 방법에 따라 변량들이 다르게 선택되며 모델의 성능에 차이가 발생한다. 본 논문은 Putnam 방법 대신 주성분분석을 이용하여 최적의 시스템 속성을 선택하였다. 모델의 성능분석 결과 주성분분석 방법이 Putnam의 방법보다 9.85% 성능향상을 보였다. 또한, 제안된 모델은 단순하고 쉽게 구현할 수 있다.

인공신경망을 이용한 상수관망 내 무수율 산정 (Calculation of Non-revenue Water Ratio through the Artificial Neural Network of Water Distribution System)

  • 장동우;최계운;박효선;조형근
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.120-120
    • /
    • 2017
  • 인천지역의 상수도공급은 팔당댐을 취수원으로 하여 도수, 송수관을 거쳐 인천지역 내 정수장을 통하여 각 급수지역까지 일원화된 관로시스템으로 공급되고 있다. 관망에서의 적절한 수압관리, 노후관로 교체사업 등은 급수관망 내 관로 사고위험을 줄일 수 있고, 누수량을 저감하여 무수율의 감소로 이어질 수 있다. 상수관망 내 누수에 영향을 주는 물리적, 운영적 요소를 파악하고, 이를 이용하여 누수해결을 위한 방법론을 제시하는 것은 매우 중요하다. 본 연구에서는 인천시 배수관망 데이터를 활용하여 통계분석 및 인공신경망을 통하여 무수율에 영향을 미치는 인자를 선별하고, 무수율과의 연관성을 분석하고자 하였다. 이를 위해 대상지역에 대한 시설현황 및 운영자료를 취득하고, 무수율 분석에 활용하였다. 인천시의 소블럭을 대상으로 관로노후도, 배수관연장, 평균관경, 급수전당 공급량, 누수발생 횟수, 용도지역, 관망구성 형태 등을 고려하여 무수율과의 관계분석을 위한 통계분석을 수행하였다. 특히 급수에 필요한 최소에너지와 관망에서 공급되는 에너지를 비교하기 위하여 관망해석 프로그램인 EPANET을 이용하여 관망내 절점에서의 수압과 수요량이 적용된 최소공급에너지를 활용하였고, 이를 통하여 블록 내 과잉공급에너지와 무수율의 영향성을 비교하였다. 최종적으로 산출된 주요인자에 대한 주성분분석, 분산분석, 다중회귀분석 등의 통계분석과 인공신경망에 의해 학습된 알고리즘을 통하여 산정된 무수율을 실측 무수율과 비교, 분석하였다. 인공신경망에 의해 산정된 무수율과 실측 무수율의 정확도를 평가하기 위하여 MAE, MSE, PBIAS 등의 정확도 평가와 산점도 분석을 수행하고, 상관계수를 도출하여 가장 정확한 방법을 결정하였다. 분석 결과 통계분석에 의한 다중회귀식으로 산출된 무수율 보다 인공신경망에 의한 무수율이 실측값에 더욱 근접한 것으로 나타났으며 이용된 뉴런의 수의 따라 산출결과가 상이하기 때문에 최적 뉴런의 수를 산정해야 할 필요가 있음을 확인하였다. 특히 사용된 상수관망 주요인자 중 주성분분석을 통하여 선정된 각 성분을 인공신경망에 적용시 더욱 정확한 무수율 예측이 가능한 것으로 나타났다.

  • PDF

가중치 산출방법에 따른 고객만족도지수의 비교 (Comparison of Customer Satisfaction Indices Using Different Methods of Weight Calculation)

  • 이상준;김용태;김성윤
    • 디지털융복합연구
    • /
    • 제11권12호
    • /
    • pp.201-211
    • /
    • 2013
  • 본 연구는 다양한 가중치 산출방법을 적용하여 각 차원별 가중치 및 고객만족도지수를 비교하고 시사점을 밝혀보고자 한다. 이를 위해 가중치 산출방법을 주관적 방법과 통계적 방법으로 구분하고, 다시 주관적 방법은 고정총합법, 그리고 통계적 방법은 상관분석, 회귀분석, 주성분분석, 요인분석, 구조방정식으로 세분화하였다. 연구결과 주관적 방법과 통계적 방법에 의한 가중치는 서로 차이가 있는 것으로 나타났고, 분석방법에 따른 가중치의 순위는 유사한 패턴으로 구분되었다. 그리고 가중치 산출방법에 따른 각 차원별 가중치는 큰 편차를 보여 차원간의 변별력 및 안정성에 차이를 나타냈다. 마지막으로 다양한 가중치 산출방법에 따른 고객만족도지수는 구조방정식, 회귀분석, 상관분석, 산술평균, 주성분분석, 고정총합법, 요인분석의 순으로 높게 나타났고, 각 방법론에 따른 고객만족도지수는 통계적으로 유의한 차이가 있는 것으로 나타났다.

주성분분석 및 다중회귀분석에 의한 제주도 토양유기물 및 $Al_o+1/2Fe_o$ 함량 분포 (Distribution of Organic Matter and $Al_o+1/2Fe_o$ Contents in Soils Using Principal Component and Multiple Regression Analysis in Jeju Island)

  • 문경환;임한철;현해남
    • 한국토양비료학회지
    • /
    • 제43권5호
    • /
    • pp.748-754
    • /
    • 2010
  • Soil Taxonomy의 새로운 Andisols목 토양의 분류체계에서 토양유기물 함량과 Ammonium oxalate 추출 Al함량과 Fe의 1/2함량의 합은 중요한 기준이다. 제주도는 토양생성환경이 다양하여 Andisols 토양을 포함하여 다양한 토양이 분포하고 있다. 이 논문은 제주도 토양을 대상으로 기후, 식생, 지형 등 여러 가지 환경변수들을 이용하여 토양유기물과 $Al_o+1/2Fe_o$의 함량을 추정할 수 있는 모형을 개발하고, 이를 이용하여 토양특성지도를 제작하기 위하여 수행하였다. 조사대상 지역의 321 지점에서 토양을 채취하여 토양유기물과 $Al_o+1/2Fe_o$ 함량을 분석하고, 각 토양시료 채취지점의 온도, 강우, 순일차생산량, 일사량, 증발산량, 해발고도, 토양생성에너지, 지형습윤지수, 주변과의 고도차, 해안과 정상으로부터의 거리 등의 환경변수들을 환경변수 지도를 제작하여 추출하였다. 여러 환경변수 간에는 서로 상관관계가 높게 나타나는 다중공선성을 나타내었으며, 이를 주성분분석에 의한 변수 변환으로 제거하였다. 주성분분석 결과를 바탕으로 변환된 변수들은 산악효과, 식생효과, 복잡 효과 등 3개의 주성분으로 축소할 수 있었고, 이 3개의 변수를 이용하여 토양유기물과 $Al_o+1/2Fe_o$ 함량을 예측할 수 있는 다중회귀모형을 구하였다. 이 모형들은 전체 토양유기물 변이의 52%와 전체 $Al_o+1/2Fe_o$ 변이의 37%를 설명할 수 있었다. 모형을 이용하여 제작된 토양유기물 지도는 토양도를 바탕으로 한 토양유기물 지도와 전체적인 형태에서 매우 유사한 형태를 나타내었다. 따라서 환경요인은 제주도 토양의 분포에 큰 영향을 미치는 것으로 판단되었고, 정량화할 수 있는 환경요인을 이용하여 토양특성지도를 제작할 수 있음을 구명하였다.

교량 모니터링 빅데이터를 이용한 광안대교의 교통량 의존 변위 추정 모델 (Traffic Volume Dependent Displacement Estimation Model for Gwangan Bridge Using Monitoring Big Data)

  • 박지현;신성우;김수용
    • 대한토목학회논문집
    • /
    • 제38권2호
    • /
    • pp.183-191
    • /
    • 2018
  • 본 연구에서는 차종별 교통량 데이터와 연직 변위 데이터의 상관관계를 바탕으로 광안대교의 차종별 교통량 데이터를 이용한 연직 변위 추정 모델을 개발하였다. 추정 모델의 개발 과정에서 구조화 회귀 분석에 기반한 모델링 방법과 주성분 분석법에 기반한 모델링 방법이 적용되었으며, 각각의 방법으로 개발된 모델의 변위 추정 성능을 비교 분석하였다. 개발된 모델을 이용하여 추정된 변위는 실측 변위와 유사한 것으로 분석되었으며, 이로부터 차종별 교통량 데이터를 광안대교의 교통량 의존 변위 추정에 적용 가능한 것을 알 수 있었다. 또한, 구조화 회귀 분석에 기반한 모델과 주성분 분석에 기반한 모델의 변위 추정 성능은 상호간에 큰 차이가 없다는 것을 알 수 있었다. 결론적으로 본 연구에서 개발한 차종별 교통량 데이터를 이용한 연직 변위 추정 모델은, 광안대교의 교통하중에 따른 거동 분석 등에 유효하게 활용될 수 있을 것으로 사료된다.

해상교통 조우데이터 요인분석에 관한 연구 (A Study on the Factor Analysis of the Encounter Data in the Maritime Traffic Environment)

  • 김광일;정중식;박계각
    • 한국지능시스템학회논문지
    • /
    • 제25권3호
    • /
    • pp.293-298
    • /
    • 2015
  • 해상교통상황에서 수집된 선박 조우(Encounter) 데이터 변수는 선박 충돌 및 근접사고(Near-Collision) 위험도를 통계적인 방법에 의한 분석이 가능하다. 본 연구에서는 선박 조우 데이터에서 추출되는 다수의 선박충돌위험도 평가 변수들을 요인분석(Factor Analysis)하여, 선박 조우데이터에서 충돌위험에 영향을 미치는 주요 요인을 결정하고자 한다. 각 요인 결정을 위해 선박조우데이터 변수 정규분포화 및 표준화를 수행한 후 주성분 분석(Principal Component Analysis)으로 요인을 결정하였다. 요인분석결과 선박 근접도 요인과 충돌회피변화요인으로 요약하였다.

기온 강수량 자료의 함수적 데이터 분석 (Functional Data Analysis of Temperature and Precipitation Data)

  • 강기훈;안홍세
    • 응용통계연구
    • /
    • 제19권3호
    • /
    • pp.431-445
    • /
    • 2006
  • 본 연구는 함수적 데이터 분석의 몇 가지 이론에 대해 소개하고 분석 기법을 실제 자료에 적용하는 내용을 다루었다. 함수적 데이터 분석의 이론적 내용으로 기저를 이용해 자료를 함수적 데이터로 표현하는 방법, 그리고 함수적 데이터의 변동성을 조사하는 주성분분석, 선형모형 등에 대해 살펴보았다. 그리고 우리나라 기온 데이터와 강수량 데이터를 대상으로 각각 함수적 데이터 분석 기법을 적용해 보았다. 또한, 기온과 강수량 데이터에 대해 함수적 회귀모형을 적합시켜 두 변수간의 함수관계를 살펴보았다.

IT산업 연구개발 투자의 경제적 효과 분석 (An Analysis of the Economic Effects of R&D Investment in the IT Industry)

  • 홍재표;최나린;김방룡
    • 한국통신학회논문지
    • /
    • 제37B권9호
    • /
    • pp.837-848
    • /
    • 2012
  • 본 연구에서는 IT산업의 연구개발 투자가 부가가치에 미치는 영향을 분석하기 위하여 IT산업을 방송통신기기, 정보기기, 전자부품으로 세분하고, 각 세부 산업별로 자본스톡, 노동투입, 연구개발스톡을 독립변수로 설정하여 다중회귀분석을 실시하였다. 분석 결과, 모든 산업부문에서 t-value와 R-square 값들은 유의한 것으로 나타났지만, 자기상관은 매우 높게 나타났다. 한편 정보기기산업에서는 연구개발스톡, 전자부품산업에서는 노통투입의 계수 값이 마이너스로 나타나서 다중공선성의 징후가 의심되었다. 본 연구에서는 Cochrane-Orcutt 절차와 주성분회귀분석을 통하여 자기상관 및 다중공선성의 문제를 해결하였다. 연구개발스톡이 부가가치에 미치는 영향을 분석한 결과, 방송통신기기산업의 연구개발투자가 정보기기산업이나 전자부품산업에 비해 훨씬 큰 영향을 미치는 것으로 추정되었다.

쌀의 KOH 농도별 붕괴양상에 따른 품종변이 해석 (Analysis of Varietal Variation in Alkali Digestion of Milled Rice at Several Levels of Alkali Concentration)

  • 최해춘;손영희
    • 한국작물학회지
    • /
    • 제38권1호
    • /
    • pp.31-37
    • /
    • 1993
  • 우리나라 주요 벼 재배품종 및 신육성계통(자포니카: 25품종, 통일형:8품종)에 대한 쌀 알칼리 붕괴성의 품종적 특이성을 분시검토하여 보고자 KOH 농도를 0.8-1.8까지 0.2% 간격으로 처리하여 농도별 쌀의 알칼리 붕괴반응을 조사하고 주성분분석법을 적용하여 품종적 유형을 분류하였다. 주성분분석에서 상위 2개 주성분치의 변이가 전변이량의 92%을 차지하였고 제1 및 제2 주요분치 좌표상의 품종분포에 따라 크게 4개 유형으로 군집화 시킬 수 있었다. 제 I 군에서는 전 KOH 농도에 걸쳐 거의 비슷하게 알칼리 붕괴성(ADV)가 낮은 도봉벼만 유일하게 분포하였고, 제 II군에는 1.4% KOH 농도에서 중간정도의 ADV 이면서 고-저 알칼리 농도 ADV간차가 중도인 백운찰벼, 신선찰벼 및 수원 34002 등 찰벼가 포함되어 있었다. 제 III군에는 1.4% KOH 농도에서 중-중고의 ADV 이면서 저-고 KOH 농도간 ADV 변화가 심했던 대부분의 통일형 품종과 자포니카 조생계가 분포되어 있었고 육도농림찰 001와 한강 찰벼등은 이 유형에 포함되어 있었다. 제 IV군에는 1.4% KOH 농도에서 ADV가 중고이상으로 높으면서 고-저 알칼리 농도 ADV간차가 중-중고인 중생 및 중만생 자포니카 품종들이 주로 분포 하였으며 조생인 금조벼가 이 유형에 속하였다. 여기서 제 1 주성분은 전 알칼리 농도에서 평균적으로 표현되는 붕괴성 정도였고 제 2 주성분은 저-고 KOH 농도의 ADV간 차 또는 KOH 농도에 따른 ADV 변화의 회귀계수와 밀접하게 관련된 요소였다. 1.2%-1.4% KOH 농도에서의 ADV는 저-고 KOH 농도간 ADV차와 2차 곡선 회귀계수를 나타내었다.

  • PDF

다변량 형질의 유전연관성에 대한 주성분을 이용한 회귀방법와 다변량 비모수 추세검정법의 비교 (Comparison of Principal Component Regression and Nonparametric Multivariate Trend Test for Multivariate Linkage)

  • 김수영;송혜향
    • 응용통계연구
    • /
    • 제21권1호
    • /
    • pp.19-33
    • /
    • 2008
  • 연속 형질(quantitative trait)에 영향을 미치는 유전자를 알아내기 위해 형제 쌍의 자료를 수집하여, 주로 이용되는 Haseman과 Elston (1972)의 최소제곱 회귀검정법으로 분석하는데 이는 단일 형질에 대한 분석법이다. 현실적으로 여러 형질들이 복잡하게 단일유전자 좌위(single locus)와 연관되어 있어 함께 수집하게 되는 경우에는, 이러한 연관된 여러 형질을 동시에 분석하는 유전연관성 검정법(linkage test)이 절실히 필요한 실정이다. Amos 등 (1990)은 주성분(principal component) 선형모형을 이용하여 Haseman과 Elston (1972)방법을 둘 이상의 형질의 다변량 분석법으로 확장시켰다. 그러나 이 검정방법은 통계량의 분포를 알 수 없기에 아직 제 1종 오류가 제대로 통제되지 못하는 문제를 가지고 있다. 본 논문에서는 이러한 다변량 형질 자료의 연관성검정에 있어 단일변량에 대한 비모수 추세검정법을 다변량 자료에 대한 분석법으로 확장시킨 통계량을 사용할 것을 제안한다. Amos 등 (1990)이 제안한 방법과 다변량 추세검정 통계량을 모의실험으로 생성한 연속형 형질자료에 적용하였을 때, 다변량 추세검정 통계량은 Amos 등 (1990) 방법에서의 여러 문제점이 발생되지 않을 뿐만 아니라 모의실험에서 제 1종 오류가 정해진 유의수준에 가까운 것을 확인하였고, 검정적이 더 높음을 볼 수 있었다.