• 제목/요약/키워드: 주성분 회귀분석

검색결과 153건 처리시간 0.026초

주성분 분석을 활용한 재현자료 생성 (Synthetic data generation by probabilistic PCA)

  • 박민정
    • 응용통계연구
    • /
    • 제36권4호
    • /
    • pp.279-294
    • /
    • 2023
  • 재현자료를 생성할 때 순차회귀 다중대체(SRMI)를 이용하는 방식이 가장 널리 알려져 있으며, 이를 구현한 소프트웨어로 R-패키지 synthpop이 활용되고 있다. 본 논문에서는 확률적 주성분 분석(PPCA)을 이용하여 재현자료를 생성하는 방안을 제안하고 2개의 데이터 세트를 이용한 모의실험으로 SRMI 방식과 PPCA 방식을 비교하였다. 모의실험에서 PPCA 방식으로 생성한 재현자료는 쌍별 상관계수를 기준으로 원자료와의 유사성이 가장 우수함을 확인하였다. 향후 PPCA 방식을 이용하여 시계열 자료에 대한 재현자료 생성을 연구하고자 한다.

주성분분석을 이용한 소프트웨어 개발노력 추정능력 향상 (Improving Estimation Ability of Software Development Effort Using Principle Component Analysis)

  • 이상운
    • 정보처리학회논문지D
    • /
    • 제9D권1호
    • /
    • pp.75-80
    • /
    • 2002
  • Putnam은 소프트웨어 프로젝트에 참여하는 인력이 Rayleigh 분포를 따르는 SLIM 모델을 제시하였다. 이 모델에서 인력분포를 얻기 위해서는 총 개발노력과 개발 난이도를 추정해야 한다. 프로젝트 개발에 참여할 것인지 여부를 결정하기 위해서는 소프트웨어 생명주기의 초기단계에서 이 모수들을 보다 적확히 추정하는 것이 필요하다. Putnam은 시스템 속성들 중 강한 상관관계가 있는 변량을 제거하고 나머지 변량들만으로 총 개발노력과 개발 난이도를 추정하였다. 그러나 통계적 방법에 따라 변량들이 다르게 선택되며 모델의 성능에 차이가 발생한다. 본 논문은 Putnam 방법 대신 주성분분석을 이용하여 최적의 시스템 속성을 선택하였다. 모델의 성능분석 결과 주성분분석 방법이 Putnam의 방법보다 9.85% 성능향상을 보였다. 또한, 제안된 모델은 단순하고 쉽게 구현할 수 있다.

인공신경망을 이용한 상수관망 내 무수율 산정 (Calculation of Non-revenue Water Ratio through the Artificial Neural Network of Water Distribution System)

  • 장동우;최계운;박효선;조형근
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.120-120
    • /
    • 2017
  • 인천지역의 상수도공급은 팔당댐을 취수원으로 하여 도수, 송수관을 거쳐 인천지역 내 정수장을 통하여 각 급수지역까지 일원화된 관로시스템으로 공급되고 있다. 관망에서의 적절한 수압관리, 노후관로 교체사업 등은 급수관망 내 관로 사고위험을 줄일 수 있고, 누수량을 저감하여 무수율의 감소로 이어질 수 있다. 상수관망 내 누수에 영향을 주는 물리적, 운영적 요소를 파악하고, 이를 이용하여 누수해결을 위한 방법론을 제시하는 것은 매우 중요하다. 본 연구에서는 인천시 배수관망 데이터를 활용하여 통계분석 및 인공신경망을 통하여 무수율에 영향을 미치는 인자를 선별하고, 무수율과의 연관성을 분석하고자 하였다. 이를 위해 대상지역에 대한 시설현황 및 운영자료를 취득하고, 무수율 분석에 활용하였다. 인천시의 소블럭을 대상으로 관로노후도, 배수관연장, 평균관경, 급수전당 공급량, 누수발생 횟수, 용도지역, 관망구성 형태 등을 고려하여 무수율과의 관계분석을 위한 통계분석을 수행하였다. 특히 급수에 필요한 최소에너지와 관망에서 공급되는 에너지를 비교하기 위하여 관망해석 프로그램인 EPANET을 이용하여 관망내 절점에서의 수압과 수요량이 적용된 최소공급에너지를 활용하였고, 이를 통하여 블록 내 과잉공급에너지와 무수율의 영향성을 비교하였다. 최종적으로 산출된 주요인자에 대한 주성분분석, 분산분석, 다중회귀분석 등의 통계분석과 인공신경망에 의해 학습된 알고리즘을 통하여 산정된 무수율을 실측 무수율과 비교, 분석하였다. 인공신경망에 의해 산정된 무수율과 실측 무수율의 정확도를 평가하기 위하여 MAE, MSE, PBIAS 등의 정확도 평가와 산점도 분석을 수행하고, 상관계수를 도출하여 가장 정확한 방법을 결정하였다. 분석 결과 통계분석에 의한 다중회귀식으로 산출된 무수율 보다 인공신경망에 의한 무수율이 실측값에 더욱 근접한 것으로 나타났으며 이용된 뉴런의 수의 따라 산출결과가 상이하기 때문에 최적 뉴런의 수를 산정해야 할 필요가 있음을 확인하였다. 특히 사용된 상수관망 주요인자 중 주성분분석을 통하여 선정된 각 성분을 인공신경망에 적용시 더욱 정확한 무수율 예측이 가능한 것으로 나타났다.

  • PDF

주성분분석 및 다중회귀분석에 의한 제주도 토양유기물 및 $Al_o+1/2Fe_o$ 함량 분포 (Distribution of Organic Matter and $Al_o+1/2Fe_o$ Contents in Soils Using Principal Component and Multiple Regression Analysis in Jeju Island)

  • 문경환;임한철;현해남
    • 한국토양비료학회지
    • /
    • 제43권5호
    • /
    • pp.748-754
    • /
    • 2010
  • Soil Taxonomy의 새로운 Andisols목 토양의 분류체계에서 토양유기물 함량과 Ammonium oxalate 추출 Al함량과 Fe의 1/2함량의 합은 중요한 기준이다. 제주도는 토양생성환경이 다양하여 Andisols 토양을 포함하여 다양한 토양이 분포하고 있다. 이 논문은 제주도 토양을 대상으로 기후, 식생, 지형 등 여러 가지 환경변수들을 이용하여 토양유기물과 $Al_o+1/2Fe_o$의 함량을 추정할 수 있는 모형을 개발하고, 이를 이용하여 토양특성지도를 제작하기 위하여 수행하였다. 조사대상 지역의 321 지점에서 토양을 채취하여 토양유기물과 $Al_o+1/2Fe_o$ 함량을 분석하고, 각 토양시료 채취지점의 온도, 강우, 순일차생산량, 일사량, 증발산량, 해발고도, 토양생성에너지, 지형습윤지수, 주변과의 고도차, 해안과 정상으로부터의 거리 등의 환경변수들을 환경변수 지도를 제작하여 추출하였다. 여러 환경변수 간에는 서로 상관관계가 높게 나타나는 다중공선성을 나타내었으며, 이를 주성분분석에 의한 변수 변환으로 제거하였다. 주성분분석 결과를 바탕으로 변환된 변수들은 산악효과, 식생효과, 복잡 효과 등 3개의 주성분으로 축소할 수 있었고, 이 3개의 변수를 이용하여 토양유기물과 $Al_o+1/2Fe_o$ 함량을 예측할 수 있는 다중회귀모형을 구하였다. 이 모형들은 전체 토양유기물 변이의 52%와 전체 $Al_o+1/2Fe_o$ 변이의 37%를 설명할 수 있었다. 모형을 이용하여 제작된 토양유기물 지도는 토양도를 바탕으로 한 토양유기물 지도와 전체적인 형태에서 매우 유사한 형태를 나타내었다. 따라서 환경요인은 제주도 토양의 분포에 큰 영향을 미치는 것으로 판단되었고, 정량화할 수 있는 환경요인을 이용하여 토양특성지도를 제작할 수 있음을 구명하였다.

교량 모니터링 빅데이터를 이용한 광안대교의 교통량 의존 변위 추정 모델 (Traffic Volume Dependent Displacement Estimation Model for Gwangan Bridge Using Monitoring Big Data)

  • 박지현;신성우;김수용
    • 대한토목학회논문집
    • /
    • 제38권2호
    • /
    • pp.183-191
    • /
    • 2018
  • 본 연구에서는 차종별 교통량 데이터와 연직 변위 데이터의 상관관계를 바탕으로 광안대교의 차종별 교통량 데이터를 이용한 연직 변위 추정 모델을 개발하였다. 추정 모델의 개발 과정에서 구조화 회귀 분석에 기반한 모델링 방법과 주성분 분석법에 기반한 모델링 방법이 적용되었으며, 각각의 방법으로 개발된 모델의 변위 추정 성능을 비교 분석하였다. 개발된 모델을 이용하여 추정된 변위는 실측 변위와 유사한 것으로 분석되었으며, 이로부터 차종별 교통량 데이터를 광안대교의 교통량 의존 변위 추정에 적용 가능한 것을 알 수 있었다. 또한, 구조화 회귀 분석에 기반한 모델과 주성분 분석에 기반한 모델의 변위 추정 성능은 상호간에 큰 차이가 없다는 것을 알 수 있었다. 결론적으로 본 연구에서 개발한 차종별 교통량 데이터를 이용한 연직 변위 추정 모델은, 광안대교의 교통하중에 따른 거동 분석 등에 유효하게 활용될 수 있을 것으로 사료된다.

해상교통 조우데이터 요인분석에 관한 연구 (A Study on the Factor Analysis of the Encounter Data in the Maritime Traffic Environment)

  • 김광일;정중식;박계각
    • 한국지능시스템학회논문지
    • /
    • 제25권3호
    • /
    • pp.293-298
    • /
    • 2015
  • 해상교통상황에서 수집된 선박 조우(Encounter) 데이터 변수는 선박 충돌 및 근접사고(Near-Collision) 위험도를 통계적인 방법에 의한 분석이 가능하다. 본 연구에서는 선박 조우 데이터에서 추출되는 다수의 선박충돌위험도 평가 변수들을 요인분석(Factor Analysis)하여, 선박 조우데이터에서 충돌위험에 영향을 미치는 주요 요인을 결정하고자 한다. 각 요인 결정을 위해 선박조우데이터 변수 정규분포화 및 표준화를 수행한 후 주성분 분석(Principal Component Analysis)으로 요인을 결정하였다. 요인분석결과 선박 근접도 요인과 충돌회피변화요인으로 요약하였다.

기온 강수량 자료의 함수적 데이터 분석 (Functional Data Analysis of Temperature and Precipitation Data)

  • 강기훈;안홍세
    • 응용통계연구
    • /
    • 제19권3호
    • /
    • pp.431-445
    • /
    • 2006
  • 본 연구는 함수적 데이터 분석의 몇 가지 이론에 대해 소개하고 분석 기법을 실제 자료에 적용하는 내용을 다루었다. 함수적 데이터 분석의 이론적 내용으로 기저를 이용해 자료를 함수적 데이터로 표현하는 방법, 그리고 함수적 데이터의 변동성을 조사하는 주성분분석, 선형모형 등에 대해 살펴보았다. 그리고 우리나라 기온 데이터와 강수량 데이터를 대상으로 각각 함수적 데이터 분석 기법을 적용해 보았다. 또한, 기온과 강수량 데이터에 대해 함수적 회귀모형을 적합시켜 두 변수간의 함수관계를 살펴보았다.

쌀의 KOH 농도별 붕괴양상에 따른 품종변이 해석 (Analysis of Varietal Variation in Alkali Digestion of Milled Rice at Several Levels of Alkali Concentration)

  • 최해춘;손영희
    • 한국작물학회지
    • /
    • 제38권1호
    • /
    • pp.31-37
    • /
    • 1993
  • 우리나라 주요 벼 재배품종 및 신육성계통(자포니카: 25품종, 통일형:8품종)에 대한 쌀 알칼리 붕괴성의 품종적 특이성을 분시검토하여 보고자 KOH 농도를 0.8-1.8까지 0.2% 간격으로 처리하여 농도별 쌀의 알칼리 붕괴반응을 조사하고 주성분분석법을 적용하여 품종적 유형을 분류하였다. 주성분분석에서 상위 2개 주성분치의 변이가 전변이량의 92%을 차지하였고 제1 및 제2 주요분치 좌표상의 품종분포에 따라 크게 4개 유형으로 군집화 시킬 수 있었다. 제 I 군에서는 전 KOH 농도에 걸쳐 거의 비슷하게 알칼리 붕괴성(ADV)가 낮은 도봉벼만 유일하게 분포하였고, 제 II군에는 1.4% KOH 농도에서 중간정도의 ADV 이면서 고-저 알칼리 농도 ADV간차가 중도인 백운찰벼, 신선찰벼 및 수원 34002 등 찰벼가 포함되어 있었다. 제 III군에는 1.4% KOH 농도에서 중-중고의 ADV 이면서 저-고 KOH 농도간 ADV 변화가 심했던 대부분의 통일형 품종과 자포니카 조생계가 분포되어 있었고 육도농림찰 001와 한강 찰벼등은 이 유형에 포함되어 있었다. 제 IV군에는 1.4% KOH 농도에서 ADV가 중고이상으로 높으면서 고-저 알칼리 농도 ADV간차가 중-중고인 중생 및 중만생 자포니카 품종들이 주로 분포 하였으며 조생인 금조벼가 이 유형에 속하였다. 여기서 제 1 주성분은 전 알칼리 농도에서 평균적으로 표현되는 붕괴성 정도였고 제 2 주성분은 저-고 KOH 농도의 ADV간 차 또는 KOH 농도에 따른 ADV 변화의 회귀계수와 밀접하게 관련된 요소였다. 1.2%-1.4% KOH 농도에서의 ADV는 저-고 KOH 농도간 ADV차와 2차 곡선 회귀계수를 나타내었다.

  • PDF

한강수계의 수문자료와 원수탁도의 상관관계 분석 (Analysis on the Correlation between Hydrological Data and Raw Water Turbidity of Han River Basin)

  • 정안철;강태운;김성원;정관수
    • 한국수자원학회논문집
    • /
    • 제49권1호
    • /
    • pp.1-9
    • /
    • 2016
  • 원활한 용수공급과 정수장의 효율적이고 경제적인 설계 유지 관리를 위해서 한강수계에 위치하고 있는 두 광역정수장의 원수탁도와 수문자료간의 상관관계를 분석하였다. 광역정수장의 취수원인 댐의 유입유량, 방류량, 강우를 수문자료로서 활용하였으며, 상관관계 분석을 위해서는 상관분석과 주성분분석 기법을 이용하였다. 또한, 탁도변화를 예측할 수 있는 회귀식을 제안하여 탁도 변화 예측을 수행하였다. 충주정수장의 원수탁도는 충주댐의 방류량(0.708)과 와부정수장의 원수탁도는 팔당댐의 유입량(0.805)과 높은 상관성이 높은 것으로 확인되었다. 상관성이 높은 시계열자료를 이용하여 제안한 회귀식의 탁도 예측치는 상수도시설기준에서 제시하고 있는 원수탁도 산정방법을 이용한 경우와 유사한 결과를 도출하였다. 본 연구의 결과는 장래의 원수탁도를 예측하여 추가적인 정수장 건설 및 기존 정수장의 효율적인 유지 관리를 위한 기초 자료를 제공할 수 있을 것으로 판단된다.

모바일 비디오기기 위에서의 중요한 객체탐색을 위한 문맥인식 특성벡터 선택 모델 (Context Aware Feature Selection Model for Salient Feature Detection from Mobile Video Devices)

  • 이재호;신현경
    • 인터넷정보학회논문지
    • /
    • 제15권6호
    • /
    • pp.117-124
    • /
    • 2014
  • 모바일 기기를 사용한 실시간 비디오 영상처리분야의 중요 객체탐색 및 추적의 문제에 있어서 난제는 복잡한 배경속에서 전경을 구분해 내는 일이다. 본 논문에서는 기계학습을 위한 특성벡터 선정의 문제를 위한 문맥인식 모델을 제시하여 잡음제거를 위한 기계학습기반의 구분자를 구현하였다. 수학적으로 NP-hard로 알려진 가장 가까운 이웃을 사용한 문맥인식 특성벡터 선정 알고리즘의 구현에 있어서, 본 논문은 연산횟수를 줄인 유사방법론에 대해 자세히 거론하였다. 또한, 문맥인식 성격을 가미한 특성벡터 선정을 통해 얻어진 특성 공간에서의 향상된 분리성에 대해 주성분 분석을 통해 엄밀한 분석결과를 제시하였다. 전반적인 성능 향상의 정도를 계측하기 위해 다양한 기계학습 방법론, 예를 들어, 다층신경망, 지원벡터기계, 나이브베이지안, 회귀분석 등을 사용해 비교결과를 제시하였다. 본 논문에서 제시한 방법론의 성능과 계산상 자원사용에 대한 내용을 결론으로 서술하였다.