• 제목/요약/키워드: 주성분 요인

검색결과 276건 처리시간 0.034초

PCA 기법을 이용한 폐탄광 지역의 지반침하 관련 요인 추출 (Extract the main factors related to ground subsidence near abandoned underground coal mine using PCA)

  • 최종국;김기동
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2007년도 춘계학술대회 논문집
    • /
    • pp.301-304
    • /
    • 2007
  • 본 연구에서는 폐탄광 지역에서 발생하는 지반침하에 영향을 주는 주요 요인들을 추출하기 위하여 다변량 통계분석 방법의 하나인 주성분분석(Principle Component Analysis : PCA)기법과 지리정보시스템 (Geographic Information System : GIS)을 이용하였다. 이를 위해 연구지역에서 수행한 지표지질조사, 정밀조사, 실내암석시험 등으로부터 취득된 자료를 데이터베이스로 구축하고, 지반침하 위험지역 분포를 공간적으로 해석할 수 있는 지질, 토지이용, 경사도, 지표로부터 지하 갱도까지의 심도, 갱도의 지표상 위치로부터의 수평거리, 지하수심도, 투수계수, RMR(Rock Mass Rating) 값을 분석대상으로 선정하였다. 각 요인들이 연구지역 전체에 걸쳐 분포하도록 GIS의 공간분석 기법의 하나인 표면분석(Surface Analysis), 버퍼링기법(Buffering) 및 내삽법(Interpolation)을 이용하여 래스터 데이터베이스로 구축하고 이로부터 추출된 자료들을 입력값으로 하는 주성분분석을 수행하였다. 주성분분석 결과 폐탄광 지역의 지반침하에 영향을 주는 주요인을 추출하는 것이 가능하였으며, 연구지역은 지질 및 지반강도 관련 요인이 침하발생의 가장 큰 요인인 것으로 분석되었다.

  • PDF

주성분분석과 공통요인분석에 대한 비교연구: 요인구조 복원 관점에서 (A Comparative Study on Factor Recovery of Principal Component Analysis and Common Factor Analysis)

  • 정선호;서상윤
    • 응용통계연구
    • /
    • 제26권6호
    • /
    • pp.933-942
    • /
    • 2013
  • 본 연구에서는 시뮬레이션 방법을 사용해서 다양한 조건에서 주성분분석이 얼마나 잘 요인 구조를 복원할 수 있는지를 공통요인분석과 비교하여 체계적으로 평가하였다. 이 연구에서 요인 대 변수 비율, 공통성, 그리고 표본크기를 실험변수로 설정하였다. 주성분분석은 표본의 크기가 200개 이하인 경우 공통적으로 공통요인분석에 비해 더 우수한 요인구조의 복원력을 보여주었다. 특히, 요인 당 변수 수가 적은 경우, 주성분분석은 50개의 표본에서도 만족할 만한 수준의 요인복원능력을 보여주었다. 이와 더불어 공통성 수준 또한 낮은 경우 필요한 표본수는 100개로 늘어난다. 본 연구결과는 요인추출방법으로서 주성분분석의 선택의 근거를 제시하고 타당한 사용에 관한 가이드라인을 제시해 준다.

주성분 회귀모형을 이용한 과학기술 지식생산함수 추정 (Estimation of S&T Knowledge Production Function Using Principal Component Regression Model)

  • 박수동;성웅현
    • 기술혁신학회지
    • /
    • 제13권2호
    • /
    • pp.231-251
    • /
    • 2010
  • 과학기술 R&D 활동의 대표적 성과인 SCI 논문과 특허의 생산에 영향을 미치는 요인은 연구비, 연구원수, 지식스톡(R&D스톡, 논문스톡, 특허스톡 등), 연구환경, 개방화 정도, 인적자본, GDP 등 다양하다. 일반적인 회귀모형을 이용하여 논문 또는 특허의 생산에 영향을 미치는 요인을 추정하면 생산요인들 간에 다중공선성 문제가 발생하여 추정의 오류가 발생한다. 본 논문에서는 과학기술 지식생산에 영향을 미치는 요인들 간의 다중공선성 문제를 해결하기 위해 주성분 회귀모형을 이용하였다. SCI 논문을 산출로 가정한 과학생산성과와 특허를 산출로 가정한 기술생산성과에 영향을 미치는 요인을 회귀모형과 주성분 회귀모형을 이용하여 3가지 사례를 대상으로 비교 분석하였다. 일반 회귀모형을 이용하여 SCI 논문과 특허의 생산에 영향을 미치는 요인들을 분석한 결과, 요인들간에 다중공선성이 매우 높게 나타났고, 그 결과 회귀계수와 추정과 검정에 오류가 발생되었다. 반면 주성분 회귀모형을 이용하여 분석한 결과 다중공선성문제가 해결되어, 개별 생산요인에 대한 효과를 적절하게 추정할 수 있었다. 본 논문에서 제안한 주성분 회귀모형을 이용한 과학기술 지식생산함수 추정방법은 다중공선성이 강한 소수의 생산요소를 포함한 회귀분석에서 유용하게 적용될 수 있을 것이다.

  • PDF

다차원 데이터의 군집분석을 위한 차원축소 방법: 주성분분석 및 요인분석 비교 (A dimensional reduction method in cluster analysis for multidimensional data: principal component analysis and factor analysis comparison)

  • 홍준호;오민지;조용빈;이경희;조완섭
    • 한국빅데이터학회지
    • /
    • 제5권2호
    • /
    • pp.135-143
    • /
    • 2020
  • 본 논문은 농식품 소비자패널 데이터에서 소비자의 유형을 나눌 때에 변수간 연관성이 많은 장바구니 분석에서 전처리 방법과 차원축소의 방법을 제안한다. 군집분석은 다변량 자료에서 관측 개체를 몇 개의 군집으로 나눌 때 널리 사용되는 분석기법이다. 하지만 여러 개의 변수가 연관성을 가진 경우에는 차원축소를 통한 군집분석이 더 효과적일 수 있다. 본 논문은 1,987 가구를 대상으로 조사한 식품소비 데이터를 K-means 방법을 사용하여 군집화하였으며, 군집을 나누기 위해 17개의 변수를 선정하였고, 17개의 다중공선성 문제와 군집을 나누기 위한 차원축소의 방법 중 주성분 분석과 요인분석을 비교하였다. 본 연구에서는 주성분분석과 요인분석 모두 2개의 차원으로 축소하였으며 주성분분석에서는 3개의 군집으로 나뉘었지만 분석하고자 하였던 소비 패턴에 대한 군집의 특성이 잘 나타나지 않았으며 요인분석에서는 분석가가 보고자 하는 소비 패턴의 특징이 잘 나타났다.

최근 5년간 국내 연근해에서 발생한 해양사고에 대한 주성분분석 (Principal Component Analysis on Marine Casualties Occurred at Korean Littoral Sea in Recent 5 Years)

  • 김영식
    • 수산해양교육연구
    • /
    • 제28권2호
    • /
    • pp.465-472
    • /
    • 2016
  • 본 연구에서는 2010년부터 2014년까지 최근 5년간 우리 나라 주변해역에서 발생하여 중앙해양안전심판원의 재결을 마친 1417건의 해양사고에 대해 이를 25개 요인별로 분류하고, SPSS 통계 프로그램에 의한 주성분분석(Principal Component Analysis; PCA)을 행하여 이들 각 요인들의 상관성 및 주요 해양원인을 분석 고찰하였다. 얻어진 주요한 결과들을 요약하면 다음과 같다. 1. 해양사고의 주된 원인은 기관설비취급불량, 화기취급불량, 항행법규소홀, 침로선정유지불량, 경계소홀 등 기관실 및 조타실 관련 인적요인에 의해 발생한다. 2. 조타실 관련 인적요인에 의해 발생하는 사고는 충돌과 좌초 등이 큰 비중을 차지하며, 기관실 관련 인적요인에 의해 발생하는 사고유형은 주로 기관손상이나 화재폭발 등이다. 3. 주성분분석의 결과 제1주성분은 해양사고의 출현율을, 제2주성분은 해양사고의 원인을, 제3주 성분은 해양사고의 유형을 나타낸다.

수량화 이론을 이용한 도시부 터널 내 교통사고 영향요인에 관한 연구 - 부산광역시를 중심으로 - (Study on Influencing Factors of Traffic Accidents in Urban Tunnel Using Quantification Theory (In Busan Metropolitan City))

  • 임창식;최양원
    • 대한토목학회논문집
    • /
    • 제35권1호
    • /
    • pp.173-185
    • /
    • 2015
  • 본 연구는 통계적 분석기법을 통하여 부산시내에서 운영 중인 11개 터널에서 발생한 교통사고 456건을 대상으로 교통사고의 발생특성, 유형화 및 예측모델을 구축하였는바 다음과 같은 결론을 얻게 되었다. 교통사고 발생특성으로는 시간대별 터널 내 교통사고 08~18시 사이가 전체의 64.9%를 차지하고 있어 기존 도로의 45.8~46.1%에 비해 높게 나타났고, 사고유형별로는 차대차 사고가 대부분을 차지하고 있으며, 차량단독사고는 기존도로에 비해 다소 높게 나타났으며, 연령층별로는 21~40세의 구성비가 높았고, 제1당사자 차종별로는 화물차의 비중이 높았고, 운량별로는 맑은 날을 제외하고 비가 오는 날이 흐린 날 보다 더욱 높은 수치를 보였다. 교통사고 영향요인에 대하여 주성분분석을 실시한 결과, 제1주성분은 도로, 터널구조 및 교통류 관련요인이, 제2주성분은 조명시설 및 도로구조 관련요인이, 제3주성분은 대기상태 및 조명시설 관련요인이, 제4주성분은 인적 및 시계열 관련요인이, 제5주성분은 인적요인이, 제6주성분은 차량적 요인과 교통류 관련 요인이, 제7주성분은 기상요인으로 대별되었다. 교통사고 발생지점에 대하여 유형화를 실시한 결과, 최적 집단수는 5개로 구분지어 졌으며, 집단별로 수량화이론 1류를 적용하여 분석한 결과, 제1집단은 예측모델의 설명력이 낮은 반면 제4집단은 예측모델의 설명력이 중간정도, 제2, 제3, 제5집단은 높은 설명력을 가진 예측모델이 구축되었다. 예측모델의 편상관계수 절대 값이 0.2(약한 상관) 이상인 항목(주성분) 중에서 도로환경적 요인이 포함된 변수를 체크하여 분석한 결과, 주요 검토항목은 적절한 교통류 처리, 횡단구성(차로폭), 터널구조(터널길이), 도로선형, 환기시설, 조명시설로 요약되었다.

감 재배지 간 과실 품질 차이에 관계한 기온요인 분석 (Analysis of Air Temperature Factors Related to Difference of Fruit Characteristics According to Cultivating Areas of Persimmon (Diospyros kaki Thunb.))

  • 김호철;전경수;김태춘
    • 생물환경조절학회지
    • /
    • 제17권2호
    • /
    • pp.124-131
    • /
    • 2008
  • 본 연구에서는 감 재배지 간 과실 특성 차이에 관계한 기온 요인을 분석하고자 8개 단감 '부유' 재배지의 16개 기온요인과 과실 특성을 조사하여 주성분 및 다중회귀 분석을 실시하였다. 16개 기온요인 중 제1주성분은 12개 요인으로 이중 연 평균최저기온, 10월 평균기온, 연 평균최저극온, 생육기 평균기온의 영향력이 아주 높았다. 그리고 제2주성분은 4개 요인으로 4월에서 7월까지의 월 평균기온이었고 5월과 6월 평균기온의 영향력이 높았다. 이에 제2주성분까지 누적기여율은 91.4%로 재배지 간 기온 차이에 관여하는 기온 요인을 분석하는 데에는 충분하였다. 8개 재배지 중 5 재배지은 주요 기온요인이나 그 영향력에서 뚜렷한 차이를 나타내었다. 기온요인과 과실 특성 간 다중회귀분석에서 과고는 생육기 평균기온($X_8$) 겨울철 적산온도($X_6$) 영향을 뚜렷이 받으며 회귀식 $Y=150.55-5.375X_8+0.014X_6$을 나타내었고, 이 회귀식에 대하여 생육기 평균최저기온($X_9$), 적산온도($X_5$), 8월 평균기온($X_{12}$) 등이 영향을 주었다. 과경은 생육기 평균기온($X_8$, 부의 상관), 과육갈반정도는 생육기 평균최저기온($X_9$, 정의 상관), 과피색 $a^*$값은 연 평균최저기온($X_2$, 정의 상관)의 영향을 받는 것으로 나타났다.

직교요인을 이용한 국소선형 로지스틱 마이크로어레이 자료의 판별분석 (Local Linear Logistic Classification of Microarray Data Using Orthogonal Components)

  • 백장선;손영숙
    • 응용통계연구
    • /
    • 제19권3호
    • /
    • pp.587-598
    • /
    • 2006
  • 본 논문에서는 마이크로어레이 (microarray) 자료에 판별분석을 적용 시 나타나는 고차원 및 소표본 문제의 해결방법으로서 직교요인을 새로운 특징변수로 사용한 비모수적 국소선형 로지스틱 판별분석을 제안한다. 제안된 방법은 국소우도에 기반한 것으로서 다범주 판별분석에 적용될 수 있으며, 고려된 직교인자는 주성분 요인, 부분최소제곱 요인, 인자분석 요인 등이다. 대표적인 두 가지 실제 마이크로어레이 자료에 적용한 결과 직교요인들 중에서 부분최소제곱 요인을 특징변수로 사용한 경우 고전적인 통계적 판별분석보다 향상된 분류 능력을 나타내고 있음을 확인하였다.

주성분회귀분석에서 주성분선정을 위한 새로운 방법 (Procedure for the Selection of Principal Components in Principal Components Regression)

  • 김부용;신명희
    • 응용통계연구
    • /
    • 제23권5호
    • /
    • pp.967-975
    • /
    • 2010
  • 데이터마이닝 분야에서의 회귀모형에는 연관성이 높은 설명변수들이 포함되어 다중공선성을 유발하는 경우가 많은데, 다중공선성이 야기하는 문제를 해결하기 위하여 주성분회귀분석을 적용할 수 있다. 이 분석에서는 적절한 주성분을 선정하는 과정이 핵심인데, 기존의 선정방법들은 다중공선성을 잘 해결하지 못하거나 모형의 적합성을 저하시킨다는 지적을 받고 있다. 따라서 본 논문에서는 다중공선성 문제와 적합성 저하 현상을 동시에 해결할 수 있는 새로운 선정방법을 제안하였다. 다중공선성에 의해 최소제곱추정량의 분산이 팽창되는 문제를 주성분회귀에 의해 해결할 수 있지만, 주성분의 일부를 선정함에 따라 발생하는 편의도 동시에 통제해야 한다. 따라서 주성분회귀추정량의 평균제곱오차를 최소가 되게 하는 상태지수를 측정하고, 이 값에 영향을 미치는 주요 요인들을 컨조인트분석에 의해 파악하여 주성분 선정기준 모형을 구축하였다. 선정기준의 상한과 하한을 설정하고, 상태지수가 상한을 초과하면 해당 주성분을 제외시키고, 하한에 미달하면 해당 주성분을 포함시킨다. 그리고 상한과 하한 사이의 상태지수에 대응하는 주성분들에 대해서는 일반화선형검정을 순차적으로 적용하여 주성분을 선정하는 방법이다.