• 제목/요약/키워드: 주성분 회귀분석

검색결과 153건 처리시간 0.023초

국적선사의 경쟁력 강화를 위한 한중정기항로 활성화 방안에 대한 실증연구 (An Empirical Study on the Activation Approach for the Competitive Power of Korean Shipping Company in the Korea-China Liner Routes)

  • 이용호
    • 한국항해항만학회지
    • /
    • 제27권2호
    • /
    • pp.163-170
    • /
    • 2003
  • 본 연구는 한중정기항로에서 국적선사 활성화 방안에 관한 실증연구이다. 본 연구를 위하여 한중항로의 국적정기선사, 중국적 정기선사, 3국적 정기선사 등의 종사자에 실문지 500매를 배포하여 290매 회수하였으며, 한중정기항로 국적선사 활성화 요인과 물동량 증대효과의 관련성을 검증하기 위하여 먼저, 설문문항의 신뢰성(Reliability)은 크론바하 알파(Cronbach's Alpha)에 의한 내적 일관성 검사법을 통하여 검정하였고, 독립변수의 구성타당성(Construct Validity)을 검정하기 위해서 변수들이 선형결합이라는 가정 하에 요인을 추출하는 주성분 법(Principal Components)을 이용한 요인분석(Factor Analysis)을 실시하였다. 그리고 연구가설을 검증하기 위하여 다변량 회귀분석(Multiple Regression Analysis)을 실시하였다.

주성분 분석기법을 이용한 선박의 연료소비 예측에 관한 연구 (A Study on the Prediction of Fuel Consumption of a Ship Using the Principal Component Analysis)

  • 김영롱;김구종;박준범
    • 한국항해항만학회지
    • /
    • 제43권6호
    • /
    • pp.335-343
    • /
    • 2019
  • 최근 선박의 배기가스 규제가 강화되면서 연료소비량을 저감하기 위한 많은 방안들이 검토되고 있다. 그중에서도 선박으로부터 수집한 데이터를 활용하여 연료소모량을 예측하는 기계학습 모델을 개발하고자 하는 연구가 활발히 수행되고 있다. 하지만 많은 연구들이 학습모델의 주요 변수 선정이나 수집데이터의 처리 방법에 대한 고려가 미흡하였으며, 무분별한 데이터의 활용은 변수 간의 다중공선성 문제를 야기할 수도 있다. 본 연구에서는 이러한 문제점을 해결하기 위하여 주성분 분석을 이용하여 선박의 연료소비를 예측하는 방법을 제시하였다. 13K TEU 컨테이너 선박의 운항데이터에 주성분 분석을 수행하였으며, 추출한 주성분으로 회귀분석을 수행하여 연료소비 예측모델을 구현하였다. 평가용 데이터에 대한 모델의 설명력은 82.99%이었으며, 이러한 예측모델은 항해 계획 수립 시 운항자의 의사결정을 지원하고 항해 중 에너지 효율적인 운항상태 모니터링에 기여할 수 있을 것으로 기대된다.

호우피해자료에서의 고차원 자료 및 다중공선성 문제를 해소한 회귀모형 개발 (Development of Regression Models Resolving High-Dimensional Data and Multicollinearity Problem for Heavy Rain Damage Data)

  • 김정환;박지현;최창현;김형수
    • 대한토목학회논문집
    • /
    • 제38권6호
    • /
    • pp.801-808
    • /
    • 2018
  • 선형회귀모형의 학습은 일반적으로 자료의 개수가 설명변수의 개수보다 충분히 크고, 설명변수들 사이에 심각한 다중공선성이 없다는 가정 하에서 안정적으로 이루어진다. 본 연구에서는 이러한 가정이 위배되었을 경우 모형 학습의 어려움을 실제 호우피해자료를 분석함으로써 조명하였고, 이를 해결하기 위해 자료를 통합한 다음 주성분회귀모형 또는 능형회귀모형을 사용할 것을 검토하였다. 모형의 학습에 사용된 자료와 별도의 독립된 자료에서 제안된 모형들의 예측력을 평가하였고, 제안된 방법이 선형회귀모형보다 더 나은 예측력을 보이는 것을 확인하였다.

교통문화지수 영향요인에 의한 유형화와 영향정도에 관한 연구 (A Study on Patterning and Grading by the Impact of Traffic Culture Index)

  • 정철우;정헌영;고상선
    • 한국항해항만학회지
    • /
    • 제30권1호
    • /
    • pp.35-43
    • /
    • 2006
  • 본 연구는 교통안전공단과 사단법인 녹색교통운동이 공동으로 개발한 교통문화지수와 관련한 2002년과 2003년의 전국 81개 도시 자료를 토대로 통계적 분석을 행하여 이들 대상도시들을 유형화하고, 집단별 영향요인에 근거하여 교통사고 예방대책들을 제시하고자 하였다. 먼저 교통문화지수와 영향요인들에 대한 주성분분석 결과로는 4개의 주성분으로 구분 지울 수 있었으며, 도시 특성별 최적 집단 수는 4개가 적합한 것으로 나타났다. 또한 이들 유형화된 집단별 교통문화지수에의 영향요인을 단계별 다중 회귀분석법을 이용하여 분석한 결과, 4개 집단 모두 높은 설명력을 갖는 회귀모형을 구축할 수 있었다. 이에 따라 각 집단별 교통사고 예방대책들을 구체적으로 제시할 수 있었으며, 아울러 투자된 시설이 얼마나 교통사고 예방에 효과적이었는가를 분석할 필요성이 있음을 향후의 연구 과제로 제시하였다.

한국프로야구에서 타자능력지수 제안 - 대체선수대비승수(WAR)을 중심으로 (Suggestion of batter ability index in Korea baseball - focusing on the sabermetrics statistics WAR)

  • 이제영;김현규
    • 응용통계연구
    • /
    • 제29권7호
    • /
    • pp.1271-1281
    • /
    • 2016
  • 야구에서 타자의 능력을 측정하는 많은 세이버메트릭스 통계량들 중에서 대체선수대비승수(wins above replacement; WAR)은 가장 많이 쓰이는 통계량이다. WAR은 선수의 공격능력과 주루능력, 수비능력 등을 하나의 수치로 표현하는 방법이란 점에서 큰 장점을 가지고 있다. 본 논문에서는 지난 3년간(2013-2015년) 한국프로야구 기록 자료를 바탕으로 세이버메트릭스 변수들의 값을 구한 뒤, 이를 이용하여 WAR을 대체할 수 있는 타자능력지수를 제안하였다. 타자능력지수는 산술평균방법, 가중평균방법, 주성분회귀분석 등을 통해 산출하고 WAR과 비교하여 가장 관계가 높은 방법을 선택하였다.

희소주성분분석을 이용한 텍스트데이터의 단어선택 (Feature selection for text data via sparse principal component analysis)

  • 손원
    • 응용통계연구
    • /
    • 제36권6호
    • /
    • pp.501-514
    • /
    • 2023
  • 텍스트데이터는 일반적으로 많은 단어로 이루어져 있다. 텍스트데이터와 같이 많은 변수로 구성된 데이터의 경우 과적합 등의 문제로 분석에 있어서의 정확성이 떨어지고, 계산과정에서의 효율성에도 문제가 발생하는 경우를 흔히 볼 수 있다. 이렇게 변수가 많은 데이터를 분석하기 위해 특징선택, 특징추출 등의 차원 축소 기법이 자주 사용되고 있다. 희소주성분분석은 벌점이 부여된 최소제곱법 중 하나로 엘라스틱넷 형태의 목적함수를 사용하여 유용하지 않은 주성분을 제거하고 각 주성분에서도 중요도가 큰 변수만 식별해내기 위해 활용되고 있다. 이 연구에서는 희소주성분분석을 이용하여 많은 변수를 가진 텍스트데이터를 소수의 변수만으로 요약하는 절차를 제안한다. 이러한 절차를 실제 데이터에 적용한 결과, 희소주성분분석을 이용하여 단어를 선택하는 과정을 통해 목표변수에 대한 정보를 이용하지 않고도 유용성이 낮은 단어를 제거하여 텍스트데이터의 분류 정확성은 유지하면서 데이터의 차원을 축소할 수 있음을 확인하였다. 특히 차원축소를 통해 고차원 데이터 분석에서 분류 정확도가 저하되는 KNN 분류기 등의 분류 성능을 개선할 수 있음을 알 수 있었다.

가중치 산출방법에 따른 고객만족도지수의 비교 (Comparison of Customer Satisfaction Indices Using Different Methods of Weight Calculation)

  • 이상준;김용태;김성윤
    • 디지털융복합연구
    • /
    • 제11권12호
    • /
    • pp.201-211
    • /
    • 2013
  • 본 연구는 다양한 가중치 산출방법을 적용하여 각 차원별 가중치 및 고객만족도지수를 비교하고 시사점을 밝혀보고자 한다. 이를 위해 가중치 산출방법을 주관적 방법과 통계적 방법으로 구분하고, 다시 주관적 방법은 고정총합법, 그리고 통계적 방법은 상관분석, 회귀분석, 주성분분석, 요인분석, 구조방정식으로 세분화하였다. 연구결과 주관적 방법과 통계적 방법에 의한 가중치는 서로 차이가 있는 것으로 나타났고, 분석방법에 따른 가중치의 순위는 유사한 패턴으로 구분되었다. 그리고 가중치 산출방법에 따른 각 차원별 가중치는 큰 편차를 보여 차원간의 변별력 및 안정성에 차이를 나타냈다. 마지막으로 다양한 가중치 산출방법에 따른 고객만족도지수는 구조방정식, 회귀분석, 상관분석, 산술평균, 주성분분석, 고정총합법, 요인분석의 순으로 높게 나타났고, 각 방법론에 따른 고객만족도지수는 통계적으로 유의한 차이가 있는 것으로 나타났다.

주성분 분석법을 이용한 회귀다항식 기반 모델 및 패턴 분류기 설계 (Design of Regression Model and Pattern Classifier by Using Principal Component Analysis)

  • 노석범;이동윤
    • 한국정보전자통신기술학회논문지
    • /
    • 제10권6호
    • /
    • pp.594-600
    • /
    • 2017
  • 본 논문에서는 매우 높은 차원을 가진 데이터에서 의미 있는 특징 벡터 추출하여 입력 공간의 차원을 줄이기 위하여 주성분 분석법을 사용하였다. 주성분 분석법을 이용하여 축소된 차원을 가진 입력 데이터를 이용하여 회귀 다항식의 입력벡터로 사용하는 모델과 패턴 분류기의 설계 방법을 제안하였다. 제안된 모델 및 패턴 분류기는 매우 단순한 구조를 가진 회귀다항식을 기반으로 설계하여 모델 및 패턴 분류기의 과적합 문제를 해결 하고자 하였다. 제안된 설계방법을 적용하여 설계된 모델과 패턴 분류기의 성능을 비교 및 평가하기 위하여, 다양한 기계 학습 데이터 집합을 사용하였다.

철강 도금로의 예지보전을 위한 열화 기반 잔존수명 분석 (Degradation-Based Remaining Useful Life Analysis for Predictive Maintenance in a Steel Galvanizing Kettle)

  • 신준호;김창욱
    • 한국융합학회논문지
    • /
    • 제10권12호
    • /
    • pp.271-280
    • /
    • 2019
  • 제조산업 분야의 디지털트랜스포메이션의 일환인 스마트공장은 데이터 기반으로 모니터링 및 분석 그리고 예측을 통해서 의사결정 방식을 획기적으로 변화시키고 있다. 특히 설비에 대한 예지보전은 스마트공장의 핵심적인 요소로서 필요성이 증대되고 있다. 본 연구의 목적은 철강 도금공정의 예지보전을 위해 도금로 설비의 열화 특성을 고려한 잔존수명 분석과 예측모델을 산출하는 것이다. 상관성 분석, 다중회귀 분석, 주성분회귀 분석 그리고 시간의 경과에 따른 열화의 추이 파악을 위하여 이동회귀 방식을 제안하여 진행하였다. 그 결과 도금로 열화는 생산성 인자들과 주된 의존적 관계가 있으며, 특히 환경 온도 인자들의 영향성이 열화의 추이 변화에 관계가 있음을 추론할 수 있었다. 예측된 잔존수명을 활용하여 도금로 교체가 필요한 시점을 사전에 알려주는 예지보전을 구현하였다. 향후 설비의 열화 추이 파악에 본 연구에서 수행한 방안이 적절한 사례가 되어 보다 정합성 있는 예지보전 구현이 가능해지기를 기대한다.

서울시의 카셰어링 이용도에 대한 지역적 요인특성분석 (Study on the Local Factors Affecting Availability of Car-Sharing in Seoul)

  • 최현수;박준태
    • 한국철도학회논문집
    • /
    • 제17권5호
    • /
    • pp.381-389
    • /
    • 2014
  • 본 연구에서는 카셰어링 이용특성자료 및 GIS를 활용하여 입지특성과 관련된 도시 및 지역적 사회경제에 대한 DB를 구축하였으며, 주성분분석을 통해 잠재변수를 도출하였고 요인점수를 활용한 다중회귀분석을 통해 영향변수의 의미를 살펴보았다. 업무중심지역 및 역세권지역, 대학교인근지역에서의 활용도가 높았고, 특히, 전기차에 대한 관심도가 카셰어링 이용도에 영향을 미치는 것으로 파악되었다. 한편, 금융기관이 집중된 지역 및 영업용(택시)차량 배치가 많은 지역에서는 이용이 제한되는 것으로 나타났다. 본 연구의 분석결과는 향후의 카셰어링의 활성화와 공유가치에 대한 시민의 이해도 향상과 소유에서 공유로의 발상전환에 기여할 것으로 판단된다.