• 제목/요약/키워드: 주성분회귀분석

검색결과 152건 처리시간 0.027초

한국프로야구에서 선발투수의 투수능력지수 제안 - 대체선수대비승수 (WAR)을 중심으로 (Suggestion of starting pitcher ability index in Korea baseball - Focusing on the sabermetrics statistics WAR)

  • 김현규;이제영
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권4호
    • /
    • pp.863-874
    • /
    • 2017
  • 야구선수들의 능력을 측정하는 많은 세이버메트릭스 통계량들 중에서 대체선수대비승수 (WAR)은 가장 많이 사용되는 통계량이다. WAR의 장점은 투수와 타자처럼 서로 다른 포지션임에도 불구하고 선수들의 WAR을 비교할 수 있다는 점이다. 하지만 WAR은 복잡한 형태로 일반적으로 제공되는 기록만으로 구하기 어렵다. 따라서 본 논문에서는 지난 3년간 (2014-2016년) 한국프로야구 기록 자료를 바탕으로 세이버메트릭스 변수를 계산한 뒤, 이를 이용하여 WAR을 대체할 수 있는 선발투수능력지수를 제안한다. 선발투수능력지수는 산술평균방법, 가중평균방법, 주성분회귀분석 등을 통해 산출한 뒤, WAR과 비교하여 가장 관계가 높은 방법을 선택하였다. 이는 선발투수의 능력을 파악하는데 유용하게 사용될 것이다.

희소주성분분석을 이용한 텍스트데이터의 단어선택 (Feature selection for text data via sparse principal component analysis)

  • 손원
    • 응용통계연구
    • /
    • 제36권6호
    • /
    • pp.501-514
    • /
    • 2023
  • 텍스트데이터는 일반적으로 많은 단어로 이루어져 있다. 텍스트데이터와 같이 많은 변수로 구성된 데이터의 경우 과적합 등의 문제로 분석에 있어서의 정확성이 떨어지고, 계산과정에서의 효율성에도 문제가 발생하는 경우를 흔히 볼 수 있다. 이렇게 변수가 많은 데이터를 분석하기 위해 특징선택, 특징추출 등의 차원 축소 기법이 자주 사용되고 있다. 희소주성분분석은 벌점이 부여된 최소제곱법 중 하나로 엘라스틱넷 형태의 목적함수를 사용하여 유용하지 않은 주성분을 제거하고 각 주성분에서도 중요도가 큰 변수만 식별해내기 위해 활용되고 있다. 이 연구에서는 희소주성분분석을 이용하여 많은 변수를 가진 텍스트데이터를 소수의 변수만으로 요약하는 절차를 제안한다. 이러한 절차를 실제 데이터에 적용한 결과, 희소주성분분석을 이용하여 단어를 선택하는 과정을 통해 목표변수에 대한 정보를 이용하지 않고도 유용성이 낮은 단어를 제거하여 텍스트데이터의 분류 정확성은 유지하면서 데이터의 차원을 축소할 수 있음을 확인하였다. 특히 차원축소를 통해 고차원 데이터 분석에서 분류 정확도가 저하되는 KNN 분류기 등의 분류 성능을 개선할 수 있음을 알 수 있었다.

주성분 분석법을 이용한 회귀다항식 기반 모델 및 패턴 분류기 설계 (Design of Regression Model and Pattern Classifier by Using Principal Component Analysis)

  • 노석범;이동윤
    • 한국정보전자통신기술학회논문지
    • /
    • 제10권6호
    • /
    • pp.594-600
    • /
    • 2017
  • 본 논문에서는 매우 높은 차원을 가진 데이터에서 의미 있는 특징 벡터 추출하여 입력 공간의 차원을 줄이기 위하여 주성분 분석법을 사용하였다. 주성분 분석법을 이용하여 축소된 차원을 가진 입력 데이터를 이용하여 회귀 다항식의 입력벡터로 사용하는 모델과 패턴 분류기의 설계 방법을 제안하였다. 제안된 모델 및 패턴 분류기는 매우 단순한 구조를 가진 회귀다항식을 기반으로 설계하여 모델 및 패턴 분류기의 과적합 문제를 해결 하고자 하였다. 제안된 설계방법을 적용하여 설계된 모델과 패턴 분류기의 성능을 비교 및 평가하기 위하여, 다양한 기계 학습 데이터 집합을 사용하였다.

한국 제조업의 임금결정에 대한 연구 : 외환위기 전·후를 중심으로 (The Study of Korean Manufacturing Industry Wage : Principal Components Regression Analysis)

  • 오유진;박성준;김유섭
    • 노동경제논집
    • /
    • 제28권1호
    • /
    • pp.61-82
    • /
    • 2005
  • 본 연구는 경제 위기 이후 한국 제조업의 산업간 임금격차가 경제위기 이전 그대로 유지되고 있는가의 여부와, 임금을 결정하는 메커니즘이 외환위기를 지나면서 어떻게 변화하였는가에 관하여 분석하였다. 분석에 사용된 자료는 1995년도와 1999년도 노동부의 "임금구조기본통계조사"이고, 주된 계량 기법으로는 요인분석(factor analysis)과 주성분 회귀분석(principal components regression)을 사용하였다. 분석 결과, 제조업의 산업간 임금격차는 더 벌어졌으며 임금결정의 주된 요인도 외환위기 이전에는 개인의 업무능력이었으나 위기 이후에는 사업체의 특성인 것으로 밝혀졌다.

  • PDF

데이터 마이닝을 통한 기술경영 전략 수립에 관한 연구 (Establishment of Strategy for Management of Technology Using Data Mining Technique)

  • 이준석;이준혁;김갑조;박상성;장동식
    • 한국지능시스템학회논문지
    • /
    • 제25권2호
    • /
    • pp.126-132
    • /
    • 2015
  • 기술예측은 현재까지 관측된 특정기술에 대한 데이터를 바탕으로 미래에 그 기술이 어떠한 상태가 될 지를 알아보는 것으로써 기술경영 전략 수립 시 유용하게 사용된다. 현재는 전문가 의견을 바탕으로 한 분석법을 이용하여 기술예측을 실시하고, 국가, 기업 그리고 연구자는 이를 근거로 연구개발의 방향 및 전략을 수립한다. 전문가의 의견을 바탕으로 하는 정성적 기술예측은 전문가마다 다른 결과를 예상할 수 있고, 여러 전문가의 의견을 수집하여야 하므로 많은 시간과 비용을 필요로 한다. 이러한 문제점을 극복하고 예측에 대한 객관성을 확보하여 기업의 연구개발 의사결정을 돕기 위해 정량적 예측법을 바탕으로 한 기술예측 방법이 연구되고 있다. 본 논문에서는 정량적 분석법에 기반 한 기술예측 방법론에 대한 연구를 제안한다. 제안된 방법은 데이터 수집, 주성분 분석, 그리고 데이터마이닝 기법 중 하나인 로지스틱 회귀분석을 이용한 예측 단계로 구성되어 있다. 본 연구에서는 무인자동차에 관련된 특허 문서를 이용하여 데이터를 수집 및 추출하고, 특허문서의 텍스트를 마이닝하여 분석이 가능한 형태로 구축한다. 주성분분석 후 추출된 주성분 점수를 이용하여 로지스틱 회귀분석을 실시하며 이를 바탕으로 개발현황 분석 및 기술예측을 시행한다.

철강 도금로의 예지보전을 위한 열화 기반 잔존수명 분석 (Degradation-Based Remaining Useful Life Analysis for Predictive Maintenance in a Steel Galvanizing Kettle)

  • 신준호;김창욱
    • 한국융합학회논문지
    • /
    • 제10권12호
    • /
    • pp.271-280
    • /
    • 2019
  • 제조산업 분야의 디지털트랜스포메이션의 일환인 스마트공장은 데이터 기반으로 모니터링 및 분석 그리고 예측을 통해서 의사결정 방식을 획기적으로 변화시키고 있다. 특히 설비에 대한 예지보전은 스마트공장의 핵심적인 요소로서 필요성이 증대되고 있다. 본 연구의 목적은 철강 도금공정의 예지보전을 위해 도금로 설비의 열화 특성을 고려한 잔존수명 분석과 예측모델을 산출하는 것이다. 상관성 분석, 다중회귀 분석, 주성분회귀 분석 그리고 시간의 경과에 따른 열화의 추이 파악을 위하여 이동회귀 방식을 제안하여 진행하였다. 그 결과 도금로 열화는 생산성 인자들과 주된 의존적 관계가 있으며, 특히 환경 온도 인자들의 영향성이 열화의 추이 변화에 관계가 있음을 추론할 수 있었다. 예측된 잔존수명을 활용하여 도금로 교체가 필요한 시점을 사전에 알려주는 예지보전을 구현하였다. 향후 설비의 열화 추이 파악에 본 연구에서 수행한 방안이 적절한 사례가 되어 보다 정합성 있는 예지보전 구현이 가능해지기를 기대한다.

서울시의 카셰어링 이용도에 대한 지역적 요인특성분석 (Study on the Local Factors Affecting Availability of Car-Sharing in Seoul)

  • 최현수;박준태
    • 한국철도학회논문집
    • /
    • 제17권5호
    • /
    • pp.381-389
    • /
    • 2014
  • 본 연구에서는 카셰어링 이용특성자료 및 GIS를 활용하여 입지특성과 관련된 도시 및 지역적 사회경제에 대한 DB를 구축하였으며, 주성분분석을 통해 잠재변수를 도출하였고 요인점수를 활용한 다중회귀분석을 통해 영향변수의 의미를 살펴보았다. 업무중심지역 및 역세권지역, 대학교인근지역에서의 활용도가 높았고, 특히, 전기차에 대한 관심도가 카셰어링 이용도에 영향을 미치는 것으로 파악되었다. 한편, 금융기관이 집중된 지역 및 영업용(택시)차량 배치가 많은 지역에서는 이용이 제한되는 것으로 나타났다. 본 연구의 분석결과는 향후의 카셰어링의 활성화와 공유가치에 대한 시민의 이해도 향상과 소유에서 공유로의 발상전환에 기여할 것으로 판단된다.

인공 신경망 기법을 이용한 제지공정의 지절 원인 분석

  • 이진희;이학래
    • 한국펄프종이공학회:학술대회논문집
    • /
    • 한국펄프종이공학회 2001년도 춘계학술발표논문집
    • /
    • pp.168-168
    • /
    • 2001
  • 제지공정의 지절 현상은 많은 공정 변수들이 복합적으로 작용하여 발생하는 가장 큰 공정 트러블 중의 하나이다. 지절은 생산량 감소 뿐만 아니라 발생 후 공정의 복구 와 정리, 생산재가동 및 공정의 재안정화를 위해 많은 시간과 비용, 그리고 노력이 투 입되어야 하므로 공정의 효율과 생산성을 크게 저하시키는 요인이다. 그러나 지절 현상 의 복잡성 때문에 이에 대해 쉽게 접근하거나 해결하지 못하고 있는 것이 현실이지만 그 필요성은 더욱 더 증대되고 있다. 본 연구에서는 최근 들어 각종 산업분야에서 복잡 한 공정상의 결점 발견 및 진단에 효과적이라고 인정받고 있는 예측 분석기법인 인공 신경망(artificial neural network) 시율레이션과 일반적인 통계기법 중의 하나인 주성분 분석을 이용하여 제지 공정의 지절 현상의 검토 가능성을 타진하였다. 인공신경망이란 인간두뇌에서 일어나는 자극-반응-학습과정을 모사하여 현실세계에 존재하는 다양한 현상들의 업력벡터와 출력상태 간의 비선형 mapping올 컴퓨터 시율 레이션을 통하여 분석하고자 하는 기법으로, 여러 가지 현상들을 학습을 통해서 인식하 는 신경망 내의 신경단위들이 병렬처리에 의해 많은 양의 자료에 대한 추론이나 판단 을 신속하고 정확하게 해주는 특징이 있으며 실시간 패턴인식이나 분류 응용분야에도 매우 매력적으로 이용되고 있는 방법이다. 이러한 인공 신경망 기법 중에서도 본 연구 에서는 퍼셉트론의 한계점을 극복하기 위하여 입력총과 출력층에 한 개 이상의 은닉층 ( (hidden layer)을 사용하여 다층 네트워으로 구성하고, 모든 입력패턴에 대하여 발생하 는 오차함수를 최소화하는 방향으로 연결강도를 조정하는 back propagation 학습 알고 리즘을 사용하였다. 지절의 원인으로 추정 가능한 공정인자들을 변수로 하여 최적의 인 공신경망을 구축하기 위해 학습률과 모멘트 상수의 변화 및 은닉층의 수와 출력층의 뉴런 수를 조절하는 동의 작업을 거쳐 네트워크의 정확도가 높은 인공신경망을 설계하 였다. 또한 이러한 인공신경망과의 비교분석을 위해 동일한 공정 데이터들올 이용하여 보편적으로 사용하는 통계기법 중의 하나인 주성분회귀분석을 실시하였다. 주성분 분석은 여러 개의 반응변수에 대하여 얻어진 다변량 자료의 다차원적인 변 수들을 축소, 요약하는 차원의 단순화와 더불어 서로 상관되어있는 반응변수들 상호간 의 복잡한 구조를 분석하는 기법이다. 본 발표에서는 공정 자료를 활용하여 인공신경망 과 주성분분석을 통해 공정 트러블의 발생에 영향 하는 인자들을 보다 현실적으로 추 정하고, 그 대책을 모색함으로써 이를 최소화할 수 있는 방안을 소개하고자 한다.

  • PDF

국적선사의 경쟁력 강화를 위한 한중정기항로 활성화 방안에 대한 실증연구 (An Empirical Study on the Activation Approach for the Competitive Power of Korean Shipping Company in the Korea-China Liner Routes)

  • 이용호
    • 한국항해항만학회지
    • /
    • 제27권2호
    • /
    • pp.163-170
    • /
    • 2003
  • 본 연구는 한중정기항로에서 국적선사 활성화 방안에 관한 실증연구이다. 본 연구를 위하여 한중항로의 국적정기선사, 중국적 정기선사, 3국적 정기선사 등의 종사자에 실문지 500매를 배포하여 290매 회수하였으며, 한중정기항로 국적선사 활성화 요인과 물동량 증대효과의 관련성을 검증하기 위하여 먼저, 설문문항의 신뢰성(Reliability)은 크론바하 알파(Cronbach's Alpha)에 의한 내적 일관성 검사법을 통하여 검정하였고, 독립변수의 구성타당성(Construct Validity)을 검정하기 위해서 변수들이 선형결합이라는 가정 하에 요인을 추출하는 주성분 법(Principal Components)을 이용한 요인분석(Factor Analysis)을 실시하였다. 그리고 연구가설을 검증하기 위하여 다변량 회귀분석(Multiple Regression Analysis)을 실시하였다.

주성분 분석을 이용한 목재 건조 중 발생하는 음향방출 신호의 해석 및 분류 (Analysis and Classification of Acoustic Emission Signals During Wood Drying Using the Principal Component Analysis)

  • 강호양;김기복
    • 비파괴검사학회지
    • /
    • 제23권3호
    • /
    • pp.254-262
    • /
    • 2003
  • 본 연구는 목재(참나무 판목 판재) 건조 중 발생하는 음향방출 신호에 대하여 목재 내 수분이동에 의한 신호와 표면할열에 의한 신호를 해석하고 분류하기 위하여 수행되었다. AE 신호의 특징값들에 대한 상관분석을 실시하여 상호의존성이 높은 변수를 제거한 후 주성분 분석을 실시하였다. AE 변수들을 독립변수로 한 분류기와 주성분들을 독립변수로 한 분류기에 대하여 분류성능을 비교하였다. 목재 건조 시 발생하는 표면할열과 수분이동에 따른 AE 신호 파형을 분석한 결과 대체적으로 표면할열에 의한 신호가 최대진폭이 크며 상승시간이 팎고 상대적으로 고주파의 신호인 것으로 분석되었다. 다중 회귀분석모델을 이용하여 수분이동에 의한 신호와 표면할열에 의한 신호를 분류할 수 있는 분류기를 개발하고 평가한 결과 개별 AE 변수들을 독립변수로 하는 분류기 보다 주성분들을 독립변수로 하는 분류기의 분류성능이 양호한 것으로 나타났다.