• 제목/요약/키워드: 주성분로지스틱회귀

검색결과 13건 처리시간 0.031초

로버스트추정에 바탕을 둔 주성분로지스틱회귀 (Principal Components Logistic Regression based on Robust Estimation)

  • 김부용;강명욱;장혜원
    • 응용통계연구
    • /
    • 제22권3호
    • /
    • pp.531-539
    • /
    • 2009
  • 로지스틱회귀분석은 고객관계관리를 위한 데이터마이닝 분야에서 많이 사용되는 기법인데, 이 분야의 모형설정 과정에서는 연관성이 매우 높은 설명변수들이 모형에 함께 포함되어 다중공선성의 문제를 유발하며, 더욱이 회귀자료에 이상점들이 포함되면 최우추정량은 심각한 결함을 갖게 된다. 두 가지 문제점을 동시에 해결하기 위하여 로버스트주성분로지스틱회귀를 적용할 수 있는데, 본 논문에서는 주성분의 선정기준을 결정하는 모형을 개발하고, 주성분모형에서의 추정치에 미치는 이상점의 영향을 축소하기 위한 로버스트추정법을 제안하였다. 제안된 추정법은 다중공선성과 이상점이 유발하는 문제들을 적절히 해결해 준다는 사실이 모의실험을 통하여 확인되었다.

로지스틱모형에서의 주성분회귀 (Principal Components Regression in Logistic Model)

  • 김부용;강명욱
    • 응용통계연구
    • /
    • 제21권4호
    • /
    • pp.571-580
    • /
    • 2008
  • 로지스틱회귀분석은 고객관계관리나 신용위험관리 등의 분야에서 많이 사용되는 기법인데, 이러한 분야에서의 로지스틱회귀모형에는 연관성이 높은 설명변수들이 다수 포함되어 다중공선성의 문제를 유발하는 경우가 있다. 다중공선성이 존재하는 상황에서 최우추정량은 심각한 결함을 갖는다는 사실은 잘 알려졌다. 이 문제를 해결하기 위하여 로지스틱주성분회귀를 연구하되, 분석상의 주요 과정인 주성분 선정을 위한 방법을 새롭게 제안하였다. 추정량의 분산을 최소가 되게 하는 상태지수 값을 측정하고, 이 값에 영향을 미치는 주요 요인들을 컨조인트분석에 의해 파악하여 주성분 선정기준을 결정하는 모형을 구축하였다. 제안된 방법은 다중공선성 문제를 적절히 해결하면서도 모형의 적합성을 향상시킨다는 사실이 모의실험을 통하여 확인되었다.

주성분 분석과 로지스틱 회귀분석을 이용한 다국 통화포트폴리오 전략 (Multi-currencies portfolio strategy using principal component analysis and logistic regression)

  • 심경식;안재준;오경주
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권1호
    • /
    • pp.151-159
    • /
    • 2012
  • 본 논문에서는 외환시장에서 주성분 분석과 로지스틱 회귀분석을 이용한 다국 통화 포트폴리오 전략을 개발하는 것을 제안한다. 과거 환율시장의 분석에 대한 많은 연구가 진행되어 왔으나 상대적으로 외환시장에서의 거래 전략을 개발하는 연구는 거의 없었다. 본 연구는 크게 두 가지 목적을 가지고 있다. 첫 번째 목적은 주성분 분석을 적용시켜 포트폴리오를 구성하는 다양한 나라의 환율에 가중치 할당 방법을 제안하는 것이다. 두 번째 목적은 로지스틱 회귀분석을 이용하여 구성된 포트폴리오의 적절한 매수시점과 매도시점을 정하는 것이다. 이 논문의 실험결과는 제안한 투자전략의 유용성을 증명할 수 있을 것이며, 또한 이를 통해 시장참여자들에게 투자 결정에 있어 도움을 줄 수 있을 것이다.

주성분회귀와 고유값회귀에 대한 감도분석의 성질에 대한 연구 (A study on the properties of sensitivity analysis in principal component regression and latent root regression)

  • 신재경;장덕준
    • Journal of the Korean Data and Information Science Society
    • /
    • 제20권2호
    • /
    • pp.321-328
    • /
    • 2009
  • 회귀분석에서 설명변수들 사이에 상관이 높으면 최소제곱추정법에서 구한 회귀계수들의 정도가 떨어진다. 다중공선성이라 불리는 이 현상은 실제 자료분석에서 심각한 문제를 야기시킨다. 이 다중공선성의 문제를 극복하기 위한 여러 가지 방법이 제안되었다. 능형회귀, 축소추정량 그리고 주성분분석에 기초한 주성분회귀와 고유값회귀등이 있다. 지난 수십 년간 많은 통계학자들은 일반적인 중 회귀에서 감도분석에 관해 연구하였으며, 주성분회귀, 고유값회귀와 로지스틱 주성분회귀에 대해서도 같은 주제로 연구하였다. 이 모든 방법에서 주성분분석은 중요한 역할을 하였다. 또한, 많은 통계학자들이 주성분분석과 관련된 다변량 방법에서 감도분석에 대해 연구를 하였다. 본 연구논문에서는 주성분회귀와 고유값회귀를 소개하고, 또한 주성분회귀와 고유값회귀에서 감도분석의 방법을 소개하고, 마지막으로 이들두방법에 대한 감도분석의 성질에 대해 논의하였다.

  • PDF

2017 International Ice Hockey Federation World Championship의 승리 결정요인 분석 (Factors Contributing to Winning in Ice Hockey: Analysis of 2017 Ice Hockey World Championship)

  • 이주성;김혜영;김채은;프라밧;문제헌
    • 한국체육학회지인문사회과학편
    • /
    • 제57권4호
    • /
    • pp.387-394
    • /
    • 2018
  • 본 연구의 목적은 국제아이스하키연맹(IIHF)이 개최하는 대회에서 승리 팀을 결정하는 주요 변인들을 파악하여 전략 및 전술 수립에 필요한 정보를 제공하는 것이다. 2017 IIHF World Championship 1부 리그 14개 팀의 예선 및 본선을 포함한 64개 경기의 기록지를 분석대상으로 하였다. 분석변인은 save, shot on goal, penalty in minute, time on power play, power play goal, face off win의 비율, 승패 간 로지스틱 회귀분석, 중다회귀분석, 주성분분석을 수행하였다. 로지스틱 회귀분석 결과 승리와 관련이 있는 변인은 shot on goal(p<.001)와 face off win(p<.001)이고 penalty in minute(p<.01)과 time on power play(p<.01)는 부정적인 영향을 미친다. 중다회귀분석에 의하여 산출한 승패 비율과 각 변인과의 상관분석에서는 save(p<.01), face off win(p<.001)가 정적인 상관관계이고 penalty in minute(p<.001)이 부정적인 상관관계이다. 주성분분석 결과에서는 승리한 팀의 경우 페널티 요인, 공격 요인, 수비 요인으로 구성되는 반면 패배한 팀에서는 페널티 요인을 제외하고 공격과 수비 요인이 혼합되어 구성되었다. 따라서 최상위 팀이 참가하는 아이스하키 경기에서 승리하기 위해서는 페널티를 받지 않는 내에서 거친 플레이가 이루어져야 하고 face off win 비율을 높일 수 있는 방안이 마련되어야 할 것이다.

데이터 마이닝을 통한 기술경영 전략 수립에 관한 연구 (Establishment of Strategy for Management of Technology Using Data Mining Technique)

  • 이준석;이준혁;김갑조;박상성;장동식
    • 한국지능시스템학회논문지
    • /
    • 제25권2호
    • /
    • pp.126-132
    • /
    • 2015
  • 기술예측은 현재까지 관측된 특정기술에 대한 데이터를 바탕으로 미래에 그 기술이 어떠한 상태가 될 지를 알아보는 것으로써 기술경영 전략 수립 시 유용하게 사용된다. 현재는 전문가 의견을 바탕으로 한 분석법을 이용하여 기술예측을 실시하고, 국가, 기업 그리고 연구자는 이를 근거로 연구개발의 방향 및 전략을 수립한다. 전문가의 의견을 바탕으로 하는 정성적 기술예측은 전문가마다 다른 결과를 예상할 수 있고, 여러 전문가의 의견을 수집하여야 하므로 많은 시간과 비용을 필요로 한다. 이러한 문제점을 극복하고 예측에 대한 객관성을 확보하여 기업의 연구개발 의사결정을 돕기 위해 정량적 예측법을 바탕으로 한 기술예측 방법이 연구되고 있다. 본 논문에서는 정량적 분석법에 기반 한 기술예측 방법론에 대한 연구를 제안한다. 제안된 방법은 데이터 수집, 주성분 분석, 그리고 데이터마이닝 기법 중 하나인 로지스틱 회귀분석을 이용한 예측 단계로 구성되어 있다. 본 연구에서는 무인자동차에 관련된 특허 문서를 이용하여 데이터를 수집 및 추출하고, 특허문서의 텍스트를 마이닝하여 분석이 가능한 형태로 구축한다. 주성분분석 후 추출된 주성분 점수를 이용하여 로지스틱 회귀분석을 실시하며 이를 바탕으로 개발현황 분석 및 기술예측을 시행한다.

해상교통 조우데이터 요인분석에 관한 연구 (A Study on the Factor Analysis of the Encounter Data in the Maritime Traffic Environment)

  • 김광일;정중식;박계각
    • 한국지능시스템학회논문지
    • /
    • 제25권3호
    • /
    • pp.293-298
    • /
    • 2015
  • 해상교통상황에서 수집된 선박 조우(Encounter) 데이터 변수는 선박 충돌 및 근접사고(Near-Collision) 위험도를 통계적인 방법에 의한 분석이 가능하다. 본 연구에서는 선박 조우 데이터에서 추출되는 다수의 선박충돌위험도 평가 변수들을 요인분석(Factor Analysis)하여, 선박 조우데이터에서 충돌위험에 영향을 미치는 주요 요인을 결정하고자 한다. 각 요인 결정을 위해 선박조우데이터 변수 정규분포화 및 표준화를 수행한 후 주성분 분석(Principal Component Analysis)으로 요인을 결정하였다. 요인분석결과 선박 근접도 요인과 충돌회피변화요인으로 요약하였다.

주성분분석으로 추정한 한·중·일 3국의 정체성 (A study of the Korea-China-Japan trilateral relationship and national identities via principal component analysis)

  • 박흥선;한민;양운철;이은지
    • 응용통계연구
    • /
    • 제32권3호
    • /
    • pp.435-450
    • /
    • 2019
  • 한 중 일 3국에 대한 연구는 정치 경제 외교를 비롯한 여러 분야에서 지정학적 관점을 비롯한 여러 방법으로 분석되어 왔다. 최근에 한 중 일 3국 간 경제적 문화적 교류는 어느 때보다 활발한 상태이지만 정치 외교분야에서 피할 수 없는 갈등은 점점 심화되고 있다. 본 연구는 최근에 한 중 일 3국에서 실시한 설문조사를 토대로 국가 정체성에 대한 종합지수를 주성분분석을 통해 제시하였으며 이들이 한 중 일 3국의 협력과 갈등에 어떤 영향을 주고 있는지를 조사해 보았다. 그 결과 자국에 대한 애착도는 흔히 예상했던 것과 달리 국가 간 갈등에 유의한 영향을 끼치지 않았다. 반면에 이웃 나라에 대해 친근감이 증가할수록 국가 간 갈등에 덜 민감하게 반응하며 국가 간 협력에 대해서는 더 긍정적인 반응을 보였다.

불안과 우울 예측을 위한 기계학습 알고리즘 (Machine Learning Algorithms for Predicting Anxiety and Depression)

  • 강윤정;이민혜;박혁규
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.207-209
    • /
    • 2022
  • IoT환경에서 스마트 디바이스로부터 사람의 신체 활동을 인식하여 생활 패턴 데이터를 수집할 수 있게 되었다. 본 논문에서는 제안된 모델은 예측단계와 추천단계로 구성한다. 예측 단계는 생활 패턴 데이터로부터 수집된 데이터셋을 기계학습을 통해 로지스틱 회귀와 k-최근접 이웃 알고리즘을 활용하여 불안과 우울의 척도를 예측한다. 추천 단계는 불안과 우울 증상으로 분류된 경우 이를 호전시킬 수 있는 음식과 가벼운 운동을 추천하기 위해 주성분 분석 알고리즘을 적용한다. 제안한 불안·우울 예측과 음식·운동 추천은 개인의 삶의 품질 개선에 파급효과가 있을 것으로 기대한다.

  • PDF

통계적 예측모형을 활용한 경륜 경기 순위 분석 (Analysis of cycle racing ranking using statistical prediction models)

  • 박가희;박리라;송종우
    • 응용통계연구
    • /
    • 제30권1호
    • /
    • pp.25-39
    • /
    • 2017
  • 최근 경륜은 2015년도 기준, 5백만 명 이상의 많은 사람들이 참여하고 2조를 넘어선 매출을 발생시키는 대중적인 레저스포츠로서 자리 잡고 있다. 본 연구의 목적은 다양한 통계적 분석기법을 사용하여 경륜경기의 순위를 예측하고, 순위에 유의한 영향을 미치는 변수들을 파악하는 데에 있다. 다양한 Classification 방법과 Regression 방법들을 적용하여 순위예측모형을 만들고 비교분석하였다. 대부분의 모형에서 공통적으로 선택된 변수들을 살펴보면, 등급이 강급될수록, 종합득점이 높을수록 순위가 높아지며 반대로 등급이 승급될수록, 번호 4번을 부여받을수록 그리고 최근성적의 순위가 낮을수록 순위가 낮아지는 것을 알 수 있었다. 또한, 선수의 실력과 관련된 연속형 변수들을 각 경기별로 평균값을 빼서 보정한 자료와 원자료를 사용하여 모형을 적합시킨 결과 모든 모형에서 보정된 자료를 사용하였을 때 더 낮은 오분류율을 보였다. 마지막으로 분석에 사용하지 않은 최근 한 달 경기결과를 예측해서 베팅했을 때 모든 경우에 예측률은 높았지만 큰 이익을 거두지 못했는데 그 이유는 낮은 배당률을 가진 경기의 결과만을 잘 예측했기 때문이다.