• 제목/요약/키워드: Multi-collinearity

검색결과 26건 처리시간 0.029초

영화흥행 영향요인 선택에 관한 연구 (A Study for the Drivers of Movie Box-office Performance)

  • 김연형;홍정한
    • 응용통계연구
    • /
    • 제26권3호
    • /
    • pp.441-452
    • /
    • 2013
  • 국내 영화 산업은 투자 배급사 멀티플렉스로 수직 계열화된 대기업 중심으로 온라인 구전 마케팅이 활발히 진행되고 있다, 최근에는 대기업 계열의 멀티플렉스 영화관 중심으로 3D 4D 영화포맷 복합상영을 통해 up-selling을 통한 흥행성과 극대화를 도모하고 있다. 영화산업 기술진보와 흥행여건 변화에 따라, 기존 관객 수 대신 매출액을 흥행성과로 정의하고, 국내 개봉 상업영화를 대상으로 축소추정기법을 포함한 여러 회귀모형을 적용하였다. 특히 LASSO회귀의 경우, 교차타당성 방법을 이용한 예측오차가 가장 적고 흥행성과에 설명력이 높은 변수 순으로 의미 있는 독립변수들을 빠르고 효율적으로 선택할 수 있었다. 2013년도 1분기 개봉 영화를 대상으로 실증분석 결과, 개봉 후 온라인 평점과 빈도 모두 영향력이 높았으나, 개봉 전에는 온라인 평점만 효과적인 것으로 나타났다. 상영포맷 또한 흥행성과에 유의한 영향을 미치는 것으로 나타났다.

다변량 통계분석을 이용한 남부 내륙지역 태풍피해예측모형 개발 (Development of Typhoon Damage Forecasting Function of Southern Inland Area By Multivariate Analysis Technique)

  • 김연수;김태균
    • 한국습지학회지
    • /
    • 제21권4호
    • /
    • pp.281-289
    • /
    • 2019
  • 본 연구에서는 남부 내륙지역에 속한 시군구별 태풍으로 인한 피해를 예측할 수 있는 태풍피해예측모형을 개발하였다. 내륙지역의 태풍 피해는 호우, 강풍으로 인한 피해가 복합적으로 발생하므로, 모형을 구성하는 변수가 많고 다양하나, 내륙지역 시군구 단위의 피해사례는 모형을 개발할 만큼 충분하지 않다. 태풍피해 관련 수문기상 자료는 3시간 간격 지속기간별 최대 강우량, 총강우량, 1-5일 선행강우량, 최대풍속 및 제주도 인근 지역에서의 태풍중심기압을 이용하였다. 피해자료의 부족을 고려하기 위해 군집화를 하였으며, 강우 관련 자료의 다중공선성을 제거하기 위하여 주성분분석 등 다변량 통계분석을 이용하여 권역별(경남, 경북, 전남, 전북)로 피해예측모형을 개발하였다. 모형에 의한 태풍피해추정치와 실측치는 최대 2.2배 정도까지 차이가 발생하였는데, 이는 강풍에 의한 피해를 추정하기 어렵고, 전국 69개 ASOS 관측소에 의한 강우자료가 지역적 강우특성을 제대로 반영하지 못하기 때문인 것으로 추정된다.

성능요인에 따른 무기체계 적정가격 추정방안 연구: 헬기발사형 대전차 유도무기를 중심으로 (A Study on the Estimation of the Proper Price of Weapon System by Performance Factors: Focused on Heli-Launched Anti-Tank Guided Missiles)

  • 박상현;강언비;전정환
    • 한국군사과학기술학회지
    • /
    • 제24권1호
    • /
    • pp.133-143
    • /
    • 2021
  • In government procurement programs, cost estimation and analysis support funding decisions and are the basis for other major decisions, too. Such estimating and analyzing the cost of the weapon systems are crucial in execution of the defense budget. However, existing cost estimations and analyses have focused on domestic R&D projects, thus those are not valid in application to foreign weapon acquisitions. This study aims at foreign weapon systems that are acquired from Direct Commercial Sales. Because the data for price estimation of a foreign weapon is usually not available, we suggest a price estimation model based on performance factors of the weapon. In this study, the proper price of the weapon system is estimated using the parametric cost estimating model. Using the data of helicopter-launched anti-tank guided missiles worldwide, we analyze the effect of each performance factor on the weapon system price by regression analysis, and use step-wise and ridge regression analysis to remove multi-collinearity. This study hopefully contributes to more reasonable decision making on proper price of weapons.

토픽 모형을 이용한 텍스트 데이터의 단어 선택 (Feature selection for text data via topic modeling)

  • 장우솔;김예은;손원
    • 응용통계연구
    • /
    • 제35권6호
    • /
    • pp.739-754
    • /
    • 2022
  • 텍스트 데이터는 일반적으로 많은 변수를 포함하고 있으며 변수들 사이의 연관성도 높아 통계 분석의 정확성, 효율성 등에서 문제가 생길 수 있다. 이러한 문제점에 대처하기 위해 목표 변수가 주어진 지도 학습에서는 목표 변수를 잘 설명할 수 있는 단어들을 선택하여 이 단어들만 통계 분석에 이용하기도 한다. 반면, 비지도 학습에서는 목표 변수가 주어지지 않으므로 지도 학습에서와 같은 단어 선택 절차를 활용하기 어렵다. 이 연구에서는 토픽 모형을 이용하여 지도 학습에서의 목표 변수를 대신할 수 있는 토픽을 생성하고 각 토픽별로 연관성이 높은 단어들을 선택하는 단어 선택 절차를 제안한다. 제안된 절차를 실제 텍스트 데이터에 적용한 결과, 단어 선택 절차를 이용하면 많은 토픽에서 공통적으로 자주 등장하는 단어들을 제거함으로써 토픽을 더 명확하게 식별할 수 있었다. 또한, 군집 분석에 적용한 결과, 군집과 범주 사이에 높은 연관성을 가지는 군집 분석 결과를 얻을 수 있는 것으로 나타났다. 목표 변수에 대한 정보없이 토픽 모형을 이용하여 선택한 단어들을 분류 분석에 적용하였을 때 목표 변수를 이용하여 단어들을 선택한 경우와 비슷한 분류 정확성을 얻을 수 있음도 확인하였다.

MCI 모형과 Equity 추정방식을 이용한 마케팅믹스 변수들이 시장점유율에 미치는 효과에 대한 분석 (An Investigation into the Effect of Marketing Mix Variables on Market Share based on MCI Model and Equity Estimation)

  • 임병훈;김근배
    • Asia Marketing Journal
    • /
    • 제6권2호
    • /
    • pp.55-68
    • /
    • 2004
  • 본 연구는 마케팅믹스변수와 시장점유율간의 관계를 파악하는 시장점유율모형 중 논리적 타당성으로 주목을 받고 있는 MCI (Multiplicative Competitive Interaction) 모형의 특성과 적용방법을 실증적 자료를 이용해 설명하려는 데 목적이 있다. MCI 모형은 유인력모형의 한 형태이며, Nakanishi and Cooper(1982)에 의해 비선형모형을 선형모형으로 전환시켜 모수를 추정할 수 있는 방안이 제시되면서 활용가능성이 높아졌다. 본 연구에서는 MCI 모형의 적용과정을 국내 소비재산업의 마케팅담당자가 입수가능한 다양한 원천의 마케팅자료를 종합적으로 이용하여 제시하였다. 이 과정에서 선형화된 MCI 모형의 모수 추정에 있어 Equity 추정방식을 적용하여 독립변수로 활용된 마케팅믹스 변수들간 다중공선성 문제의 해결방안도 제시하였다. 국내 껌시장에 대해 적용된 분석결과, 시장점유율 증대에 영향을 미치는 마케팅믹스변수들을 찾아낼 수 있었으며, 마케팅담당자들에게 유용한 시사점을 제시해줄 수 있었다.

  • PDF

지속가능 녹색 도로 조성을 위한 ANP 모델 기반 자전거도로 환경 평가 방안 (A Study on Environmental Assessment of Bikeway based on ANP Model for Sustainable Green Road)

  • 이지환;주용진;박수홍
    • Spatial Information Research
    • /
    • 제20권6호
    • /
    • pp.33-43
    • /
    • 2012
  • 최근 지속가능한 교통체계의 일환으로 자전거는 보행과 대중교통을 연계하는 근거리 녹색교통수단이자 현행 자동차 교통수단의 문제를 해결하기 위한 대안으로 각광 받고 있다. 이미 유럽이나 미국과 같은 선진국에서는 자전거 이용활성화를 위한 연구와 정책들이 나오고 있다. 국내외 대부분의 연구들은 자전거 도로 서비스 수준, 자전거 보관소나 휴게시설과 같은 인프라 선정 등 공급자 중심 자전거 이용 활성화 방안에 대한 내용이 대부분으로 되어 있다. 이에 본 연구에서는 인천시를 대상으로 자전거 이용자 만족도 수준에 초점을 맞추어 대중교통과의 연계성, 이용자 안전성, 자전거 도로 설치 적합성 등을 종합적으로 고려한 새로운 평가 모형을 개발하여 차별화하고자 하였다. 특히, 평가 모형의 신뢰도 향상을 위해 일반적인 다기준 의사결정의 계층화분석과정(AHP) 대신 분석방법 측면에서 평가 지표 간 다중공선성 상관관계를 고려할 수 있는 ANP(Analytic Network Process) 모델을 이용하였다. 결과적으로 인천시 남동구와 부평구에 자전거 도로의 유지관리와 시설물 개선 대상 도로를 사례별로 도출하고 이를 비교 분석할 수 있었다. 본 연구 결과를 통해 자전거 도로 이용의 유형과 목적에 따른 종합 평가 지수를 도출할 수 있었으며 향후 자전거 도로 선정과 개선을 위한 차별화된 정책 의사결정 수립에 활용 가능할 것으로 판단된다.

딥러닝 시계열 알고리즘 적용한 기업부도예측모형 유용성 검증 (Corporate Default Prediction Model Using Deep Learning Time Series Algorithm, RNN and LSTM)

  • 차성재;강정석
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.1-32
    • /
    • 2018
  • 본 연구는 경제적으로 국내에 큰 영향을 주었던 글로벌 금융위기를 기반으로 총 10년의 연간 기업데이터를 이용한다. 먼저 시대 변화 흐름에 일관성있는 부도 모형을 구축하는 것을 목표로 금융위기 이전(2000~2006년)의 데이터를 학습한다. 이후 매개 변수 튜닝을 통해 금융위기 기간이 포함(2007~2008년)된 유효성 검증 데이터가 학습데이터의 결과와 비슷한 양상을 보이고, 우수한 예측력을 가지도록 조정한다. 이후 학습 및 유효성 검증 데이터를 통합(2000~2008년)하여 유효성 검증 때와 같은 매개변수를 적용하여 모형을 재구축하고, 결과적으로 최종 학습된 모형을 기반으로 시험 데이터(2009년) 결과를 바탕으로 딥러닝 시계열 알고리즘 기반의 기업부도예측 모형이 유용함을 검증한다. 부도에 대한 정의는 Lee(2015) 연구와 동일하게 기업의 상장폐지 사유들 중 실적이 부진했던 경우를 부도로 선정한다. 독립변수의 경우, 기존 선행연구에서 이용되었던 재무비율 변수를 비롯한 기타 재무정보를 포함한다. 이후 최적의 변수군을 선별하는 방식으로 다변량 판별분석, 로짓 모형, 그리고 Lasso 회귀분석 모형을 이용한다. 기업부도예측 모형 방법론으로는 Altman(1968)이 제시했던 다중판별분석 모형, Ohlson(1980)이 제시한 로짓모형, 그리고 비시계열 기계학습 기반 부도예측모형과 딥러닝 시계열 알고리즘을 이용한다. 기업 데이터의 경우, '비선형적인 변수들', 변수들의 '다중 공선성 문제', 그리고 '데이터 수 부족'이란 한계점이 존재한다. 이에 로짓 모형은 '비선형성'을, Lasso 회귀분석 모형은 '다중 공선성 문제'를 해결하고, 가변적인 데이터 생성 방식을 이용하는 딥러닝 시계열 알고리즘을 접목함으로서 데이터 수가 부족한 점을 보완하여 연구를 진행한다. 현 정부를 비롯한 해외 정부에서는 4차 산업혁명을 통해 국가 및 사회의 시스템, 일상생활 전반을 아우르기 위해 힘쓰고 있다. 즉, 현재는 다양한 산업에 이르러 빅데이터를 이용한 딥러닝 연구가 활발히 진행되고 있지만, 금융 산업을 위한 연구분야는 아직도 미비하다. 따라서 이 연구는 기업 부도에 관하여 딥러닝 시계열 알고리즘 분석을 진행한 초기 논문으로서, 금융 데이터와 딥러닝 시계열 알고리즘을 접목한 연구를 시작하는 비 전공자에게 비교분석 자료로 쓰이기를 바란다.

임상의를 위한 다변량 분석의 실제 (Multivariate Analysis for Clinicians)

  • 오주한;정석원
    • Clinics in Shoulder and Elbow
    • /
    • 제16권1호
    • /
    • pp.63-72
    • /
    • 2013
  • 임상 의학의 연구에 사용되는 대표적 다변량 분석 방법은 다중 회귀 분석 방법인데, 이는 인과 관계를 토대로 여러 개의 변수에 의한 한꺼번에의 영향력을 분석하기 위한 방법이다. 다중 회귀 분석은 기본적으로 회귀 분석의 기본 가정을 만족해야 함은 물론, 여러 개의 독립 변수들이 포함되기 때문에 변수들을 모형에 포함시키는 방법 및 다중 공선성 문제에 대한 고려가 필요하다. 다중 회귀 분석 모형의 설명력은 결정 계수 $R^2$으로 표현되어 1에 가까울수록 설명력이 크며, 각 독립 변수들의 결과에의 영향력은 회귀 계수인 ${\beta}$값으로 표현된다. 다중 회귀 분석은 종속 변수의 형태에 따라 다중 선형 회귀 분석, 다중 로지스틱 회귀 분석, 콕스 회귀 분석으로 나눌 수 있다. 종속 변수가 연속 변수인 경우 다중 선형 회귀 분석, 범주형 변수인 경우 다중 로지스틱 회귀 분석, 시간의 영향을 고려한 상태 변수인 경우는 콕스 회귀 분석을 시행해야 하며, 각각 결과에의 영향력은 회귀 계수 ${\beta}$, 교차비, 위험비로 평가한다. 이러한 다변량 분석에 대한 이해는 연구를 계획하고 결과를 분석하고자 하는 임상 의사에게 있어 보다 효율적인 연구를 위해 필수적인 소양이라고 할 수 있다.

주성분분석 및 다중회귀분석에 의한 제주도 토양유기물 및 $Al_o+1/2Fe_o$ 함량 분포 (Distribution of Organic Matter and $Al_o+1/2Fe_o$ Contents in Soils Using Principal Component and Multiple Regression Analysis in Jeju Island)

  • 문경환;임한철;현해남
    • 한국토양비료학회지
    • /
    • 제43권5호
    • /
    • pp.748-754
    • /
    • 2010
  • Soil Taxonomy의 새로운 Andisols목 토양의 분류체계에서 토양유기물 함량과 Ammonium oxalate 추출 Al함량과 Fe의 1/2함량의 합은 중요한 기준이다. 제주도는 토양생성환경이 다양하여 Andisols 토양을 포함하여 다양한 토양이 분포하고 있다. 이 논문은 제주도 토양을 대상으로 기후, 식생, 지형 등 여러 가지 환경변수들을 이용하여 토양유기물과 $Al_o+1/2Fe_o$의 함량을 추정할 수 있는 모형을 개발하고, 이를 이용하여 토양특성지도를 제작하기 위하여 수행하였다. 조사대상 지역의 321 지점에서 토양을 채취하여 토양유기물과 $Al_o+1/2Fe_o$ 함량을 분석하고, 각 토양시료 채취지점의 온도, 강우, 순일차생산량, 일사량, 증발산량, 해발고도, 토양생성에너지, 지형습윤지수, 주변과의 고도차, 해안과 정상으로부터의 거리 등의 환경변수들을 환경변수 지도를 제작하여 추출하였다. 여러 환경변수 간에는 서로 상관관계가 높게 나타나는 다중공선성을 나타내었으며, 이를 주성분분석에 의한 변수 변환으로 제거하였다. 주성분분석 결과를 바탕으로 변환된 변수들은 산악효과, 식생효과, 복잡 효과 등 3개의 주성분으로 축소할 수 있었고, 이 3개의 변수를 이용하여 토양유기물과 $Al_o+1/2Fe_o$ 함량을 예측할 수 있는 다중회귀모형을 구하였다. 이 모형들은 전체 토양유기물 변이의 52%와 전체 $Al_o+1/2Fe_o$ 변이의 37%를 설명할 수 있었다. 모형을 이용하여 제작된 토양유기물 지도는 토양도를 바탕으로 한 토양유기물 지도와 전체적인 형태에서 매우 유사한 형태를 나타내었다. 따라서 환경요인은 제주도 토양의 분포에 큰 영향을 미치는 것으로 판단되었고, 정량화할 수 있는 환경요인을 이용하여 토양특성지도를 제작할 수 있음을 구명하였다.

학업스트레스가 높은 대학생의 교양 수영 수업 수강에 따른 자기효능감, 자아존중감 및 생활만족도의 구조적 관계 (A Structural Relation Among Self-Efficacy, Self-Esteem and Life Satisfaction of Highly Stressed University Students for Studying after Taking Swim Class in College)

  • 이영준
    • 한국응용과학기술학회지
    • /
    • 제37권2호
    • /
    • pp.192-205
    • /
    • 2020
  • 본 연구의 목적은 학업 스트레스가 높다고 대답한 우리나라 서울지역 대학생의 자기효능감, 자아존중감 및 삶의 만족도 사이에서 경험적으로 구조적 관계를 검증하는데 있다. 연구의 목적을 달성하기 위하여 SPSS 23.0 및 AMOS 21.0을 사용하였다. SPSS 23.0에서는 인구 통계학적 특성 분석을 위한 빈도 분석, 설문지 척도 간의 다중 공선성을 검증하기 위한 상관관계 분석, 설문지 질문의 신뢰성을 판단하기 위한 신뢰도 검증이 실시되었다. AMOS 21.0에서는 요인간의 구성타당도를 확인하고 변수 간의 인과 관계를 확인하기 위해 확인적 요인 분석을 수행하였다. 모형의 적합도를 확인하기 위해 𝑥2 검정과 적합도 지수를 기본으로 하는 구조방정식 모형을 사용하였다. 연구의 결과는 다음과 같다. 첫째, 높은 학업 스트레스를 가지며 수영 수업을 수강한 대학생의 자기효능감은 자아존중감에 정의 영향을 미치는 것으로 나타났다. 둘째, 높은 학업 스트레스를 가지며 수영 수업을 수강한 대학생의 자기 효능감은 삶의 만족도에 정의 영향을 미치는 것으로 나타났다. 셋째, 높은 학업 스트레스를 가지며 수영 수업을 수강한 대학생의 자아존중감은 삶의 만족도에 정의 영향을 미치는 것으로 나타났다. 이 연구의 결과를 토대로하여 한국 대학생의 학업 스트레스 문제를 해결하고, 더 나아가 우리나라 입시 제도의 사각이라 할 수 있는 체육 교과 문제 해결 방안의 마련에 중요하게 기여할 수 있을 것으로 기대하는 바이다.