• Title/Summary/Keyword: Explanatory variables

검색결과 1,105건 처리시간 0.023초

다중회귀에서 회귀계수 추정량의 특성 (Comments on the regression coefficients)

  • 강명욱
    • 응용통계연구
    • /
    • 제34권4호
    • /
    • pp.589-597
    • /
    • 2021
  • 단순회귀와 다중회귀에서 회귀계수의 의미는 차이가 있고 회귀계수의 추정값은 같지 않을 뿐 아니라 그 부호가 서로 다른 경우도 발생한다. 회귀모형에서 설명변수의 상대적 기여도의 파악은 회귀분석의 수행의 중요한 부분이다. 표준화 회귀모형에서 표준화 회귀계수는 해당 설명변수를 제외한 나머지 설명변수의 값이 고정되어있는 상황에서 설명변수가 표준편차만큼 증가하였을 때 반응변수가 표준편차를 기준으로 얼마나 변화했는가로 해석할 수 있지만 표준화 회귀계수의 크기가 각 설명변수의 상대적 중요도를 나타내는 척도라고 할 수 없음은 잘 알려져 있다. 본 논문에서는 다중회귀에서 회귀계수의 추정량을 상관계수와 결정계수의 함수로 나타내고 이를 추가적인 설명력과 추가적인 결정계수의 관점에서 생각해 본다. 또한 다양한 산점도에서의 상관계수와 회귀계수 추정값의 관계를 알아보고 설명변수가 두 개인 경우에 구체적으로 적용해 본다.

경기도 파주시 오존농도의 통계모형 연구 (Analysis of statistical models for ozone concentrations at the Paju city in Korea)

  • 이훈자
    • Journal of the Korean Data and Information Science Society
    • /
    • 제20권6호
    • /
    • pp.1085-1092
    • /
    • 2009
  • 지표오존 농도는 국가의 중요한 환경 척도 중의 하나이다. 본 연구에서는 경기도 파주시 오존농도를 자기회귀오차모형과 신경망모형으로 분석하였다. 오존 분석을 위한 설명변수로는 이산화황, 이산화질소, 일산화탄소, 프로메툼10 등의 대기자료와 일 최고온도, 풍속, 상대습도, 강수량, 이슬점온도, 운량, 수증기압 등의 기상자료를 사용하였다. 분석 결과 전반적으로 신경망모형이 좋은 모형으로 나타났고, 자기회귀오차모형도 오존에 영향을 주는 설명변수를 첨가하면 좋은 모형이 될 것으로 생각된다.

  • PDF

Analysis of Time Series Models for Ozone Concentrations at the Uijeongbu City in Korea

  • Lee, Hoon-Ja
    • Journal of the Korean Data and Information Science Society
    • /
    • 제19권4호
    • /
    • pp.1153-1164
    • /
    • 2008
  • The ozone data is one of the important environmental data for measurement of the atmospheric condition of the country. In this article, the Autoregressive Error (ARE) model have been considered for analyzing the ozone data at the northern part of the Gyeonggi-Do, Uijeongbu monitoring site in Korea. The result showed that both overall and monthly ARE models are suited for describing the ozone concentration. In the ARE model, seven meteorological variables and four pollution variables are used as the as the explanatory variables for the ozone data set. The seven meteorological variables are daily maximum temperature, wind speed, relative humidity, rainfall, dew point temperature, steam pressure, and amount of cloud. The four air pollution explanatory variables are Sulfur dioxide(SO2), Nitrogen dioxide(NO2), Cobalt(CO), and Promethium 10(PM10). Also, the high level ozone data (over 80ppb) have been analyzed four ARE models, General ARE, HL ARE, PM10 add ARE, Temperature add ARE model. The result shows that the General ARE, HL ARE, and PM10 add ARE models are suited for describing the high level of ozone data.

  • PDF

경기도 수원시 미세먼지 농도의 시계열모형 연구 (Analysis of time series models for PM10 concentrations at the Suwon city in Korea)

  • 이훈자
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권6호
    • /
    • pp.1117-1124
    • /
    • 2010
  • 미세먼지 농도는 국가의 중요한 환경 척도 중의 하나이다. 본 연구에서는 경기도 남부에 위치한 수원시 2003년-2009년 미세먼지 농도를 주위에서 쉽게 구할 수 있는 대기자료와 기상자료를 이용하여 자기회귀오차모형으로 월별로 분석하였다. 미세먼지 농도 분석을 위한 대기자료는 이산화황, 이산화질소, 일산화탄소, 오존 등을 사용했고, 기상자료로는 일 최고온도, 풍속, 상대습도, 강수량, 일사량, 운량을 사용하였다. 분석 결과, 자기회귀오차모형으로 월별 미세먼지 농도를 13%-49% 정도 설명할 수 있다.

Utilization of Electrical Conductivity to Improve Prediction Accuracy of Cooking Loss of Pork Loin

  • Kyung Jo;Seonmin Lee;Hyun Gyung Jeong;Dae-Hyun Lee;Sangwon Yoon;Yoonji Chung;Samooel Jung
    • 한국축산식품학회지
    • /
    • 제43권1호
    • /
    • pp.113-123
    • /
    • 2023
  • This study investigated the predictability of cooking loss of pork loin through relatively easy and quick measurable quality properties. The pH, color, moisture, protein content, and cooking loss of 100 pork loins were measured. The explanatory variables included in all linear regression models with an adjust-r2 value of ≥0.5 were pH and the protein content. In the linear regression model predicting cooking loss, the highest adjust-r2 value was 0.7, with pH, CIE L*, CIE b*, moisture, and protein content as the explanatory variables. In 30 pork loins, electrical conductivity was additionally measured, and as a result of linear regression analysis for predicting cooking loss, the highest adjust-r2 value was 0.646 with electrical conductivity measured at 40 Hz, with pH and color as the explanatory variables. Ordinal logistic regression analysis was performed to predict the three grades (low, middle, and high) of loin cooking loss using pH, color, and 40 Hz electrical conductivity as the explanatory variables, and the percent concordance was 93.8%. In conclusion, the addition of electrical conductivity as an explanatory variable did not increase the prediction accuracy of the linear regression model for predicting cooking loss; however, it was demonstrated that it is possible to predict and classify the cooking loss grade of pork loin through quality properties that can be measured quickly and easily.

영화흥행 영향요인 선택에 관한 연구 (A Study for the Drivers of Movie Box-office Performance)

  • 김연형;홍정한
    • 응용통계연구
    • /
    • 제26권3호
    • /
    • pp.441-452
    • /
    • 2013
  • 국내 영화 산업은 투자 배급사 멀티플렉스로 수직 계열화된 대기업 중심으로 온라인 구전 마케팅이 활발히 진행되고 있다, 최근에는 대기업 계열의 멀티플렉스 영화관 중심으로 3D 4D 영화포맷 복합상영을 통해 up-selling을 통한 흥행성과 극대화를 도모하고 있다. 영화산업 기술진보와 흥행여건 변화에 따라, 기존 관객 수 대신 매출액을 흥행성과로 정의하고, 국내 개봉 상업영화를 대상으로 축소추정기법을 포함한 여러 회귀모형을 적용하였다. 특히 LASSO회귀의 경우, 교차타당성 방법을 이용한 예측오차가 가장 적고 흥행성과에 설명력이 높은 변수 순으로 의미 있는 독립변수들을 빠르고 효율적으로 선택할 수 있었다. 2013년도 1분기 개봉 영화를 대상으로 실증분석 결과, 개봉 후 온라인 평점과 빈도 모두 영향력이 높았으나, 개봉 전에는 온라인 평점만 효과적인 것으로 나타났다. 상영포맷 또한 흥행성과에 유의한 영향을 미치는 것으로 나타났다.

패션상품 소비자들의 상표관계본질에 영향을 미치는 변인 연구 (Variables Affecting Brand Relationship Quality of Fashion Product Consumers)

  • 채진미
    • 대한가정학회지
    • /
    • 제46권8호
    • /
    • pp.121-133
    • /
    • 2008
  • The purpose of this study was to decipher the BRQ (Brand Relationship Quality) Construct of fashion product consumers and to identify influencing variables. Consumption values of consumers, fashion product attributes and marketing communication instruments were investigated as affecting variables. A questionnaire was distributed to 350 women between the age of 20 and 50 living in Seoul and other metropolitan areas from Mar. 5 to Mar. 18, 2008. Collected data were analyzed by factor analysis, reliability, multiple regression, frequency and percentage using SPSS (Version 15,0) statistical Package. The results were as follows: Firstly, the BRQ Construct of fashion product consumers was proved to be composed of five factors; 'self-connective love', 'pursuing symbol', 'trust', 'intimacy', and 'knowledge'. Secondly, consumption values had a significant effect on the BRQ Construct and their explanatory power was 32%, 'Epistemic value' was the most significant variable affecting BRQ. 'Functional value' had a significant influence on some BRQ factors. Thirdly, explanatory power of fashion product attributes affecting BRQ was 45%. 'Aesthetic attribute' had significant effect on all BRQ factors, while 'functional attribute' showed significant effect on only 'pursuing symbol', 'trust', and 'intimacy'. Finally, marketing communication mixes showed 21% explanatory power and 'word of mouth' and 'display' among marketing communication mixes were found as the most influential variables affecting the BRQ Construct.

Bootstrap Testing for Reliability of Stess-Strength Model with Explanatory Variables

  • Park, Jin-Pyo;Kang, Sang-Gil;Cho, Jang-Sik
    • Journal of the Korean Data and Information Science Society
    • /
    • 제9권2호
    • /
    • pp.263-273
    • /
    • 1998
  • In this paper, we consider some approximate testings for the reliability of the stress-strength model when the stress X and strength Y each depends linearly on some explanatory variables z and w, respectively. We construct a bootstrap procedure for testing for various values of the reliability and compare the power of the bootstrap test with the test based on Mann-Whitney type estimator by Park et.al.(1996) for small and moderate sample size.

  • PDF

Biplots of Multivariate Data Guided by Linear and/or Logistic Regression

  • Huh, Myung-Hoe;Lee, Yonggoo
    • Communications for Statistical Applications and Methods
    • /
    • 제20권2호
    • /
    • pp.129-136
    • /
    • 2013
  • Linear regression is the most basic statistical model for exploring the relationship between a numerical response variable and several explanatory variables. Logistic regression secures the role of linear regression for the dichotomous response variable. In this paper, we propose a biplot-type display of the multivariate data guided by the linear regression and/or the logistic regression. The figures show the directional flow of the response variable as well as the interrelationship of explanatory variables.

Bayesian Analysis for a Functional Regression Model with Truncated Errors in Variables

  • Kim, Hea-Jung
    • Journal of the Korean Statistical Society
    • /
    • 제31권1호
    • /
    • pp.77-91
    • /
    • 2002
  • This paper considers a functional regression model with truncated errors in explanatory variables. We show that the ordinary least squares (OLS) estimators produce bias in regression parameter estimates under misspecified models with ignored errors in the explanatory variable measurements, and then propose methods for analyzing the functional model. Fully parametric frequentist approaches for analyzing the model are intractable and thus Bayesian methods are pursued using a Markov chain Monte Carlo (MCMC) sampling based approach. Necessary theories involved in modeling and computation are provided. Finally, a simulation study is given to illustrate and examine the proposed methods.