Purpose: The development of information technology makes it easy to utilize high-dimensional categorical data. In this regard, the purpose of this study is to propose a novel method to select the proper categorical variables in high-dimensional categorical data. Methods: The proposed feature selection method consists of three steps: (1) The first step defines the goodness-to-pick measure. In this paper, a categorical variable is relevant if it has relationships among other variables. According to the above definition of relevant variables, the goodness-to-pick measure calculates the normalized conditional entropy with other variables. (2) The second step finds the relevant feature subset from the original variables set. This step decides whether a variable is relevant or not. (3) The third step eliminates redundancy variables from the relevant feature subset. Results: Our experimental results showed that the proposed feature selection method generally yielded better classification performance than without feature selection in high-dimensional categorical data, especially as the number of irrelevant categorical variables increase. Besides, as the number of irrelevant categorical variables that have imbalanced categorical values is increasing, the difference in accuracy between the proposed method and the existing methods being compared increases. Conclusion: According to experimental results, we confirmed that the proposed method makes it possible to consistently produce high classification accuracy rates in high-dimensional categorical data. Therefore, the proposed method is promising to be used effectively in high-dimensional situation.
본 연구의 주제는 국내 자본시장에서 기업의 연구개발비 비중에 영향을 줄 수 있는 재무적 결정요인들을 심층적으로 분석하고자 하는 것이다. 최근까지 다른 국가들에서 정기적으로 수입하여 왔던 국내 기업들의 핵심 소재와 부품들에 대한 부족 현상이 지속되고 있는 상황 속에서, 해당 핵심소재들의 자급을 위한 국내 연구개발비 투자와 관련된 추가 연구에 더 많은 관심을 기울이는 것은 이론적 그리고 실무적 측면에서 더욱 중요하다고 판단된다. 연구개발비 투자 확대를 위한 정부와 기업들의 정책을 기준으로, 국제금융위기 이후 코스닥 상장기업들의 연구개발비 비중의 결정요인들 분석하기 위하여, 3가지의 가설들이 본 논문에서는 검정되었다. 분위회기모형을 응용한 첫번째 가설 검정 결과, 총 설명변수들 중, 전년도의 연구개발 비중(Lag_RD), 비선형성을 검정을 위한 Lag_RD의 제곱 항, 그리고 하이텍 기술군과 Lag_Rd 간의 교호작용 등이 연구개발비 비중에 유의한 영향을 보였다. 두번째 가설에서 총 설명 변수들 중 과반수 이상의 재무변수들이 연구재발비 비중이 높은 기업군과 낮은 기업군을 통계적으로 구분하는 요인들로 판명되었으다. 본 연구의 결과들은 향후 기업의 연구개발비의 적정 수준을 측정하기 위한 재무적 결정요인으로서 활용되어, 주주의 측면에서 기업가치의 극대화에 기여할 수 있을 것으로 기대된다.
본 연구는 국내 자본시장에서의 최근 주요 관심이슈 중 하나인 국제금융위기 이후 재벌그룹 소속 계열사들의 수익성 분포 편향가능성과 관련된, 동 지표에 대한 재무적 결정요인의 분석이다. 연구대상으로 공정거래위원회에서 규정한 대규모기업집단과 유사한 의미인 국내 재벌그룹 중심의 소속 계열사들이며 특히, 시장가치 산정을 위하여 유가증권시장과 코스닥시장에 상장된 기업들로만 구성된다. 또한, 동 연구기간은 국제금융위기 이후의 기간인 2009년부터 2012년 사이로 선정되었다. 관련 분석을 위하여 2가지 가설들이 설정되었으며, 전자는 분위회귀모형을 이용한 각 해당 비율 구간별 재벌 계열사들의 수익성 결정요인들을 각각 판명하여 비교분석하는 것이며, 후자는 5가지의 요인들로 구성된 '확장적' 듀퐁공식을 기준으로, 프로빗 모형분석을 이용한 표본기업들의 재무적 차별요인들을 분석하는 것이다. 도출된 결과와 관련하여, 수익성에 대한 재무적 결정요인으로서 부채비율, 비유동자산회전율, 외국인지분율, 그리고 주식거래시장의 구분 등이 통계적인 유의성을 나타냈으며, 두번째 가설검정 결과는 자기자본수익률에 영향을 미치는 요인들로서, 자기자본(시장가치 기준) 대비 매출액 비율과 부채비율 등이 재벌소속 기업들의 금융위기 시점과 최근까지의 변화되는 재무적 특성으로 판명되었다. 또한, 현재 정책적인 측면에서 기업들의 사내유보금에 축소에 대한 논리와 관련하여 본 연구에서는 기업의 유보금과 수익성 증대의 상관관계에서 통계적 비유의성을 보였다.
지화학 자료는 환경 관리를 위한 중요한 환경 변수중 하나로 인식되어 왔다. 지화학 자료는 보통 공간적으로 산재되어 수집되기 때문에, 샘플링 되지 않은 지점에서의 속성값 예측과 더불어 부가적인 분석을 위해 예측에 수반되는 불확실성을 추정할 필요가 있다. 이 논문은 지시자 지구통계학이 지화학 자료의 공간적인 분포값의 제시뿐만 아니라 의사결정을 보조할 수 있는 정보를 제공하기 위해 유용하게 사용될 수 있는지를 예시하고자 한다. 카드뮴 자료의 추정사례 연구를 통해 확률론적 불확실성 모델링, 위험성 분석 등 지구통계학적 분석의 틀을 제시하였다. 지시자 크리깅을 통해 조건부 누적 분포 함수를 모델링한 후에, 기대값 추정치와 조건부 분산을 카드뮴의 추정값과 정량적 불확실성 추정을 위해 각각 계산하였다. 그리고 확률 임계치와 속성 임계치의 적용을 통해 오염/비오염 지역을 구분하였다. 또한 조건부 분산과 속성값과 임계치값의 차이를 모두 설명할 수 있는 변동 계수를 통해 추가적인 샘플링 지점을 추출하였다. 이 연구에서 적용한 지시자 지구통계학적 분석 틀은 불확실성을 고려한 의사 결정과 관련하여 지화학 자료를 포함한 환경 변수의 분석에 유용하게 사용될 수 있을 것으로 기대된다.
Purpose - This study examines the impact of oil price volatility on economic activities in Korea. The new millennium has seen a deregulation in the crude oil market, which invited immense capital inflow into Korea. It has also raised oil price levels and volatility. Drawing on the recent theoretical literature that emphasizes the role of volatility, this paper attends to the asymmetric changes in economic growth in response to the oil price movement. This study further examines several key macroeconomic variables, such as interest rate, production, and inflation. We come to the conclusion that oil price volatility can, in some part, explain the structural changes. Research design, data, and methodology - We use two methodological frameworks in this study. First, in regards to the oil price uncertainty, we use an Exponential-GARCH (Exponential Generalized Autoregressive Conditional Heteroskedasticity: EGARCH) model estimate to elucidate the asymmetric effect of oil price shock on the conditional oil price volatility. Second, along with the estimation of the conditional volatility by the EGARCH model, we use the estimates in a VECM (Vector Error Correction Model). The study thus examines the dynamic impacts of oil price volatility on industrial production, price levels, and monetary policy responses. We also approximate the monetary policy function by the yield of monetary stabilization bond. The data collected for the study ranges from 1990: M1 to 2013: M7. In the VECM analysis section, the time span is split into two sub-periods; one from 1990 to 1999, and another from 2000 to 2013, due to the U.S. CFTC (Commodity Futures Trading Commission) deregulation on the crude oil futures that became effective in 2000. This paper intends to probe the relationship between oil price uncertainty and macroeconomic variables since the structural change in the oil market became effective. Results and Conclusions - The dynamic impulse response functions obtained from the VECM show a prolonged dampening effect of oil price volatility shock on the industrial production across all sub-periods. We also find that inflation measured by CPI rises by one standard deviation shock in response to oil price uncertainty, and lasts for the ensuing period. In addition, the impulse response functions allude that South Korea practices an expansionary monetary policy in response to oil price shocks, which stems from oil price uncertainty. Moreover, a comparison of the results of the dynamic impulse response functions from the two sub-periods suggests that the dynamic relationships have strengthened since 2000. Specifically, the results are most drastic in terms of industrial production; the impact of oil price volatility shocks has more than doubled from the year 2000 onwards. These results again indicate that the relationships between crude oil price uncertainty and Korean macroeconomic activities have been strengthened since the year2000, which resulted in a structural change in the crude oil market due to the deregulation of the crude oil futures.
본 연구는 아웃도어 브랜드 소비자의 소비가치와 기업의 공유가치창출활동이 소비자의 구매의도에 미치는 영향을 실증적으로 분석하였다. 소비자의 구매의도에 미치는 영향요인으로 소비가치의 하위변수는 기능적 가치, 상황적 가치, 감정적 가치로 설정하였고, 기업의 공유가치창출활동의 하위 변수는 경제적 가치, 관계적 가치, 사회적 가치로 설정하였다. 분석결과, 소비가치의 기능적 가치, 상황적 가치, 감정적 가치는 구매의도에 긍정적인 영향을 미치는 것으로 분석되었고, 기업의 공유가치창출활동의 경제적 가치, 사회적 가치, 관계적 가치도 모두 긍정적인 영향을 미치는 것으로 분석되었다. 분석결과에 따라 아웃도어 브랜드 소비자의 소비가치와 기업의 공유가치창출활동은 모두 구매의도에 긍정적인 요인으로 작용하고 있음을 알 수 있었다. 이러한 결과는 아웃도어 브랜드 산업에서 소비자의 소비가치나 기업의 공유가치창출활동은 이미 소비자의 구매의도에 충분히 반영되었다고 추론할 수 있었다.
Communications for Statistical Applications and Methods
In the two-condition within-subject mediation design, pairs of variables such as mediator and outcome are observed under two treatment conditions. The main objective of the design is to investigate the indirect effects of the condition difference (sum) on the outcome difference (sum) through the mediator difference (sum) for comparison of two treatment conditions. The natural condition variables mean the original variables, while the rotated condition variables mean the difference and the sum of two natural variables. The outcome difference (sum) is expressed as a linear model regressed on two natural (rotated) mediators as a parallel two-mediator design in two condition approaches: the natural condition approach uses regressors as the natural condition variables, while the rotated condition approach uses regressors as the rotated condition variables. In each condition approach, the total indirect effect on the outcome difference (sum) can be expressed as the sum of two individual indirect effects: within- and cross-condition indirect effects. The total indirect effects on the outcome difference (sum) for both condition approaches are the same. The invariance of the total indirect effect makes it possible to analyze the nature of two pairs of individual indirect effects induced from the natural conditions and the rotated conditions. The two-condition within-subject design is extended to the addition of a between-subject moderator. Probing of the conditional indirect effects given the moderator values is implemented by plotting the bootstrap confidence intervals of indirect effects against the moderator values. The expected indirect effect with respect to the moderator is derived to provide the overall effect of moderator on the indirect effect. The model coefficients are estimated by the structural equation modeling approach and their statistical significance is tested using the bias-corrected bootstrap confidence intervals. All procedures are evaluated using function lavaan() of package {lavaan} in R.
As the danger of exposure to the asbestos has been revealed, the importance of demolition asbestos in existing buildings has been raised. Extensive body of study has been conducted to evaluate the risk of demolition asbestos, but there were confined types of variables caused by not reflecting categorical information and limitations in collecting quantitative information. Thus, this study aims to derive a model that predicts the risk in workplace of demolition asbestos by collecting categorical and continuous variables. For this purpose, categorical and continuous variables were collected from asbestos demolition reports, and the risk assessment score was set as the dependent variable. In this study, the influence of each variable was identified using logistic regression, and the risk prediction model methodologies were compared through decision tree regression and artificial neural network. As a result, a conditional risk prediction model was derived to evaluate the risk of demolition asbestos, and this model is expected to be used to ensure the safety of asbestos demolition workers.
본 연구의 목적은 거시경제변수의 수익률 및 변동성이 호텔 레저 주가지수 수익률 및 변동성에 대해 정보이전효과가 존재하는 지에 대해 알아보는 것이다. 실증분석을 위해 2000년 1월 4일부터 2015년 12월 31일까지 자료가 사용되었다. 연구의 주요 결과는 다음과 같다. 첫째, 시간가변 AR(1)-GARCH(1,1) 모형을 이용하여 분석한 결과, 거시경제변수으로부터 호텔 레저 주가지수로 수익률 및 변동성의 이전효과는 통계적으로 존재하지 않는 것으로 나타났다. 둘째, 환율(KOSPI)과 호텔 레저 주가지수의 수익률 간에는 음(양)의 관계를 가지는 것으로 나타났다. 마지막으로 원유(금리)와 호텔 레저 주가지수의 변동성 간에는 양(음)의 관계를 가지는 것으로 관측되었다.
The purpose of this study was firstly to identify how the characteristics of children(grades, birth order, self-consciousness), parents(age, educational level, employment status of mother, mother's parenting behavior), and context (private tutoring status, tying area) relate to children's stress and secondly to examine the relative effects of these variables on children's stress. The subjects of this study were 940(453 boys, 440 girls) children from grades 4 to 6 who were selected from three elementary schools in Seoul and Buchun. Data were analyzed with t-test, correlation, and multiple regression analysis. The results were as follows: (1) Girls get stressed easier than boys in terms of being treated distantly by their friends. (2) The study showed a negative relationship between children's stress and their self-consciousness such as general self-consciousness, teaming self-consciousness and total self-consciousness. (3) While the results showed a negative relationship between children's stress and mothers' acceptable behavior, the study revealed a positive relationship between children's stress and the mother's over protective behavior which in turn raised the children's stress level. (4) In 'total stress', it was recognized that boys were affected mostly tv grades in the children's variables category, while girls were affected by their general self-consciouness. In addition, both girls and boys were affected mostly by acceptable-refusal parental behavior in the parental variables category, and further affected by the living area in the category of conditional variables.
