• Title/Summary/Keyword: 변수

Search Result 27,892, Processing Time 0.239 seconds

A procedure for simultaneous variable selection, variable transformation and outlier identification in linear regression (선형회귀에서 변수선택, 변수변환과 이상치 탐지의 동시적 수행을 위한 절차)

  • Seo, Han Son;Yoon, Min
    • The Korean Journal of Applied Statistics
    • /
    • v.33 no.1
    • /
    • pp.1-10
    • /
    • 2020
  • We propose a unified approach to variable selection, transformation and outliers in the linear model. The procedure includes a sequential method for outlier detection and a least trimmed squares estimator for variable transformation. It uses all possible subsets regressions for model selection. Some real data analyses and the simulation results are provided to show the efficiency of the methods in the context of the correct variable selection and the fitness of the estimated model.

Development of a Parameter Estimation Support System for SWMM 5 (SWMM 5의 매개변수 추정지원 시스템 개발)

  • Jung, Tae Hun;Lee, Sangho
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • /
    • pp.529-533
    • /
    • 2016
  • 미국 환경청의 SWMM 5(storm water management model 5)는 유역의 홍수유출 모의 및 연속 유출 모의를 할 수 있는 모형으로서 국내뿐만 아니라 세계적으로 많이 사용되고 있는 모형이다. SWMM 5와 같은 유역 유출모형에서 결과의 적절성을 향상시키기 위해서는 모형에 사용되는 매개변수를 올바르게 추정할 필요가 있다. 하지만, 외국의 정교한 유역 유출모형들이 우리나라에서 제대로 적용되고 있지 못하는 이유 중 하나는 적절한 매개변수의 추정이 이루어지지 못하고 있는 점이다. 이러한 문제를 해결하고자 SWMM 5의 매개변수 추정 지원 시스템을 개발하였다. SWMM 5의 매개변수 추정지원 시스템은 민감도 분석, 최적화 기법에 의한 모형 자동보정, 매개변수 할당 및 도움 모듈로 이루어져 있다. SWMM 5의 매개변수 추정 지원 시스템에 사용되는 최적화 기법은 전역최적화 기법 중 하나인 SCE-UA(shuffled complex evolution-University of Arizona) 이다. SWMM 5의 매개변수 추정 지원 시스템의 개발은 국내 수자원 기술자들의 SWMM 5에 대한 이해 및 활용도를 더욱 향상시켜줄 것으로 기대한다.

  • PDF

Casual Model Study among Variables Related to the Social Worker's Job Attitude and Behavior (사회복지사의 직무태도 및 행동 관련 변수 간의 인과모형 연구)

  • Lee, Kyung-Cheol
    • Proceedings of the KAIS Fall Conference
    • /
    • /
    • pp.769-772
    • /
    • 2011
  • 본 연구는 조직시민행동의 선행요인으로 조직관리 차원에서 주요하게 고려되고 있는 인사관리 공정성, 경영자 행동특성, 윤리경영 같은 원인(외생, 독립)변수가 매개변수인 경영자 신뢰 및 조직냉소주의를 매개하여, 이들이 결과(내생, 종속)변수인 직무태도 및 행동(조직시민행동, 직무만족, 정서적몰입)과 어떠한 인과관계를 갖고 있는지 이들의 관계를 규명하는데 주력하였다. 이에 본 연구는 포괄적인 모형을 통해 직무태도 및 행동에 영향을 미치는 변수들의 경로를 확인함으로써, 단편적인 분석에서는 알수 없었던, 직무태도 및 행동에 영향을 미치는 원인변수, 매개변수, 결과변수를 분명하게 확정짓는 실증적인 틀을 제공하고 있다. 즉 사회복지행정 분야에서 이제까지 접목하지 않았던 경영자 행동특성, 윤리경영 등 전반적인 사회복지조직관리와 관련된 변수들을 포괄하였으며, 이는 추 후 사회복지조직 혹은 사회복지사를 대상으로 진행되는 연구의 이론적인 기반을 구축하는데 기여한 논문이라는 점에서 연구의 의의가 있다.

  • PDF

요인분석을 이용한 대체방법

  • Lee, Jae-Gap;Lee, U-Ri;Jeong, Jae-Gu;Lee, Sang-Eun
    • Proceedings of the Korean Statistical Society Conference
    • /
    • /
    • pp.143-148
    • /
    • 2003
  • 표본조사에서 발생되는 무응답에 대한 대체법은 매우 다양하게 연구 되고 있다. 특히 모형을 기반으로 하는 회귀 대체법은 매우 활용도가 높다. 이 때 일반적으로 종속변수가 결측값의 변수가 되며 독립변수는 주어지게 된다. 주어지 주어진 종속변수와 독립변수의 값을 이용하여 모델을 설정하고 그에 따라 결측값을 예측하여 대체하게 된다. 이 때 예측값 즉 결측값을 구하는 과정에서 독립변수 값 자체에도 결측값이 생기게 된다는 것이다. 이때 여러 가지 방법으로 독립변수의 결측값을 대체하고 모형을 활용할 수 있다. 그러나 이 연구에서는 독립변수들을 같은 특성끼리 그룹화 시키는 요인분석(factor analysis)을 이용하여 독립변수의 결측값에따른 예측된 결측값의 변동을 최소화 하고자했다.

  • PDF

Representing variables in the latent space (분석변수들의 잠재공간 표현)

  • Huh, Myung-Hoe
    • The Korean Journal of Applied Statistics
    • /
    • v.30 no.4
    • /
    • pp.555-566
    • /
    • 2017
  • For multivariate datasets with large number of variables, classical dimensional reduction methods such as principal component analysis may not be effective for data visualization. The underlying reason is that the dimensionality of the space of variables is often larger than two or three, while the visualization to the human eye is most effective with two or three dimensions. This paper proposes a working procedure which first partitions the variables into several "latent" clusters, explores individual data subsets, and finally integrates findings. We use R pakacage "ClustOfVar" for partitioning variables around latent dimensions and the principal component biplot method to visualize within-cluster patterns. Additionally, we use the technique for embedding supplementary variables to figure out the relationships between within-cluster variables and outside variables.

Correlated variable importance for random forests (랜덤포레스트를 위한 상관예측변수 중요도)

  • Shin, Seung Beom;Cho, Hyung Jun
    • The Korean Journal of Applied Statistics
    • /
    • v.34 no.2
    • /
    • pp.177-190
    • /
    • 2021
  • Random forests is a popular method that improves the instability and accuracy of decision trees by ensembles. In contrast to increasing the accuracy, the ease of interpretation is sacrificed; hence, to compensate for this, variable importance is provided. The variable importance indicates which variable plays a role more importantly in constructing the random forests. However, when a predictor is correlated with other predictors, the variable importance of the existing importance algorithm may be distorted. The downward bias of correlated predictors may reduce the importance of truly important predictors. We propose a new algorithm remedying the downward bias of correlated predictors. The performance of the proposed algorithm is demonstrated by the simulated data and illustrated by the real data.

The Case Study of High School Students' Understanding of the Concept of Parameter In A Computer Algebra Environment (컴퓨터 대수 환경에서 매개변수 개념에 대한 고등학생의 이해에 관한 사례 연구)

  • Cho, Yeong-Ju;Kim, Kyung-Mi
    • Communications of Mathematical Education
    • /
    • v.24 no.4
    • /
    • pp.949-974
    • /
    • 2010
  • The purpose of the study was to investigate how students' understanding was formed for solving the algebra problems involving parameters in a computer algebra environment. The teaching experiment has been conducted with 6 high school students. As a result, students studied the parameter in different roles such as placeholder, changing quantity, unknown and generalizer. The results indicate that a computer algebra environment offers opportunities for algebra activities that may support the development of understanding of the concept of parameter.

A Study on Selection of Split Variable in Constructing Classification Tree (의사결정나무에서 분리 변수 선택에 관한 연구)

  • 정성석;김순영;임한필
    • The Korean Journal of Applied Statistics
    • /
    • v.17 no.2
    • /
    • pp.347-357
    • /
    • 2004
  • It is very important to select a split variable in constructing the classification tree. The efficiency of a classification tree algorithm can be evaluated by the variable selection bias and the variable selection power. The C4.5 has largely biased variable selection due to the influence of many distinct values in variable selection and the QUEST has low variable selection power when a continuous predictor variable doesn't deviate from normal distribution. In this thesis, we propose the SRT algorithm which overcomes the drawback of the C4.5 and the QUEST. Simulations were performed to compare the SRT with the C4.5 and the QUEST. As a result, the SRT is characterized with low biased variable selection and robust variable selection power.

The Analysis of Students' Conceptions of Parameter and Development of Teaching-Learning Model (중학생들의 매개변수개념 분석과 교수-학습방안 탐색)

  • 이종희;김부미
    • School Mathematics
    • /
    • v.5 no.4
    • /
    • pp.477-506
    • /
    • 2003
  • In this paper, we analyze nine-grade students' conceptions of parameters, their relation to unknowns and variables and the process of understanding of letters in problem solving of equations and functions. The roles of letters become different according to the letters-used contexts and the meaning of letters Is changed in the process of being used. But, students do not understand the meaning of letters correctly, especially that of parameter. As a result, students operate letters in algebraic expressions according to the syntax without understanding the distinction between the roles. Therefore, the parameter of learning should focus on the dynamic change of roles and the flexible thinking of using letters. We develop a self-regulation model based on the monitoring working question in teaching-learning situations. We expect that this model helps students understand concepts of letters that enable to construct meaning in a concrete context.

  • PDF

Study of Direct Parameter Estimation for Neyman-Scott Rectangular Pulse Model (Neyman-Scott 구형 펄스모형의 직접적인 매개변수 추정연구)

  • Jeong, Chang-Sam
    • Journal of Korea Water Resources Association
    • /
    • v.42 no.11
    • /
    • pp.1017-1028
    • /
    • 2009
  • NSRPM (Neyman-Scott Rectangular Pulse Model) is one of the common model for generating future precipitation time series in stochastical hydrology. There are 5 parameters to compose the NSRPM model for generating precipitation time series. Generally parameter estimation using moment has some problems related with increased objective functions and shows different results in accordance with random variable generating models. In this study, direct parameter estimation method was proposed to cover with disadvantages of parameter estimation using moment. To apply the direct parameter estimation, generating stochastical data variance in accordance with numbers of precipitation events of NSRPM was done. Both kinds of methods were applied at the Cheongju gauge station data. Precipitation time series were generated using 4 different random variable generator, and compared with observed time series to check the accuracies. As a results, direct method showed more stable and better results.