• 제목/요약/키워드: grouped variable

검색결과 88건 처리시간 0.027초

Two-Stage Penalized Composite Quantile Regression with Grouped Variables

  • Bang, Sungwan;Jhun, Myoungshic
    • Communications for Statistical Applications and Methods
    • /
    • 제20권4호
    • /
    • pp.259-270
    • /
    • 2013
  • This paper considers a penalized composite quantile regression (CQR) that performs a variable selection in the linear model with grouped variables. An adaptive sup-norm penalized CQR (ASCQR) is proposed to select variables in a grouped manner; in addition, the consistency and oracle property of the resulting estimator are also derived under some regularity conditions. To improve the efficiency of estimation and variable selection, this paper suggests the two-stage penalized CQR (TSCQR), which uses the ASCQR to select relevant groups in the first stage and the adaptive lasso penalized CQR to select important variables in the second stage. Simulation studies are conducted to illustrate the finite sample performance of the proposed methods.

변형된 캐스케이드-상관 학습 알고리즘을 적용한 그룹 고장 데이터의 소프트웨어 신뢰도 예측 (Software Reliability Prediction of Grouped Failure Data Using Variant Models of Cascade-Correlation Learning Algorithm)

  • 이상운;박중양
    • 정보처리학회논문지D
    • /
    • 제8D권4호
    • /
    • pp.387-392
    • /
    • 2001
  • 많은 소프트웨어 프로젝트는 시험이나 운영단계에서 고장시간이나 고장 수 데이타보다 그룹 고장 데이터(여러 고장 간격에서 또는 가변적인 시간 간격에서의 고장들)가 수집된다. 본 논문은 그룹 고장 데이터에 대해 가변적인 미래의 시간에서 누적 고장 수를 예측할 수 있는 신경망 모델을 제시한다. 2개의 변형된 캐스케이드-상관 학습 알고리즘을 제안하였다. 제안된 신경망 모델들은 다른 잘 알려진 신경망 모델과 통계적 소프트웨어 신뢰도 성장 모델과 비교되었다. 실험결과, 그룹 데이터에 대해 변형된 캐스케이드-상관 학습 알고리즘이 좋은 예측 결과를 나타내었다.

  • PDF

그룹 고장 데이터의 소프트웨어 신뢰성 예측에 관한 신경망 모델 (Neural Network Modeling for Software Reliability Prediction of Grouped Failure Data)

  • 이상운;박영목;박수진;박재흥
    • 한국정보처리학회논문지
    • /
    • 제7권12호
    • /
    • pp.3821-3828
    • /
    • 2000
  • 많은 소프트웨어 프로젝트는 시험이나 운영단계에서 고장 시간이나 고장 수 데이타 보다는 그룹 고장 데이타 (여러 고장 간격에서 또는 가변적인 시간 간격에서의 고장 들)가 수집된다. 본 논문은 그룹 고장 데이타에 대해 가변적인 미래의 시간에서 누적 고장 수를 예측할 수 있는 신경망 모델을 제시한다. 신경망의 입-출력으로 무엇을 선택하고 어떤 순서로 훈련을 수행하느냐에 따라 신경망의 예측력에 영향을 미친다. 따라서, 신경망의 입-출력에 대한 11개의 훈련제도가 고려되었으며, 모델의 성능을 평가하기 위해 다음 단계 평균 상대 예측 오차 (AE)와 정규화된 AE (NAE) 측도에 의해 최적의 훈련제도가 선택되고, 다른 잘 알려진 신경망 모델과 통계적 소프트웨어 신뢰성 성장 모델과 비교되었다. 실험 결과, 가변적인 미래의 시간 간격에서 누적 고장 수를 예측하기 위해서는 신경망 모델에 가변 시간간격 정보가 필요함을 보였다.

  • PDF

그룹변수를 포함하는 불균형 자료의 분류분석을 위한 서포트 벡터 머신 (Hierarchically penalized support vector machine for the classication of imbalanced data with grouped variables)

  • 김은경;전명식;방성완
    • 응용통계연구
    • /
    • 제29권5호
    • /
    • pp.961-975
    • /
    • 2016
  • H-SVM은 입력변수들이 그룹화 되어 있는 경우 분류함수의 추정에서 그룹 및 그룹 내의 변수선택을 동시에 할 수 있는 방법론이다. 그러나 H-SVM은 입력변수들의 중요도에 상관없이 모든 변수들을 동일하게 축소 추정하기 때문에 추정의 효율성이 감소될 수 있다. 또한, 집단별 개체수가 상이한 불균형 자료의 분류분석에서는 분류함수가 편향되어 추정되므로 소수집단의 예측력이 하락할 수 있다. 이러한 문제점들을 보완하기 위해 본 논문에서는 적응적 조율모수를 사용하여 변수선택의 성능을 개선하고 집단별 오분류 비용을 차등적으로 부여하는 WAH-SVM을 제안하였다. 또한, 모의실험과 실제자료 분석을 통하여 제안한 모형과 기존 방법론들의 성능 비교하였으며, 제안한 모형의 유용성과 활용 가능성 확인하였다.

Drought Forecasting with Regionalization of Climate Variables and Generalized Linear Model

  • Yejin Kong;Taesam Lee;Joo-Heon Lee;Sejeong Lee
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.249-249
    • /
    • 2023
  • Spring drought forecasting in South Korea is essential due to the sknewness of rainfall which could lead to water shortage especially in spring when managed without prediction. Therefore, drought forecasting over South Korea was performed in the current study by thoroughly searching appropriate predictors from the lagged global climate variable, mean sea level pressure(MSLP), specifically in winter season for forecasting time lag. The target predictand defined as accumulated spring precipitation(ASP) was driven by the median of 93 weather stations in South Korea. Then, it was found that a number of points of the MSLP data were significantly cross-correlated with the ASP, and the points with high correlation were regionally grouped. The grouped variables with three regions: the Arctic Ocean (R1), South Pacific (R2), and South Africa (R3) were determined. The generalized linear model(GLM) was further applied for skewed marginal distribution in drought prediction. It was shown that the applied GLM presents reasonable performance in forecasting ASP. The results concluded that the presented regionalization of the climate variable, MSLP can be a good alternative in forecasting spring drought.

  • PDF

그룹화 CMA 알고리즘을 이용한 RF 중계기의 적응 간섭 제거 시스템(Adaptive Interference Cancellation System)에 관한 연구 (A Study on Adaptive Interference Cancellation System of RF Repeater Using the Grouped Constant-Modulus Algorithm)

  • 한용식;양운근
    • 한국전자파학회논문지
    • /
    • 제19권9호
    • /
    • pp.1058-1064
    • /
    • 2008
  • 본 논문에서는 RF(Radio Frequency) 중계기에서 그룹화 CMA(Constant Modulus Algorithm)와 LMS(Least Mean Square) 알고리즘을 이용하여 적응 필터를 적용시킨 새로운 혼합 간섭 제거기를 제안한다. 송신 안테나에서 수신안테나로 궤환되는 신호는 수신 시스템의 성능을 저하시킨다. 제안한 간섭 제거기는 그룹화 CMA 알고리즘 간섭 제거 기법을 적용시키기 때문에 기존 구조보다 나은 채널 적응 성능과 낮은 MSE(Mean Square Error)을 가진다. 이 구조는 기존 비선형 간섭 제거기에 비해 같은 MSE(Mean Square Error)에 대한 반복수와 하드웨어 복잡도를 줄여준다. 즉, 제안한 알고리즘은 LMS 알고리즘에 비해 평균 자승 에러가 적응 상수에 따라 2.5 dB 또는 4 dB 정도 낮은 값을 보였다. 또한, VSS(Variable Step Size)-LMS 알고리즘에 비해 수렴 속도가 빠르고, 비슷한 평균 자승 에러를 가진다.

계층적 벌점함수를 이용한 주성분분석 (Hierarchically penalized sparse principal component analysis)

  • 강종경;박재신;방성완
    • 응용통계연구
    • /
    • 제30권1호
    • /
    • pp.135-145
    • /
    • 2017
  • 주성분 분석(principal component analysis; PCA)은 서로 상관되어 있는 다변량 자료의 차원을 축소하는 대표적인 기법으로 많은 다변량 분석에서 활용되고 있다. 하지만 주성분은 모든 변수들의 선형결합으로 이루어지므로, 그 결과의 해석이 어렵다는 한계가 있다. sparse PCA(SPCA) 방법은 elastic net 형태의 벌점함수를 이용하여 보다 성긴(sparse) 적재를 가진 수정된 주성분을 만들어주지만, 변수들의 그룹구조를 이용하지 못한다는 한계가 있다. 이에 본 연구에서는 기존 SPCA를 개선하여, 자료가 그룹화되어 있는 경우에 유의한 그룹을 선택함과 동시에 그룹 내 불필요한 변수를 제거할 수 있는 새로운 주성분 분석 방법을 제시하고자 한다. 그룹과 그룹 내 변수 구조를 모형 적합에 이용하기 위하여, sparse 주성분 분석에서의 elastic net 벌점함수 대신에 계층적 벌점함수 형태를 고려하였다. 또한 실제 자료의 분석을 통해 제안 방법의 성능 및 유용성을 입증하였다.

The Study of Factors Influencing the Intention of Continuous Usage Using Augmented Reality Games: Comparative Analysis of Korean and Chinese Users

  • Namjae Cho;YanRui Wang;Jeong Hun Lim;Giseob Yu
    • Asia pacific journal of information systems
    • /
    • 제32권2호
    • /
    • pp.249-274
    • /
    • 2022
  • This study is to focuses on users' attitudes toward augmented reality games. Based on the Technology Acceptance Model (TAM) and Flow theory, continuous usage intention was set as a dependent variable, and immersion was set as a mediating variable. As independent variables, spatial presence, perceived interactivity, perceived pleasure, and sickness were set. Besides, this study strived to compare and analyze Korean and Chinese Data. The results of this study were as follows. First of all, Korean users significantly affected spatial presence, perceived pleasure, and immersion. Spatial presence and perceived pleasure had also mediated effects on continuous usage intention through immersion. However, perceived interactivity and sickness did not affect immersion and even no mediating effect to continuous usage intention. In the case of Chinese users, spatial presence, perceived interactivity, and perceived pleasure were grouped into one variable. This variable influenced immersion and also had mediated effect on continuous usage intention. However, sickness, like Korean users, did not affect the set path. This study had implications for analyzing user perspective using immersion, a significant variable in previous research. In addition, this study found similarities and characteristics through a comparative analysis between Korean and Chinese users indirectly.

A small review and further studies on the LASSO

  • Kwon, Sunghoon;Han, Sangmi;Lee, Sangin
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권5호
    • /
    • pp.1077-1088
    • /
    • 2013
  • High-dimensional data analysis arises from almost all scientific areas, evolving with development of computing skills, and has encouraged penalized estimations that play important roles in statistical learning. For the past years, various penalized estimations have been developed, and the least absolute shrinkage and selection operator (LASSO) proposed by Tibshirani (1996) has shown outstanding ability, earning the first place on the development of penalized estimation. In this paper, we first introduce a number of recent advances in high-dimensional data analysis using the LASSO. The topics include various statistical problems such as variable selection and grouped or structured variable selection under sparse high-dimensional linear regression models. Several unsupervised learning methods including inverse covariance matrix estimation are presented. In addition, we address further studies on new applications which may establish a guideline on how to use the LASSO for statistical challenges of high-dimensional data analysis.

High Throughput Parallel Decoding Method for H.264/AVC CAVLC

  • Yeo, Dong-Hoon;Shin, Hyun-Chul
    • ETRI Journal
    • /
    • 제31권5호
    • /
    • pp.510-517
    • /
    • 2009
  • A high throughput parallel decoding method is developed for context-based adaptive variable length codes. In this paper, several new design ideas are devised and implemented for scalable parallel processing, a reduction in area, and a reduction in power requirements. First, simplified logical operations instead of memory lookups are used for parallel processing. Second, the codes are grouped based on their lengths for efficient logical operation. Third, up to M bits of the input stream can be analyzed simultaneously. For comparison, we designed a logical-operation-based parallel decoder for M=8 and a conventional parallel decoder. High-speed parallel decoding becomes possible with our method. In addition, for similar decoding rates (1.57 codes/cycle for M=8), our new approach uses 46% less chip area than the conventional method.