• 제목/요약/키워드: Lasso

검색결과 169건 처리시간 0.027초

Adaptive lasso를 이용하여 추세-정상시계열과 차분-정상시계열을 판별하는 방법에 대한 연구 (Discrimination between trend and difference stationary processes based on adaptive lasso)

  • 나옥경
    • 응용통계연구
    • /
    • 제33권6호
    • /
    • pp.723-738
    • /
    • 2020
  • 본 논문에서는 추세-정상시계열과 차분-정상시계열을 판별하는 방법에 대해 연구한다. 두 시계열 모형은 시계열적 특징, 충격의 지속성 여부, 시계열을 정상화시키는 방법 등이 모두 다르므로, 어떤 모형을 선택하냐에 따라 분석 방법이나 해석에 차이가 발생한다. 따라서 시계열 자료를 분석할 때 추세-정상성과 차분-정상성을 판별하는 것은 매우 중요한 일이다. 두 시계열을 구분하는 중요한 기준은 단위근의 존재 여부이므로, 단위근 검정 결과를 활용할 수 있다. 최근 연구 결과들을 살펴보면, 다양한 시계열 모형을 적합시킬 때 뿐만 아니라 비정상 자기회귀모형의 차분 차수를 결정할 때도 adaptive lasso와 같은 벌점화 추정방법을 도입, 사용하고 있다. 본 논문에서도 adaptive lasso를 이용하여 추세-정상시계열과 차분-정상시계열을 판별하는 방법을 제안, 연구를 진행하였다. 단위근 검정을 이용한 분류 방법과 adaptive lasso 추정량을 기초로 한 분류 방법에 대한 비교 모의실험을 수행하였고, 그 결과 추세-정상시계열이 참인 경우는 adaptive lasso 방법의 분류 정확도가 단위근 검정방법보다 좀 더 우세하며, 차분-정상시계열의 경우에는 반대로 정확도가 떨어지는 것을 확인할 수 있었다.

Elastic Net를 이용한 시간 지연 추정 알고리즘 (Time delay estimation algorithm using Elastic Net)

  • 임준석; 이근화
    • 한국음향학회지
    • /
    • 제42권4호
    • /
    • pp.364-369
    • /
    • 2023
  • 두 개 수신기에 들어오는 신호 간의 시간 지연 추정 기술은 수중 음향 뿐만 아니라 실내 음향 및 로보틱스에 이르기까지 다양한 분야에서 응용되고 있는 기술이다. 시간 지연 추정 기술에는 수신기 사이 상호 상관으로부터 시간 지연량을 추정하는 방법이 한 기술 부류이고, 수신기 사이의 시간 지연을 파라메트릭 모델링을 하여 그 파라미터를 시스템 인식의 방법으로 추정하는 기술 부류가 있다. 두 부류 중 후자의 경우 시스템의 파라미터 중에서 지연과 직접 관련 있는 파라미터는 전체 중 극히 일부라는 특성이 있다. 이 특성을 이용하여 Lasso 정규화 같은 방법으로 추정 정확도를 높이기도 한다. 그러나 Lasso 정규화의 경우 필요한 정보가 소실되는 경우가 발생한다. 본 논문에서는 이를 보완하기 위해서 Lasso 정규화에 Ridge 정규화를 덧붙인 Elastic Net을 사용한 방법을 제안한다. 제안한 방법을 기존의 일반 상호 상관(Generalized Cross Correlation, GCC) 방법 및 Lasso 정규화를 사용한 방법과 비교하여, 백색 가우시안 신호원 및 유색 신호원에서도 추정 오차가 매우 적음을 보인다.

High-dimensional linear discriminant analysis with moderately clipped LASSO

  • Chang, Jaeho;Moon, Haeseong;Kwon, Sunghoon
    • Communications for Statistical Applications and Methods
    • /
    • 제28권1호
    • /
    • pp.21-37
    • /
    • 2021
  • There is a direct connection between linear discriminant analysis (LDA) and linear regression since the direction vector of the LDA can be obtained by the least square estimation. The connection motivates the penalized LDA when the model is high-dimensional where the number of predictive variables is larger than the sample size. In this paper, we study the penalized LDA for a class of penalties, called the moderately clipped LASSO (MCL), which interpolates between the least absolute shrinkage and selection operator (LASSO) and minimax concave penalty. We prove that the MCL penalized LDA correctly identifies the sparsity of the Bayes direction vector with probability tending to one, which is supported by better finite sample performance than LASSO based on concrete numerical studies.

라소를 이용한 간편한 주성분분석 (Simple principal component analysis using Lasso)

  • 박철용
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권3호
    • /
    • pp.533-541
    • /
    • 2013
  • 이 연구에서는 라소를 이용한 간편한 주성분분석을 제안한다. 이 방법은 다음의 두 단계로 구성되어 있다. 먼저 주성분분석에 의해 주성분을 구한다. 다음으로 각 주성분을 반응변수로 하고 원자료를 설명변수로 하는 라소 회귀모형에 의한 회귀계수 추정량을 구한다. 이 회귀계수 추정량에 기반한 새로운 주성분을 사용한다. 이 방법은 라소 회귀분석의 성질에 의해 회귀계수 추정량이 보다 쉽게 0이 될 수 있기 때문에 해석이 쉬운 장점이 있다. 왜냐하면 주성분을 반응변수로 하고 원자료를 설명변수로 하는 회귀모형의 회귀계수가 고유벡터가 되기 때문이다. 라소 회귀모형을 위한 R 패키지를 이용하여 모의생성된 자료와 실제 자료에 이 방법을 적용하여 유용성을 보였다.

콩밭 잡초방제에 관한 연구 (Studies on Weed Control with Herbicides in Soybean Field)

  • 양환승
    • 한국응용곤충학회지
    • /
    • 제10권1호
    • /
    • pp.31-38
    • /
    • 1971
  • 콩 재배에 있어서 선택성약제를 찾아내기 위하여 약제에 대한 콩의 저항성실험과 사양토 조건에서 폿트 및 포장실험을 병행하여 얻은 결과를 요약하면 다음과 같다. 1. 콩에 대하여 고도의 선택성이 있어서 표준시용량의 2-3배량 처리로도 정상 생육이 가능한 약해는 Triallate, Lasso, Machete, Propachlor, Nitrofen, MO, Chloroxuron, Nitrofen+Dinoseb 약제등이었다. 2. 약간의 선택성이 있는 약제는(표준시용량의 1-2배 사용) Propazine, Propazine, Diruon, Metabromuron, Swep, Linuron, HE-314, PCP등이었다. 3. 감수성이 예민하여 표준시용량에서도 고사 또는 심한 약해를 낸 약제는 Simazine, Fluorometuron 이었다. 4. Mathete, Lasso, Kerb, Nltrofen, Nitrofen+Dinoseb, Swep, Linuron, Simazine, PCP 등 약제의 폿트 및 포장실험에서의 비교실험 결과에 있어서 가) 심한 약해를 입힌 약제는 Simazine (포장)이었고 Linuron, Kerb 처리구에서도 부분적으로 약간의 약해를 냈다. 나) Nitrofen, Nitrofen+ Dinoseb, Lasso, Machete, Swep는 초기부터 최후까지 전혀 약해를 불수 없었다. 다) 제초효과는 포장에서의 Simazine 처리구를 제외하고 모든 약제가 우수한 결과를 보였다. 라) Simazine, Linuron 처리구에 있어서는 특히 피와 바랭이에 대해 약효가 없는 편이었다. 마) 방등산이와 개망초는 Kerb에 대하여 지항성이었다. 바) Lasso, Machete는 화본과잡초에 매우 강력한 살초력을 가졌으나 여뀌 등이 약간의 내성을 보였다. 5, 콩밭 잡초방제를 위하여 사용된 Lasso, Machete, Nitrofen, Swep, Nitrofen+Dinoseb, Linuron, Kerb 구등은 파종후 1회의 약제 살포로 수확기까지 무제초 방임재배가 가능하며 수량면에서도 관행구에 뒤지지 않는 결과를 얻을 수 있었다.

  • PDF

Survival Prognostic Factors of Male Breast Cancer in Southern Iran: a LASSO-Cox Regression Approach

  • Shahraki, Hadi Raeisi;Salehi, Alireza;Zare, Najaf
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제16권15호
    • /
    • pp.6773-6777
    • /
    • 2015
  • We used to LASSO-Cox method for determining prognostic factors of male breast cancer survival and showed the superiority of this method compared to Cox proportional hazard model in low sample size setting. In order to identify and estimate exactly the relative hazard of the most important factors effective for the survival duration of male breast cancer, the LASSO-Cox method has been used. Our data includes the information of male breast cancer patients in Fars province, south of Iran, from 1989 to 2008. Cox proportional hazard and LASSO-Cox models were fitted for 20 classified variables. To reduce the impact of missing data, the multiple imputation method was used 20 times through the Markov chain Mont Carlo method and the results were combined with Rubin's rules. In 50 patients, the age at diagnosis was 59.6 (SD=12.8) years with a minimum of 34 and maximum of 84 years and the mean of survival time was 62 months. Three, 5 and 10 year survival were 92%, 77% and 26%, respectively. Using the LASSO-Cox method led to eliminating 8 low effect variables and also decreased the standard error by 2.5 to 7 times. The relative efficiency of LASSO-Cox method compared with the Cox proportional hazard method was calculated as 22.39. The19 years follow of male breast cancer patients show that the age, having a history of alcohol use, nipple discharge, laterality, histological grade and duration of symptoms were the most important variables that have played an effective role in the patient's survival. In such situations, estimating the coefficients by LASSO-Cox method will be more efficient than the Cox's proportional hazard method.

A small review and further studies on the LASSO

  • Kwon, Sunghoon;Han, Sangmi;Lee, Sangin
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권5호
    • /
    • pp.1077-1088
    • /
    • 2013
  • High-dimensional data analysis arises from almost all scientific areas, evolving with development of computing skills, and has encouraged penalized estimations that play important roles in statistical learning. For the past years, various penalized estimations have been developed, and the least absolute shrinkage and selection operator (LASSO) proposed by Tibshirani (1996) has shown outstanding ability, earning the first place on the development of penalized estimation. In this paper, we first introduce a number of recent advances in high-dimensional data analysis using the LASSO. The topics include various statistical problems such as variable selection and grouped or structured variable selection under sparse high-dimensional linear regression models. Several unsupervised learning methods including inverse covariance matrix estimation are presented. In addition, we address further studies on new applications which may establish a guideline on how to use the LASSO for statistical challenges of high-dimensional data analysis.

An Additive Sparse Penalty for Variable Selection in High-Dimensional Linear Regression Model

  • Lee, Sangin
    • Communications for Statistical Applications and Methods
    • /
    • 제22권2호
    • /
    • pp.147-157
    • /
    • 2015
  • We consider a sparse high-dimensional linear regression model. Penalized methods using LASSO or non-convex penalties have been widely used for variable selection and estimation in high-dimensional regression models. In penalized regression, the selection and prediction performances depend on which penalty function is used. For example, it is known that LASSO has a good prediction performance but tends to select more variables than necessary. In this paper, we propose an additive sparse penalty for variable selection using a combination of LASSO and minimax concave penalties (MCP). The proposed penalty is designed for good properties of both LASSO and MCP.We develop an efficient algorithm to compute the proposed estimator by combining a concave convex procedure and coordinate descent algorithm. Numerical studies show that the proposed method has better selection and prediction performances compared to other penalized methods.

Generalized Lasso를 이용한 공간 군집 기법 (Spatial Clustering Method Via Generalized Lasso)

  • 송은정;최호식;황승식;이우주
    • 응용통계연구
    • /
    • 제27권4호
    • /
    • pp.561-575
    • /
    • 2014
  • 본 논문에서는 질병과 연관성을 갖는 국소 공간 군집을 검출할 수 있는 벌칙 가능도 방법을 제안한다. 핵심적인 계산 알고리즘은 Tibshirani와 Taylor (2011)에 의해 제안된 일반화된 라소(generalized lasso)에 기반한다. 제안된 방법은 현재 널리 사용되고 있는 국소 공간 군집 방법인 Kulldorff의 기법에 비해 두가지 주요 장점을 가지고 있다. 첫째로, 제안된 방법은 사전에 군집의 크기를 미리 결정해 줄 필요가 없다. 둘째로, 임의의 설명변수를 공간 군집 탐색 기법에 고려할 수 있기 때문에 인구학적인 변수를 보정하였을 때 나타나는 국소 공간 군집을 찾는 것이 가능하다. 우리는 제안된 방법을 서울시 결핵 자료를 사용하여 설명한다.

Effect of outliers on the variable selection by the regularized regression

  • Jeong, Junho;Kim, Choongrak
    • Communications for Statistical Applications and Methods
    • /
    • 제25권2호
    • /
    • pp.235-243
    • /
    • 2018
  • Many studies exist on the influence of one or few observations on estimators in a variety of statistical models under the "large n, small p" setup; however, diagnostic issues in the regression models have been rarely studied in a high dimensional setup. In the high dimensional data, the influence of observations is more serious because the sample size n is significantly less than the number variables p. Here, we investigate the influence of observations on the least absolute shrinkage and selection operator (LASSO) estimates, suggested by Tibshirani (Journal of the Royal Statistical Society, Series B, 73, 273-282, 1996), and the influence of observations on selected variables by the LASSO in the high dimensional setup. We also derived an analytic expression for the influence of the k observation on LASSO estimates in simple linear regression. Numerical studies based on artificial data and real data are done for illustration. Numerical results showed that the influence of observations on the LASSO estimates and the selected variables by the LASSO in the high dimensional setup is more severe than that in the usual "large n, small p" setup.