• 제목/요약/키워드: 라쏘

검색결과 12건 처리시간 0.019초

고차원 자료에서 영향점의 영향을 평가하기 위한 그래픽 방법 (Graphical method for evaluating the impact of influential observations in high-dimensional data)

  • 안소진;이재은;장대흥
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권6호
    • /
    • pp.1291-1300
    • /
    • 2017
  • 고차원 자료에서는 관측값의 개수보다 변수의 개수가 과다하게 많은 것이 특징이다. 그러므로 회귀 계수 추정에 있어 관측값의 영향이 매우 클 수 있다. Jang과 Anserson-Cook (2017)은 라쏘추정량 사용시 영향점의 영향을 평가할 수 있는 라쏘 영향그림을 제안하였다. 본 연구에서는 고차원 자료에서 영향점을 평가하기 위한 그래픽 방법들로서 라쏘 영향그림 뿐만 아니라 라쏘 변수선택 순위그림, 삼차원 라쏘 영향그림을 제안하였다. 실세 두 가지 고차원 자료 예들에 영향점들을 찾기 위한 회귀진단 수단으로서 세가지 그래픽 방법들을 사용하여 본 결과 영향점들을 효과적으로 찾아낼 수 있었다.

릿지 회귀와 라쏘 회귀 모형에 의한 부산 전략산업의 지역경제 효과에 대한 머신러닝 예측 (Machine Learning Prediction of Economic Effects of Busan's Strategic Industry through Ridge Regression and Lasso Regression)

  • 이재득
    • 한국항만경제학회지
    • /
    • 제37권1호
    • /
    • pp.197-215
    • /
    • 2021
  • 본 연구는 규제항을 도입한 릿지 회귀분석과 라쏘 회귀분석을 사용하여 부산 전략산업의 지역경제에 미치는 효과를 특히 고용과 소득에 대한 영향을 중심으로 머신러닝 기법으로 예측하고 분석하였다. 주요 연구결과는 다음과 같다. 첫째, 고용에 대한 전략산업들의 영향을 릿지 회귀모형과 라쏘 회귀모형으로 추정해보면, 전략산업 가운데 서비스플랫폼, 콘텐츠, 스마트금융산업으로 이루어진 지능정보서비스 산업과 MICE, 특화관광으로 구성된 글로벌관광산업의 순으로 고용을 증가시키는데 기여하고 있다. 둘째, 릿지 회귀모형과 라쏘 회귀모형에 의하면 초기투자 단계인 자율주행차, 항공, 드론 산업으로 이루어진 미래수송기기산업은 고용과 소득을 유의하게 증가시키지 않는 것으로 나타났다. 셋째, 전략산업의 소득에 대한 릿지 회귀모형의 추정계수들을 보면, 지능정보서비스산업과 글로벌관광산업의 순으로 부산지역의 소득을 증가시키고 있다. 넷째, 라쏘 회귀모형에서 라이프케어, 스마트해양, 지능형기계, 클린테크산업 등 4개의 전략산업들은 소득에 유의한 영향을 주고 있지 않는 반면, 지능정보서비스산업과 글로벌관광산업 등 2개의 전략산업들은 소득을 증가시키고 있으나, 장기 투자 산업인 미래수송기기산업은 현재 지역경제와 소득에 부의 영향을 줄 수 있는 것으로 나타났다. 그리하여 전략산업을 선정하고 육성하는데 있어, 부산지역 경제목표와 정책 우선순위를 먼저 설정할 필요가 있다는 점을 시사한다.

벌점-최소제곱법을 이용한 다중 변화점 탐색 (Detection of multiple change points using penalized least square methods: a comparative study between ℓ0 and ℓ1 penalty)

  • 손원;임요한;유동현
    • 응용통계연구
    • /
    • 제29권6호
    • /
    • pp.1147-1154
    • /
    • 2016
  • 본 연구에서는 다중 변화점 탐색과 관련하여 최근 많은 관심을 받고 있는 ${\ell}_0$-벌점 최소제곱법과 fused-라쏘-회귀(fused lasso regression; FLR)방법을 모의 실험을 통하여 비교하였다. 모의 실험의 결과로 FLR방법은 비-변화점을 변화점으로 잘못 탐색하는 경향이 ${\ell}_0$-벌점 최소제곱법과 비교할 때 상대적으로 높게 나타났으며 ${\ell}_0$-벌점 최소제곱법이 전반적으로 FLR방법에 비하여 좋은 성능을 보였다. 더불어 ${\ell}_0$-벌점 최소제곱법은 동적프로그래밍을 통하여 FLR 방법과 유사하게 효율적인 계산이 가능하다.

타타리메밀의 생력재배 기술 (Labor-saving practices in Tartary buckwheat(Fagopyrum tataricum) production)

  • 임용섭;박병재;박철호;박종인;김양식;박광호;강윤규;장광진
    • 한국자원식물학회지
    • /
    • 제22권4호
    • /
    • pp.359-363
    • /
    • 2009
  • 타타리메밀의 생력재배기술 확립을 목표로 파종, 제초, 수확방법의 개선을 도모하였다. 산파(손뿌림)는 종자량이 10a당 6 kg 정도 소요되었으며, 줄뿌림파종기는 4.5 kg, 복토직파기는 3.2 kg정도 소요되었다. 복도직파기를 이용한 기계파종의 경우 종실 수량이 주당 3.4 g으로 산파 시 종실수량 주당 2.4 g에 비하여 월등한 수량성을 보였다. 이것을 10a당 수량으로 환산하면 복토직파기 파종에서 113 kg으로 산파 80 kg에 비하여 우수하였다. 라쏘만 처리한 경우에 비하여 혼용과 조합 체계 처리에서 방제가가 90% 이상으로 높았으며 수량은 혼용(라쏘+그라목손)의 체계 처리 시 가장 높았다.

안정적 유전자 특징 선택을 위한 유전자 발현량 데이터의 부트스트랩 기반 Lasso 회귀 분석 (Lasso Regression of RNA-Seq Data based on Bootstrapping for Robust Feature Selection)

  • 조정희;윤성로
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권9호
    • /
    • pp.557-563
    • /
    • 2017
  • 많은 수의 유전자 데이터를 이용해서 Lasso 회귀 분석을 할 때, 유전자 발현량 값들 사이의 높은 상관성으로 인하여 회귀 계수의 추정값이 회귀 분석의 반복 시행마다 달라질 수 있다. L1 정규화에 의해 축소되는 회귀 계수의 불안정성은 변수 선택을 어렵게 하는 요인이 된다. 본 연구에서는 이러한 문제를 해결하기 위하여 부트스트랩 단계를 반복 시행하여 높은 빈도로 선택된 유전자들을 이용한 회귀 모형들을 만들고, 각 모형들에서 안정적으로 선택되는 특징 유전자들을 찾고, 그 유전자들이 위양성 결과가 아님을 입증하였다. 또한, 회귀모형 별 예측지수의 정확도를 실제지수와의 상관관계를 이용해 측정하였는데, 선택된 특징 유전자들의 회귀계수 부호의 분포가 정확도와 관련성을 보임을 확인하였다.

사례연구: 대구 파티마 병원 폐렴 입원 환자 수에 영향을 미치는 날씨 변수 선택 (Case study: Selection of the weather variables influencing the number of pneumonia patients in Daegu Fatima Hospital)

  • 최소현;이학래;박천건;이경은
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권1호
    • /
    • pp.131-142
    • /
    • 2017
  • 매년 폐렴 입원 환자 수는 증가하는 추세이며, 국내 질환 중 입원율 1위이기도 하다. 주로 박테리아와 바이러스가 주된 원인인 폐렴은 날씨의 영향을 받기도 한다. 본 연구에서는 날씨 변수로는 습도, 일조량, 일교차, 평균온도, 미세먼지 농도를 각각 1일 전부터 27일 전까지의 총 135개 변수를 고려하였다. 날씨와 입원 환자 수에 잠재적으로 영향을 미치는 위험 요인으로 연도 효과, 휴일 효과, 계절 효과를 추가적으로 고려하였다. 벌점화 일반화 선형 모형을 이용하여 폐렴 입원 환자 수와 관련된 변수를 선택하였다.

순열검정을 이용한 FLSA의 사후추론 (Permutation test for a post selection inference of the FLSA)

  • 최지은;손원
    • 응용통계연구
    • /
    • 제34권6호
    • /
    • pp.863-874
    • /
    • 2021
  • FLSA는 총변동벌점을 이용해 구간별상수인 평균 구조를 구현하는 벌점모형으로 다중변화점 탐색을 위해 활용되고 있다. 한편, FLSA는 변화점 탐색에 있어서 점근적 일치성이 만족되지 않으므로 잡음의 크기가 0에 가깝게 수렴하는 경우에도 다수의 거짓 변화점이 식별될 수 있다는 단점이 있다. 이 연구에서는 이러한 FLSA의 문제점을 해결하기 위한 사후추론 방법으로 순열검정 방법을 제안한다. 단일변화점 모형과 관련된 순열검정 방법은 Antoch와 Hušková (2001)에 의해 제안된 바 있다. 이 연구에서는 Antoch와 Hušková (2001)의 검정절차를 확장하여 다중변화점 식별에 사용되는 FLSA와 결합함으로써 다중변화점 모형에 적용할 수 있는 순열검정절차를 제안한다. 모의실험 결과, 제안된 방법은 z-검정과 CUSUM 통계량의 극한분포에 기반을 둔 검정방법에 비해 전반적으로 우수하였으며 거짓 변화점의 식별에 유용함을 확인할 수 있었다.

1 추세필터의 변화점 식별에 있어서의 비일치성 (An empirical evidence of inconsistency of the ℓ1 trend filtering in change point detection)

  • 유동현;임요한;손원
    • 응용통계연구
    • /
    • 제35권3호
    • /
    • pp.371-384
    • /
    • 2022
  • 구간별 상수 구조를 가지는 관측값으로부터 변화점을 식별하기 위해 FLSA가 자주 사용되고 있다. FLSA는 총변동벌점을 이용하기 때문에 평균 수준이 단조성을 가지는 경우에는 변화점 식별에서의 일치성이 보장되지 않는다는 특징이 있다. ℓ1 추세필터는 오차제곱합과 기울기 차이에 대한 ℓ1 벌점의 합을 목적함수로 가지는 구간별 선형 구조 추정방법으로 구간별 선형 구조에서의 변화점을 식별하기 위해 활용할 수 있다. 한편, ℓ1 추세필터의 경우에도 총변동벌점을 이용하므로 FLSA와 마찬가지로 변화점 식별에 있어서 비일치성을 보일 것으로 예상할 수 있는데 이와 관련된 연구는 아직까지 많이 이루어져 있지 않다. 이 연구에서는 모의실험을 통해 구간별 선형 모형에서 변화점을 식별하기 위해 사용되는 ℓ1 추세필터의 비일치성에 대해 살펴본다.

동적요인모형에 기반한 한국의 GDP 성장률 예측 (Forecasting Korea's GDP growth rate based on the dynamic factor model)

  • 이경서;임예지
    • 응용통계연구
    • /
    • 제37권2호
    • /
    • pp.255-263
    • /
    • 2024
  • GDP는 한 나라의 가계, 기업, 정부 등 모든 경제 주체가 일정 기간 동안 창출한 재화와 서비스의 시장 가치의 합을 나타낸다. GDP를 통하여 국가의 경제 규모를 파악할 수 있으며, 정부의 정책 방향에 영향을 미치는 대표적인 경제 지표이므로 이에 대한 연구가 다양하게 이루어지고 있다. 본 논문에서는 G20 국가들의 주요 거시경제 지표를 활용하여 dynamic factor model 기반의 GDP 성장률 예측 모델을 제시하였다. 추출된 factor를 다양한 회귀분석 방법론과 결합하여 그 결과들을 비교하였으며, 기존의 전통적인 시계열 예측방법인 ARIMA 모델, common component를 이용한 예측 등도 함께 비교하였다. COVID 이후 지표의 변동성이 큰 점을 고려하여 예측 시기를 COVID 전후로 나누었으며, 그 결과 factor에 대해 ridge regression과 lasso regression을 적용하여 예측한 경우 가장 좋은 성능을 나타내었다.

메밀증수를 위한 잡초방제 및 도복경감 효과 (Effect of Weed Control and Lodging Reduction for Increase the Grain Yield of Buckwheat)

  • 허권;이한범;박철호;최용순
    • 한국자원식물학회지
    • /
    • 제13권3호
    • /
    • pp.243-248
    • /
    • 2000
  • 메밀의 수량 증대방안의 일환으로 내도복성 및 잡초방제 효과에 대하여 초장 및 수량을 비교 분석하여 얻어진 결과는 다음과 같다. 1 식물왜화제인 C.C.C. 및 TIBA의 왜화효과는 있었으나 수량에 있어서는 이들 두처리구 모두 관행구보다 낮았으므로 왜화를 통한 도복경감과 수량증대 효과는 없었다. 2. 적심의 효과는 3엽기, 5엽기, 7엽기 적심에서 초장의 차이는 나타나지 않았으나 적심시기가 늦으면 늦을수록 수량은 현저한 감소를 초래했다. 3. 도복방지를 위한 지지망 설치구에서는 관행 구보다 약간 수량이 증가하였으나(4kg/10a)실제 농가에서는 적용하기 어렵다고 판단되었다. 4. 메밀 파종 후 2일째에 라쏘 유제를 살포한 결과 방제효과는 뛰어 났으나 초장이 잘 신장하지 못하며 수량도 관행구보다 낮았다. 따라서 메밀 재배에는 제초제의 필요성이 없다고 하겠다. 관행구에서의 잡초발생은 주로 강아지풀, 바랭이, 망초, 개망초, 벼룩 나물 종이 우점 하였다. 5 메밀종 각각의 줄기 경도를 측정한 결과 Fagopyrum urophyllum의 경도가 가장 높았다. 따라서, F. urophyllum의 유전자를 재배품종에 도입하는 육종연구가 요망된다.

  • PDF