• 제목/요약/키워드: 단계적 변수선택

검색결과 149건 처리시간 0.025초

단계적 회귀법과 자료봉합분석을 이용한 변수선택기법의 개발 (Development of Variable Selection Technique using Stepwise Regression and Data Envelopment Analysis)

  • 정민의;유성진
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제41권8호
    • /
    • pp.598-604
    • /
    • 2014
  • 본 연구는 주요변수를 선정하는 기법을 개발하기 위해서 단계적 회귀와 변수들의 효율성을 평가하기 위해 사용되는 자료봉합분석을 결합한 새로운 방법을 제안하였다. 이를 위해서 먼저 단계적 회귀를 이용하여 중요 변수들을 일차적으로 선정하고, 선정된 각 변수들의 중요도를 이해하기 위해 귀무가설을 세웠고, 중요 변수를 선택하기 위해 Kruskal-Wallis 검정을 사용했다. 또한 해당되는 변수를 Conover-Inman 검정을 사용하여 변동이 발생하는 각 변수들의 우선순위를 결정하였다. 따라서 그 결과, 많은 변수들과 DEA(Data Envelopment Analysis)의 한계를 극복하기 위해 원래 계획된 변수들 중 기준에 의해 원래 유지된 변수와 높은 연관성을 가진 변수들을 남기는 방식으로 변수를 선정하는 기법을 개발한 Jenkins의 기존연구에서는 I2, I4, I5, I6 변수가 누락되었고 I1, I3 변수만이 DEA에 사용되었지만, 본 논문에서 제안된 모델의 효율성 결과로는 I2와 I4 변수를 각각 유지하였다. 본 연구는 다른 문헌에서 단계적 변수의 선택을 보여주기 위해 같은 데이터 집합을 사용하였는데, 여기서 Jenkins의 연구와 같이 변수 I6과 I1, I2를 삭제하였고, I3, I4, I5는 유지하였다. 결론적으로 단계적 회귀 DEA 모델을 사용하여 긴 계산적 절차 없이 변수 선택이 가능함을 발견했으며 기존 연구의 데이터를 적용하여 제안된 모델을 검증하였다. 개발한 DEA모델 결과는 상호 변수에 따라 포함되거나 생략할 수 있기 때문에 실제 현실 상황에서의 지식과 경영적 판단에 매우 유용할 것이다.

MDA에서 판별변수 선택을 위한 베이즈 기준 (A Bayes Criterion for Selecting Variables in MDA)

  • 김혜중;유희경
    • 응용통계연구
    • /
    • 제11권2호
    • /
    • pp.435-449
    • /
    • 1998
  • 본 연구는 다중판별분석(MDA)에서 필요한 변수선택기준을 베이즈접근법으로 제안하였다. 이 베이즈판별변수 선택기준은 여러 정규모집단분포의 평균벡터에 대한 동질성 검정에 필요한 디폴터형태의 베이즈요인을 객관적 베이즈방법으로 유도하여 설정하였다. 디폴트베이즈요인(default Bayes factor)은 Spiegelhalter와 Smith (1982)가 계발한 가상적트레이닝표본법(imaginary training sample method)을 사용하여서 도출하였다. 또한 제안된 베이즈판별변수선택 기준이 지닌 분포의 성질을 이용하여, 추가 판별변수(또는 변수군)가 MDA에 기여하는 부가적인 판별력에 대한 검정법 및 추가판별변수(또는 변수군)의 선택 기준에 대해서도 논하였다. 본 연구에서 새로이 얻은 변수선택기준은 최적부분집합선택법(optimal subset selection method)뿐 아니라 각 단계적방법(stepwise method)의 변수선택기준으로 사용될 수 있으며, 두 그룹 판별분석에도 사용이 가능하다는 점에서 표본이론에 의해 여러 형태로 개발된 기존의 판별변수 선택 기준들을 하나로 통합시킬 수 있는 기능을 지니고 있다. 모의실험을 실시하여 최적 부분집합선택법과 단계적방법하에서 제안된 판별변수선택 기준이 가진 효용성을 평가하였다.

  • PDF

수정 결정계수를 사용한 로지스틱 회귀모형에서의 변수선택법 (Variable Selection for Logistic Regression Model Using Adjusted Coefficients of Determination)

  • 홍종선;함주형;김호일
    • 응용통계연구
    • /
    • 제18권2호
    • /
    • pp.435-443
    • /
    • 2005
  • 로지스틱 회귀모형에서 결정계수는 선형 회귀모형보다 다양하게 정의되며 그 값들도 매우 작아 로지스틱 회귀모형 평가기준으로 사용되는 통계량이 라고 할 수 없다. Liao와 McGee(2003)는 부적절한 설명변수의 추가 또는 표본크기의 변화에 민감하지 않은 두 종류의 수정 결정계수를 제안하였다. 본 연구에서는 실제자료에 적용한 로지스틱 회귀모형에서 수정 결정계수를 포함한 네 종류의 결정계수들을 변수선택의 기준으로 사용하여 기존의 변수선택 방법인 전진선택, 후진제거, 단계적 선택방법, AIC 통계량 등을 사용한 방법들과 비교하여 그 적절함과 효율성을 토론한다.

변수 선택 및 샘플링 기법을 적용한 조류 경보 단계 예측 모델의 정확도 개선 (Environmental variable selection and synthetic sampling methods for improving the accuracy of algal alert level prediction model)

  • 김진휘;이한규;변서현;신재기;박용은
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.517-517
    • /
    • 2023
  • 현재 우리나라에서는 4대강 및 주요 호소 29지점을 대상으로 조류경보제가 시행되고 있으며 조류 경보 단계는 실시간 모니터링지점에서 측정되는 유해 조류의 셀농도를 기반으로 발령 단계가 결정된다. 상수원 구간은 관심, 경계, 조류 대발생, 해제 또는 미발생 총 4구간으로 구성되며, 친수 활동 구간의 경우 조류 대발생을 제외한 3구간으로 구성된다. 현재 시행되는 조류 경보제의 목적은 유해 조류 발생 시 사후 대응 방안 마련에 보다 초점이 맞춰져 있으며 특히, 모니터링 주기 확대 여부, 오염원 관리 방안 마련, 조류 제거 여부 등의 의사 결정 수단으로 사용되고 있다. 하지만 조류 경보 단계에 대한 사전 예측이 가능한 경우 유해 조류의 성장을 억제할 수 있으며 이를 통해 안전하고 깨끗한 수자원을 확보할 수 있다. 본 연구에서는 조류 경보 단계의 사전적 예측을 위해 국가 실시간 측정망에서 제공하는 전국 보 모니터링 종합 정보 자료, 기상측정망 자료, 실시간 보 현황 자료를 활용하여 예측 모델을 구축하였다. 또한, 단계 예측의 정확도를 개선하기 위해 변수 선택 기법을 활용하여 조류 경보 단계에 영향을 미치는 환경변수를 선정하였으며 자료의 불균형으로 인해 모델 학습 과정에서 발생하는 예측 오류를 최소화하기 위해 다양한 샘플링 기법을 적용하여 모델의 성능을 평가하였다. 변수 선택 및 샘플링 기법을 고려하지 않은 원자료를 사용하여 예측 모델을 구축한 결과 관심 단계(Level-1) 및 경보 단계(Level-2)에 대해 각각 50%, 62.5%의 예측 정확도를 보인 반면 비선형 변수 선택 기법 및 Synthetic Minority Over-sampling Technique-Edited Nearrest Neighbor(SMOTE-ENN) 샘플링 기법을 적용하여 구축한 모델에서는 Level-1은 85.7%, Level-2는 75.0%의 예측 정확도를 보였다.

  • PDF

노년층의 라이프스타일과 프랜차이즈 레스토랑 선택행동의 관계 및 구전의도의 조절효과에 관한 연구 (A Study of the Effect between Senior Citizen Lifestyle Choice Behavior on Franchise Restaurants - Mediating Effect of Word of Mouth -)

  • 김찬우;양동휘
    • 한국조리학회지
    • /
    • 제22권5호
    • /
    • pp.106-116
    • /
    • 2016
  • 본 연구에서는 노년층의 라이프스타일이 프랜차이즈 레스토랑의 선택속성이 얼마나 영향을 끼치는지 측정하였다. 그리고 구전의도가 노년층의 라이프스타일과 프랜차이즈 레스토랑의 선택속성 사이에서 어떤 영향을 끼치는지 측정하였다. 연구 결과, 첫째, 노년층들의 라이프스타일의 하위변수인 외향적, 개방형, 진보형, 미래 지향형 활동 4가지를 변수로 설정하였다. 그 결과, 외향적(${\beta}=.463$, p<.001), 개방형(${\beta}=.132$, p<.001), 진보형(${\beta}=.150$, p<.001), 미래지향적(${\beta}=.320$, p<.001)로 종속변수인 프랜차이즈 레스토랑의 선택속성에 대하여 모두 유의한 정(+)의 영향관계가 있는 것으로 분석되었다. 둘째, 조절변수인 구전의도가 추가된 2단계 모형에서는 구전의도의 추가로 인한 설명력의 증가는 0.1%이고, 이에 대한 F=147.556(p<0.01)로 설명력의 증가로 2단계 역시 유의적으로 나왔다. 조절효과를 검증하는 상호작용항들이 추가로 들어간 3단계에서는 '노년의 라이프스타일${\times}$구전의도'의 추가적인 투입으로 인한 설명력의 증가는 0.5%이고, 이에 대한 F=82.987(p<0.01)로 조절효과는 유의적으로 나왔다. 노년의 라이프스타일과 구전의도의 개별적인 조절효과를 보면 미래적${\times}$구전의도는 유의적인 정(+)의 영향력이 있었고, 또한 외향적${\times}$구전의도는 유의적인 부(-)의 영향력이 있었다.

부분선형모형에서 LARS를 이용한 변수선택 (Variable selection in partial linear regression using the least angle regression)

  • 서한손;윤민;이학배
    • 응용통계연구
    • /
    • 제34권6호
    • /
    • pp.937-944
    • /
    • 2021
  • 본 연구는 부분선형모형에서 변수선택의 문제를 다룬다. 부분선형모형은 평활화모수 추정과 같은 비모수 추정과 선형설명변수에 대한 추정의 문제를 함께 포함하고 있어 변수선택이 쉽지 않다. 본 연구에서는 빠른 전진선택법인 LARS 를 이용한 변수선택법을 제시한다. 제안된 방법은 LARS에 의하여 선별된 변수들에 대하여 t-검정, 가능한 모든 회귀모형 비교 또는 단계별 선택법을 적용한다. 제안된 방법들의 효율성을 비교하기 위하여 실제데이터에 적용한 예제와 모의실험 결과가 제시된다.

음원변수 추출에서 선택적 저역통과필터링 (Selective Low-Pass Filtering Method on Estimation of Voice Source Parameters)

  • 엄기완
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.238-241
    • /
    • 1998
  • 성문파 신호로부터 음원변수들을 추출하는 방법과 그 전 단계에서 역 필터링 방법에 의해 구한 미분성문파 신호로부터 고주파 잡음을 제거하기 위해 음원구간에 따라 필터의 대역폭을 달리함으로서 음원변수 추출과정에서 저역통과 필터에 의해 발생할 수 있는 오차를 최소화하기 위한 선택적 저역통과 필터링 방법을 제안한다. 이 방법은 음원모델중 하나인 LF-model 펄스를 합성하여 필터링 함으로서 그 성능을 비교, 평가하였다.

  • PDF

회귀분석에 기초한 균등화 방법에 관한 연구 (A study on equating method based on regression analysis)

  • 조장식
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권3호
    • /
    • pp.513-521
    • /
    • 2010
  • 대부분의 대학들은 교수업적평가를 위해 강의평가제도를 실시하고 있다. 그러나 강의평가의 결과는 강좌규모, 강의형태, 개설학년, 이수구분, 평균평점 등과 같은 개설강좌의 특성에 많은 영향을 받게 된다. 따라서 이러한 각 강좌특성들이 강의평가 결과에 영향을 미치는 효과를 제거하지 않는다면, 담당교수가 강의평가 결과에 대한 공정성과 객관성을 신뢰할 수 없게 만들 정도로 심각한 편의를 갖게 된다. 따라서 강의평가의 공정성을 위해 강좌특성에 따른 편의를 제거하기 위한 사후조정된 점수가 요구된다. 따라서 본 연구에서는 단계적 변수선택법에 의한 회귀분석을 이용하여 강의평가 결과에 대한 균등화 방법을 이용하여 사후조정된 점수를 계산하는 방법을 제안한다. 그리고 제안된 방법은 기존의 방법과 비교를 하였다.

대형 데이터에서 VIF회귀를 이용한 신속 강건 변수선택법 (Fast robust variable selection using VIF regression in large datasets)

  • 서한손
    • 응용통계연구
    • /
    • 제31권4호
    • /
    • pp.463-473
    • /
    • 2018
  • 연구에서는 선형회귀모형을 가정한 대형 데이터에서의 변수선택 알고리즘을 다룬다. 방법의 속도와 강건성에 주안점을 둔 여러 알고리즘들이 제안되었다. 그 중에서 streamwise 회귀 접근법을 사용한 VIF회귀는 신속하고 정확하게 수행된다. 그러나 VIF회귀는 최소제곱방법에 의해 모형이 추정되므로 이상치에 민감하다. 변수선택방법의 강건성을 높이기 위해 가중 추정치를 사용한 강건측도가 제안되었으며 강건 VIF회귀도 제안되었다. 본 연구에서는 잠재적 이상치를 탐지하여 제거한 후 VIF회귀를 수행하는, 빠르고 강건한 변수선택 방법을 제안한다. 제안된 방법은 모의실험과 데이터 분석 통해 다른 방법들과 비교된다.

다변량 분석을 활용한 강우지역빈도해석의 지역구분인자 선정에 관한 연구 (Selection of variables for regional precipitation frequency analysis using multivariate analysis)

  • 남우성;김태순;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2006년도 학술발표회 논문집
    • /
    • pp.710-714
    • /
    • 2006
  • 지역빈도해석기법은 수문학적으로 성질이 유사한 지점을 하나의 군으로 구성한 자료를 이용해서 빈도해석을 하는 기법으로, 지점빈도해석이 가질 수 있는 단점들을 보완하기 위한 방안의 하나로 기대되고 있다. 본 논문은, 지역빈도해석기법을 적용하기 위한 단계중의 하나인 군집해석에 사용되는 변수들을 보다 효율적으로 선택하기 위한 연구로서, 다변량 분석방법인 주성분분석과 요인분석, 그리고, 변수선택을 위한 Procrustes Analysis를 통해서 보다 효율적으로 변수를 선택하는 방법을 제안하기 위한 연구이다.

  • PDF