• 제목/요약/키워드: 변수 선택

검색결과 2,111건 처리시간 0.033초

로지스틱회귀모형의 변수선택에서 로그-오즈 그래프를 통한 로그-밀도비 연구 (A study on log-density with log-odds graph for variable selection in logistic regression)

  • 강명욱;신은영
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권1호
    • /
    • pp.99-111
    • /
    • 2012
  • 반응변수가 주어졌을 때 설명변수의 조건부 확률분포의 로그-밀도비는 로지스틱회귀모형에서 어떤 설명변수가 어떻게 모형에 포함되는지에 대한 변수선택문제에서 유용한 정보를 제공한다. 설명변수의 조건부 확률분포가 좌우대칭이 아닌 경우 감마분포로 가정하는 것이 적절하고 이 경우 x항과 log(x)항이 모형에 포함되어야 한다. 로그-오즈 그래프는 변수선택문제를 연구하는데 매우 중요한 도구가 된다. 이러한 그래픽적 연구에 의하면, x|y = 0과 x|y = 1의 두 분포가 겹치는 경우에서는 x항과 log(x)항 모두 필요하다. 그리고 두 분포가 분리된 경우에는 x항 또는 log(x)항 중 하나만 필요하다.

차세대 통신서비스 환경에서 3GPP LTE-Advanced 도입과 와이브로(WiBro) 활성화 요인분석 (An Analysis of 3GPP LTE-Advanced Service Introduction and WiBro Active Factors in the Next-generation Telecommunications Service Environment)

  • 이용석;조상섭;강신원
    • 정보화정책
    • /
    • 제18권1호
    • /
    • pp.45-54
    • /
    • 2011
  • 본 연구는 와이브로(WiBro) 가입과 3GPP LTE-Advanced 가입이 동시에 이루어지는 통신서비스 환경에서 통신서비스선택행위결정모형에 대한 분석을 목적으로 한다. 2009년 수도권 이동통신가입자 500명을 중심으로 설문 조사한 자료를 바탕으로 선택모형을 분석하였다. 분석결과는 첫째, 미래 통신서비스 사용자의 유망한 두 종류 선택상황에서 와이브로 선택과 3GPP LTE-Advanced 선택행위는 서로 높은 보완적 연관성을 보였다. 둘째, 이변량 프라빗 모형추정 결과 연령, 지출액 그리고 소득변수는 와이브로와 3GPP LTE-Advanced 선택행위에 중요한 영향을 미치는 결정변수로 나타났다. 반면 성별, 사용연수 그리고 이동통신제공 통신사에 관련된 변수는 두 통신서비스 선택의 중요한 변수로 작용하지 못했다. 이 분석 결과는 단일 프라빗 및 이변량 프라빗추정결과에서 동일하게 나타났다. 마지막으로 이변량 프라빗 추정결과를 이용하여 두 통신 서비스 가입전망을 실시한 결과, 와이브로 선택전망이 28.6% 그리고 3GPP LTE-Advanced 가입전망이 25.3%로 나타났다. 또한 두 통신서비스를 동시에 가입할 확률은 19.3%로 나타났다. 따라서 와이브로 선택확률이 3GPP LTE-Advanced 선택확률 보다 높게 나타났다. 분석결과의 시사점은 미래 통신서비스 선택은 근본적으로 경제적인 요인 즉 소득 및 통신비 지출정도에 의하여 결정될 것으로 볼 수 있다.

  • PDF

고용형태별 직무만족도 차이 및 결정요인 (Differences and Determinants of Job Satisfaction by Employment Type)

  • 문영만
    • 산업노동연구
    • /
    • 제19권1호
    • /
    • pp.139-175
    • /
    • 2013
  • 본 연구는 한국노동패널데이터(5차~13차)를 사용하여 고용형태별 직무만족도 차이 및 결정요인을 분석하였으며, 그 결과는 다음과 같다. 첫째, 정규직이 비정규직에 비해 직무만족도가 유의미하게 높은 것으로 나타났으며, 비정규직을 고용형태별로 세분화하여 직무만족도를 분석한 결과, 비정규직 내에서는 한시적 근로가 가장 높았으며, 장기임시직이 가장 낮았다. 그리고 직업선택 방식에 따른 고용형태별 직무만족도 차이를 분석한 결과, 자발적으로 직업을 선택한 경우가 비자발적으로 직업을 선택한 경우에 비해 직무만족도가 높았다. 둘째, 고용형태별 직무만족도 결정요인을 분석한 결과, 정규직은 모든 변수가 종속변수인 직무만족도에 대해 통계적으로 유의미한 영향을 미치는 반면, 비정규직은 고용유형에 따라 제한적으로만 영향을 미치는 것으로 나타났다. 직업선택 방식에 따른 직무만족도 결정요인의 경우, 자발적으로 직업을 선택한 그룹은 경력변수를 제외한 모든 변수가 통계적으로 유의미한 영향을 미치는 반면, 비자발적으로 직업을 선택한 그룹은 성별, 임금 등 일부변수에서만 유의미한 영향을 미치는 것으로 나타났다. 따라서 고용형태별 직무만족도를 분석할 시에는 정규직과 비정규직으로만 구분하는 것보다 고용형태별로 세분화하여 분석하는 것이 더 의미가 있으며, 직업선택 방식(자발적/비자발적) 또한 고려될 필요가 있다.

대기행렬 네트워크 시뮬레이션에서 분지확률 통제변수의 응용 (Application of Control Variable with Routing Probability to Queueing Network Simulation)

  • 권치명;임상규
    • 한국시뮬레이션학회논문지
    • /
    • 제21권3호
    • /
    • pp.71-78
    • /
    • 2012
  • 본 연구는 대기행렬 네트워크 시뮬레이션에서 통제변수를 활용하여 목표 반응변수를 보다 더 정확히 추정하는 기법을 탐색한다. 반응변수 추정에서 통제변수기법의 효율성은 반응변수와 높은 상관관계를 가지는 통제변수의 선택과 선택된 통제변수를 이용하여 통제추정량을 어떻게 정의하는가에 따라 달라진다. 대기행렬 네트워크 시뮬레이션 모형에서 확률적 모형의 발전과정은 확률적 서비스시간과 분지 확률에 의하여 재현된다. 대부분의 통제변수기법은 통제추정치 구성에서 서비스 시간 확률변수를 사용한다. 본 연구는 서비스 시간 확률변수와 분지 확률변수를 동시에 사용하는 통제 추정량을 제안하고 이를 컴퓨터 네트워크 시스템의 관심 반응변수 추정에 응용하여 그 효율성을 탐색하고자 한다. 시뮬레이션 결과는 반응변수 추정에 있어서 분지확률 통제변수의 활용 가능성을 제시하고 있으며, 서비스-시간과 분지확률을 동시에 이용하는 결합 통제변수의 활용은 향후 연구가 필요한 분야로 판단된다.

노년층의 라이프스타일과 프랜차이즈 레스토랑 선택행동의 관계 및 구전의도의 조절효과에 관한 연구 (A Study of the Effect between Senior Citizen Lifestyle Choice Behavior on Franchise Restaurants - Mediating Effect of Word of Mouth -)

  • 김찬우;양동휘
    • 한국조리학회지
    • /
    • 제22권5호
    • /
    • pp.106-116
    • /
    • 2016
  • 본 연구에서는 노년층의 라이프스타일이 프랜차이즈 레스토랑의 선택속성이 얼마나 영향을 끼치는지 측정하였다. 그리고 구전의도가 노년층의 라이프스타일과 프랜차이즈 레스토랑의 선택속성 사이에서 어떤 영향을 끼치는지 측정하였다. 연구 결과, 첫째, 노년층들의 라이프스타일의 하위변수인 외향적, 개방형, 진보형, 미래 지향형 활동 4가지를 변수로 설정하였다. 그 결과, 외향적(${\beta}=.463$, p<.001), 개방형(${\beta}=.132$, p<.001), 진보형(${\beta}=.150$, p<.001), 미래지향적(${\beta}=.320$, p<.001)로 종속변수인 프랜차이즈 레스토랑의 선택속성에 대하여 모두 유의한 정(+)의 영향관계가 있는 것으로 분석되었다. 둘째, 조절변수인 구전의도가 추가된 2단계 모형에서는 구전의도의 추가로 인한 설명력의 증가는 0.1%이고, 이에 대한 F=147.556(p<0.01)로 설명력의 증가로 2단계 역시 유의적으로 나왔다. 조절효과를 검증하는 상호작용항들이 추가로 들어간 3단계에서는 '노년의 라이프스타일${\times}$구전의도'의 추가적인 투입으로 인한 설명력의 증가는 0.5%이고, 이에 대한 F=82.987(p<0.01)로 조절효과는 유의적으로 나왔다. 노년의 라이프스타일과 구전의도의 개별적인 조절효과를 보면 미래적${\times}$구전의도는 유의적인 정(+)의 영향력이 있었고, 또한 외향적${\times}$구전의도는 유의적인 부(-)의 영향력이 있었다.

체면민감성이 대학생의 전공선택과 구직효능감에 미치는 영향 : 관광전공 대학생을 중심으로 (The Influence of Social-Face Sensitivity on Major-Choice and Job-Searching efficacy : A Case Study of Major for University students in Tourism)

  • 김광용
    • 디지털융복합연구
    • /
    • 제15권1호
    • /
    • pp.151-162
    • /
    • 2017
  • 본 연구의 목적은 체면민감성이 관광관련전공 학생들의 전공선택과 구직효능감에 미치는 영향을 분석하는 것이다. 이에 서울에 위치한 2년제 대학교에 재학중인 관광관련전공 학생 315명을 대상으로 실시한 설문을 다중회귀분석을 통해 분석하였다. 분석의 결과 독립변수인 체면민감성의 자괴의식성 요인이 종속변수인 전공선택 요인에 대해서는 영향을 미치지 않는 것으로 나타났으며, 전공선택을 독립변수로 구성한 연구에서는 학문의 전문성 개인적 경험의 요인이 구직효능감에 대해서는 영향을 미치지 않는 것으로 나타났다. 또한 독립변수 체면민감성의 자괴의식성 타인의식성 요인이 통계적 유의수준(p.<.05)에서 구직효능감에 영향을 미치지 않는 것으로 나타났다. 따라서 관광산업에 긍정적인 태도함양과 지도가 졸업 후의 진로설계와 진로성숙 수준을 높이는데 좋은 영향을 미칠 것으로 기대할 수 있다.

평균-분산 가속화 실패시간 모형에서 벌점화 변수선택 (Penalized variable selection in mean-variance accelerated failure time models)

  • 권지훈;하일도
    • 응용통계연구
    • /
    • 제34권3호
    • /
    • pp.411-425
    • /
    • 2021
  • 가속화 실패시간모형은 로그 생존시간과 공변량간의 선형적 관계를 묘사해 준다. 가속화 실패시간모형에서 생존시간의 평균뿐만 아니라 변동성에도 영향을 미치는 공변량 효과를 추론하는 것은 흥미가 있다. 이를 위해 생존시간의 평균뿐만 아니라 분산을 모형화 하는 것이 필요하며, 이러한 모형을 평균-분산 가속화 실패시간모형이라 부른다. 본 논문에서는 벌점 가능도함수를 이용하여 평균-분산 가속화 실패시간모형에서 회귀모수에 대한 변수선택 절차를 제안한다. 여기서 벌점함수로서 LASSO, ALASSO, SCAD 그리고 HL (계층가능도)와 같은 네 가지 벌점함수를 연구한다. 제안된 변수선택 절차를 통해 중요한 공변량의 선택 뿐만 아니라 회귀모수의 추정을 동시에 제공할 수 있다. 제안된 방법의 성능은 모의실험을 통해 평가하고, 하나의 임상 예제자료를 통해 제안된 방법을 예증하고자 한다.

개인사업자 부도율 예측 모델에서 신용정보 특성 선택 방법 (The Credit Information Feature Selection Method in Default Rate Prediction Model for Individual Businesses)

  • 홍동숙;백한종;신현준
    • 한국시뮬레이션학회논문지
    • /
    • 제30권1호
    • /
    • pp.75-85
    • /
    • 2021
  • 본 논문에서는 개인사업자 부도율을 보다 정확하게 예측하기 위한 새로운 방법으로 개인사업자의 기업 신용 및 개인 신용정보를 가공, 분석하여 입력 특성으로 활용하는 심층 신경망기반 예측 모델을 제시한다. 다양한 분야의 모델링 연구에서 특성 선택 기법은 특히 많은 특성을 포함하는 예측 모델에서 성능 개선을 위한 방법으로 활발히 연구되어 왔다. 본 논문에서는 부도율 예측 모델에 이용된 입력 변수인 거시경제지표(거시변수)와 신용정보(미시변수)에 대한 통계적 검증 이후 추가적으로 신용정보 특성 선택 방법을 통해 예측 성능을 개선하는 특성 집합을 확인할 수 있다. 제안하는 신용정보 특성 선택 방법은 통계적 검증을 수행하는 필터방법과 다수 래퍼를 결합 사용하는 반복적·하이브리드 방법으로, 서브 모델들을 구축하고 최대 성능 모델의 중요 변수를 추출하여 부분집합을 구성 한 후 부분집합과 그 결합셋에 대한 예측 성능 분석을 통해 최종 특성 집합을 결정한다.

상호정보량기법과 웨이블렛변환을 적용한 인공신경망의 하천유량 예측 활용 (Application on Prediction of Stream Flow using Artificial Neural Network with Mutual Information and Wavelet Transform)

  • 류용준;정영훈;신주영;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2012년도 학술발표회
    • /
    • pp.116-116
    • /
    • 2012
  • 하천유역 내의 인자를 이용하여 댐의 하천유량(stream flow)을 예측하는 일은 수문특성의 연구와 자연재해에 대한 대비 및 수공구조물과 방재시설의 설계 시 중요한 역할을 한다. 이러한 연구는 과거부터 활발히 이루어졌으며, 아직도 보다 높은 정확도의 결과를 얻기 위해 많은 연구들이 이루어지고 있다. 특히 기존의 유역 내 자료를 통해 비선형적 모델인 인공신경망(artificial neural network)을 이용한 하천유량을 예측하는 연구 역시 활발히 이루어지고 있다. 본 연구의 목적은 여러 유역인자들 중 하천유량에 가장 영향을 미치는 변수를 추출하고 보다 정확한 예측모델을 구축하는 것이다. 기존의 입력자료 선정기법중의 하나인 상호정보량(mutual information)과 수문기상자료의 비선형 동역학적 성분을 추출하는 웨이블렛 변환(wavelet transform)을 사용하여 인공신경망에 적용시켰다. 인공신경망을 적용하는 경우, 수문자료에 있어서 변수의 선택과 자료의 상태가 강우예측의 결과에 큰 영향을 미친다. 이러한 변수의 선택에 있어서 상호정보량을 바탕으로 한 인공신경망 입력변수 선택기법이 많이 사용되고 있다. 일반적으로 시계열자료는 경향성(trend), 주기성(periodicity) 및 추계학적 성분(stochastic component)의 선형조합으로 가정될 수 있으며, 특히 경향성과 주기성은 시계열 모형을 위해 제거되어야 할 결정론적 성분으로 취급한다. 즉. 수문 기상자료에 포함되어 있는 경향성과 주기성과 같은 비선형 동역학적 잡음(nonlinear dynamical noise)을 제거하고 입력자료의 카오스적 거동을 보이는 성분을 분리하기 위해 웨이블렛 변환을 사용하였다. 대상유역은 한강 유역에 포함되어 있는 충주댐으로 선택하였다. 유역 내 다양한 인자들과 하천유량사이의 상호정보량을 구해 영향력이 가장 큰 변수를 추출하고, 그 자료를 웨이블렛 변환을 적용하여 인공신경망의 입력자료로 사용하였다. 본 논문에서는 위와 같은 과정을 이용해 추정한 하천유량 결과와 기존의 방법인 상호정보량을 이용해 인공신경망을 적용한 결과를 실제자료와 비교하였다.

  • PDF

변수 선택 및 샘플링 기법을 적용한 조류 경보 단계 예측 모델의 정확도 개선 (Environmental variable selection and synthetic sampling methods for improving the accuracy of algal alert level prediction model)

  • 김진휘;이한규;변서현;신재기;박용은
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.517-517
    • /
    • 2023
  • 현재 우리나라에서는 4대강 및 주요 호소 29지점을 대상으로 조류경보제가 시행되고 있으며 조류 경보 단계는 실시간 모니터링지점에서 측정되는 유해 조류의 셀농도를 기반으로 발령 단계가 결정된다. 상수원 구간은 관심, 경계, 조류 대발생, 해제 또는 미발생 총 4구간으로 구성되며, 친수 활동 구간의 경우 조류 대발생을 제외한 3구간으로 구성된다. 현재 시행되는 조류 경보제의 목적은 유해 조류 발생 시 사후 대응 방안 마련에 보다 초점이 맞춰져 있으며 특히, 모니터링 주기 확대 여부, 오염원 관리 방안 마련, 조류 제거 여부 등의 의사 결정 수단으로 사용되고 있다. 하지만 조류 경보 단계에 대한 사전 예측이 가능한 경우 유해 조류의 성장을 억제할 수 있으며 이를 통해 안전하고 깨끗한 수자원을 확보할 수 있다. 본 연구에서는 조류 경보 단계의 사전적 예측을 위해 국가 실시간 측정망에서 제공하는 전국 보 모니터링 종합 정보 자료, 기상측정망 자료, 실시간 보 현황 자료를 활용하여 예측 모델을 구축하였다. 또한, 단계 예측의 정확도를 개선하기 위해 변수 선택 기법을 활용하여 조류 경보 단계에 영향을 미치는 환경변수를 선정하였으며 자료의 불균형으로 인해 모델 학습 과정에서 발생하는 예측 오류를 최소화하기 위해 다양한 샘플링 기법을 적용하여 모델의 성능을 평가하였다. 변수 선택 및 샘플링 기법을 고려하지 않은 원자료를 사용하여 예측 모델을 구축한 결과 관심 단계(Level-1) 및 경보 단계(Level-2)에 대해 각각 50%, 62.5%의 예측 정확도를 보인 반면 비선형 변수 선택 기법 및 Synthetic Minority Over-sampling Technique-Edited Nearrest Neighbor(SMOTE-ENN) 샘플링 기법을 적용하여 구축한 모델에서는 Level-1은 85.7%, Level-2는 75.0%의 예측 정확도를 보였다.

  • PDF