• 제목/요약/키워드: 로짓회귀모형

검색결과 53건 처리시간 0.021초

로짓모형에 있어서 다중공선성의 영향에 관한 연구 (Effects of Multicollinearity in Logit Model)

  • 류시균
    • 대한교통학회지
    • /
    • 제26권1호
    • /
    • pp.113-126
    • /
    • 2008
  • 비확률변수간 선형관계로 정의되는 다중공선성은 설명변수간 선형방정식으로 표현되는 회귀모형의 신뢰도를 저하시키기 때문에 회귀모형의 구축과정에서는 세심한 검토와 대응이 이루어진다. 본 연구에서는 구조화된 수치실험을 통해서 로짓모형에 대한 다중공선성의 영향을 규명하였다. 효용함수를 구성하는 설명변수들간 상관관계의 정도에 따라서 추정된 모형의 적합도 지표와 계수의 신뢰도 지표가 어떻게 변동하는 지를 추적함으로써 다음과 같은 시사점을 확인할 수 있었다. 첫째, 설명변수의 추가를 통해서 모델의 적합도 개선이 가능한 회귀모형과 달리, 로짓모형에서는 효용함수에 설명변수를 추가하는 경우 로짓모형의 적합도가 개선될 수도, 역으로 저하될 수도 있음이 확인되었다. 둘째, 공통의 계수를 갖도록 모델을 구성하면 제네릭 변수간 상관관계가 높아짐에 따라 모델의 적합도가 저하됨을 확인하였다. 셋째, 설명 변수간 상관관계가 높은 경우 선택행동에 대한 설명변수의 기여도가 과대평가될 가능성을 확인하였다. 넷째, 설명변수간 상관관계가 높으면 추정된 계수의 신뢰도가 저하됨을 확인하였다. 결론적으로 본 연구를 통해서 그동안 로짓모형의 구축과정에서는 주목받지 못했던 다중공선성이 실제로는 세심한 배려와 적절한 대응을 통해서 제어되어야 함이 규명되었다.

다범주 자료의 다항로짓 모형과 로지스틱 회귀모형 비교;장애연금 특성분석 중심으로 (Comparison of Multinomial Logit and Logistic Regression on Disability Pensioners' Characteristic)

  • 김미정
    • 응용통계연구
    • /
    • 제21권4호
    • /
    • pp.589-602
    • /
    • 2008
  • 순위형 다범주 자료에 있어서 범주값의 증감에 대한 설명변수의 특성분석을 위하여 다항로짓모형을 적합하여 분석하고 로지스틱 회귀모형을 적합하여 분석한 결과와 비교하였다. 이를 통하여 장애연금 수급자자료의 재정추계를 위해 필요한 일곱 가지 요인인 성별, 수급나이, 가입기간, 가입종별, 소득활동여부, 소득수준, 장애원인이 장애등급에 미치는 영향을 파악하였다. 일곱 요인 모두 장애응급에 대한 연관성이 있음을 확인하였고 이 가운데 다섯 요인은 장애등급의 증감에 있어서도 일정한 추세를 보였으나, 장애원인과 소득수준은 장애등급의 증감에는 일정한 추세를 보이지 않음을 확인하였다. 본 연구의 결과는 장애연금 관리방안을 모색하는데 있어서 장애등급에 따른 설명 요인의 특성을 반영하는데 필요한 가이드라인을 제공할 수 있을 것으로 기대한다. 장애등급 분류에 있어서 다중분류의 정분류율은 각각 42.56%와 42.43%로 로지스틱 회귀모형의 경우 다중로짓 모형의 경우보다 다소 높았지만 거의 비슷한 정확도를 보였다.

다항 로짓 회귀모형에서의 그룹화 전략을 이용한 적합도 검정 방법 비교 (Comparison of Goodness-of-Fit Tests using Grouping Strategies for Multinomial Logit Regression Model)

  • 송미경;정인경
    • 응용통계연구
    • /
    • 제26권6호
    • /
    • pp.889-902
    • /
    • 2013
  • 지금까지 제안되어 있는 다항 로짓 회귀모형의 적합도 검정 방법들에 대하여 저자들이 제안한 방법들이 타당한지를 확인하고자 본 연구를 진행하였다. 여러 검정 통계량들 중 그룹화 전략을 이용한 통계량들 (Fagerland 등, 2008; Bull, 1994; Pigeon과 Heyse, 1999)을 선정하였고, 이러한 통계량의 기반이 되는 피어슨 ${\chi}^2$ 통계량 또한 같이 비교하였다. 제안된 분포가 모의실험의 상황 하에 얻어지는 귀무분포와 유사한지, 그리고 부적절한 모형의 판별을 적절히 수행하는지에 대하여 확인하였으며, 실제 자료에 세 가지 방법을 적용한 결과를 비교, 평가하였다.

원인균별 식중독 발생 건수 예측 (Prediction of the Number of Food Poisoning Occurrences by Microbes)

  • 여인권
    • 응용통계연구
    • /
    • 제26권6호
    • /
    • pp.923-932
    • /
    • 2013
  • 이 논문에서는 우리나라에서 발생하는 원인균별 식중독 발생건수를 예측하는 방법을 제안한다. 우리나라에서 보고되는 주별 식중독 발생 건수를 원인균로 나누면 자료에 많은 0의 관측값이 포함되어 있으며 식중독 발생 간에 종속성을 가진다. 이 현상을 모형화하기 위해 이 논문에서는 전체 식중독 건수를 자기회귀모형으로 예측하고 원인균별 식중독 발생 확률을 다범주 로짓모형으로 추정한다. 예측된 식중독 건수와 추정된 원인균별 식중독 발생 확률을 곱하여 원인균별 식중독 발생건수를 예측한다. 제안된 방법의 타당성을 확인하기 위해 평균제곱오차와 평균절대편차를 이용하여 제안 방법과 영과잉모형을 비교해 본다.

의사결정나무를 이용한 화물자동차 투어유형 선택행태 분석 (An Analysis of Choice Behavior for Tour Type of Commercial Vehicle using Decision Tree)

  • 김한수;박동주;김찬성;최창호;김경수
    • 대한교통학회지
    • /
    • 제28권6호
    • /
    • pp.43-54
    • /
    • 2010
  • 최근 화물수요모형에 화물자동차 투어행태를 반영하기 위한 접근방법이 제시되었다. 화물자동차 이동을 투어기반 접근방법으로 모형화 하기 위해서는 화물자동차 투어와 투어유형에 대한 이해가 필요하다. 본 연구는 화물자동차 투어유형을 왕복형 투어와 체인형 투어로 구분하여 이들 투어유형 선택행태를 분석하였다. 투어유형 선택행태를 분석하기 위한 방법으로는 의사결정나무(decision tree)와 로짓모형(logit model)을 이용하였다. 분석결과 화물자동차 투어유형을 분류하는 설명변수로 화물적재율, 평균화물량, 총화물량이 선정되었으며, 의사결정나무와 로짓모형이 유사한 결과를 도출하였다. 또한 소형과 중형 화물자동차의 투어유형을 분류하는 설명변수가 큰 차이를 보이지 않음에 따라 화물자동차 투어를 계획함에 있어 화물을 어떻게 적재할 것인지가 가장 중요한 것으로 나타났다. 의사결정나무와 로짓모형의 예측력을 비교한 결과는 의사결정나무가 로짓모형에 비해 상대적으로 우수한 결과를 보였는데, 이는 화물자동차 투어유형을 분류함에 있어 로짓모형과 같이 설명변수의 선형적 결합에 의한 분류 보다는 의사결정나무와 같이 다수 설명변수들의 규칙조합으로 분류하는 것이 효과적임을 나타낸다.

로지스틱 회귀모형에서의 SUPPRESSION (Suppression for Logistic Regression Model)

  • 홍종선;김호일;함주형
    • 응용통계연구
    • /
    • 제18권3호
    • /
    • pp.701-712
    • /
    • 2005
  • 로지스틱 회귀모형에서 suppression의 논의는 선형회귀의 논의보다 많지 않은데 그 이유 중의 하나는 회귀제곱합 또는 결정계수의 정의가 유일하지 않고 다양하기 때문이다. 여러 종류의 결정계수들 중에서 선호되는 두 종류의 결정계수와 Liao와 McGee(2003)가 제안한 두 종류의 수정 결정계수의 정의로부터 회귀제곱합을 유도하여 로지스틱 회귀모형에서의 suppression을 설명하고자 한다. 모의실험을 통하여 자료를 생성하여 어떤 경우에 suppression이 발생하는지를 살펴보고 그 결과를 선형회귀모형에서의 suppression 결과와 비교한다.

공공기관의 지식관리시스템의 이용 유무의 영향 요인 탐색 - 제주특별자치도 사례를 중심으로 - (An Investigation of Factors that Influence the Usage of Knowledge Management System in Public Sector - A Case of Jeju Provincial Government Organization -)

  • 김민철;김동욱
    • 정보관리연구
    • /
    • 제42권1호
    • /
    • pp.199-219
    • /
    • 2011
  • 국내 외의 지식관리와 관련한 연구 대부분은 민간기업을 대상으로 이루어졌고, 공공부문 중에서 지방자치단체의 지식관리시스템 효과나 핵심요인에 대한 구체적인 사례연구는 부족한 상황이고, 그 기존 연구도 대부분 지식관리시스템 만족 요인 탐색인데 반해서 본 연구에서는 지식관리시스템의 이용 정도를 높이기 위해서는 어떤 영향 요인이 중요한지를 탐색하는 데 있다. 본 연구에서는 지식관리시스템이 갖고 있는 어떤 요인이 지식관리시스템 이용 유무에 원인이 되는지 고찰하기 위하여 분석모형에 포함된 지식관리시스템 케퍼빌리티의 구성요소와 개인 및 조직 케퍼빌리티의 구성요소 및 인구 통계학적 요인들을 독립변수로 하여 로짓회귀모형으로 분석 검증한다. '지식관리시스템 이용 유무'에 가장 영향을 미치는 변수는 '지식창조', 다음으로 유의한 변수인 '지식인프라', '부서장의 추진 의지' 요인도 유의하게 산출되었다.

국내 회사채 신용 등급 예측 모형의 비교 연구 (Comparative study of prediction models for corporate bond rating)

  • 박형권;강준영;허성욱;유동현
    • 응용통계연구
    • /
    • 제31권3호
    • /
    • pp.367-382
    • /
    • 2018
  • 회사채 신용 등급 예측 모형에 대한 연구는 신용 평가 기관이 회사채 신용 등급 평가에 사용될 것이라 예상 되는 여러 재무적 특성 변수들을 기반으로 진행되었으며 선형 회귀 모형(linear regression), 순위 로짓(ordered logit), 순위 프로빗(ordered probit), 서포트 벡터 기계(support vector machine), 랜덤 포레스트(random forest) 등 다양한 모형들을 적용하여 개발되었다. 하지만 기존 연구들에서 고려한 회사채 신용 등급은 연구에 따라 5등급에서 20등급까지 다른 등급 구간을 적용하였으며 분석에 이용된 표본 자료의 기간 및 대상도 상이하여 예측 성능의 공정한 비교에 어려움이 있다. 따라서 본 연구에서는 2013년부터 2017년까지의 회사채 신용 등급 자료와 기존 연구들에서 사용된 재무 지표들을 통합하여 기존에 발표된 예측 모형들을 동일한 자료에 적용하고 예측 성능을 비교하였다. 추가적으로 Elastic-net 벌점화 회귀 모형 및 순위 로짓, 순위 프로빗 모형을 적합하여 LASSO 벌점이 선택됨을 확인하였으며 LASSO 벌점을 고려한 예측 모형이 대응하는 기존의 예측 모형들보다 향상된 성능을 보임을 확인하였다. 본 연구의 수행 결과, 랜덤 포레스트를 이용한 예측 모형이 15등급 기준 검증 자료에서 정확한 등급 예측률이 69.6%로 다른 모형과 비교하여 높은 예측 성능을 나타내었다.

증강현실시스템의 수용 의도 분석 - 로짓모형 이용 (Analysis on Acceptance Intention of Augmented Reality System - Using Logit Model)

  • 김민철
    • 디지털융복합연구
    • /
    • 제11권11호
    • /
    • pp.373-380
    • /
    • 2013
  • 최근 정보의 근접성을 높이기 위한 하나의 정보기술인 증강현실시스템(Augmented Reality System)이 향후 관광 안내의 차세대 시스템으로서의 가능성을 갖고 있다. 본 연구는 관광지(Tourism destination)에 GPS 기반 증강현실시스템의 기술 수용(Technology acceptance)에 대한 영향 요인을 탐색하는데 목적으로 하고 있으며, 그 연구 목적을 위하여 로짓회귀모형(Logit regression model)을 적용하여 그 영향 여부를 분석하였다. 본 연구는 최종 224명을 대상으로 분석을 실시하여, 최종 분석의 결과 이동성이 편리한 기기(Device)로서 스마트 폰 등을 활용하여 쉽게 접근하고, 신뢰성만 확보할 수 있다면 본 시스템의 수용성이 높다는 것을 보여주었다. 본 연구의 결과는 증강현실시스템 사용자의 니즈(needs)에 부합되는 서비스를 개시(launching)하고자 하는 시스템 개발자 입장 및 서비스 제공자 입장에서 기초적 자료로서 활용될 수 있다.

이단계 소지역추정 (Two Stage Small Area Estimation)

  • 이상은;신기일
    • 응용통계연구
    • /
    • 제25권2호
    • /
    • pp.293-300
    • /
    • 2012
  • 지역 또는 도메인에 작은 크기의 표본이 배정되어 추정의 정도가 낮을 때 사용하는 통계적 기법인 소지역추정에 관한 많은 연구가 진행되고 있다. 소지역추정에 사용되는 자료는 단위수준자료(unit level data)와 지역수준자료(area level data)로 분류된다. 본 논문에서는 단위수준자료를 이용하여 소지역추정을 실시한 후 얻어진 추정값에 공간통계분석기법을 도입하여 최종적인 소지역추정값을 얻는 이단계 소지역추정법을 제안하였다. 제안된 소지역추정법은 단위수준자료가 갖고 있는 정보와 지역수준자료가 갖고 있는 공간정보를 모두 이용하는 방법으로 추정의 정도를 높일 수 있는 새로운 방법이다. 본 논문에서는 경제활동인구조사 자료를 이용한 모의실험을 통해 이단계 소지역추정법의 우수성을 확인하였다.