• 제목/요약/키워드: Logistic 모형

검색결과 690건 처리시간 0.027초

수정 결정계수를 사용한 로지스틱 회귀모형에서의 변수선택법 (Variable Selection for Logistic Regression Model Using Adjusted Coefficients of Determination)

  • 홍종선;함주형;김호일
    • 응용통계연구
    • /
    • 제18권2호
    • /
    • pp.435-443
    • /
    • 2005
  • 로지스틱 회귀모형에서 결정계수는 선형 회귀모형보다 다양하게 정의되며 그 값들도 매우 작아 로지스틱 회귀모형 평가기준으로 사용되는 통계량이 라고 할 수 없다. Liao와 McGee(2003)는 부적절한 설명변수의 추가 또는 표본크기의 변화에 민감하지 않은 두 종류의 수정 결정계수를 제안하였다. 본 연구에서는 실제자료에 적용한 로지스틱 회귀모형에서 수정 결정계수를 포함한 네 종류의 결정계수들을 변수선택의 기준으로 사용하여 기존의 변수선택 방법인 전진선택, 후진제거, 단계적 선택방법, AIC 통계량 등을 사용한 방법들과 비교하여 그 적절함과 효율성을 토론한다.

로지스틱회귀에서 잔차산점도를 이용한 모형평가 (Model assessment with residual plot in logistic regression)

  • 강명욱
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권1호
    • /
    • pp.141-150
    • /
    • 2015
  • 로지스틱회귀에서 모형을 평가하거나 진단할 때 가설검정이 주로 사용되지만 이것만으로는 놓칠 수 있는 부분이 많고 이에 대한 보완을 위하여 그래픽적 방법의 사용이 요구된다. 그래프를 이용한 모형의 적절성 평가를 위한 도구로 잔차산점도가 널리 이용되고 있으나 적용 범위가 선형회귀에 국한되는 문제점이 있다. 해결 방안으로 주변모형산점도를 이용하여 모형의 적절성을 평가하는 방법이 있으나 역시 문제점을 가지고 있다. 본 논문에서는 주변모형산점도의 대안으로 카이잔차산점도를 제안하고 그 효용성을 알아본다.

형상모수를 고려한 소프트웨어 신뢰성 비용 모형에 관한 비교 연구 (The Comparative Software Reliability Cost Model of Considering Shape Parameter)

  • 김경수;김희철
    • 디지털융복합연구
    • /
    • 제12권3호
    • /
    • pp.219-226
    • /
    • 2014
  • 본 연구에서는 소프트웨어 제품 테스팅 과정에서 고장 수명분포의 형상모수를 고려한 소프트웨어 신뢰성 비용 모형에 대하여 연구 하였다. 신뢰성 분야에서 많이 사용되는 어랑 분포와 로그-로지스틱 모형을 이용한 형상모수를 반영한 문제를 제시하였다. 소프트웨어 고장모형은 유한고장 비동질적인 포아송과정을 이용하고 모수추정법은 최우추정법을 이용 하였다. 따라서 본 논문에서는 형상모수를 고려한 소프트웨어 비용모형 분석을 위하여 소프트웨어 고장 시간 자료를 적용하여 비교 분석하였다. 본 연구에서 사용된 어랑 분포와 로그-로지스틱분포에 근거한 소프트웨어 비용 모델을 비교한 결과 어랑 모형은 최적의 소프트웨어 방출 시간을 예측 할 수 있지만 로그-로지스틱 모형은 방출시간을 예측 할 수 없기 때문에 로그-로지스틱 보다 어랑 모형이 보다 효율적으로 나타나고 있다. 이 연구를 통하여 소프트웨어 개발자들은 소프트웨어 개발 비용을 파악 하는데 어느 정도 도움을 줄 수 있을 것으로 사료된다.

로지스틱모형에서 그래픽을 이용한 회귀와 모형평가 (Graphical regression and model assessment in logistic model)

  • 강명욱;김부용;홍주희
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권1호
    • /
    • pp.21-32
    • /
    • 2010
  • 그래픽적 회귀는 모형에 대한 가정을 하지 않고 회귀정보를 모두 포함하는 충분요약그림을 찾아내는 분석 방법으로 모든 회귀정보를 저차원의 그림으로 표현할 수 있게 하는 데에 그 목적이 있다. 잔차산점도를 이용한 모형의 평가는 적용 범위가 선형회귀모형에 국한되는 문제점이 있기 때문에 일반화선형모형에서는 그 대안으로 주변모형 산점도를 이용하여 모형의 적절성을 평가한다. 본 논문에서는 일반화선형모형 중에서 이진반응변수를 갖는 로지스틱모형에서의 그래픽적 회귀 방법과 주변모형 산점도를 이용한 모형평가 방법을 알아본다.

로지스틱 회귀모형에서의 SUPPRESSION (Suppression for Logistic Regression Model)

  • 홍종선;김호일;함주형
    • 응용통계연구
    • /
    • 제18권3호
    • /
    • pp.701-712
    • /
    • 2005
  • 로지스틱 회귀모형에서 suppression의 논의는 선형회귀의 논의보다 많지 않은데 그 이유 중의 하나는 회귀제곱합 또는 결정계수의 정의가 유일하지 않고 다양하기 때문이다. 여러 종류의 결정계수들 중에서 선호되는 두 종류의 결정계수와 Liao와 McGee(2003)가 제안한 두 종류의 수정 결정계수의 정의로부터 회귀제곱합을 유도하여 로지스틱 회귀모형에서의 suppression을 설명하고자 한다. 모의실험을 통하여 자료를 생성하여 어떤 경우에 suppression이 발생하는지를 살펴보고 그 결과를 선형회귀모형에서의 suppression 결과와 비교한다.

특허정보를 활용한 기술 확산 예측: NCW 정보보호기술을 중심으로 (Forecasting the Diffusion of Technology using Patent Information: Focused on Information Security Technology for Network-Centric Warfare)

  • 김도회;박상성;신영근;장동식
    • 한국콘텐츠학회논문지
    • /
    • 제9권2호
    • /
    • pp.125-132
    • /
    • 2009
  • 세계의 경제가 지식 기반 경제로 급변함에 따라 특허경쟁력을 강화하기 위한 노력을 다각적으로 실시하고 있다. 이러한 특허경쟁력을 강화하기 위해 일반적으로 해당 기술 분야에 대한 특허동향조사를 통해 다양한 분석을 하고 있지만 대부분 현재까지의 기술동향에 대한 자료를 통계적으로 표현하거나 핵심 기술에 대한 전문가의 정성분석을 포함하는 정도에 국한되고 있다. 따라서 본 논문에서는 제한적으로 활용되고 있는 특허정보를 이용하여 향후 기술 확산 형태를 예측해 보고자 한다. 이를 위해 일반적으로 많이 사용되고 있는 확산모형인 Bass 모형과 Logistic 모형을 통해 실험을 진행하였고, 각 모형의 성능을 평가하기 위해 MSE값과 MAPE값을 이용하였다. 입력데이터로는 NCW 정보보호기술과 관련된 특허데이터를 사용함으로써 기존 특허동향조사와 연계한 심화분석을 도출하였다. 실험결과 NCW 정보보호기술에 대한 확산을 예측하기 위한 모형은 Logistic 모형이 더 우수함을 알 수 있었으며, NCW 정보보호기술은 2008년 현재 점차 기술 성숙기에 접어들고 있음을 예측할 수 있었다.

3차원 잔차산점도를 이용한 로지스틱회귀모형에서 교호작용의 탐색 (Exploring interaction using 3-D residual plots in logistic regression model)

  • 강명욱
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권1호
    • /
    • pp.177-185
    • /
    • 2014
  • 로지스틱회귀모형에서 설명변수만으로는 충분히 설명이 되지 못하고 설명변수의 변환된 형태인 이차항 또는 교호작용항이 필요한 경우가 있다. 설명변수가 두 개이고 조건부 분포가 이변량 정규분포를 따르는 경우 로지스틱회귀모형에서는 기본적으로 이차항과 교호작용항이 모형에 포함되어야 한다. 하지만 조건부 분포의 분산과 상관계수에 따라 이차항과 교호작용항이 필요하지 않게 되는 경우도 있다. 분산이나 상관계수에 대한 정보는 산점도를 보고 대체적인 판단이 가능하지만 교호작용항의 필요성을 판단하기가 쉽지 않다. 본 논문에서는 3차원 잔차산점도를 이용한 교호작용의 탐색방법을 제시하고 이 방법을 실제 자료에 적용시켜본다.

다수준 로지스틱 모형을 이용한 흡연 여부에 미치는 영향 분석 (A Study of Effect on the Smoking Status using Multilevel Logistic Model)

  • 이지혜;허태영
    • 응용통계연구
    • /
    • 제27권1호
    • /
    • pp.89-102
    • /
    • 2014
  • 본 연구에서는 질병관리본부에서 매년 조사하고 있는 지역사회 건강조사 자료를 이용하여 서울시 지역을 대상으로 개인의 흡연 여부에 대한 영향 요인을 확인하고 지역간 차이를 모형에 반영시키는 다수준 로지스틱 모형을 이용하여 분석하였다. 다수준 모형에서의 적합한 분석 모형의 수준을 결정하기 위해 ICC(intraclass correlation coefficient)와 프로파일링 분석, 수준별 모형의 예측정확도를 이용하였다. 제안된 모형들의 성능을 평가하기 위해 민감도, 특이도, 정확도를 구하고 ROC curve를 작성하였다. 결과적으로 지역사회 건강조사 자료와 같이 개인과 집단 변수를 동시에 고려할 수 있다면 다양한 다수준 모형의 적용이 가능하며 활용성이 높다는 것을 알 수 있었다.

로지스틱 회귀모형과 의사결정 나무모형을 활용한 청소년 자살 시도 예측모형 비교: 2019 청소년 건강행태 온라인조사를 이용한 2차 자료분석 (Comparison of the Prediction Model of Adolescents' Suicide Attempt Using Logistic Regression and Decision Tree: Secondary Data Analysis of the 2019 Youth Health Risk Behavior Web-Based Survey)

  • 이윤주;김희진;이예슬;정혜선
    • 대한간호학회지
    • /
    • 제51권1호
    • /
    • pp.40-53
    • /
    • 2021
  • Purpose: The purpose of this study was to develop and compare the prediction model for suicide attempts by Korean adolescents using logistic regression and decision tree analysis. Methods: This study utilized secondary data drawn from the 2019 Youth Health Risk Behavior web-based survey. A total of 20 items were selected as the explanatory variables (5 of sociodemographic characteristics, 10 of health-related behaviors, and 5 of psychosocial characteristics). For data analysis, descriptive statistics and logistic regression with complex samples and decision tree analysis were performed using IBM SPSS ver. 25.0 and Stata ver. 16.0. Results: A total of 1,731 participants (3.0%) out of 57,303 responded that they had attempted suicide. The most significant predictors of suicide attempts as determined using the logistic regression model were experience of sadness and hopelessness, substance abuse, and violent victimization. Girls who have experience of sadness and hopelessness, and experience of substance abuse have been identified as the most vulnerable group in suicide attempts in the decision tree model. Conclusion: Experiences of sadness and hopelessness, experiences of substance abuse, and experiences of violent victimization are the common major predictors of suicide attempts in both logistic regression and decision tree models, and the predict rates of both models were similar. We suggest to provide programs considering combination of high-risk predictors for adolescents to prevent suicide attempt.

미래 수요시장의 예측 방법론 (Forecasting methodology of future demand market)

  • 오상영
    • 디지털융복합연구
    • /
    • 제18권2호
    • /
    • pp.205-211
    • /
    • 2020
  • 미래 예측의 방법은 기술적 특성 또는 기술적 성능으로 예측이 가능할 수 있다. 그러므로 기술예측은 경제적, 사회적 이익을 산출해 낼 수 있는 전략적 연구 분야에서 활용되고 있다. 본 연구에서는 이러한 기술적 특성으로 미래를 예측하는 방법의 연구를 통하여 미래 시장을 예측하였다. 특별한 제품의 수요 욕구에 따라 시장을 점유하는 시점의 예측을 통해 미래 예측 방법을 연구하였다. 시장수요 예측을 위하여 대표적인 계량적 분석 방법인 연평균성장률(CAGR) 모형, BASS 모형, Logistic 모형, 곰페르츠 성장모형(Gompertz Growth Curve) 등의 비교를 통해 미래시장의 수요예측 모형을 제안하였다. 본 연구는 Rogers의 혁신확산 이론을 접목하여 제품이 시장에 확산되는 시점을 예측하였다. 연구결과로 특별한 제품이 시장을 점유하기 위한 다양한 요인들의 확산 시점을 통해 특별한 상품이 미래 시장에서 성숙하는 시점을 예측할 수 있는 방법론을 개발하였다. 그러나 시장을 예측하기 위한 전문가 판단에 대한 오류를 줄이는 것은 한계점이 있다.