• 제목/요약/키워드: Binary response regression

검색결과 44건 처리시간 0.03초

범주형 자료의 진단방법에 관한 연구 (A Study on Diagnostics Method for Categorical Data)

  • 이선규;조범석
    • 산업경영시스템학회지
    • /
    • 제18권33호
    • /
    • pp.93-102
    • /
    • 1995
  • In this study we are concerned with the diagnostics method of cross-classified categorical data using logistic regression model of binary response models for cell proportions. under this model, we could examine the goodness-of-fit of the models using Pearson's $x^2$test statistic and likelihood ratio statistic. Under this model, these statistics are assumed that sample survey schemes are with replacement sampling model. But these statistics are often inappropriate for analysing contingency tables consists of complex sampling schemes obtained sample survey data. In this study we are examined diagnostics procedures detecting any outlying cell proportions and influential observations on design space in logistic regression modeltake account of the survey design effects.

  • PDF

Mean Platelet Volume as an Independent Predictive Marker for Pathologic Complete Response after Neoadjuvant Chemotherapy in Patients with Locally Advanced Breast Cancer

  • Mutlu, Hasan;Eryilmaz, Melek Karakurt;Musri, Fatma Yalccn;Gunduz, Seyda;Salim, Derya Kivrak;Coskun, Hasan Senol
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제17권4호
    • /
    • pp.2089-2092
    • /
    • 2016
  • Background: The impact of mean platelet volume (MPV) on prognosis, diagnosis and response to therapy in cancer patients has been widely investigated. In the present study, we evaluated whether MPV at diagnosis has predictive value for pathologic complete response (pCR) after neoadjuvant chemotherapy in patients with locally advanced breast cancer (LABC). Materials and Methods: A total of 109 patients with LABC from Akdeniz University and Antalya Research and Training Hospital were evaluated retrospectively. Results: ROC curve analysis suggested that the optimum MPV cut-off point for LABC patients with pCR (+) was 8.15 (AUC:0.378, 95%CI [0.256-0.499], p=0.077). The patients with MPV <8.15 had higher pCR rates (29.2% vs. 13.1%, p=0.038). After binary logistic regression analysis, MPV and estrogen receptor absence were independent predictors for pCR. Conclusions: MPV has an independent predictive value for pCR after neoadjuvant chemotherapy in patients with LABC.

로지스틱 회귀모형을 이용한 비대칭 종형 확률곡선의 추정 (Estimation of Asymmetric Bell Shaped Probability Curve using Logistic Regression)

  • 박성현;김기호;이소형
    • 응용통계연구
    • /
    • 제14권1호
    • /
    • pp.71-80
    • /
    • 2001
  • 로지스틱 회귀모형은 이항 반응자료에 대한 가장 보편적인 일반화 선형모형으로 독립변수에 대한 확률함수를 추정하는데 이용된다. 많은 실제적 상황에서 확률함수가 종형의 곡선형태로 표현되는데 이 경우에는 2차항을 포함한 로지스틱 회귀모형을 이용한 분석은 대칭성을 갖는 확률함수에 대한 가정으로 인해 비대칭 형태의 종형곡선에서는 확률함수의 신뢰성이 저하되고, 2차항을 포함하기 때문에 독립변수의 효과를 설명하기가 쉽지 않다는 제한점을 가지고 있다. 본 논문에서는 이러한 문제점을 해소하기 위해서 로지스틱 회귀분석과 반복적 이분법을 이용하여 종형의 형태에 관계없이 확률곡선을 추정하는 방법론을 제안하고 모의 실험을 통해 2차항을 포함한 로지스틱 회귀모형과 비교하고자 한다.

  • PDF

신경망을 이용한 우승자 예측모형 (Prediction of a winner in PGA tournament using neural network)

  • 민대기;현무성
    • Journal of the Korean Data and Information Science Society
    • /
    • 제20권6호
    • /
    • pp.1119-1127
    • /
    • 2009
  • 골프경기에서 상금이나 평균타수와 같은 척도에는 명확한 기록이 정의되어 있지만 누가 우승을 할 것인가 하는 관점에서는 Tiger Woods나 Phil Mickelson 그리고 Steve Stricker 등 2009년에 3승 이상을 한 선수를 제외하면 과연 누구일까 하는 의문을 갖게 될 것이다. 왜냐하면 워낙 선수층이 두터워 백지한창 차이의 실력을 갖춘 우승후보 선수들이 많고, 다른 종목보다 정신력이 결과에 많은 영향을 미치기 때문이다. 본 연구에서는 복잡한 비선형 형태의 자료를 파악하는데 아주 유용한 도구인 신경망을 이용하여 2009년 PGA자료를 바탕으로 우승자 예측모형에 대하여 연구를 하였다.

  • PDF

서울시 PM 대 보행자 교통사고 심각도에 대한 도시건조환경의 영향 (Influence of Urban Built Environment on Severity of PM-Pedestrian Accidents in Seoul)

  • 신송현;추상호;임단비
    • 한국ITS학회 논문지
    • /
    • 제22권4호
    • /
    • pp.114-131
    • /
    • 2023
  • 개인형 이동수단의 이용이 활성화됨에 따라, 관련한 PM 사고도 급격하게 증가하였다. 이러한 사고 증가에 대응하기 위해, 2021년 5월 13일 정부에서는 관련 규정을 강화하였지만, PM 가해사고의 증가 추이는 피해사고의 증가 추이보다 크게 감소하지 않았다. 이러한 PM 가해사고의 대부분은 보행자와의 충돌 사고로, 보행자들의 안전이 위협받고 있는 것을 알 수 있었다. 이에 본 연구에서는 PM 대 보행자 충돌사고를 중점적으로 규제 및 기상환경, 도시건조환경 특성 등을 반영하여, PM 대 보행자 교통사고 심각도에 영향을 미치는 요인들을 분석하였다. 2020년부터 2021년 간 서울시에서 발생한 PM 대 보행자 교통사고를 수집하였으며, 이항 로지스틱 회귀분석을 활용하여 분석을 수행하였다. 주요 분석결과를 통해 정책적 시사점을 도출하였다.

한국국민의 가계 금융부채에 대한 체감도 분석 (Analysis of Stress level of Korean Household Members due to Household Debt)

  • 오만숙;현승미
    • 응용통계연구
    • /
    • 제22권2호
    • /
    • pp.297-307
    • /
    • 2009
  • 최근 금융위기의 요인이 되고 있는 가계부채에 대하여 가계구성원이 느끼는 부담감, 즉, 가계부채에 대한 체감도에 가계구성원의 속성들(주택점유형태, 가구주 학력, 가구주 연령, 월소득, 거주지역)이 미치는 영향을 2004년도 국민은행이 조사한 실제자료를 가지고 분석하였다. 체감도를 부채에 대한 부담감이 낮음과 높음의 이항자료로 구분하여 가계구성원의 속성들을 설명변수로 갖는 로지스틱 회귀분석을 수행하였다. 적합도에 대한 우도비 통계량을 이용한 후진제거법을 사용하여 간단하면서도 자료를 잘 적합시키는 모형을 선택한 결과 2개의 2차 교호작용을 갖는 모형이 선택되었다. 선택된 모형에 대한 계수 추정치를 통하여 각 속성이 부채 체감도에 대하여 미치는 영향을 분석하였다. 또한 가계부채의 유무에 대하여 가계구성원의 속성들이 미치는 영향을 로지스틱 회귀모형을 통하여 유사한 방법으로 분석하였다 자가주택일수록, 월소득이 증가할수록, 가구주 학력이 낮을수록 그리고 가구주 연령이 낮아질수록 부채에 대한 체감도가 낮아짐을 알 수 있었다.

로지스틱회귀모형의 변수선택에서 로그-오즈 그래프를 통한 로그-밀도비 연구 (A study on log-density with log-odds graph for variable selection in logistic regression)

  • 강명욱;신은영
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권1호
    • /
    • pp.99-111
    • /
    • 2012
  • 반응변수가 주어졌을 때 설명변수의 조건부 확률분포의 로그-밀도비는 로지스틱회귀모형에서 어떤 설명변수가 어떻게 모형에 포함되는지에 대한 변수선택문제에서 유용한 정보를 제공한다. 설명변수의 조건부 확률분포가 좌우대칭이 아닌 경우 감마분포로 가정하는 것이 적절하고 이 경우 x항과 log(x)항이 모형에 포함되어야 한다. 로그-오즈 그래프는 변수선택문제를 연구하는데 매우 중요한 도구가 된다. 이러한 그래픽적 연구에 의하면, x|y = 0과 x|y = 1의 두 분포가 겹치는 경우에서는 x항과 log(x)항 모두 필요하다. 그리고 두 분포가 분리된 경우에는 x항 또는 log(x)항 중 하나만 필요하다.

로지스틱회귀모형의 평가를 위한 그래픽적 방법 (Various Graphical Methods for Assessing a Logistic Regression Model)

  • 김경진;강명욱
    • 응용통계연구
    • /
    • 제28권6호
    • /
    • pp.1191-1208
    • /
    • 2015
  • 대부분의 통계분석방법은 요약통계량에 의존하지만 그래픽적 방법을 이용하면 자료의 특성을 파악하기 쉽고 통계량만으로는 알아낼 수 없는 부분까지도 접근이 가능하다. 그래프를 통한 로지스틱회귀모형의 평가 방법으로 로그-밀도비를 통한 검토, 차원 검토, 주변모형산점도, 카이잔차산점도, CERES 그림을 알아보고 모의자료들을 통해 다양한 상황에서 그래픽적 방법들 어떠한 결과를 나타내지를 비교 검토한다.

로지스틱 회귀모형에서 최우추정량의 정확도 산정 (Assessing the accuracy of the maximum likelihood estimator in logistic regression models)

  • 이기원;손건태;정윤식
    • 응용통계연구
    • /
    • 제6권2호
    • /
    • pp.393-399
    • /
    • 1993
  • 반응이 두 가지로 나타나는 자료에서 설명변수와 반응변수와의 관계를 연구할 때 많이 사용되는 로지스틱 회귀모형에 대하여 그 모수들을 최우추정법으로 구할 때 추정량의 표준오차는 보통 로그우도함수의 2차도함수에 바탕을 두어 계산하게 된다. 한편 피셔정보량이 로그우도함수의 1차도함수를 제곱한 통계량의 기대값으로도 계산된다는 점에 착안하여 얻어지는 피셔정보량의 추정량도 이와 거의 비슷한 대표본 성질을 갖는 것으로 알려져 있다. 이러한 피셔정보량의 추정량들은 최우추정량을 구할 때의 반복 알고리즘과 깊은 관련을 갖고 있다. 어느 방법이 더 효과적으로 최우추정량을 계산하는 지 평균반복횟수를 비교하고 대표본분산의 추정량으로서 각 방법에서 계산되는 분산의 추정량들을 비교하였다.

  • PDF

Risk Relationship of Cataract and Epilation on Radiation Dose and Smoking Habit

  • Tomita, Makoto;Otake, Masanori;Moon, Sung-Ho
    • Journal of the Korean Data and Information Science Society
    • /
    • 제17권4호
    • /
    • pp.1349-1364
    • /
    • 2006
  • An analytic approach that provides explicit estimates of risk on cataract and epilation data is evaluated by reasonableness of conceivable relative risk models regarding a simple, odds, logistic or Gompertz regression method, assuming a binomial distribution. In these analyses, we apply relative risk models with two thresholds between epilators and nonepilators from a highly characteristic lesion of which radiation cataract does not occur around 2 gray for a single acute exposure. The risk models are fitted to the data assuming 10 as a constant relative biological effectiveness of neutron. The likelihood of observing the entire data set in these models fitted is evaluated by an individual binary-response array. Estimation of a threshold with or without severe epilation and the 100 ($1-\alpha$)% confidence limits are derived from the maximum likelihood approach. The relative risk model with two thresholds can be expressed as a formula with structure of Background $\times$ RR, where RR includes threshold models with or without epilation. The radiosensitivity of ionizing radiation to cataracts has been examined for the relationship between epilators and nonepilators.

  • PDF