• 제목/요약/키워드: 로지스틱

검색결과 1,996건 처리시간 0.025초

다범주 자료의 다항로짓 모형과 로지스틱 회귀모형 비교;장애연금 특성분석 중심으로 (Comparison of Multinomial Logit and Logistic Regression on Disability Pensioners' Characteristic)

  • 김미정
    • 응용통계연구
    • /
    • 제21권4호
    • /
    • pp.589-602
    • /
    • 2008
  • 순위형 다범주 자료에 있어서 범주값의 증감에 대한 설명변수의 특성분석을 위하여 다항로짓모형을 적합하여 분석하고 로지스틱 회귀모형을 적합하여 분석한 결과와 비교하였다. 이를 통하여 장애연금 수급자자료의 재정추계를 위해 필요한 일곱 가지 요인인 성별, 수급나이, 가입기간, 가입종별, 소득활동여부, 소득수준, 장애원인이 장애등급에 미치는 영향을 파악하였다. 일곱 요인 모두 장애응급에 대한 연관성이 있음을 확인하였고 이 가운데 다섯 요인은 장애등급의 증감에 있어서도 일정한 추세를 보였으나, 장애원인과 소득수준은 장애등급의 증감에는 일정한 추세를 보이지 않음을 확인하였다. 본 연구의 결과는 장애연금 관리방안을 모색하는데 있어서 장애등급에 따른 설명 요인의 특성을 반영하는데 필요한 가이드라인을 제공할 수 있을 것으로 기대한다. 장애등급 분류에 있어서 다중분류의 정분류율은 각각 42.56%와 42.43%로 로지스틱 회귀모형의 경우 다중로짓 모형의 경우보다 다소 높았지만 거의 비슷한 정확도를 보였다.

로지스틱 분석을 이용한 메소드 위치 결정 방법 (An Approach to decide the location of a method using the logistic analysis)

  • 정영애;박용범
    • 정보처리학회논문지D
    • /
    • 제12D권7호
    • /
    • pp.1017-1022
    • /
    • 2005
  • 소프트웨어의 요구사항 변경은 소프트웨어의 생명주기 전반에 걸쳐 발생한다. 이러한 변경은 소프트웨어의 수정을 요구하며, 소프트웨어 수정시 소프트웨어의 품질과 안정성을 향상시키는 것은 중요한 문제이다. 리팩토링은 소프트웨어의 품질과 안정성을 보장하면서 소프트웨어를 수정하는 기술이다. 따라서 리팩토링의 자동화에 대하여 다양한 연구가 이루어지고 있다. 본 논문에서는 무브 메소드(Move Method)의 적용여부를 결정지을 수 있는 세 가지 요인을 정의하였다. 정의된 요인에 의해 데이터를 샘플 프로그램에서 추출하였고, 추출된 데이터에 이진 로지스틱 회귀분석을 적용하였다. 이진 로지스틱 회귀분석을 통하여 얻은 무브 메소드 적용 여부에 대한 추측결과는 숙련된 프로그래머들의 수동분석 결과와 상당부분 일치하였다 더불어, 각 요인들은 프로그램 내에서 메소드의 위치를 결정하는데 중요하게 작용하며, 메소드의 최적 위치를 결정짓는 기준으로써 사용될 수 있음을 밝혔다.

클래스 간 메소드 위치 결정 방법의 비교 (Comparative Analysis of Determination of Method Location between Classes)

  • 정영애;박용범
    • 한국콘텐츠학회논문지
    • /
    • 제6권12호
    • /
    • pp.80-88
    • /
    • 2006
  • 객체지향 패러다임에서 객체의 속성, 동작, 객체사이의 관계를 표현하는 클래스의 구성요소들에 대한 연관관계를 측정하는 응집도는 다양하게 연구되어 왔다. 리팩토링 분야에서도 개발자의 경험이나 직감에 의한 수동분석에서 자동분석에 이르기까지 다양한 연구가 제안되어 왔다. 리팩토링을 자동으로 수행하기 위해서는 수행여부를 결정짓는 객관적 판단기준에 대한 검증이 필요하다. 본 논문에서는 참조관계를 고려한 여섯 개의 메소드 위치 결정 요인과 메소드 위치에 대한 관계를 분석하기 위한 방법으로 로지스틱 회귀분석과 신경망을 사용할 것을 제안하였다. 실험 결과, 로지스틱 회귀 분석은 97%, 신경망은 90% 이상의 예측율을 보였으며, 로지스틱 회귀분석이 신경망을 이용한 방법보다 더 우수한 예측결과를 보였다. 또한 두 방법 모두 90% 이상의 예측율로 여섯 개의 메소드 위치 결정 요인이 리팩토링 무브 메소드의 객관적 판단기준으로 적용될 수 있음을 보였다.

  • PDF

로지스틱 회귀분석을 이용한 문제음주 예측요인 분석 (Analysis for Factors of Predicting Problem Drinking by Logistic Regression Analysis)

  • 김미영
    • 디지털융복합연구
    • /
    • 제15권5호
    • /
    • pp.487-494
    • /
    • 2017
  • 문제음주는 개인의 정서적 문제와 신체적 질병을 유발하며 사고나 상해, 주취폭력 등 주변인 및 지역사회에 미치는 부정적 폐해가 크기 때문에 어떠한 특성을 가진 개인이 문제음주의 가능성이 높은지 그 예측요인을 규명하는 것은 음주와 관련한 치명적인 손실을 예방하기 위해 무척 중요하다. 이에 본 연구는 2012년도에 실시된 한국복지패널 7차년도 데이터 중 음주경험이 있으며 AUDIT에 응답한 3,915명을 대상으로 문제음주와 인구사회학적, 심리사회적 변인과의 관계를 분석하고, 문제음주의 예측요인을 검증하기 위해 로지스틱 회귀분석을 실시하였다. 연구 결과 조사대상자의 36%가 문제음주군으로 나타났으며, 성별, 연령, 학력, 직업, 경제적 상황과 자아존중감, 우울, 가족관계 만족 및 사회관계 만족이 문제음주와 상관관계가 있는 것으로 확인되었다. 또한 로지스틱 회귀분석 결과 조사대상자의 문제음주를 예측하는 요인은 성별, 연령, 학력, 직업, 자아존중감 및 우울로 확인되었다. 이러한 결과를 토대로 일반 성인들의 문제음주군으로의 진입을 예방하기 위한 실천적 방안의 근거를 제시하였다.

로버스트추정에 바탕을 둔 주성분로지스틱회귀 (Principal Components Logistic Regression based on Robust Estimation)

  • 김부용;강명욱;장혜원
    • 응용통계연구
    • /
    • 제22권3호
    • /
    • pp.531-539
    • /
    • 2009
  • 로지스틱회귀분석은 고객관계관리를 위한 데이터마이닝 분야에서 많이 사용되는 기법인데, 이 분야의 모형설정 과정에서는 연관성이 매우 높은 설명변수들이 모형에 함께 포함되어 다중공선성의 문제를 유발하며, 더욱이 회귀자료에 이상점들이 포함되면 최우추정량은 심각한 결함을 갖게 된다. 두 가지 문제점을 동시에 해결하기 위하여 로버스트주성분로지스틱회귀를 적용할 수 있는데, 본 논문에서는 주성분의 선정기준을 결정하는 모형을 개발하고, 주성분모형에서의 추정치에 미치는 이상점의 영향을 축소하기 위한 로버스트추정법을 제안하였다. 제안된 추정법은 다중공선성과 이상점이 유발하는 문제들을 적절히 해결해 준다는 사실이 모의실험을 통하여 확인되었다.

신용평가에서 로지스틱 회귀를 이용한 미결정자 추론 (Undecided inference using logistic regression for credit evaluation)

  • 홍종선;정민섭
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권2호
    • /
    • pp.149-157
    • /
    • 2011
  • 본 연구는 신용평가 과정에서 발생하는 미결정자를 결측자료 문제로 간주하여 MAR와 MNAR 가정 하에서 추론한다. MAR 가정에서 미결정자 추론은 결정자들에 대한 로지스틱 회귀모형의 회귀 계수벡터를 이용하여 미결정자의 부도 확률을 구한 후 결정자의 부도확률과 비교하여 미결정자의 미래 상태를 판단한다. 그리고 MNAR 가정에서의 미결정자 추론은 특성변수가 추가한 로지스틱 모형으로부터 미결정자의 부도확률을 구하고 미결정자를 예측하는 방법을 제안하였다. 두 종류의 실제 자료에 대하여 모의실험을 한 결과, MAR 가정에서 미결정자의 비율이 증가하더라도 원자료의 오분류율과 추론한 결과 차이가 없으며, MNAR 가정에서는 추가적인 변수를 고려하여 미결정자를 추정하였기 때문에 미결정자의 오분류율이 MAR 가정에서의 오분류율보다 감소하고 나아가 전체에서 미결정자가 차지하는 비율이 증가함에 따라 전체의 오분류율이 더욱 감소함을 발견하였다.

지진 재현수준 예측에 대한 로그-로지스틱 분포와 일반화 극단값 분포의 비교 (Comparison of log-logistic and generalized extreme value distributions for predicted return level of earthquake)

  • 고낙경;하일도;장대흥
    • 응용통계연구
    • /
    • 제33권1호
    • /
    • pp.107-114
    • /
    • 2020
  • 자연 재해로부터 관측되는 자료를 대상으로 재현 수준 예측 등과 같은 자료 분석을 위해 일반화 극단값 분포(generalized extreme value)가 자주 사용되어 왔다. 표본 수가 충분히 큰 경우 연속적인 블록 최댓값들은 점근적으로 일반화 극단값 분포를 따른다. 하지만 소표본인 경우 이러한 사실은 성립되지 않을 수도 있다. 본 논문에서는 이러한 문제점을 해결하기 위해 모형 적합도 검정 및 모형 선택을 통해 로그-로지스틱(log-logistic) 분포의 사용을 제안한다. 하나의 예증으로서 중국 지진 자료를 대상으로 하여 로그-로지스틱 분포를 이용하여 재현 기간별 재현 수준 예측 및 신뢰구간을 제시한다.

주성분 분석과 로지스틱 회귀분석을 이용한 다국 통화포트폴리오 전략 (Multi-currencies portfolio strategy using principal component analysis and logistic regression)

  • 심경식;안재준;오경주
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권1호
    • /
    • pp.151-159
    • /
    • 2012
  • 본 논문에서는 외환시장에서 주성분 분석과 로지스틱 회귀분석을 이용한 다국 통화 포트폴리오 전략을 개발하는 것을 제안한다. 과거 환율시장의 분석에 대한 많은 연구가 진행되어 왔으나 상대적으로 외환시장에서의 거래 전략을 개발하는 연구는 거의 없었다. 본 연구는 크게 두 가지 목적을 가지고 있다. 첫 번째 목적은 주성분 분석을 적용시켜 포트폴리오를 구성하는 다양한 나라의 환율에 가중치 할당 방법을 제안하는 것이다. 두 번째 목적은 로지스틱 회귀분석을 이용하여 구성된 포트폴리오의 적절한 매수시점과 매도시점을 정하는 것이다. 이 논문의 실험결과는 제안한 투자전략의 유용성을 증명할 수 있을 것이며, 또한 이를 통해 시장참여자들에게 투자 결정에 있어 도움을 줄 수 있을 것이다.

RHIPE 플랫폼에서 빅데이터 로지스틱 회귀를 위한 학습 알고리즘 (Learning algorithms for big data logistic regression on RHIPE platform)

  • 정병호;임동훈
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권4호
    • /
    • pp.911-923
    • /
    • 2016
  • 빅데이터 시대에 머신러닝의 중요성은 더욱 부각되고 있고 로지스틱 회귀는 머신러닝에서 분류를 위한 방법으로 의료, 경제학, 마케팅 및 사회과학 전반에 걸쳐 널리 사용되고 있다. 지금까지 R과 Hadoop의 통합환경인 RHIPE 플랫폼은 설치 및 MapReduce 구현의 어려움으로 인해 거의 연구가 이루지 지지 않았다. 본 논문에서는 대용량 데이터에 대해 로지스틱 회귀 추정을 위한 두가지 알고리즘 즉, Gradient Descent 알고리즘과 Newton-Raphson 알고리즘에 대해 MapReduce로 구현하고, 실제 데이터와 모의실험 데이터를 가지고 이들 알고리즘 간의 성능을 비교하고자 한다. 알고리즘 성능 실험에서 Gradient Descent 알고리즘은 학습률에 크게 의존하고 또한 데이터에 따라 수렴하지 않는 문제를 갖고 있다. Newton-Raphson 알고리즘은 학습률이 불필요 할 뿐만 아니라 모든 실험 데이터에 대해 좋은 성능을 보였다.

형상모수를 고려한 소프트웨어 신뢰성 비용 모형에 관한 비교 연구 (The Comparative Software Reliability Cost Model of Considering Shape Parameter)

  • 김경수;김희철
    • 디지털융복합연구
    • /
    • 제12권3호
    • /
    • pp.219-226
    • /
    • 2014
  • 본 연구에서는 소프트웨어 제품 테스팅 과정에서 고장 수명분포의 형상모수를 고려한 소프트웨어 신뢰성 비용 모형에 대하여 연구 하였다. 신뢰성 분야에서 많이 사용되는 어랑 분포와 로그-로지스틱 모형을 이용한 형상모수를 반영한 문제를 제시하였다. 소프트웨어 고장모형은 유한고장 비동질적인 포아송과정을 이용하고 모수추정법은 최우추정법을 이용 하였다. 따라서 본 논문에서는 형상모수를 고려한 소프트웨어 비용모형 분석을 위하여 소프트웨어 고장 시간 자료를 적용하여 비교 분석하였다. 본 연구에서 사용된 어랑 분포와 로그-로지스틱분포에 근거한 소프트웨어 비용 모델을 비교한 결과 어랑 모형은 최적의 소프트웨어 방출 시간을 예측 할 수 있지만 로그-로지스틱 모형은 방출시간을 예측 할 수 없기 때문에 로그-로지스틱 보다 어랑 모형이 보다 효율적으로 나타나고 있다. 이 연구를 통하여 소프트웨어 개발자들은 소프트웨어 개발 비용을 파악 하는데 어느 정도 도움을 줄 수 있을 것으로 사료된다.