• 제목/요약/키워드: 다항 로지스틱 모형

검색결과 34건 처리시간 0.023초

다범주 자료의 다항로짓 모형과 로지스틱 회귀모형 비교;장애연금 특성분석 중심으로 (Comparison of Multinomial Logit and Logistic Regression on Disability Pensioners' Characteristic)

  • 김미정
    • 응용통계연구
    • /
    • 제21권4호
    • /
    • pp.589-602
    • /
    • 2008
  • 순위형 다범주 자료에 있어서 범주값의 증감에 대한 설명변수의 특성분석을 위하여 다항로짓모형을 적합하여 분석하고 로지스틱 회귀모형을 적합하여 분석한 결과와 비교하였다. 이를 통하여 장애연금 수급자자료의 재정추계를 위해 필요한 일곱 가지 요인인 성별, 수급나이, 가입기간, 가입종별, 소득활동여부, 소득수준, 장애원인이 장애등급에 미치는 영향을 파악하였다. 일곱 요인 모두 장애응급에 대한 연관성이 있음을 확인하였고 이 가운데 다섯 요인은 장애등급의 증감에 있어서도 일정한 추세를 보였으나, 장애원인과 소득수준은 장애등급의 증감에는 일정한 추세를 보이지 않음을 확인하였다. 본 연구의 결과는 장애연금 관리방안을 모색하는데 있어서 장애등급에 따른 설명 요인의 특성을 반영하는데 필요한 가이드라인을 제공할 수 있을 것으로 기대한다. 장애등급 분류에 있어서 다중분류의 정분류율은 각각 42.56%와 42.43%로 로지스틱 회귀모형의 경우 다중로짓 모형의 경우보다 다소 높았지만 거의 비슷한 정확도를 보였다.

연속형의 텐서곱과 범주형의 직합을 사용한 다항 로지스틱 회귀모형 (A polychotomous regression model with tensor product splines and direct sums)

  • 심송용;강희모
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권1호
    • /
    • pp.19-26
    • /
    • 2014
  • 다항 로지스틱 회귀모형의 설명변수가 연속형과 범주형을 모두 포함할 때 범주형 설명변수는 직합을 적용하고 연속형 설명변수는 텐서곱을 적용하는 모형을 제안한다. 변수선택의 기준으로 BIC를 사용하고, 제안된 모형의 알고리즘을 구현하였다. 구현된 알고리즘을 실제 자료에 적용하여 기존의 방법과 비교하여 제안된 모형이 더 좋은 분류율을 보임을 확인하였다.

한우 거세우 고기 관능평가 데이터의 로지스틱 회귀분석 (Logistic Regressions with Sensory Evaluation Data about Hanwoo Steer Beef)

  • 이혜정;김재희
    • 응용통계연구
    • /
    • 제23권5호
    • /
    • pp.857-870
    • /
    • 2010
  • 국립축산과학원에서는 2006년 부터 2008년 까지 전국 소비자들을 대상으로 한우 거세우 표본 시료에 대한 관능 평가 조사를 실시하여 데이터를 수집하였으며 본 연구에서는 한우 관능 평가 데이터에 대해 사회 인구학적 요인과 한국 소비자들의 맛 평가에 대한 연관성을 탐구하고자 한다. 소비자 거주지역, 연령, 성별, 직업, 월수입과 쇠고기 부위를 설명변수로 맛등급 평가를 반응변수로 이항 다중 로지스틱 모형과 다항 다중 로지스틱 모형을 적합하고 회귀계수별 유의성 검정과 적합도 검정을 실시한다. 단계별 변수 선택으로 최종 모형을 선택하고 반응변수 범주에 대한 오즈비를 계산하여 맛등급과 설명변수들 간의 관련성을 파악한다. 또한 맛과 관련 있는 연속형 변수를 설명변수로 포함한 경우에 대해서도 이항 다중 로지스틱 모형과 다항 다중 로지스틱 모형을 적합하고 비교한다. 그 결과 거주 지역, 연령, 월수입과 쇠고기 부위 변수들이 선택되었으며 영남지역에서 맛에 대한 오즈가 큰 편이며 수입이 많고 연령이 높을수록 맛에 대한 오즈가 작은 편이었다. 요리법으로는 탕에 대한 구이의 오즈비가 큰 편이며 쇠고기 부위별로는 우둔에 비해서 등심이 다른 부위들 보다 맛에 대한 차이가 크다고 볼 수 있다. 연속형 변수로는 연도가 맛등급에 큰 영향을 미치는 변수로 나타났다.

심층 신경망모형을 사용한 미세먼지 PM10의 예측 (Prediction of fine dust PM10 using a deep neural network model)

  • 전성현;손영숙
    • 응용통계연구
    • /
    • 제31권2호
    • /
    • pp.265-285
    • /
    • 2018
  • 본 연구에서는 미세먼지 $PM_{10}$의 4가지 분류 등급인 '좋음, 보통, 나쁨, 매우 나쁨' 그리고 2가지 분류 등급인 '좋음 혹은 보통, 나쁨 혹은 매우 나쁨'을 예측하기 위해서 심층 신경망모형을 사용하였다. 2010년부터 2015년까지 국내 6개 대도시 지역에서 관측한 일별 미세먼지 데이터에 대하여 기존 분류기법인 신경망모형, 다항 로지스틱 회귀모형, Support Vector Machine, Random Forest을 적용했을 때에 비해서 심층 신경망모형의 정확도는 더 높아졌다.

계수적 반응을 갖는 종양 억제 혼합물 실험에서 모형 비교 (A comparison of models for the quantal response on tumor incidence data in mixture experiments)

  • 김정일
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권5호
    • /
    • pp.1021-1026
    • /
    • 2017
  • 화학, 제약, 식품 등 여러 분야에서 활용되는 혼합물 실험은 반응변수가 설명변수들의 절대량이 아닌 상대적인 혼합비율에 의해 영향을 받고 구조상 공선성이 존재하게 되는 성질이 있으며 양적인 반응변수들에 대한 실험이 많아 대부분 정규분포를 가정하고 선형모형을 적용하여 분석하고 있다. 이 논문에서는 반응변수가 계수형인 혼합물 실험의 사례로 Chen 등(1996)에 소개된 종양 억제 효과에 대한 실험에 나타난 지방, 탄수화물, 섬유질과 같은 식이요법 관련 혼합물 성분들과 종양 발현 여부인 계수형 방응변수를 갖는 자료를 대상으로 셰페의 2차 다항모형과 성분들간의 비선형적 관계를 보완하기 위해 대안으로 제시된 베커의 수정 모형들, 그리고 공선성을 완화하기 위해 제시된 Akay와 Tez(2011)의 성분비 변환 모형을 설명변수들의 선형결합으로 활용하여 설정한 로지스틱회귀모형들을 분류 정확도 기준을 적용하여 비교하고 결과를 설명하였다.

VUS와 HUM 최적화를 이용한 선형함수의 모수추정 (Parameter estimation of linear function using VUS and HUM maximization)

  • 홍종선;원치환;정동길
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권6호
    • /
    • pp.1305-1315
    • /
    • 2015
  • ROC 곡선을 구성하는 한 개의 스코어 변수로 이루어진 분류모형을 확장하여 선형 스코어의 함수인 리스크 스코어를 고려하고, 선형 스코어의 계수를 추정하기 위한 방법으로 AUC를 최대화하는 방법을 사용한다. 이런 AUC 접근방법으로 구한 스코어의 계수 추정량은 로지스틱모형을 이용한 선형 스코어의 모수의 최대가능도 추정량보다 자료가 로지스틱 가정이 맞지 않는 일반적인 상황에서도 좋은 추정 결과를 보인다. 본 연구에서는 다항범주로 분류되어 현실적인 판별 및 예측 상황을 고려하여 AUC 접근방법을 확장한 VUS와 HUM 접근방법을 제안한다. 연결함수로는 로짓, complementary log-log와 로짓을 변형한 함수의 세 종류와 그리고 다양한 분류점의 분포인 경우에 대하여도 모의실험을 실시하였다. 본 논문에서는 다항범주 판별결과에 대하여 VUS와 HUM 접근방법도 AUC 접근방법과 유사하게 다양한 연결함수에 대하여 로지스틱모형 추정방법보다 동등하거나 더 나은 모수추정 결과를 보이는 것을 확인하였다.

도시 쇠퇴지역 공간 특성을 반영한 적합 도시재생 사업유형 적용방안 연구 (A Study on the Application of Suitable Urban Regeneration Project Types Reflecting the Spatial Characteristics of Urban Declining Areas)

  • 조돈철;신동빈
    • 한국지리정보학회지
    • /
    • 제24권4호
    • /
    • pp.148-163
    • /
    • 2021
  • 본 연구는 「도시재생 활성화 및 지원에 관한 특별법」에 따라 2017년부터 시작된 도시재생 뉴딜사업(이하 '뉴딜사업')의 종류가 다양해짐에 따라 데이터 기반의 정확한 쇠퇴진단과 사업유형 예측이 중요하다고 판단되어, 전국 읍면동을 대상으로 가장 적합한 뉴딜사업 유형을 판별할 수 있는 적용 모형 개발을 위한 연구를 수행하였다. 적용 모형 개발을 위한 데이터는 통계지리정보서비스(SGIS)와 도시재생정보체계의 '도시재생 종합정보 개방체계'를 통해 수집하고 데이터 전처리를 거쳐 분석 모델을 위한 데이터를 구축하였다. 적용 모형은 다항 회귀분석과 다항 로지스틱 회귀분석을 통해 4가지 모형을 도출하였다. 4가지 모형의 적용 가능성과 유효성 검증을 위해 서울특별시를 대상으로 각 모형별로 기존에 선정된 뉴딜사업지에 공간분포도를 비교 분석한 결과 DI-54 모형이 가장 높은 일치율을 확인할 수 있었다. 또한 DI-54 모형을 전국 954개 도시 쇠퇴지역에 적용해본 결과에서도 적합 도시재생 사업유형 판별에 활용 가능성을 확인할 수 있었다.

한우 수소 고기 관능평가 데이터에 대한 범주형 자료 분석 (Categorical data analysis of sensory evaluation data with Hanwoo bull beef)

  • 이혜정;조수현;김재희
    • Journal of the Korean Data and Information Science Society
    • /
    • 제20권5호
    • /
    • pp.819-827
    • /
    • 2009
  • 국립축산과학원에서 수집한 한우 관능 평가 데이터에 대해 사회 인구학적 요인과 한국 소비자들의 맛 평가에 대한 연관성을 연구하고자 한다. 소비자 거주지역, 연령, 성별, 직업, 월수입과 쇠고기 부위를 설명변수로 맛등급 평가를 반응변수로 이항 다중 로지스틱 모형과 다항 다중 로지스틱 모형을 적합하고 회귀계수별 유의성 검정과 적합도 검정을 실시하였다. 단계별 변수 선택으로 최종 모형을 선택하고 반응변수 범주에 대한 오즈비를 계산하여 관련성을 파악한다. 그 결과 거주 지역, 연령, 월수입과 쇠고기 부위 변수들이 선택되었다. 영남에서 맛을 비교적 높게 평가하는 경향이 있으며 수입이 많고 연령이 높을수록 맛을 까다롭게 평가하는 경향을 보인다. 쇠고기 부위별로는 우둔에 비해서 등심이 다른 부위들 중 맛에 대한 차이가 크다고 볼 수 있다.

  • PDF

한국 노인의 노화궤적 연구 (Multiple Aging Trajectories of the Elderly in Korea)

  • 김소진
    • 한국노년학
    • /
    • 제39권1호
    • /
    • pp.37-60
    • /
    • 2019
  • 이 연구는 한국 노인들의 노화과정을 추적해 노화의 궤적을 도출하고, 그 특성을 파악하고자 시도된 것이다. 특별히 연구는 Rowe와 Kahn이 제시한 성공노화모델을 분석틀로 삼고, 집단중심 다중궤적모형을 활용해 귀납적 방식으로 노화궤적을 도출하였다. 또한 주요 인구사회적 특성들을 기본 예측요인으로 삼아 각 노화궤적의 특성들을 다항로지스틱 분석으로 파악하고자 했다. 분석을 위해 활용된 자료는 고령화연구패널(KLoSA)의 1~6차 조사자료이며, 분석대상은 65세이상 74세이하의 전기노인 2,682명이다. 다중궤적모형에 활용된 분석지표는 만성질환, 신체기능, 인지기능, 우울증상, 그리고 사회참여활동이다. 분석을 통해 도출된 노화궤적은 5개이며, 각각은 5개 지표의 변화양상에 따라 일반노화군(33.9%), 경도인지장애동반군(22.1%), 건강기능저하군(18.2%), 성공노화군(17.8%), 병적노화군(7.9%)로 명명되었다. 한편, 다항로지스틱분석을 실시한 결과 일반적으로 성공 노화는 남성, 저연령, 고학력, 고소득, 유배우자 집단이 경험할 가능성이 컸다. 반면, 저학력, 저소득, 그리고 고연령의 경우 상대적으로 어려운 노화의 과정을 겪을 가능성이 컸다. 특히, 경도인지장애동반노화를 겪을 가능성은 배우자가 없는 저학력, 저소득, 그리고 고연령 여성에게서 크게 나타났다.

통계적 기법을 이용한 악성 소프트웨어 분류 (Malware classification using statistical techniques)

  • 원성민;김현주;송종우
    • 응용통계연구
    • /
    • 제30권6호
    • /
    • pp.851-865
    • /
    • 2017
  • 최근 워너크라이라는 이름의 랜섬웨어가 전 세계적으로 큰 화두에 오르면서, 악성 소프트웨어로 인한 피해를 줄이기 위한 방법들이 재조명 되고 있다. 새로운 악성 소프트웨어가 발생했을 때 피해를 최소화하기 위해서는 해당 소프트웨어가 어떤 공격 유형을 가진 악성 소프트웨어인지 빠르게 분류할 필요가 있다. 본 연구 목적은 다양한 통계적 기법을 이용하여 악성 소프트웨어를 효과적으로 분류할 수 있는 모형을 구축하는 데 있다. 모형 적합 시 다항 로지스틱, 랜덤 포레스트, 그래디언트 부스팅, 서포트 벡터 기계 등의 기법들을 이용하였으며, 본 연구를 통해 악성 소프트웨어를 분류하는 데에 있어 중요한 역할을 하는 변수들이 존재한다는 사실을 발견하였다.