• Title/Summary/Keyword: 순서형 변수

검색결과 84건 처리시간 0.024초

의사결정나무에서 순서형 분리변수 선택에 관한 연구 (Ordinal Variable Selection in Decision Trees)

  • 김현중
    • 응용통계연구
    • /
    • 제19권1호
    • /
    • pp.149-161
    • /
    • 2006
  • CART로 대표되는 의사결정나무의 알고리즘에서 가장 중요한 요소는 분리변수의 선택방법이다. 대부분의 알고리즘은 변수의 형태가 연속형인지, 혹은 명목형(nominal)인지에 따라 별개의 변수선택방법을 적용한다. 하지만 변수의 형태가 순서형(ordinal)인 경우에는 그 변수를 연속형으로 취급하여 연속형 변수선택방법을 적용하는 것이 대부분이다. 이것은 CART와 같은 Greedy탐색을 이용하는 방법에는 문제점이 발생하지 않는다. 하지만 Greedy탐색의 약점을 보완하기 위해 통계이론을 이용하여 개발된 최근의 방법들에는 최선의 대처방법이 아니다. 따라서 본 연구에서는 의사결정 나무에서 분리변수를 선택하는데 있어서 비모수적 접근 방법인 Clamor-von Mises 검정을 이용한 방법을 순서형 변수에 사용하는 것을 제안하고, CART, C4.5, QUEST, CRUISE등 기존 알고리즘과 본 연구에서 제안하는 방법의 순서형 변수 선택력을 비교하였다. 모의실험의 결과, Clamor-von Mises 검정을 이용한 변수선택방법은 순서형 변수의 분류력을 기존 방법들에 비해 더 정확히 예측하는 좋은 성과를 보여주었다.

의사결정나무에서 순서형 분리 변수 선택에 관한 연구

  • 김현중;송주미
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2004년도 학술발표논문집
    • /
    • pp.283-288
    • /
    • 2004
  • 지금까지 의사결정나무에서 분리 변수의 선택에 관한 연구는 많았으나, 대부분 연속형 변수와 명목형 변수에 국한되어 왔다. 본 연구에서는 순서형 변수에 주목하여 CART, QUEST, CRUISE 등 기존 알고리즘과 본 연구에서 제안하는 비모수적 접근 방법인 K-S test, framer-von Misos test 방법의 변수 선택력을 비교하였다. 그 결과 본 연구에서 제안하는 framer-von Mises test 방법이 다른 알고리즘에 비하여, 변수 선택력과 안정성에 있어서 좋은 성과를 보였다.

  • PDF

베이지안 순서형 프로빗 준모수 회귀 모형 : 국민건강영양조사 2016 자료를 통한 흡연양태와 커피섭취 간의 관계 분석 (Bayesian ordinal probit semiparametric regression models: KNHANES 2016 data analysis of the relationship between smoking behavior and coffee intake)

  • 이다솜;이은지;조성일;최태련
    • 응용통계연구
    • /
    • 제33권1호
    • /
    • pp.25-46
    • /
    • 2020
  • 본 논문에서는 Bayesian spectral analysis regression (BSAR) 방법론을 이용한 베이지안 순서형 프로빗 준모수 회귀모형에 대해서 고찰한다. 순서형 프로빗 회귀모형은 순서가 있는 범주형 자료를 모형화하는 방법으로, 정규 분포의 분포함수의 역함수인 프로빗 연결함수를 이용해 각 범주의 확률과 설명변수을 연결함으로써 반응변수의 확률을 모형화한다. 베이지안 프로빗 회귀 모형은 정규 분포를 따르는 잠재변수를 도입함으로써 사후 분포 도출을 용이하게 하고, 절단점에 따라 나뉘어지는 잠재변수들의 값에 따라서 반응 변수들이 범주화된다. 본 논문에서는 이러한 잠재 변수 방법을 확장해 BSAR 방법론에 기반하여 단조증가/감소와 같은 형태제약을 반영할 수 있는 베이지안 이항형 및 순서형 프로빗 준모수 회귀모형에 대해 연구한다. 모의실험을 통하여 이항형 프로빗 준모수 회귀모형과 기존의 다른 모형들 간의 적합결과를 비교하고, 형태 제약에 따른 순서형 프로빗 준모수 회귀모형의 적합결과를 비교 분석하도록 한다. 아울러, 국민건강영양조사 제 7기 1차년도 (2016) 자료(Korean National Health and Nutrition Examination Survey (KNHANES), 2016)를 바탕으로, 본 논문에서 고찰한 이항형 및 순서형 프로빗 준모수 회귀모형을 적용하여, 흡연양태와 커피섭취 간의 관계에 대한 실증적 분석을 수행한다.

순서형 로지스틱 회귀분석을 이용한 어린이 사고심각도 분석 연구 (The Study on the Severity of Children Traffic Accident using Ordinal Logistic Regression Analysis)

  • 윤병조;고은혁;양승룡
    • 한국재난정보학회:학술대회논문집
    • /
    • 한국재난정보학회 2016년 정기학술대회
    • /
    • pp.259-260
    • /
    • 2016
  • 어린이의 경우 다른 연령층에 비해 신체적, 정신적으로 완성되지 못하여 교통사고의 가능성이 높으며, 특히 전국의 어린이 교통사고는 점진적으로 감소 추세이나 인천의 어린이 교통사고는 감소하다가 다시 증가 추세에 들어선 실정이다. 따라서 본 연구의 목적은 어린이 교통사고 심각도에 영향을 미치는 주요 요인들을 발견하고 제시하고자 하였다. 순서형 로지스틱 회귀분석을 활용하여 순서척도인 반응변수에 대한 설명변수의 오즈(Odds)를 확인하고자 하였으며 안전운전불이행, 차대사람(횡단중), 차대차(측면직각충돌)사고가 유의한 결과로 나타났다. 안전운전불이행으로 인한 사망사고와 기타사고의 오즈차이는 1.35배, 측면직각충돌로 인한 사망사고와 기타사고의 오즈차이는 1.76배 증가하는 것으로 나타났고, 횡단중인 경우에는 오히려 사망 위험도의 오즈값이 0.58배로 감소하는 것으로 나타났다.

  • PDF

베이지안 분계점 모형에 의한 순서 범주형 변수의 대체 (Imputation for Binary or Ordered Categorical Traits Based on the Bayesian Threshold Model)

  • 이승천
    • 응용통계연구
    • /
    • 제18권3호
    • /
    • pp.597-606
    • /
    • 2005
  • 대개의 표본조사에서 무응답은 필연적으로 발생되고 있고, 직접 표본조사에 참가하지 않은 데이터의 사용자는 무응답의 원인을 알 수 없는 것이 일반적이므로 데이터 분석에 어려움을 갖는다. 또 대부분의 통계분석 방법은 무응답을 전제하지 않고 있어 무응답이 있는 항목은 데이터 분석의 걸림돌이 된다고 하겠다. 최근 무응답에 대해 대체법이 하나의 표준적인 처리 방법이 되고 있어 현재까지 대체법에 대한 많은 연구가 있었으나 대부분의 대체법은 정규성 등을 가정한 연속형 변수의 대체법에 대한 것이었다. 그러나 표본조사에서 많은 중요한 항목들이 순서 범주에 의해 측정되는 경우가 많으므로 범주형변수의 대체법에 대한 연구가 필요하며, 본 연구에서는 보조변수가 있는 경우 Bayesian 모형에 의한 순서범주형 항목의 대체법에 대해 알아본다.

모자이크 플롯에서 변수와 범주의 순서화 (Ordering Variables and Categories on the Mosaic Plot)

  • 이문주;허명회
    • 응용통계연구
    • /
    • 제21권5호
    • /
    • pp.875-888
    • /
    • 2008
  • Hartigan과 Kleiner (1981, 1984)에 의해 제안된 모자이크 플롯은 범주형 자료의 탐색에 매우 유용한 시각화 도구이다. 모자이크 플롯은 범주 셀의 빈도를 사각형의 기에 비례하게 나타내므로 이해가 쉽고 데이터에 포함된 정보를 유지하지만 실제 모습은 변수 순서와 변수 내 범주의 순서에 따라 상당히 달라진다. 이에 우리는 본 연구에서 모자이크 플롯에서 크래머(Cramer)의 V 계수를 활용한 변수의 순서화 방법과 감마 계수를 활용한 범주의 순서화 방법을 제안하고 Titanic, Housing, PreSex 등 공개 자료에 적용한 결과를 제시한다.

A Study on the Scoring Method of the Ordinal Variable

  • Chung, Sung-S.;Chun, Young-M.;Oh, Seon-J.
    • Journal of the Korean Data and Information Science Society
    • /
    • 제15권1호
    • /
    • pp.95-105
    • /
    • 2004
  • The main characteristic of the ordinal scale is that its categories have a logically or continuously ordered relationship to each other. A continuous type permits measuring degrees of differences among categories. Also, the specific amount of differences is important. In this paper we consider the scoring method using a dummy variable based on distance among categories.

  • PDF

순서형 프로빗 모형을 이용한 사고심각도 분석 (The Study on the Accident Injury Severity Using Ordered Probit Model)

  • 하오근;오주택;원제무;성낙문
    • 대한교통학회지
    • /
    • 제23권4호
    • /
    • pp.47-55
    • /
    • 2005
  • 최근 폭등하는 자동차의 이용과 교통사고의 증가는 물적 손실이란 측면에서 뿐만 아니라, 국민의 기본 생활권을 위협한다는 측면에서 교통사고를 줄이기 위한 많은 노력이 요구된다. 특히, 일반 도로구간에 비해 사고의 잠재성이 상대적으로 높은 교차로의 경우 이에 대한 적절한 대책이 필요하다. 이를 위해 본 연구에서는 교차로 교통사고에 있어서 사고 심각도에 영향을 미치는 요인들을 분석하고 이를 통하여 교차로 안전성 향상에 기여하고자 한다. 사고 심각도 분석에 있어서 사고 자료의 특성을 고려하여 순서형 확률모형 중 적절한 모형을 적용하였다. 데이터의 ${\epsilon}_i$(오차항)의 분포를 정규분포로 가정하여 순서형 프로빗 모형을 적용하였고 모형의 설명력과 적합성을 나타내는 $p^2$(우도비)와 $x^2$(Chi-square)의 값을 이용하여 최적의 사고 심각도 모형을 개발하였다. 개발된 심각도 모형을 분석한 결과, 교차로 교통사고 심각도에 영향을 미치는 변수는 부도로 교통량, 주도로 중차량 비율, 주도로 우회전 비율, 주도로 조명시설, 주도로 제약시설, 부도로 좌회전 유도선 등으로 분석되었다.

순서형 변수를 위한 관리도 (Control Charts for Ordinal Variables)

  • 장대홍
    • 한국품질경영학회:학술대회논문집
    • /
    • 한국품질경영학회 2006년도 춘계학술대회
    • /
    • pp.330-333
    • /
    • 2006
  • Many practical problems of quality control in service management are derived from the use of ordinal variables. Ordered linguistic variables differ from measurement variables. This paper presents a new control chart of a production process based on ordinal variables.

  • PDF

순서형 프로빗 모형을 이용한 버스 운송사업 유형 별 사고심각도 영향요인 분석 (Factors Influencing Crash Severity by the Types of Bus Transportation Services Using Ordered Probit Models)

  • 윤상원;고승영;김동규
    • 대한교통학회지
    • /
    • 제36권1호
    • /
    • pp.13-22
    • /
    • 2018
  • 버스는 대표적인 대중교통수단 중 하나로서, 운행 목적, 운영 거리, 관리 기관 등에 따라 운송사업 유형별로 구분되어 다양하게 운영되고 있다. 버스 관련 사고는 높은 재차인원으로 인하여 큰 피해를 야기할 수 있음에도 불구하고, 버스 운송사업 유형에 따른 사고심각도에 관한 연구는 상대적으로 기존 연구에서 많이 다루어지지 않았다. 본 연구는 버스 관련 사고의 심각도에 미치는 영향요인들을 분석하고 버스 운송사업 유형 별 사고심각도를 저감하기 위한 정책 방향을 제시하는 것을 목적으로 한다. 이를 위해 교통사고 분석시스템(TAAS)에서 추출된 5년 동안의 버스 관련 사고 자료가 사용된다. 시내버스, 시외 및 고속버스, 그리고 전세버스의 세 가지 운송사업 유형 별 순서형 프로빗 모형이 사고심각도 영향요인을 분석하기 위해 추정된다. 분석 결과 속도, 노면상태 등 모든 버스 운송사업 유형의 사고심각도에 유의미한 영향을 미치는 변수도 존재하는 반면 버스 운송사업 유형에 따라 상이하게 사고심각도에 유의미하게 영향을 미치는 변수들이 존재함을 확인하였다. 시내버스의 경우 시간대, 도로 선형 및 신호기 설치 여부가 통계적으로 유의한 변수인 것으로 확인되었다. 시외 및 고속버스의 경우 안전벨트 착용여부와 도로 등급이 사고심각도에 유의미한 영향을 미치는 변수였으며, 전세버스의 경우 시간대, 운전자의 운전 경험, 안전벨트 착용여부, 신호기 설치 여부 및 시간대가 통계적으로 유의한 변수인 것으로 분석되었다. 본 연구의 결과를 통해 버스 운송사업 유형 별 사고심각도를 저감하는 데 기여할 수 있을 것으로 사료된다.