• 제목/요약/키워드: Exhaustive CHAID

검색결과 6건 처리시간 0.025초

인체측정조사에서 측정곤란부위 예측을 위한 의사결정나무 추천 모형 탐지에 관한 연구 (A Study on Exploration of the Recommended Model of Decision Tree to Predict a Hard-to-Measure Mesurement in Anthropometric Survey)

  • 최종후;김선경
    • 응용통계연구
    • /
    • 제22권5호
    • /
    • pp.923-935
    • /
    • 2009
  • 본 연구는 의사결정나무의 추천 모형 선택을 위한 비교실험에 초점을 두고 있다. 의사결정나무 모형은 구축된 모형에 기반을 두고 미래 관측치에 대한 예측 기능을 수행하게 될 것이므로 구축된 모형이 아무리 정치(精緻)하다고 하더라도 일반화의 성질을 충족시키지 못하면 실제성이 없게 된다. 따라서 본 연구는 교차타당성 검토를 통해 일반화의 성질을 충족시키면서 우수한 예측력을 갖는 추천 모형을 탐지하는 절차를 연구하는 데에 초점을 맞추고 있다. 사례 연구로 인체측정자료를 사용하여 측정곤란부위 예측을 위한 의사결정나무 추천 모형을 탐지한다. 그 결과 CART 모형 이 추천 모형으로 탐지되었다.

데이터마이닝 패키지에서 변수선택 편의에 관한 연구 (A Study on Variable Selection Bias in Data Mining Software Packages)

  • 송문섭;윤영주
    • 응용통계연구
    • /
    • 제14권2호
    • /
    • pp.475-486
    • /
    • 2001
  • 데이터마이닝 패키지에 구현된 분류나무 알고리즘 가운데 CART, CHAID, QUEST, C4.5에서 변수 선택법을 비교하였다. CART의 전체탐색법이 편의를 갖는다는 사실은 잘알려졌으며, 여기서는 상품화된 패키지들에서 이들 알고리즘의 편의와 선택력을 모의실험 연구를 통하여 비교하였다. 상용 패키지로는 CART, Enterprise Miner, AnswerTree, Clementine을 사용하였다. 본 논문의 제한된 모의실험 연구 결과에 의하면 C4.5와 CART는 모두 변수선택에서 심각한 편의를 갖고 있으며, CHAID와 QUEST는 비교적 안정된 결과를 보여주고 있었다.

  • PDF

데이터마이닝 기법을 활용한 불법주차 영향요인 분석 (A Study on the Analysis Effect Factors of Illegal Parking Using Data Mining Techniques)

  • 이창희;김명수;서소민
    • 한국ITS학회 논문지
    • /
    • 제13권4호
    • /
    • pp.63-72
    • /
    • 2014
  • 우리나라는 급속한 경제발전과 고속성장으로 생활수준이 향상되면서 자동차 수요가 급격히 증가함에 따라 교통혼잡, 교통사고, 주차문제 등의 문제가 발생되고 있다. 자동차 증가로 인한 주차문제 중 불법주차는 교통혼잡을 야기하고 주차공간으로 인한 이웃간 분쟁의 원인이 되어 사회적 문제로 대두되고 있다. 이에 본 연구에서는 지방 광역시중 승용차 수단분담률이 높음에도 불구하고 불법주차 단속건수가 상대적을 적은 대전광역시를 대상으로 주차조사를 실시하였으며 불법주차에 대한 원론적인 문제를 파악하기 위해 의사결정나무모형 Exhaustive CHAID분석을 통하여 운전자들의 주차행위에 있어 불법주차를 선택하는 과정과 그에 따른 영향요인을 탐색하여 불법주차의 원인을 파악하고 해결하는 방안을 제시하고자 한다. 분석결과 불법주차를 선택하는 영향요인으로는 거리, 단속경험, 직업, 이용시간대 순으로 영향을 미치는 것으로 나타났으며 예측 모형은 최종적으로 4가지 노드가 도출되었다. 분석결과에 따른 불법주차의 해결방안으로는 공영주차장의 추가설치와 생계유지 및 조업차량의 주차공간 확보가 우선되어야 하고 불법주차 단속강화와 시민의식 고취를 위한 캠페인의 활성화가 필요하다.

청각장애인의 취업결정요인 분석 연구 -데이터마이닝 기법(Exhaustive CHAID)의 적용 (Analyzing vocational outcomes of people with hearing impairments : A data mining approach)

  • 신현욱
    • 디지털융복합연구
    • /
    • 제13권11호
    • /
    • pp.449-459
    • /
    • 2015
  • 본 연구의 목적은 청각장애인의 취업결정요인을 데이터마이닝 기법을 적용하여 분석 제공함으로서, 장애인의 취업 성공률을 높임과 동시에 직업재활 개입의 효율성을 극대화할 수 있는 방안을 제시하는데 있다. 자료 분석을 위해 2013년 장애인고용패널조사의 제6차년도 자료를 이용하여, 전체 패널 데이터 중 청각장애인이면서 전체연령 20세 이상 65세 미만의 422명을 의사결정나무 기법의 하나인 Exhaustive CHAID 알고리즘을 적용하여 분석하였다. 본 연구를 통해서 얻어진 주요한 사실의 하나는 국민기초생활수급여부, 일상생활 도움필요 여부, 그리고 자격증 고용서비스 요인간의 상호작용(interaction)에 관한 패턴 분석이 청각장애인의 취업 예측에 주요한 역할을 할 수 있다는 것으로, 향후 직업재활 개입의 효과성을 높이기 위해 효과적인 취업결정요인, 즉 높은 학력 수준, 자격증 보유, 높은 일상생활 독립성을 가지고 있는 장애인을 적극적으로 발굴하여 집중적인 재활 서비스를 제공할 필요가 있을 것으로 사료된다.

A Study on Unbiased Methods in Constructing Classification Trees

  • Lee, Yoon-Mo;Song, Moon Sup
    • Communications for Statistical Applications and Methods
    • /
    • 제9권3호
    • /
    • pp.809-824
    • /
    • 2002
  • we propose two methods which separate the variable selection step and the split-point selection step. We call these two algorithms as CHITES method and F&CHITES method. They adapted some of the best characteristics of CART, CHAID, and QUEST. In the first step the variable, which is most significant to predict the target class values, is selected. In the second step, the exhaustive search method is applied to find the splitting point based on the selected variable in the first step. We compared the proposed methods, CART, and QUEST in terms of variable selection bias and power, error rates, and training times. The proposed methods are not only unbiased in the null case, but also powerful for selecting correct variables in non-null cases.

의사결정나무 모형을 이용한 주관적 음성장애 예측모형 (The Prediction Model for Self-Reported Voice Problem Using a Decision Tree Model)

  • 변해원
    • 한국산학기술학회논문지
    • /
    • 제14권7호
    • /
    • pp.3368-3373
    • /
    • 2013
  • 본 연구에서는 주관적 음성문제의 위험요인으로 구명된 주요 변수를 기반으로 주관적 음성장애를 예측할 수 있는 모형을 개발 하였다. 연구자료는 2008년도 국민건강영양조사이며, 이비인후검진을 완료한 전국의 19세 이상 지역사회 성인 3,600명(남 1,501명, 여 2,099명)을 분석대상으로 하였다. 분석방법은 주관적 음성장애 여부를 결과변수로 성, 연령, 흡연, 음주, 교육수준, 직업, 갑상선장애, 최근 2주간 급성 및 만성질환으로 인한 통증 및 불편감을 설명변수로 사용하였고, 예측모형은 의사결정나무 모형(Decision Tree)의 exhaustive CHAID(Chi Squared Automatic Interaction Detection) 알고리즘을 이용하였다. 주관적 음성 장애와 관련된 통계학적 분류 모형을 구축한 결과, 유의미한 예측 변수는 연령, 교육수준, 최장 직업, 갑상선 장애, 최근 2주 동안의 신체 불편 및 통증경험 여부였다. 이 연구의 모형을 기초로 음성장애 예방을 위해서 음성장애 고위험군에 대한 조기 관리의 필요성이 제기된다.