• 제목/요약/키워드: CHAID Analysis

검색결과 46건 처리시간 0.029초

Selecting variables for evidence-diagnosis of paralysis disease using CHAID algorithm

  • Shin, Yan-Kyu
    • 한국데이터정보과학회:학술대회논문집
    • /
    • 한국데이터정보과학회 2001년도 추계학술대회
    • /
    • pp.76-78
    • /
    • 2001
  • Variable selection in oriental medical research is considered. Decision tree analysis algorithms such as CHAID, CART, C4.5 and QUEST have been successfully applied to a medical research. Paralysis disease is a highly dangerous and murderous disease which accompanied with a great deal of severe physical handicap. In this paper, we explore the use of CHAID algorithm for selecting variables for evidence-diagnosis of paralysis, disease. Empirical results comparing our proposed method to the method using Wilks $\lambda$ given.

  • PDF

CHAID 알고리즘을 이용한 산업재해 특성분석 (A Feature Analysis of Industrial Accidents Using CHAID Algorithm)

  • 임영문;황영섭
    • 대한안전경영과학회지
    • /
    • 제7권5호
    • /
    • pp.59-67
    • /
    • 2005
  • The main objective of the statistical analysis about industrial accidents is to find out what is the dangerous factor in its own industrial field so that it is possible to prevent or decrease the number of the possible accidents by educating those who work in the fields for safety tools. However, so far, there is no technique of quantitative evaluation on danger. Almost all previous researches as to industrial accidents have only relied on the frequency analysis such as the analysis of the constituent ratio on accidents. As an application of data mining technique, this paper presents analysis on the efficiency of the CHAID algorithm to classify types of industrial accidents data and thereby identifies potential weak points in accident risk grouping.

CHAID분석을 이용한 나들목 주변 지가의 공간분포 영향모형 개발 - 서울외곽순환고속도로를 중심으로 - (Development of Selection Model of Interchange Influence Area in Seoul Belt Expressway Using Chi-square Automatic Interaction Detection (CHAID))

  • 김태호;박제진;김영일;노정현
    • 대한토목학회논문집
    • /
    • 제29권6D호
    • /
    • pp.711-717
    • /
    • 2009
  • 본 연구는 고속도로 나들목의 접근성이 주변 아파트 지가형성에 미치는 영향 관계를 규명하기 위해서 서울외곽순환고속도로를 중심으로 분석하였다. 분석을 위해서는 데이터마이닝(CHAID분석), 추세선 분석(Trend Analysis) 등을 활용하여 고속도로의 나들목(IC) 주변 아파트가격과 관련된 지가경사 모형을 개발하였다. 분석결과, 첫째, 고속도로 나들목이 위치한 지역별(외측 : 경기도, 내측 : 서울시)로 아파트 가격에 차이가 있으며, 일반적인 주택가격과 교통결절점이 가지는 선형 관계가 아닌 비선형적 관계(2차 다항식)를 가지는 것으로 나타났다. 둘째, CHAID분석을 이용한 공간분포 검토 결과, 외측지역(경기도)의 경우 2.6km를 전후하여 2개의 상이한 공간분포를 가지며, 내측지역(서울시)의 경우 1.4km와 3.8km를 전후하여 3개의 상이한 공간분포를 가지는 것으로 나타났다. 이는 아파트 가격이 도로결절점(고속도로 나들목)으로부터 첫 번째 임계점까지 는 점차 상승하다가 일정거리 이후부터 서서히 감소하는 복합적인 공간분포를 가지는 것으로 나타나 교통접근성이 좋다고 하여 주택가격이 높지만은 않으며, 주거환경(고속도로 소음, 지역단절 등)과 교통접근성간의 상호 교환 작용(Trade Off Effect)에 의한 현상이라 할 수 있다. 향후 본 연구의 고속도로 나들목 주택가격 영향모형을 이용하여 고속도로 주변에 지속적으로 건설되고 있는 신도시 주택가격 산정에 활용이 가능할 것으로 판단된다.

CHAID 技法에 의한 都市機能의 試論的 硏究 (An introductory study on the urban functions using CHAID technique)

  • 양순정
    • 대한지리학회지
    • /
    • 제29권3호
    • /
    • pp.360-368
    • /
    • 1994
  • 地理學에서는 地域의 特性을 규명하고자 수많은 計量的 分析手法을 사용하여 왔다. 본 고에서는 일종의 判別分析技法으로 최근에 도입된 CHAID技法을 사용하여 都市와 都市 機能에 관한 통계처리를 시도하였다. 2종류의 자료를 가지고 두 차례 처리를 실시하였는데, 하나는 인구 25만명 이상의 도시 20개를 예측변수로 하고, 行政, 市場, 金融機能 그리고 生 産機能을 반응변수로 하여 도시의 기능을 분류해 내었다. 두번째 처리에서는 앞서 언급한 행정, 시장, 금융, 생산기능 이외에 交通, 敎育, 의료, 文化, 그리고 運送機能의 9가지를 예측 변수로 선정하고, 수도권, 부산권, 대구권, 광주권, 충청권의 5개 권역을 반응변수로 하여 각 권역에서 탁월한 기능을 판별, 분류해 내었다. 이상에서 CHAID기법은 큰 양의 범주형 자료 를 처리할 수 있고, 樹形圖로 결과를 산출하여 해석이 용이하므로 地域을 分類하거나 특성 을 判別하는데 유용한 또 하나외 새로운 분석틀로 여겨진다.

  • PDF

CHAID Algorithm을 이용한 제조업에서의 산업재해 데이터 분석 (Data Analysis of Industrial Accidents in Manufacturing Industries Using CHIAD Algorithm)

  • 임영문;황영섭
    • 대한안전경영과학회:학술대회논문집
    • /
    • 대한안전경영과학회 2006년도 춘계공동학술대회
    • /
    • pp.45-50
    • /
    • 2006
  • The main objective of this study is to provide feature analysis of industrial accidents in manufacturing industries using CHAID algorithm. In this study, data on 10,536 accidents were analyed to create risk groups, Including the risk of disease and accident. The sample for this work chosen from data related to manufacturing industries during three years $(2002\sim2004)$ in Korea. The resulting classification rules have been incorporated into development of a developed database tool to help quantify associated risks and act as an early warning system to individual industrial accident in manufacturing industries.

  • PDF

교통카드자료를 이용한 통행패턴분석과 정책활용방안 연구 -경기도를 중심으로- (A Study on Travel Pattern Analysis and Political Application using Transportation Card Data: In Gyeonggi-Do Case)

  • 빈미영;문주백;조창현
    • 한국경제지리학회지
    • /
    • 제15권4호
    • /
    • pp.615-627
    • /
    • 2012
  • 본 연구는 교통카드 데이터를 이용하여 대중교통 이용과 관련하여 통행패턴을 분석하였으며 교통정책에 활용할 수 있는 방안을 제시하였다. 교통카드 데이터는 경기도권역을 대상으로 하였고 활용방안으로 교통정책 의사결정자가 버스정류소 시설을 개선할 때 교통카드데이터에서 얻어질 수 있는 여러 변수를 이용하여 대상지를 선정한다는 시나리오를 설정하여 분석하였다. 분석결과, 의사결정방법론인 K평균 군집분석과 CHAID(Chi-squared automatic interaction detection)를 이용하였으며, 유의수준 p<0.01에서 정책에 유용하게 이용될 수 있는 결과를 얻었다. 또한 본 연구에서는 이러한 결과들을 근거로 교통카드데이터를 실제로 정책에 활용되기 위해서 개선되어야 할 정책적 함의를 제시하였다.

  • PDF

CHAID분석을 이용한 서울시 지하철 역세권 지가 영향모형 개발 (Development of Selection Model of Subway Station Influence Area (SIA) in Seoul City using Chi-square Automatic Interaction Detection (CHAID))

  • 최유란;김태호;박정수
    • 한국철도학회논문집
    • /
    • 제11권5호
    • /
    • pp.504-512
    • /
    • 2008
  • 본 연구는 합리적인 역세권 범위를 설정하고 이에 미치는 요인을 규명하기 위해 CHAID분석을 이용하여 서울시의 강남 강북지역에 대해 SIA모형을 개발하였으며, 그 결과를 요약하면 다음과 같다. 첫째, 지하철 역세권에 영향을 미치는 변수를 중심으로 상관관계를 분석한 결과, 역세권 지가에 영향을 미치는 주요요인이 도보거리로 나타났으며, 두 관계를 이용하여 SIA모형을 개발하였다. 둘째, SIA모형식(선형식, 2차 다항식)을 비교분석한 결과, 강남 북의 역세권의 범위는 지하철역사로부터 도보거리기준으로 강남지역이 767m, 강북지역이 452m로 각각 다르게 나타났다. 셋째, 강남지역의 구간 1(0$\leq$175m)의 경우 역으로부터 거리와 가격과의 관계가 선형이 아닌 2차 다항식의 형태를 나타내고 있다 따라서 현행 도시철도법상 역세권 범위 반경 500m의 기준을 획일적으로 적용하기 보다는 도시의 지역적 특성을 고려하여 재설정하는 것이 바람직하다고 판단된다.

A Combinatorial Optimization for Influential Factor Analysis: a Case Study of Political Preference in Korea

  • Yun, Sung Bum;Yoon, Sanghyun;Heo, Joon
    • 한국측량학회지
    • /
    • 제35권5호
    • /
    • pp.415-422
    • /
    • 2017
  • Finding influential factors from given clustering result is a typical data science problem. Genetic Algorithm based method is proposed to derive influential factors and its performance is compared with two conventional methods, Classification and Regression Tree (CART) and Chi-Squared Automatic Interaction Detection (CHAID), by using Dunn's index measure. To extract the influential factors of preference towards political parties in South Korea, the vote result of $18^{th}$ presidential election and 'Demographic', 'Health and Welfare', 'Economic' and 'Business' related data were used. Based on the analysis, reverse engineering was implemented. Implementation of reverse engineering based approach for influential factor analysis can provide new set of influential variables which can present new insight towards the data mining field.

A Comparative Study of Medical Data Classification Methods Based on Decision Tree and System Reconstruction Analysis

  • Tang, Tzung-I;Zheng, Gang;Huang, Yalou;Shu, Guangfu;Wang, Pengtao
    • Industrial Engineering and Management Systems
    • /
    • 제4권1호
    • /
    • pp.102-108
    • /
    • 2005
  • This paper studies medical data classification methods, comparing decision tree and system reconstruction analysis as applied to heart disease medical data mining. The data we study is collected from patients with coronary heart disease. It has 1,723 records of 71 attributes each. We use the system-reconstruction method to weight it. We use decision tree algorithms, such as induction of decision trees (ID3), classification and regression tree (C4.5), classification and regression tree (CART), Chi-square automatic interaction detector (CHAID), and exhausted CHAID. We use the results to compare the correction rate, leaf number, and tree depth of different decision-tree algorithms. According to the experiments, we know that weighted data can improve the correction rate of coronary heart disease data but has little effect on the tree depth and leaf number.

신경망모형을 이용한 외래환자 만족도예측 및 민감도분석 (A Neural Network for Prediction and Sensitivity of Outpatients' Satisfaction)

  • 이견직;정영철;김미라
    • 한국병원경영학회지
    • /
    • 제8권1호
    • /
    • pp.81-94
    • /
    • 2003
  • This paper aims at developing a prediction model and analyzing a sensitivity for the outpatient's overall satisfaction on utilizing hospital services by using data mining techniques within the context of customer satisfaction. From a total of 900 outpatient cases, 80 percent were randomly selected as the training group and the other 20 percent as the validation group. Cases in the training group were used in the development of the CHAID and Neural Networks. The validation group was used to test the performance of these models. The major findings may be summarized as follows: the CHAID provided six useful predictors - satisfaction with treatment level, satisfaction with healthcare facilities and equipments, satisfaction with registration service, awareness of hospital reputation, satisfaction with staffs courtesy and responsiveness, and satisfaction with nurses kindness. The prediction accuracy rates based on MLP (77.90%) is superior to RBF (76.80%).

  • PDF