• 제목/요약/키워드: CART (classification and regression tree)

검색결과 92건 처리시간 0.022초

Data-driven approach to machine condition prognosis using least square regression trees

  • Tran, Van Tung;Yang, Bo-Suk;Oh, Myung-Suck
    • 한국소음진동공학회:학술대회논문집
    • /
    • 한국소음진동공학회 2007년도 추계학술대회논문집
    • /
    • pp.886-890
    • /
    • 2007
  • Machine fault prognosis techniques have been considered profoundly in the recent time due to their profit for reducing unexpected faults or unscheduled maintenance. With those techniques, the working conditions of components, the trending of fault propagation, and the time-to-failure are forecasted precisely before they reach the failure thresholds. In this work, we propose an approach of Least Square Regression Tree (LSRT), which is an extension of the Classification and Regression Tree (CART), in association with one-step-ahead prediction of time-series forecasting technique to predict the future conditions of machines. In this technique, the number of available observations is firstly determined by using Cao's method and LSRT is employed as prognosis system in the next step. The proposed approach is evaluated by real data of low methane compressor. Furthermore, the comparison between the predicted results of CART and LSRT are carried out to prove the accuracy. The predicted results show that LSRT offers a potential for machine condition prognosis.

  • PDF

The predictability of dentoskeletal factors for soft-tissue chin strain during lip closure

  • Yu, Yun-Hee;Kim, Yae-Jin;Lee, Dong-Yul;Lim, Yong-Kyu
    • 대한치과교정학회지
    • /
    • 제43권6호
    • /
    • pp.279-287
    • /
    • 2013
  • Objective: To investigate the dentoskeletal factors which may predict soft-tissue chin strain during lip closure. Methods: The pretreatment frontal and lateral facial photographs and lateral cephalograms of 209 women (aged 18-30 years) with Angle's Class I or II malocclusion were examined. The subjects were categorized by three examiners into the no-strain and strain groups according to the soft-tissue chin tension or deformation during lip closure. Relationships of the cephalometric measurements with the group classification were analyzed by logistic regression analysis, and a classification and regression tree (CART) model was used to define the predictive variables for the group classification. Results: The lower the value of the overbite depth indicator (ODI) and the higher the values of upper incisor to Nasion-Pogonion (U1-NPog, mm), overjet, and upper incisor to upper lip (U1-upper lip, mm), the more likely was the subject to be classified into the strain group. The CART showed that U1-NPog was the most prominent predictor of soft-tissue chin strain (cut-off value of 14.2 mm), followed by overjet. Conclusions: To minimize strain of the soft-tissue chin, orthodontic treatment should be oriented toward increasing the ODI value while decreasing the U1-NPog, overjet, and U1 upper lip values.

Prediction of Hypertension Complications Risk Using Classification Techniques

  • Lee, Wonji;Lee, Junghye;Lee, Hyeseon;Jun, Chi-Hyuck;Park, Il-Su;Kang, Sung-Hong
    • Industrial Engineering and Management Systems
    • /
    • 제13권4호
    • /
    • pp.449-453
    • /
    • 2014
  • Chronic diseases including hypertension and its complications are major sources causing the national medical expenditures to increase. We aim to predict the risk of hypertension complications for hypertension patients, using the sample national healthcare database established by Korean National Health Insurance Corporation. We apply classification techniques, such as logistic regression, linear discriminant analysis, and classification and regression tree to predict the hypertension complication onset event for each patient. The performance of these three methods is compared in terms of accuracy, sensitivity and specificity. The result shows that these methods seem to perform similarly although the logistic regression performs marginally better than the others.

CART 방법론을 사용한 클라우드 컴퓨팅 도입 의사 결정 모델링 (Cloud Computing Adoption Decision-Making Modeling Using CART)

  • 백승현;장병윤
    • 한국시뮬레이션학회논문지
    • /
    • 제23권4호
    • /
    • pp.189-195
    • /
    • 2014
  • 본 논문에서는 장소와 시간의 제약을 받지 않는 클라우드 컴퓨팅 도입 의사 결정 모델링에 대한 연구를 진행하였다. 연구에서는 65명의 응답자에게 수집 된 패널데이터와 데이터마이닝 방법 중 하나인 CART(회귀분류나무)를 사용하여 의사결정 모델을 구축하였다. 모델링에는 2단계로 진행되는데 첫 번째 단계에서는 패널데이터를 사용하여 도입 의사를 결정하는데 영향을 미치는 문항들을 선택하고 2 번째 단계에서는 선택된 문항을 사용하여 도입 의사 결정 모델을 구축하였다. 문항 선택을 통하여 설문지 수집 문항수를 25개에서 5개로 줄일 수 있어 응답자에게 빠른 답변을 얻을 수 있고 데이터의 사이즈가 작기 때문에 모델 구축 시간을 줄일 수 있는 장점을 보여주었다.

수출 관문의 변화와 한국 농식품 수출의 공간적 패턴 분석: 의사결정나무 분석의 적용 (Changes in Export Gateways and the Spatial Patterns of Korean Agri-Food Exports: A Classification and Regression Tree Analysis Approach)

  • 현기순
    • 한국경제지리학회지
    • /
    • 제21권2호
    • /
    • pp.90-106
    • /
    • 2018
  • 본 연구의 목적은 우리나라 농식품 수출의 상품별 동향과 수출 관문별 특징을 밝히고, 농식품 수출 활성화를 위한 관문의 성장 방향에 대한 시사점을 제시하는 것이다. 지난 17년 동안 우리나라 농식품 수출은 가공식품 중심으로 규모가 확대되었고, 수위 수출 관문으로서 부산항의 위상은 압도적이다. 이러한 사실을 바탕으로 의사결정나무(CART) 분석을 통해 부산항 곡물 가공식품 수출에 영향을 미치는 결정요인을 파악한 결과 지향지의 GDP, 우리나라와 상대국과의 거리, 1인당 GNI가 부산항 가공식품 수출 규모의 평균을 최대한 잘 예측해주는 변수의 집합으로 나타났다. 수출 대상국은 8개의 집단으로 분류되었고, 이는 유형별 특성에 따른 농식품 수출 활성화 전략에 대한 유용한 정보를 제공해준다.

Modelling Duration In Text-to-Speech Systems

  • 정현성
    • 대한음성학회지:말소리
    • /
    • 제49호
    • /
    • pp.159-174
    • /
    • 2004
  • The development of the durational component of prosody modelling was overviewed and discussed in text-to-speech conversion of spoken English and Korean, showing the strengths and weaknesses of each approach. The possibility of integrating linguistic feature effects into the duration modelling of TTS systems was also investigated. This paper claims that current approaches to language timing synthesis still require an understanding of how segmental duration is affected by context. Three modelling approaches were discussed: sequential rule systems, Classification and Regression Tree (CART) models and Sums-of-Products (SoP) models. The CART and SoP models show good performance results in predicting segment duration in English, while it is not the case in the SoP modelling of spoken Korean.

  • PDF

무선네트워크에서의 효율적 트래픽 분류 기법 연구 (Efficient Traffic Classifier in Wireless Network)

  • 이성진;송종우;안수한;원유집;장재성
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (D)
    • /
    • pp.485-490
    • /
    • 2008
  • 무선 인터넷의 구조적 특성상 한 셀에서 대역폭을 공유하고 그 안에서 각기 다른 QoS를 요구하는 서비스들이 한정된 자원을 사용한다. 트래픽의 변화와 패턴을 예측하기 위한 분석은 실제 서비스를 제공하기 전인 기획단계에서 매우 중요한 도구로 사용이 된다. 무선망의 트래픽을 예측하기 위해서는 유선망의 분석과는 다른 방법이 필요하기 때문에 정확한 분류를 위해서 본 연구에서는 세션의 단위로 분석할 것을 제안한다. 또한 Classification and Regression Tree(CART) 와 Support Vector Machine(SVM) 의 두 개의 판별 분류 기법을 서로 비교하고 그 성능을 평가한다. 두 개의 판별 기법의 오차는 CART의 경우 0.0094 그리고 SVM의 경우 0.0089로 둘 다 우수한 성능을 보였지만 쉬운 결과 해석이 가능한 CART가 사용하기 용이함을 보인다.

  • PDF

머신러닝 모델을 이용한 석산 개발 발파진동 예측 (Prediction of Blast Vibration in Quarry Using Machine Learning Models)

  • 정다희;최요순
    • 터널과지하공간
    • /
    • 제31권6호
    • /
    • pp.508-519
    • /
    • 2021
  • 본 연구에서는 발파 시 사람과 주변 환경에 영향을 끼치는 발파진동(peak particle velocity, PPV)을 예측하는 모델을 개발하였다. PPV를 예측하기 위해 kNN(k-nearest neighbors), CART(classification and regression tree), SVR(support vector regression), PSO(particle swarm optimization)-SVR 알고리즘을 이용한 4가지 머신러닝 모델을 개발하고 상호 비교하였다. 머신러닝 모델을 훈련하기 위해 경상남도 창원시에 있는 욕망산을 연구지역으로 선정하고 1048개의 발파 데이터를 획득하였다. 발파 데이터는 천공장, 저항선, 공간격, 최대지발장약량, 비장약량, 총공수, 에멀전비율, 이격거리, PPV로 구성되었다. 훈련된 모델들의 성능을 평가하기 위한 지표 값으로 MAE(mean absolute error), MSE(mean squared error), RMSE(root mean squared error)를 사용하였다. 평가결과 PSO-SVR 모델이 MAE, MSE, RMSE가 각각 0.0348, 0.0021, 0.0458으로 가장 우수한 예측 성능을 나타냈다. 마지막으로 개발된 머신러닝 모델을 이용하여 주변 환경에 영향을 끼치는 정도를 예측하는 방법을 제시하였다.

국어 낭독체 발화의 운율경계 예측 (Prediction of Break Indices in Korean Read Speech)

  • 김효숙;김정원;김선주;김선철;김삼진;권철홍
    • 대한음성학회지:말소리
    • /
    • 제43호
    • /
    • pp.1-9
    • /
    • 2002
  • This study aims to model Korean prosodic phrasing using CART(classification and regression tree) method. Our data are limited to Korean read speech. We used 400 sentences made up of editorials, essays, novels and news scripts. Professional radio actress read 400sentences for about two hours. We used K-ToBI transcription system. For technical reason, original break indices 1,2 are merged into AP. Differ from original K-ToBI, we have three break index Zero, AP and IP. Linguistic information selected for this study is as follows: the number of syllables in ‘Eojeol’, the location of ‘Eojeol’ in sentence and part-of-speech(POS) of adjacent ‘Eojeol’s. We trained CART tree using above information as variables. Average accuracy of predicting NonIP(Zero and AP) and IP was 90.4% in training data and 88.5% in test data. Average prediction accuracy of Zero and AP was 79.7% in training data and 78.7% in test data.

  • PDF

CART기법과 보조자료를 이용한 토양수분 추정 (Soil Moisture Estimation Using CART Algorithm and Ancillary Data)

  • 김광섭;박한균
    • 한국수자원학회논문집
    • /
    • 제43권7호
    • /
    • pp.597-608
    • /
    • 2010
  • 본 연구에서는 우리나라 전역에 대한 토양수분 분포도 작성을 위하여 지상관측 토양수분, 강수량, 지면온도, NDVI, 토지피복, 유효토심 등과 같은 보조자료와 CART기법을 이용한 새로운 추정기법을 제시하였다. 먼저 신뢰성 높은 토양 수분 관측자료를 가진 용담댐 유역(4개 지점)에 대하여 토양수분을 추정하여 적용 가능성을 분석하였다. 3개 지점(부귀, 상전, 천천2)의 토양수분 관측치는 토양수분 추정 모형 수립에 사용하였으며, 검증에 1개 지점(계북2)이 사용되었다. 관측지점들의 토양수분의 관측치와 추정치 사이의 상관계수가 약 0.737로 나타났으며, 전체적인 토양수분의 거동을 잘 나타내고 있어 토양수분 추정 모형의 적용가능성을 확인하였다. 이를 이용하여 용담댐 유역의 토양수분 분포와 우리나라 전역에 대한 토양수분 분포도를 추정하였다. 다양한 지상조건에 대하여 신뢰할 수 있는 지상관측 토양수분 관측치가 존재하지 않는 한계가 있음에도 불구하고 제시된 토양수분추정방법은 제한된 가용자료를 사용한 우리나라 전역의 토양수분 추정에 있어 합리적인 접근법이라 판단된다.