• 제목/요약/키워드: regression trees

검색결과 248건 처리시간 0.026초

A Comparative Study of Medical Data Classification Methods Based on Decision Tree and System Reconstruction Analysis

  • Tang, Tzung-I;Zheng, Gang;Huang, Yalou;Shu, Guangfu;Wang, Pengtao
    • Industrial Engineering and Management Systems
    • /
    • 제4권1호
    • /
    • pp.102-108
    • /
    • 2005
  • This paper studies medical data classification methods, comparing decision tree and system reconstruction analysis as applied to heart disease medical data mining. The data we study is collected from patients with coronary heart disease. It has 1,723 records of 71 attributes each. We use the system-reconstruction method to weight it. We use decision tree algorithms, such as induction of decision trees (ID3), classification and regression tree (C4.5), classification and regression tree (CART), Chi-square automatic interaction detector (CHAID), and exhausted CHAID. We use the results to compare the correction rate, leaf number, and tree depth of different decision-tree algorithms. According to the experiments, we know that weighted data can improve the correction rate of coronary heart disease data but has little effect on the tree depth and leaf number.

투자와 수출 및 환율의 고용에 대한 의사결정 나무, 랜덤 포레스트와 그래디언트 부스팅 머신러닝 모형 예측 (Investment, Export, and Exchange Rate on Prediction of Employment with Decision Tree, Random Forest, and Gradient Boosting Machine Learning Models)

  • 이재득
    • 무역학회지
    • /
    • 제46권2호
    • /
    • pp.281-299
    • /
    • 2021
  • This paper analyzes the feasibility of using machine learning methods to forecast the employment. The machine learning methods, such as decision tree, artificial neural network, and ensemble models such as random forest and gradient boosting regression tree were used to forecast the employment in Busan regional economy. The following were the main findings of the comparison of their predictive abilities. First, the forecasting power of machine learning methods can predict the employment well. Second, the forecasting values for the employment by decision tree models appeared somewhat differently according to the depth of decision trees. Third, the predictive power of artificial neural network model, however, does not show the high predictive power. Fourth, the ensemble models such as random forest and gradient boosting regression tree model show the higher predictive power. Thus, since the machine learning method can accurately predict the employment, we need to improve the accuracy of forecasting employment with the use of machine learning methods.

신경회로망과 회귀모형을 이용한 특수일 부하 처리 기법 (Special-Days Load Handling Method using Neural Networks and Regression Models)

  • 고희석;이세훈;이충식
    • 조명전기설비학회논문지
    • /
    • 제16권2호
    • /
    • pp.98-103
    • /
    • 2002
  • 전력수요를 예측할 경우 가장 중요한 문제 중의 하나가 특수일 부하의 처리문제이다. 따라서 본 연구에서 길고(구정, 추석) 짧은(식목일, 현충일 등) 특수일 피크 부하를 신경회로망과 회귀모형을 이용하여 예측하는 방법을 제시한다. 신경회로망 모형의 특수일 부하 처리는 패턴 변환비를 이용하며, 4차의 직교 다항 회귀모형은 과거의 10년 (1985∼1994)간의 특수일 피크부하 자료를 이용하여 길고 짧은 특수일 부하를 예측한다. 특수일 피크 부하를 예측한 결과, 신경회로망 모형의 주간 평균 예측 오차율과 직교 다항 회귀모형의 예측 오차율을 분석한 결과 1∼2[%]대로 두 모형 모두 양호한 결과를 얻었다. 또한 4차의 직교 다항 회귀 모형의 수정결정계수 및 F 검정을 분석한 결과 구성한 예측 모형의 타당성을 확인하였다. 두 모형의 특수일 부하를 예측한 결과를 비교해 보면 긴 특수일 부하를 예측할 때는 패턴 변환비를 이용한 신경회로망 모형이 보다 더 효과적이었고, 짧은 특수일 부하를 예측할 경우에는 두 방법 모두 유효하였다.

식생가뭄반응지수 (VegDRI)를 활용한 위성영상 기반 가뭄 평가 (Satellite-based Hybrid Drought Assessment using Vegetation Drought Response Index in South Korea (VegDRI-SKorea))

  • 남원호;;;장민원;홍석영
    • 한국농공학회논문집
    • /
    • 제57권4호
    • /
    • pp.1-9
    • /
    • 2015
  • The development of drought index that provides detailed-spatial-resolution drought information is essential for improving drought planning and preparedness. The objective of this study was to develop the concept of using satellite-based hybrid drought index called the Vegetation Drought Response Index in South Korea (VegDRI-SKorea) that could improve spatial resolution for monitoring local and regional drought. The VegDRI-SKorea was developed using the Classification And Regression Trees (CART) algorithm based on remote sensing data such as Normalized Difference Vegetation Index (NDVI) from MODIS satellite images, climate drought indices such as Self Calibrating Palmer Drought Severity Index (SC-PDSI) and Standardized Precipitation Index (SPI), and the biophysical data such as land cover, eco region, and soil available water capacity. A case study has been done for the 2012 drought to evaluate the VegDRI-SKorea model for South Korea. The VegDRI-SKorea represented the drought areas from the end of May and to the severe drought at the end of June. Results show that the integration of satellite imageries and various associated data allows us to get improved both spatially and temporally drought information using a data mining technique and get better understanding of drought condition. In addition, VegDRI-SKorea is expected to contribute to monitor the current drought condition for evaluating local and regional drought risk assessment and assisting drought-related decision making.

장애 음성 판별을 위한 의료/전자 융복합 소프트웨어 개발 (Development of medical/electrical convergence software for classification between normal and pathological voices)

  • 문지혜;이지연
    • 디지털융복합연구
    • /
    • 제13권12호
    • /
    • pp.187-192
    • /
    • 2015
  • 장애음성을 판별할 수 있는 소프트웨어가 개발 될 경우, 원격의료와 언어치료 등 여러 융복합 분야에서의 활용도가 매우 높다. 본 논문은 성대 진동에 대한 변화율을 나타내는 의료정보인 음향학적 파라미터와 신호처리 기반 고차 통계량에 기반을 둔 파라미터를 융합하여, CART(Classification And Regression Trees) 분석을 통해서 정상/장애음성 판별 프로그램을 구현하였다. 사용된 음향학적 파라미터는 Jitter(%)와 shimmer(%)이다. 그리고 본 연구에서 제안된 고차통계량 기반 파라미터는 왜도(Skewness)와 첨도(Kurtosis)의 평균과 분산이다. Kay Elemetrics의 데이터베이스에서 무작위로 발췌된 정상음성 53명, 장애 음성 173명의 /아/ 발화를 이용하여 결정트리(Decision tree) 기반장애음성 판별을 위해 평균적으로 83.15%의 성능을 보이는 알고리즘을 구현하였다. 그 결과를 바탕으로 추후 상용화를 고려하여 사용자 친화적인 프레임 워크에 의해 컨텐츠를 생성하는 융복합형 기능이 포함된 장애음성 판별 프로그램을 개발하였다.

CRT 알고리즘을 이용한 우리나라 노인의 사회활동 영향요인 예측 모형 개발 (Development of Predictive Model of Social Activity for the Elderly in Korea using CRT Algorithm)

  • 변해원
    • 한국융합학회논문지
    • /
    • 제9권10호
    • /
    • pp.243-248
    • /
    • 2018
  • 노년기의 사회참여는 사회적 상호작용의 기회를 제공하여 삶의 만족감을 고취시키기 때문에 성공적인 노화를 달성하기 위해서 중요하다. 이 연구는 우리나라 지역사회 노인을 대상으로 노년기 사회 활동의 관련요인과 사회 참여를 예측하는 통계적 분류 모형을 구축하였다. 분석 대상은 2015년도 지역사회 건강조사를 완료한 60세 이상 노인 1,864명(남 829명, 여 1,035명)이었다. 결과 변수는 지난 1달 간 사회 활동 경험(있음, 없음)으로 정의하였다. 예측모형은 Classification and Regression Trees(CRT) 알고리즘 기반 의사결정나무모형을 이용하여 구축하였다. 연구결과, 사회참여의 유의미한 분류 변수는 주관적 건강, 이웃과의 만남빈도, 친척과의 만남빈도, 배우자 동거여부이었고, 그 중에서도 가장 우선적으로 관여하는 예측 요인은 주관적 건강수준이었다. 본 연구의 결과를 기초로 도래하는 초고령사회의 성공적인 노화를 대비하기 위해서 노인의 사회 활동에 대한 사회적 관심과 지원이 요구된다.

심리적 의식과 물리적 요소의 상관성 분석을 통한 가로경관 개선사업 평가에 관한 연구 - 부산시 광복로를 대상으로 - (A Study on the Evaluation for the Improvement of Streetscape through Relationship Analysis between Psychological Consciousness and Physical Elements - Focused on the Gwangbok Street, Busan -)

  • 양재혁;이강희
    • KIEAE Journal
    • /
    • 제9권6호
    • /
    • pp.37-44
    • /
    • 2009
  • This study conducted an evaluation of the streetscape improvement project of the Gwangbok Street through analysis of correlations between psychological consciousness and physical elements in the street by comparing selected pictures of streetscape before and after the project. This work has conducted an analysis of Psychological characteristics by semantic differential method and an analysis of physical elements which influence psychological characteristics by regression analysis. According to the results of psychological analysis, the senses of interest, orderliness, esthetic and preference were highly improved in A district and the senses of openess, stability, orderliness were highly improved in B district. The results of analyzing physical elements influencing the improvement of these psychological consciousness in A district elucidated ; 1) the works of improving signboard and elevation of the building affected the whole these psychological consciousness, 2) the work of planting trees, making plant rests in the street improved the senses of orderliness, esthetic, 3) the work of changing finishing materials in the street enhanced the senses of esthetic, preference, 4) the work of adjusting the width between the road and the pavement, the work of improving traffic enhanced the senses of interest, preference. In the meantime in B district, the works of improving signboard and elevation of the building and those of planting trees, making plant rests in the street improved the senses of openess and orderliness. Also the work of improving traffic enhanced the senses of openess, stability and the work of expanding the pavement, that of changing finishing materials in the street improved the senses of openess, stability, orderliness.

사상체질 분류모형 개발 및 진단시스템의 구현에 관한 연구 (Study on Development of Classification Model and Implementation for Diagnosis System of Sasang Constitution)

  • 범수균;전미란;오암석
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2008년도 지능정보 및 응용 학술대회
    • /
    • pp.155-159
    • /
    • 2008
  • 본 논문에서는 사상체질분류검사 설문지를 이용하여 사상체질을 진단할 때 진단의 정확도를 향상시키기 위한 사상체질 분류모형을 개발하기 위하여 데이터마이닝의 주요 분류기법인 판별분석(discriminant analysis), 의사결정나무(decision tree analysis), 신경망분석(neural network analysis), 로지스틱 회귀분석(logistic regression analysis), 군집분석(clustering analysis) 등 다양한 분류분석모형을 이용한다. 본 연구에서는 분류의 비교적 정확도가 우수하며, 특히 분석과정을 쉽게 이해하고 설명할 수 있다는 점과 구현이 용이하다는 장점을 가지고 있는 판별분석모형과 의사결정나무분석모형을 기반으로 사상체질 분류모형을 개발하고, 두 분류모형을 적용한 사상체질 진단시스템을 구현하였다.

  • PDF

CORRELATION ANALYSIS BETWEEN FOREST VOLUME, ETM+ BANDS, AND HEIGHT ESTIMATED FROM C-BAND SRTM PRODUCT

  • Kim, Jin-Woo;Kim, Jong-Hong;Lee, Jung-Bin;Heo, Joon
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2006년도 Proceedings of ISRS 2006 PORSEC Volume I
    • /
    • pp.512-515
    • /
    • 2006
  • Forest stand height and volume are important indicators for management purpose as well as for the environmental analysis. Shuttle Radar Topography Mission (SRTM) is backscattered over forest canopy and DSM can be acquired from such scattering characteristic, while National Elevation Dataset (NED) provides bare earth elevation data. The difference between SRTM and NED is estimated as tree height, and it is correlated with forest parameters, it is correlated with forest parameters, including average DBH, Trees per acre, net BF per acre, and total Net MBF. Especially, among them, net Board Foot(BF) per acre is the index that well represents forest volume. The Project site was Douglas-fir dominating plantation area in the western Washington an the northern Oregon in the U.S. This study shows a relationship of high correlation between the forest parameters and the product from SRTM, NED, and ETM+. This research performs multi regression analysis and regression tree algorithm, and can get more improved relationship between several parameters.

  • PDF

Correlation Analysis Between Forest Volume, ETM+ Bands, and Height Estimated from C-Band SRTM Product

  • Kim, Jin-Woo;Kim, Jong-Hong;Lee, Jung-Bin;Heo, Joon
    • 대한원격탐사학회지
    • /
    • 제22권5호
    • /
    • pp.427-431
    • /
    • 2006
  • Forest stand height and volume are important indicators for management purpose as well as for the environmental analysis. Shuttle Radar Topography Mission (SRTM) is backscattered over forest canopy and DSM can be acquired from such scattering characteristic, while National Elevation Dataset (NED) provides bare earth elevation data. The difference between SRTM and NED is estimated as tree height, and it is correlated with forest parameters, it is correlated with forest parameters, including average DBH, Trees per acre, net BF per acre, and total Net MBF. Especially, among them, net Board Foot(BF) per acre is the index that well represents forest volume. The Project site was Douglas-fir dominating plantation area in the western Washington an the northern Oregon in the U.S. This study shows a relationship of high correlation between the forest parameters and the product from SRTM, NED, and ETM+. This research performs multi regression analysis and regression tree algorithm, and can get more improved relationship between several parameters.