• 제목/요약/키워드: Decision Tree analysis

검색결과 736건 처리시간 0.033초

데이터마이닝 기법을 이용한 사상체질 판별함수에 관한 연구 (Study on Classification Function into Sasang Constitution Using Data Mining Techniques)

  • 김규곤;김종원;이의주;김종열;최선미
    • 동의생리병리학회지
    • /
    • 제18권6호
    • /
    • pp.1938-1944
    • /
    • 2004
  • In this study, when we make a diagnosis of constitution using QSCC Ⅱ(Questionnaire of Sasang Constitution Classification). data mining techniques are applied to seek the classification function for improving the accuracy. Data used in the analysis are the questionnaires of 1051 patients who had been treated in Dong Eui Oriental Medical Hospital and Kyung Hee Oriental Medical Hospital. The criteria for data cleansing are the response pattern in the opposite questionnaires and the positive proportion of specific questionnaires in each constitution. And the criteria for variable selection are the test of homogeneity in frequency analysis and the coefficients in the linear discriminant function. Discriminant analysis model and decision tree model are applied to seek the classification function into Sasang constitution. The accuracy in learning sample is similar in two models, the higher accuracy in test sample is obtained in discriminant analysis model.

Analysis of Female Lower Body Shapes for the Development of Slacks Patterns: Exploring Body Clusters Using Machine Learning

  • Ji Min Kim
    • International Journal of Advanced Culture Technology
    • /
    • 제12권3호
    • /
    • pp.434-440
    • /
    • 2024
  • SIZE KOREA updates body measurement data every five years, providing essential information for the fashion industry. This anthropometric data is widely used to diagnose consumer body shapes and develop optimal clothing sizes. Artificial intelligence, particularly machine learning, excels in predicting such body shape classifications. This study seeks to enhance the suitability of clothing design by applying the new analytical methodology of machine learning techniques to better capture and classify the unique body shapes of Korean women. In this study, machine learning techniques such as K-means clustering, Silhouette analysis, and Decision Tree analysis were used to classify the lower body shapes of Korean women in their twenties and identify standard body shapes useful for slacks design. The results showed that the lower body of the age group could be classified into three categories: 'small stature' (the majority), 'tall with an average lower body volume,' and 'medium height with a fuller lower body' (the smallest share). The three-cluster approach is validated through Silhouette analysis, which minimizes misclassification. Decision Tree analysis then further defines the criteria for these clusters, highlighting waist height and hip depth as the most significant factors, achieving a classification accuracy of 90.6%. While this study is not directly related to Robotic Process Automation, its detailed analysis of body shapes for slacks patterns can aid RPA in clothing production. Future research should continue integrating machine learning in human body and fashion design studies.

의사결정나무분석을 이용한 청소년 우울의 보호요인 예측모형 (Predictors of Protective Factors for Depression in Adolescent using Decision Making Tree Analysis)

  • 김보영
    • 한국콘텐츠학회논문지
    • /
    • 제15권5호
    • /
    • pp.375-385
    • /
    • 2015
  • 본 연구는 의사결정나무 분석을 활용하여 청소년의 우울 보호요인을 예측하여 우울 예방과 조기발견 및 중재 방안을 마련하고자 시도된 서술적 조사연구이다. 연구대상은 G광역시에 소재한 청소년 총 485명이고, 자료 수집은 2013년 9월 23일부터 9월 26일 사이에 이루어졌다. 자료 분석은 SPSS 20.0 프로그램을 이용하여 빈도, 백분율, 평균과 표준편차 및 ${\chi}^2$-test, t-test, 의사결정나무 분석으로 분석하였다. 본 연구 결과, 4개의 경로, 총 12노드가 구축되었고 가족 결속력, 부모 자녀간 의사소통과 또래와의 의사소통이 청소년 우울 보호요인이었다. 우울의 보호요인 예측 정확도에서 분석용은 특이도 76.0%, 민감도 65.4%이었고, 검정용은 특이도 78.2%, 민감도 63.7%이었으며, 전체 분류 정확도는 분석용 70.1%, 검정용 69.7%이었다. 이에 본 연구 결과가 학교와 지역사회에서 청소년 정신보건을 담당하는 전문가들에게 우울을 예방을 위한 프로그램 개발의 기초자료로 제공되고, 나아가 청소년들이 자신들의 목소리를 되찾고 힘차게 성장하기 위한 보호요인 강화를 위한 우울예방 정책 전략에 활용되기를 기대해 본다.

기계학습을 활용한 주택매도 결정요인 분석 및 예측모델 구축 (Using Mechanical Learning Analysis of Determinants of Housing Sales and Establishment of Forecasting Model)

  • 김은미;김상봉;조은서
    • 지적과 국토정보
    • /
    • 제50권1호
    • /
    • pp.181-200
    • /
    • 2020
  • 본 연구는 OLS모형을 적용하여 주택보유기간에 영향을 미치는 결정요인을 추정한 후 SVM, Decision Tree, Random Forest, Gradient Boosting, XGBoost, LightGBM을 통해 각 모형별 예측력을 비교하였다. 예측력이 가장 높은 모델을 기반모델 삼아 앙상블 모형 중 하나인 Stacking모형을 적용하여 더욱 예측력이 높은 모형을 구축하여 주택시장의 주택거래량을 파악할 수 있다는 점에 선행 연구와의 차이가 있다. OLS분석 결과 매도이익, 주택가격, 가구원 수, 거주주택형태(단독주택, 아파트)이 주택보유기간에 영향을 미치는 것으로 나타났으며, RMSE를 기준삼아 각 머신러닝 모형과 예측력 비교한 결과 머신러닝 모델의 예측력이 더 높은 것으로 나타났다. 이후, 영향을 미치는 변수로 데이터를 재구축한 후 각 머신러닝을 적용하여 예측력을 비교하였으며, 분석 결과 Random Forest의 예측력이 가장 우수한 것으로 나타났다. 또한 예측력이 가장 높은 Random Forest, Decision Tree, Gradient Boosting, XGBoost모형을 개별모형으로 적용하고, Linear, Ridge, Lasso모형을 메타모델로 하여 Stacking 모형을 구축하였다. 분석 결과, Ridge모형일 때 RMSE값이 0.5181으로 가장 낮게 나타나 예측력이 가장 높은 모델을 구축하였다.

경영분석지표와 의사결정나무기법을 이용한 유상증자 예측모형 개발 (Development of Predictive Models for Rights Issues Using Financial Analysis Indices and Decision Tree Technique)

  • 김명균;조윤호
    • 지능정보연구
    • /
    • 제18권4호
    • /
    • pp.59-77
    • /
    • 2012
  • 기업의 성장성, 수익성, 안정성, 활동성, 생산성 등에 대한 다양한 분석이 은행, 신용평가기관, 투자자 등 많은 이해관계자에 의해 실시되고 있고, 이에 대한 다양한 경영분석 지표들 또한 정기적으로 발표되고 있다. 본 연구에서는 이러한 경영분석 지표를 이용하여 어떤 기업이 가까운 미래에 유상증자를 실시하는지를 데이터마이닝을 통해 예측하고자 한다. 본 연구를 통해 어떠한 지표가 유상증자 여부를 예측하는데 도움이 되는가를 살펴 볼 것이며, 그 지표들을 이용하여 예측할 경우 그 예측의 정확도가 어느 정도인지를 분석하고자 한다. 특히 1997년 IMF 금융위기 전후로 유상증자를 결정하는 변수들이 변화하는지, 그리고 예측의 정확성에 분명한 차이가 존재하는지 분석한다. 또한 유상증자 실시 시기를 경영분석 지표 발표 후 1년 내, 1~2년 내, 2~3년 내로 나누어 예측 시기에 따라 예측의 정확성과 결정 변수들의 차이가 존재하는지도 분석한다. 658개의 유가증권상장법인의 경영분석 데이터를 이용하여 실증 분석한 결과, IMF 이후의 유상증자 예측모형이 IMF 이전의 예측모형에 비해 예측 정확도가 높았고, 학습용 데이터의 예측 정확도와 검증용 데이터의 예측 정확도 차이도 IMF 이후가 낮게 나타났다. 이러한 결과는 IMF 이후 재무자료의 정확도가 높아졌고, 기업에게 유상증자의 목적이 더욱 명확해졌다고 해석될 수 있다. 또한 예측기간이 단기인 경우 경영분석 지표 중 안전성에 관련된 지표들의 중요성이 부각되었고, 장기인 경우에는 수익성과 안전성뿐만 아니라 활동성과 생산성 관련지표도 유상증자를 예측하는 데 중요한 것으로 파악되었다. 그리고 모든 예측모형에서 산업코드가 유상증자를 예측하는 중요변수로 포함되었는데 이는 산업별로 서로 다른 유상증자 유형이 존재한다는 점을 시사한다. 본 연구는 투자자나 재무담당자가 유상증자 여부를 장단기 시점에서 예측하고자 할 때 어떠한 경영분석지표를 고려하여 분석하는 것이 바람직한지에 대한 지침을 제공하는데 그 의의가 있다.

Stress Identification and Analysis using Observed Heart Beat Data from Smart HRM Sensor Device

  • Pramanta, SPL Aditya;Kim, Myonghee;Park, Man-Gon
    • 한국멀티미디어학회논문지
    • /
    • 제20권8호
    • /
    • pp.1395-1405
    • /
    • 2017
  • In this paper, we analyses heart beat data to identify subjects stress state (binary) using heart rate variability (HRV) features extracted from heart beat data of the subjects and implement supervised machine learning techniques to create the mental stress classifier. There are four steps need to be done: data acquisition, data processing (HRV analysis), features selection, and machine learning, before doing performance measurement. There are 56 features generated from the HRV Analysis module with several of them are selected (using own algorithm) after computing the Pearson Correlation Matrix (p-values). The results of the list of selected features compared with all features data are compared by its model error after training using several machine learning techniques: support vector machine, decision tree, and discriminant analysis. SVM model and decision tree model with using selected features shows close results compared to using all recording by only 1% difference. Meanwhile, the discriminant analysis differs about 5%. All the machine learning method used in this works have 90% maximum average accuracy.

원전 기기의 최적교체시기 결정방법 (Methodology to Decide Optimum Replacement Term for Components of Nuclear Power Plants)

  • 문호림;장창희;박준현;정일석
    • 한국신뢰성학회:학술대회논문집
    • /
    • 한국신뢰성학회 2000년도 추계학술대회
    • /
    • pp.257-267
    • /
    • 2000
  • 원자력발전소 주요기기의 교체에 대한 경제성평가는 대부분 결정론적 방법으로 수행하고 있으나 불확실성을 가진 입력변수에 따라 결과 값이 매우 가변적일 수 있다. 현실세계의 불확실성을 보다 면밀히 고려하기 위해 확률론적 방법을 활용하고 있다. 본 논문에서는 decision analysis를 이용하여 원자력발전소 기기 교체에 대한 경제성평가를 확률론적 방법으로 수행하였다. Decision analysis는 불확실성과 위험에 직면한 선택을 이끄는 기회를 이성적으로 개선하기 위한 방법론이며, 확률론과 통계이론이 복합되어 있다. Decision analysis의 주요요소는 여러 가지 방안 중 선택한 대안, 선택으로부터 결정된 결과, 그리고 다른 대안과 비교해서 상대적인 우선순위이다. 또한, decision analysis는 값, 불확실성, 그리고 위험도를 구조적으로 통합하는 원리를 제공한다. Decision analysis의 중요한 이점은 이러한 불확실성과 위험도에 대한 처리에 있으며, 모델은 influence diagram과 decision tree를 이용하여 작성한다. 본 논문에서는 decision analysis를 이용하여 국내 A형 원자력발전소 증기발생기의 최적교체시기를 결정하여 보았다. 이러한 방법은 향후 원자력발전소 주요기기의 교체에 관한 경제성평가시 적용할 수 있을 것으로 기대된다.

  • PDF

의사결정트리에서 공간사건 예측을 위한 리프노드 등급 결정 방법 분석 (Analysis of Leaf Node Ranking Methods for Spatial Event Prediction)

  • 연영광
    • 한국지리정보학회지
    • /
    • 제17권4호
    • /
    • pp.101-111
    • /
    • 2014
  • 공간사건들은 데이터마이닝 분류알고리즘을 이용하여 예측 가능하며, 의사결정 트리는 대표적인 분류알고리즘들 중 하나로 사용되고 있다. 의사결정 트리는 레이블 값을 갖는 분류작업에 주로 사용되었으나 규칙평가 기법을 트리 리프노드 등급 계산에 응용하면서부터 공간사건 예측에 이용되고 있다. 이 논문에서는 의사결정 트리에서 사용되는 규칙평가 방법들을 공간예측에 적용하여 비교하였다. 실험을 위해 의사결정 트리 알고리즘인 C4.5알고리즘과 규칙 평가기법인 Laplace, M-estimate 및 m-branch 기법들을 구현하여 자연환경에서 발생되는 대표적인 공간예측 응용분야인 산사태에 적용하였다. 적용한 규칙 평가 기법들의 정확도 평가결과, 그 특성에 따라 정확도의 차이가 있었으며 m-branch가 가장 높은 성능을 보였다. 그러나 m-branch 및 M-estimate와 같이 별도의 파라미터를 갖는 경우 반복적으로 최적의 파라미터 값을 찾는 과정을 요구하였다. 따라서 적용 대상에 따라 선택적으로 활용할 수 있다. 이러한 의사결정 트리를 이용한 공간예측은 예측 결과뿐만 아니라 특정 위치에서의 예측결과에 대한 원인분석을 가능하게 함으로 다양한 응용을 가능하게 한다.

의사결정나무모형을 이용한 편마암 지역에서의 급경사지재해 예측기법 개발 (Development to Prediction Technique of Slope Hazards in Gneiss Area using Decision Tree Model)

  • 송영석;채병곤
    • 지질공학
    • /
    • 제18권1호
    • /
    • pp.45-54
    • /
    • 2008
  • 본 연구에서는 기 조사된 편마암 지역에서의 급경사지재해 발생지역 및 미발생지역에 대한 현장조사자료 및 토질시험자료를 토대로 통계적인 분석방법인 의사결정나무모형을 이용하여 급경사지재해 예측기법을 개발하였다. 편마암 지역에서의 조사된 급경사지재해 자료는 서울 및 경기지역에서 1998년 집중호우로 발생된 104개소구간이다. 이 가운데 예측모델 개발에 활용된 자료수는 결측치를 제외한 61개소로서, 급경사지재해 발생구간 34개소와 미발생구간 27개소이다. 의사결정나무모형을 이용한 통계적인 분석은 카이제곱 통계량, 지니 지수 및 엔트로피 지수를 적용하여 실시하였다. 분석결과 사면경사, 포화도 및 사면고도가 분리기준으로 선택되었으며, 엔트로피 지수를 이용한 의사결정나무모형 예측모델이 정확도가 가장 높은 것으로 나타났다. 선정된 급경사지재해 예측모델의 분리기준은 최상위부터 사면경사, 포화도 및 사면고도의 순서로 선택되었으며, 각각의 분리기준치는 사면경사의 경우 $17.9^{\circ}$, 포화도의 경우 52.1%, 사면고도의 경우 320m로 결정되었다.

위성영상기반 튀니지 사막화 모니터링 및 평가에 관한 연구 (A study for Desertification Monitoring and Assessment based on satellite imagery in Tunisia)

  • 김지원;송철호;박은빈;이종열;최솔이;이은정;이우균
    • 한국지리정보학회지
    • /
    • 제21권4호
    • /
    • pp.91-107
    • /
    • 2018
  • 최근 튀니지는 국토 남쪽의 사하라 사막이 북상하는 추세로 사막화 모니터링과 평가가 요구되고 있다. 본 연구에서는 원격탐사 자료를 활용하여 토지피복 변화를 관찰하고, 정규화식생지수, 표토입자크기지수, 알베도를 산출하여 튀니지의 사막화를 모니터링하였다. 또한, 평가 지표 간 우선순위를 파악하여 Decision Tree (DT)를 구성하였고, 각 사막화 평가 지표, 사막화 등급, 토지피복의 변화빈도와 경향을 확인하였다. 이후, 연구에서 활용한 세 평가 지표와 강수량 간의 상관관계 분석을 수행하였다. 빈도와 경향 분석결과, 튀니지에서는 사막화가 전반적으로 심화되고 있으며, 사막화 정도가 심한 지역이 지리적으로 북상하는 것으로 나타났다. 사막화 평가 지표와 강수량의 상관관계 분석을 시행한 결과, 세 지표 모두 강수량과 높은 상관관계를 갖는 것으로 나타나 강수량의 변화가 튀니지 사막화에 영향을 주고 있음을 확인하였다. 본 연구를 통해 위성영상에 기반한 사막화 지표와 이를 조합하여 평가하는 방식인 Decision Tree, 그리고 토지피복 변화 경향을 고려하는 다양한 방법론의 활용성이 제고되었다.