• 제목/요약/키워드: Feature Importance Analysis

검색결과 139건 처리시간 0.02초

건설 현장에서 발생한 업무상 재해가 근로손실일수 심각도에 미치는 특징 중요도 분석 (Analysis of the Feature Importance of Occupational Accidents Occurring at Construction Sites on the Severity of Lost Workdays)

  • 강경수;최재현;류한국
    • 한국건축시공학회지
    • /
    • 제21권2호
    • /
    • pp.165-174
    • /
    • 2021
  • 건설업은 전체 산업 분야 중에서 가장 많은 재해와 사망자를 발생시키는 산업 분야이다. 건설안전 재해를 줄이기 위한 큰 노력이 진행되어왔지만, 사망사고를 제외한 근로자의 업무복귀시간까지 회복되는 근로손실일수에 관한 연구는 매우 적은 편이다. 따라서 본 연구는 근로손실일수를 심각도로 정의하여 이를 분류하는 모형을 제안하고 학습된 모형을 통해 특징 중요도를 도출하고 중요한 특징을 분석하고자 하였다. 블랙박스 모형인 랜덤 포레스트의 학습 과정을 해석하고 추출된 특징 중요도를 통해 근로손실일수 심각도에 영향력을 행사하는 중요 변수를 추출하였다. 추출된 특징을 통해 내부에 존재하는 요인들을 분석하였다. 본 연구의 목적은 건설 현장에서 발생한 사고 사례 데이터를 랜덤 포레스트 모형을 통해 분석하고자 하였다. 근로손실일수의 심각도에 미치는 중요한 특징을 도출해 체계적으로 관리한다면 건설 재해를 예방할 수 있다.

음운 오류 패턴: 설정성 자질의 임상적 고찰 (Phonological Error Patterns: Clinical Aspects on Coronal Feature)

  • 김민정;이성은
    • 말소리와 음성과학
    • /
    • 제2권4호
    • /
    • pp.239-244
    • /
    • 2010
  • The purpose of this study is to investigate two phonological error patterns on coronal feature of children with functional articulation disorders and to compare them with those of general children. We tested 120 children with functional articulation disorders and 100 general children from 2~4 years of age with 'Assessment of Phonology & Articulation for Chidren(APAC)'. The results were as follows: (1) 37 disordered children substituted [+coronal] consonants for [-coronal] consonants (fronting of velars) and 9 disordered children substituted [-coronal] consonants for [+coronal] consonants (backing to velars). (2) Theses two phonological patterns were affected by the articulatory place of following phoneme. (3) The fronting pattern of children with articulation disorders was similar with that of general children, but their backing pattern was different with that of general children. These results show the clinical usefulness of coronal feature in phonological pattern analysis, the need of articulatory assessment with various phonetic context, and the importance of error contexts in clinical judgment.

  • PDF

An interpretable machine learning approach for forecasting personal heat strain considering the cumulative effect of heat exposure

  • Seo, Seungwon;Choi, Yujin;Koo, Choongwan
    • 한국건설관리학회논문집
    • /
    • 제24권6호
    • /
    • pp.81-90
    • /
    • 2023
  • Climate change has resulted in increased frequency and intensity of heat waves, which poses a significant threat to the health and safety of construction workers, particularly those engaged in labor-intensive and heat-stress vulnerable working environments. To address this challenge, this study aimed to propose an interpretable machine learning approach for forecasting personal heat strain by considering the cumulative effect of heat exposure as a situational variable, which has not been taken into account in the existing approach. As a result, the proposed model, which incorporated the cumulative working time along with environmental and personal variables, was found to have superior forecast performance and explanatory power. Specifically, the proposed Multi-Layer Perceptron (MLP) model achieved a Mean Absolute Error (MAE) of 0.034 (℃) and an R-squared of 99.3% (0.933). Feature importance analysis revealed that the cumulative working time, as a situational variable, had the most significant impact on personal heat strain. These findings highlight the importance of systematic management of personal heat strain at construction sites by comprehensively considering the cumulative working time as a situational variable as well as environmental and personal variables. This study provided a valuable contribution to the construction industry by offering a reliable and accurate heat strain forecasting model, enhancing the health and safety of construction workers.

고혈압 위험 예측에 적용된 특징 선택 방법의 비교 (Comparison of Feature Selection Methods Applied on Risk Prediction for Hypertension)

  • ;김미혜
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권3호
    • /
    • pp.107-114
    • /
    • 2022
  • 본 논문에서는 질병관리청 국민건강영양조사(KNHANES: Korea National Health and Nutrition Examination Survey) 데이터베이스에서 특징선택 방법으로 고혈압을 감지 예측하는 방법을 개선했다. 또한 만성 고혈압과 관련된 다양한 위험 요인을 확인하였다. 본 논문은 3가지로 나누어, 첫째 결측값을 제거하고 Z-변환을 하는 데이터 전처리 단계이다. 다음은 데이터 셋에서 특징선택법을 기반으로 하는 요인분석(FA)을 사용하는 특징선택 단계이며, 특징선택을 기반으로 다중공선형 분석(MC)와 특징중요도(FI)을 비교했다. 마지막으로 예측분석단계에서 고혈압 위험을 감지하고 예측하는데 적용했다. 본 연구에서는 각 분류 모델에 대해 ROC 곡선(AUC) 아래의 평균 표준 오차(MSE), F1 점수 및 면적을 비교한다. 테스트 결과 제안한 MC-FA-RF모델은 80.12% 가장 높은 정확도를 보이고, MSE, f-score, AUC 모델의 경우 각각 0.106, 83.49%의, 85.96% 으로 나타났다. 이러한 결과는 고혈압위험 예측에 대한 제안된 MC-FA-RF 방법이 다른 방법에 비해 우수함을 보이고 있다.

Explainable Machine Learning Based a Packed Red Blood Cell Transfusion Prediction and Evaluation for Major Internal Medical Condition

  • Lee, Seongbin;Lee, Seunghee;Chang, Duhyeuk;Song, Mi-Hwa;Kim, Jong-Yeup;Lee, Suehyun
    • Journal of Information Processing Systems
    • /
    • 제18권3호
    • /
    • pp.302-310
    • /
    • 2022
  • Efficient use of limited blood products is becoming very important in terms of socioeconomic status and patient recovery. To predict the appropriateness of patient-specific transfusions for the intensive care unit (ICU) patients who require real-time monitoring, we evaluated a model to predict the possibility of transfusion dynamically by using the Medical Information Mart for Intensive Care III (MIMIC-III), an ICU admission record at Harvard Medical School. In this study, we developed an explainable machine learning to predict the possibility of red blood cell transfusion for major medical diseases in the ICU. Target disease groups that received packed red blood cell transfusions at high frequency were selected and 16,222 patients were finally extracted. The prediction model achieved an area under the ROC curve of 0.9070 and an F1-score of 0.8166 (LightGBM). To explain the performance of the machine learning model, feature importance analysis and a partial dependence plot were used. The results of our study can be used as basic data for recommendations related to the adequacy of blood transfusions and are expected to ultimately contribute to the recovery of patients and prevention of excessive consumption of blood products.

머신러닝을 이용한 골든글러브 수상 요인 분석에 대한 연구 (A Study on the Analysis of Factors for the Golden Glove Award by using Machine Learning)

  • 엄대엽;김성용
    • 한국콘텐츠학회논문지
    • /
    • 제22권5호
    • /
    • pp.48-56
    • /
    • 2022
  • 야구에서 데이터분석의 중요성은 점점 더 커지고 있는데, 이는 Billy Beane의 머니볼 이론을 적용한 MLB의 오클랜드 구단과 2020년 KBO 우승팀인 NC다이노스의 사례에서도 알 수 있다. 미국 뿐 만 아니라 우리나라에서도 데이터를 이용한 다양한 연구이 이루어지고 있는데, 특히 경기의 승패를 예측하기 딥러닝 및 머신러닝을 이용한 연구가 활발하게 진행되고 있다. 그러나 기존 연구의 경우 경기 승패 예측에 초점이 맞추어져 있으며, 어떠한 요인이 경기에 중요한 영향을 주었는지에 대한 결과 해석이 어렵다는 한계점이 존재한다. 이에 따라 본 논문에서는 포지션별 최고의 선수에게 수여되는 골든글러브 수상 예측 모형을 개발하고, 어떠한 요인이 수상에 영향을 주는지를 파악함으로써, 우수한 선수로 구분되는 척도를 찾고자 한다. 분석 모형으로는 Boosting 기법 중의 하나인 XGBoost를 이용하였으며, 어떠한 요인이 골든글러브 수상에 중요한 영향을 주었는지 파악하기 위하여 XGBoost의 변수 중요도를 이용하였다. 이와 같은 분석을 통해 각 포지션별 중요한 지표를 파악할 수 있었다.

인적요인을 고려한 머신러닝 활용 산림화재 예측 (Predicting Forest Fires Using Machine Learning Considering Human Factors)

  • 장진명;김주찬;김화중;김광태
    • 한국산업정보학회논문지
    • /
    • 제28권5호
    • /
    • pp.109-126
    • /
    • 2023
  • 대형 산림화재를 예방하기 위해 산림화재의 조기발견은 매우 중요하다. 조기발견을 위한 하나의 방안으로 산림화재 발생 예측이 고려되고 있으며 다양한 관련 연구가 진행되었다. 그러나 대다수의 선행연구가 산림화재의 주요 발화 원인 중의 하나인 인적요인을 고려하지 않고 기상요인과 지리적 요인만을 주로 다루고 있다. 따라서 본 연구는 기상 및 지리적 요인뿐만 아니라 인적요인을 고려한 산림화재 예측모형을 개발하기 위해 2003년부터 2020년까지의 강원도 산림화재 데이터를 활용하여 로지스틱 회귀모형과 다양한 머신러닝 기법 기반의 예측모형을 개발하고 성능을 비교분석하였다. 성능분석 결과, 머신러닝 기법인 랜덤 포레스트(AUC=0.920)와 XG Boost 모형(AUC=0.925)이 가장 우수한 성능을 나타냈다. 운영시사점을 도출하기 위해 순열특성중요도 분석을 활용하여 요인들의 상대적 중요도를 분석하였으며, 기상요인이 인적요인보다 높은 영향도를 나타냈지만 다양한 인적요인도 유효한 것으로 확인되었다.

주거건축물 경관조명 디자인의 트랜드 분석 (The Trend Analysis of Outdoor Lighting Design in Residential Areas)

  • 박지애;최안섭
    • 한국조명전기설비학회:학술대회논문집
    • /
    • 한국조명전기설비학회 2006년도 춘계학술대회 논문집
    • /
    • pp.16-19
    • /
    • 2006
  • Due to its increased importance, outdoor lighting has been installed even for residental area. For the most part, more outdoor lightings are being installed for those houses designed to accommodate people since 2000. On this respect, quantitative analysis is conducted after finding the cases of outdoor lighting installed for residental area until nu. The cases of 24 residental areas we investigated to find the specific feature of outdoor lightings. This type of design analysis will serve as an attempt to set the stage for future studies.

  • PDF

머신러닝 분류 알고리즘을 활용한 선박 접안속도 영향요소의 중요도 분석 (Analysis of Feature Importance of Ship's Berthing Velocity Using Classification Algorithms of Machine Learning)

  • 이형탁;이상원;조장원;조익순
    • 해양환경안전학회지
    • /
    • 제26권2호
    • /
    • pp.139-148
    • /
    • 2020
  • 선박이 접안할 때 발생하는 접안에너지에 가장 영향력이 큰 요소는 접안속도이며, 과도한 경우 사고로 이어질 수 있다. 접안속도의 결정에 영향을 미치는 요소는 다양하지만 기존 연구에서는 일반적으로 선박 크기에 제한하여 분석하였다. 따라서 본 연구에서는 다양한 선박 접안속도의 영향요소를 반영하여 분석하고 그에 따른 중요도를 도출하고자 한다. 분석에 활용한 데이터는 국내 한 탱커부두의 선박 접안속도를 실측한 것을 바탕으로 하였다. 수집된 데이터를 활용하여 머신러닝 분류 알고리즘인 의사결정나무(Decision Tree), 랜덤포레스트(Random Forest), 로지스틱회귀(Logistic Regression), 퍼셉트론(Perceptron)을 비교분석하였다. 알고리즘 평가 방법으로는 혼동 행렬에 따른 모델성능 평가지표를 사용하였다. 분석 결과, 가장 성능이 좋은 알고리즘으로는 퍼셉트론이 채택되었으며 그에 따른 접안속도 영향요인의 중요도는 선박 크기(DWT), 부두 위치(Jetty No.), 재화상태(State) 순으로 나타났다. 이에 따라 선박 접안 시, 선박의 크기를 비롯하여 부두 위치, 재화 상태 등 다양한 요인을 고려하여 접안속도를 설계하여야 한다.

설명가능한 인공지능을 통한 마르텐사이트 변태 온도 예측 모델 및 거동 분석 연구 (Study on predictive model and mechanism analysis for martensite transformation temperatures through explainable artificial intelligence)

  • 전준협;손승배;정재길;이석재
    • 열처리공학회지
    • /
    • 제37권3호
    • /
    • pp.103-113
    • /
    • 2024
  • Martensite volume fraction significantly affects the mechanical properties of alloy steels. Martensite start temperature (Ms), transformation temperature for martensite 50 vol.% (M50), and transformation temperature for martensite 90 vol.% (M90) are important transformation temperatures to control the martensite phase fraction. Several researchers proposed empirical equations and machine learning models to predict the Ms temperature. These numerical approaches can easily predict the Ms temperature without additional experiment and cost. However, to control martensite phase fraction more precisely, we need to reduce prediction error of the Ms model and propose prediction models for other martensite transformation temperatures (M50, M90). In the present study, machine learning model was applied to suggest the predictive model for the Ms, M50, M90 temperatures. To explain prediction mechanisms and suggest feature importance on martensite transformation temperature of machine learning models, the explainable artificial intelligence (XAI) is employed. Random forest regression (RFR) showed the best performance for predicting the Ms, M50, M90 temperatures using different machine learning models. The feature importance was proposed and the prediction mechanisms were discussed by XAI.