• 제목/요약/키워드: decision trees

검색결과 307건 처리시간 0.022초

Random Forest 분류기와 Bag-of-Feature 특징 히스토그램을 이용한 의료영상 자동 분류 및 검색 (Medical Image Classification and Retrieval Using BoF Feature Histogram with Random Forest Classifier)

  • 손정은;고병철;남재열
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권4호
    • /
    • pp.273-280
    • /
    • 2013
  • 본 논문에서는 의료영상의 특성을 반영하여 픽셀 그래디언트의 방향 값을 특징으로 하는 OCS-LBP (Oriented Center Symmetric Local Binary Patterns) 특징을 개발하고 BoF(Bag-of-Feature)와 Random Forest 분류기를 이용한 영상 검색 방법을 제안한다. 학습영상에서 추출된 특징 값은 code book 으로 군집화 되고, 각 영상들은 code book을 통해 의미 있는 새로운 차원인 BoF특징으로 변환된다. 이렇게 추출된 BoF특징은 Random Forest 분류기에 적용되고 학습된 분류기에 의해 유사한 특성을 갖는 N개의 클래스별로 분류되게 된다. 질의 영상이 입력되면 동일한 OCS-LBP특징이 추출되고 code book을 통해 BoF특징이 추출된다. 전통적인 내용기반 영상검색과는 다르게, 본 논문에서는 질의 영상에서 추출된 BoF특징이 학습된 Random Forest에 적용되어 가장 유사한 K-근접 이웃 (K-nearest neighbor) 클래스들을 선택하고 선택된 클래스들에 포함된 영상들에 대해서만 질의 영상과의 BoF 유사도 측정을 통해 최종 유사한 영상을 검색하게 된다. 실험결과에서 본 논문에서 제안하는 방법은 빠르고 우수한 검색 성능을 보여 주었다.

병원급식의 미생물적 품질보증을 위한 HACCP 전산프로그램의 개발 (The Development of a Computer-Assisted HACCP Program for the Microbiological Quality Assurance in Hospital Foodservice Operations)

  • 곽동경;류경;최성경
    • 한국식생활문화학회지
    • /
    • 제11권1호
    • /
    • pp.107-121
    • /
    • 1996
  • This study was carried out to develop the computer-assisted Hazard Analysis and Critical Control Point (HACCP) program for a systematic approach to the identification, assessment and control of hazards for foodservice manager to assure the microbiological quality of food in hospital foodservice operations. Sanitation practices were surveyed and analyzed in the dietetic department of 4 hospitals. Among them, one 762-bed general hospital was selected as standard model to develop computer-assisted HACCP program. All data base files and processing programs were created by using Foxpro package for easy access of HACCP concept. HACCP program was developed based on the methods suggested by NACMCF, IAMFES and Bryan. This program consisted of two parts: the pre-stage for HACCP study and the implementation stage of the HACCP system. 1. Pre-stage for HACCP study includes the selection of menu item, the development of the HACCP recipe, the construction of a product flow diagram, and printing the HACCP recipe and a product flow diagram. A menu item for HACCP study can be selected from the menu item lists classified by cooking methods. HACCP recipe includes ingredients, their amount and cooking procedure. A flow diagram is constructed based on the HACCP recipe. The HACCP recipe and a product flow diagram are printed out. 2. Implementation of HACCP study includes the identification of microbiological hazards, the determination of critical control points, the establishment of control methods of each hazard, and the complementation of data base file. Potentially hazardous ingredients are determined and microbiological hazards are identified in each phase of the product flow. Critical control points (CCPs) are identified by applying CCP decision trees for ingredients and each process stage. After hazards and CCPs are identified, criteria, monitoring system, corrective action plan, record-keeping system and verification methods are established. When the HACCP study is complemented, HACCP study result forms are printed out. HACCP data base file can be either added, corrected or deleted.

  • PDF

드론을 이용한 산림자원 정보관리를 위한 DB 설계 (Database Design for Management of Forest Resources using a Drone)

  • 오선진
    • 문화기술의 융합
    • /
    • 제5권3호
    • /
    • pp.251-256
    • /
    • 2019
  • 현대사회가 급속히 발전하면서 자연과 환경의 중요성에 대한 관심이 주요 이슈로 대두되고 있다. 특별히 최근 빠른 산업화로 극심한 환경오염과 미세먼지로 인한 사람들의 건강이 크게 위협을 받으면서 자연보호와 산림자원 관리에 대한 관심이 집중되고 있다. 하지만 잦은 화재나 풍수해 및 난개발 등으로 인해 소중한 산림자원이 제대로 관리 되지 못하고 헛되이 소실되어 지고 있는 실정이다. 이러한 문제를 효율적으로 해결하기 위해서는 산림자원의 체계적이고 과학적인 조성과 관리가 필요하며, 이를 위해 산림을 구성하는 나무 정보와 산의 지형 정보 및 생태계 정보를 아우르는 정확하고 구체적인 산림자원 정보 데이터베이스 구축이 절실히 요구된다. 본 연구는 드론 기술을 이용하여 촬영된 산림자원 이미지를 기반으로 특정 지역 위치기반 산림 자원의 생태에 대한 정보와 그 위치 지역의 지형 정보를 기반으로 효율적인 산림자원 관리와 벌목 대상이 되는 수목 의사결정 그리고 향후 조성할 산림 조림사업에 도움을 줄 수 있는 산림자원 정보 데이터베이스를 설계하고 구축하고자 한다.

기계학습 기반 유전자 발현 데이터를 이용한 치주질환 예측 (Prediction for Periodontal Disease using Gene Expression Profile Data based on Machine Learning)

  • 이제근
    • 한국정보통신학회논문지
    • /
    • 제23권8호
    • /
    • pp.903-909
    • /
    • 2019
  • 치주질환은 상당수의 성인들이 가지고 있는 질환이지만 아직 분자적인 수준에서의 발생 기작과 치료 방법에 대해서는 많은 것이 밝혀져 있지 않다. 본 연구에서는 치주질환 조직과 정상 조직에서 얻어진 유전자 발현 데이터를 이용하여 치주질환 조직과 정상 조직 사이에 분자적 차이가 있는지를 확인한다. 특히 기계학습 알고리즘을 이용하여 유전자 발현양 기반 치주질환 조직과 정상 조직의 분류가 가능한지를 확인하고, 각 조직에서 발현양 차이가 나는 유전자들이 주로 어떤 기능을 하는 것인지 살펴본다. t-SNE를 이용한 분석 결과 정상 조직과 치주질환 조직 샘플이 명확히 구분되어 군집화 될 수 있음이 확인되었다. 또한, 결정 트리, 랜덤 포레스트, 서포트 벡터 머신을 이용한 분류 알고리즘을 적용한 결과 불균형 데이터임에도 높은 정확도와 민감도, 특이도를 보였으며, 염증 반응 및 면역 반응 관련 유전자들이 주로 두 집단 간에 차이를 보임이 확인되었다.

에이다 부스트를 활용한 건설현장 추락재해의 강도 예측과 영향요인 분석 (Analysis of Occupational Injury and Feature Importance of Fall Accidents on the Construction Sites using Adaboost)

  • 최재현;류한국
    • 대한건축학회논문집:구조계
    • /
    • 제35권11호
    • /
    • pp.155-162
    • /
    • 2019
  • The construction industry is the highest safety accident causing industry as 28.55% portion of all industries' accidents in Korea. In particular, falling is the highest accidents type composed of 60.16% among the construction field accidents. Therefore, we analyzed the factors of major disaster affecting the fall accident and then derived feature importances by considering various variables. We used data collected from Korea Occupational Safety & Health Agency (KOSHA) for learning and predicting in the proposed model. We have an effort to predict the degree of occupational fall accidents by using the machine learning model, i.e., Adaboost, short for Adaptive Boosting. Adaboost is a machine learning meta-algorithm which can be used in conjunction with many other types of learning algorithms to improve performance. Decision trees were combined with AdaBoost in this model to predict and classify the degree of occupational fall accidents. HyOperpt was also used to optimize hyperparameters and to combine k-fold cross validation by hierarchy. We extracted and analyzed feature importances and affecting fall disaster by permutation technique. In this study, we verified the degree of fall accidents with predictive accuracy. The machine learning model was also confirmed to be applicable to the safety accident analysis in construction site. In the future, if the safety accident data is accumulated automatically in the network system using IoT(Internet of things) technology in real time in the construction site, it will be possible to analyze the factors and types of accidents according to the site conditions from the real time data.

빅데이터 기반 2형 당뇨 예측 알고리즘 개발 (Development of Type 2 Prediction Prediction Based on Big Data)

  • 심현;김현욱
    • 한국전자통신학회논문지
    • /
    • 제18권5호
    • /
    • pp.999-1008
    • /
    • 2023
  • 당뇨병과 같은 만성 질환의 조기 예측은 중요한 이슈이며, 그중에서도 당뇨 예측의 정확도 향상은 매우 중요하다. 당뇨 예측을 위한 다양한 기계 학습 및 딥 러닝 기반 방법론을 도입하고 있으나, 이러한 기술들은 다른 방법론보다 더 우수한 성능을 위해 대량의 데이터를 필요로 하며, 복잡한 데이터 모델 때문에 학습 비용이 높다. 본 연구에서는 pima 데이터셋과 k-fold 교차 검증을 사용한 DNN이 당뇨 진단 모델의 효율성을 감소시킨다는 주장을 검증하고자 한다. 의사 결정 트리, SVM, 랜덤 포레스트, 로지스틱 회귀, KNN 및 다양한 앙상블 기법과 같은 기계 학습 분류 방법을 사용하여 어떤 알고리즘이 최상의 예측 결과를 내는지 결정하였다. 모든 분류 모델에 대한 훈련 및 테스트 후 제안된 시스템은 ADASYN 방법과 함께 XGBoost 분류기에서 최상의 결과를 제공하였으며, 정확도는 81%, F1 계수는 0.81, AUC는 0.84였다. 또한 도메인 적응 방법이 제안된 시스템의 다양성을 보여주기 위해 구현되었다. LIME 및 SHAP 프레임워크를 사용한 설명 가능한 AI 접근 방식이 모델이 최종 결과를 어떻게 예측하는지 이해하기 위해 구현되었다.

Inhalation Configuration Detection for COVID-19 Patient Secluded Observing using Wearable IoTs Platform

  • Sulaiman Sulmi Almutairi;Rehmat Ullah;Qazi Zia Ullah;Habib Shah
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제18권6호
    • /
    • pp.1478-1499
    • /
    • 2024
  • Coronavirus disease (COVID-19) is an infectious disease caused by the severe acute respiratory syndrome coronavirus 2 (SARS-CoV-2) virus. COVID-19 become an active epidemic disease due to its spread around the globe. The main causes of the spread are through interaction and transmission of the droplets through coughing and sneezing. The spread can be minimized by isolating the susceptible patients. However, it necessitates remote monitoring to check the breathing issues of the patient remotely to minimize the interactions for spread minimization. Thus, in this article, we offer a wearable-IoTs-centered framework for remote monitoring and recognition of the breathing pattern and abnormal breath detection for timely providing the proper oxygen level required. We propose wearable sensors accelerometer and gyroscope-based breathing time-series data acquisition, temporal features extraction, and machine learning algorithms for pattern detection and abnormality identification. The sensors provide the data through Bluetooth and receive it at the server for further processing and recognition. We collect the six breathing patterns from the twenty subjects and each pattern is recorded for about five minutes. We match prediction accuracies of all machine learning models under study (i.e. Random forest, Gradient boosting tree, Decision tree, and K-nearest neighbor. Our results show that normal breathing and Bradypnea are the most correctly recognized breathing patterns. However, in some cases, algorithm recognizes kussmaul well also. Collectively, the classification outcomes of Random Forest and Gradient Boost Trees are better than the other two algorithms.

개인정보보호법에 따른 가명처리로 인한 데이터 손실이 데이터 분석의 정확도에 미치는 영향 (Pseudonymization's effect on data quality: A study under personal information protection act)

  • 김민정;유재근
    • 응용통계연구
    • /
    • 제37권3호
    • /
    • pp.381-393
    • /
    • 2024
  • 이 연구는 개인정보의 가명처리와 이것이 데이터 분석의 정확도에 미치는 영향을 조사하였다. 로지스틱 회귀 모델, 의사결정나무 및 랜덤 포레스트를 사용하여 가명처리의 적용 정도와 가명처리된 데이터 분석의 정확도 간의 관계를 정량적으로 평가하였으며, 이를 통해 민감한 정보의 가명처리가 데이터 분석의 정확도를 크게 손상시키지 않으면서도 개인정보보호를 실현할 수 있음을 확인하였다. 그러나, 단일한 샘플 데이터, 일관된 가명처리 비율의 적용 등의 한계가 있음을 인지하였다. 이러한 한계를 극복하기 위해, 다양한 데이터에 대한 추가적인 연구를 통하여 결과의 일반성을 강화하는 것이 필요하다. 또한, 개별 변수에 대해 최적의 가명처리 비율을 찾는 방법론을 개발하고 적용해 볼 것을 제안한다. 이 연구 결과는 규제 준수와 개인정보 보호를 달성하면서도 데이터의 활용성을 유지하는 방법에 대한 새로운 통찰을 제공한다.

빅데이터 및 인공지능을 활용한 축구선수 연봉등급 예측 (Predicting Soccer Players' Wage Grades Using Big Data and Artificial Intelligence)

  • 정현성;김진화;현대원
    • 산업융합연구
    • /
    • 제22권8호
    • /
    • pp.19-28
    • /
    • 2024
  • 본 연구는 빅데이터와 인공지능을 활용하여 축구선수의 연봉등급을 예측하는 새로운 방법을 제안한다. 축구선수의 연봉 예측은 선수의 성과와 잠재력을 정확하게 평가하고, 이를 연봉에 반영함으로써 축구 산업의 경제적 효율성을 높이는 중요한 과제이다. 본 연구는 FIFA 22에서 제공하는 선수 능력치 데이터를 분석하여, 다양한 빅데이터 및 인공지능 기법을 통해 선수의 연봉등급을 예측한다. 주요 연구 방법으로는 의사결정나무, 인공신경망, 랜덤 포레스트, 부스팅 등을 활용하였으며, 이를 통해 연봉등급을 예측하는 모델의 정확도를 비교 분석하였다. 연구 결과, 랜덤 포레스트와 부스팅 기법이 가장 높은 예측 정확도를 보였다. 이 연구는 빅데이터와 인공지능을 이용해 축구선수의 연봉등급을 예측하고, 축구 산업에 새로운 관점을 제공한다.

울진 소광리 금강소나무 고사발생 특성 분석 및 위험지역 평가 (Risk Assessment of Pine Tree Dieback in Sogwang-Ri, Uljin)

  • 김은숙;이보라;김재범;조낭현;임종환
    • 한국산림과학회지
    • /
    • 제109권3호
    • /
    • pp.259-270
    • /
    • 2020
  • 최근 20년 동안 고온, 건조 등 이상기상 현상이 빈발해지면서 병해충으로 인한 피해가 아닌 생리적 스트레스로 인한 소나무 피해 사례가 지속적으로 보고되고 있다. 2014년도에는 울진 소광리 산림유전자원보호구역 내에 금강소나무(Pinus densiflora for. erecta Uyeki)의 집단고사가 발견되어 이에 대한 원인 구명과 산림관리방안 마련이 요구되었다. 이에 본 연구는 2008~2015년 항공사진에서 발견된 울진 소광리 금강소나무 고사 피해 발생 지역의 지형 및 임분 특성을 파악하여 고사 발생의 영향 요인을 도출하고 이를 기반으로 전체 지역의 고사피해 발생 위험지역을 예측하는 것을 목표로 하였다. 소나무 고사발생 지점 정보와 해발고도, 경사 등의 지형정보, 영급, 경급 등의 임분 정보 등 총 14개의 설명변수를 이용하여 고사발생 예측모델을 구축하였다. 모형 개발에는 Decision Tree, Random Forest (RF), Support Vector Machine (SVM) 등 기계학습 기법을 적용하였으며, RF와 SVM가 정확도 93% 이상으로 좋은 성능을 보였다. 소나무 고사와 관련된 주요 변수 분석 결과, 소나무 고사의 지형적인 취약지역은 해발고도가 높은 동시에 일사량이 높으며 수분 조건이 불리한 지역이었으며, 임분 특성 중에서는 특히 5~15m 높이의 수직적 임분밀도가 높은 소나무림, 그리고 영급이 높은 소나무림에서 고사 위험성이 높다고 평가되었다. RF와 SVM 모형 예측에 따라, 소나무 고사위험도가 높은 지역의 면적은 연구대상지 전체 소나무림 면적의 약 9.5%, 115ha로 평가되었다. 본 연구의 고사위험도 평가 결과는 금강소나무 취약지역의 현황을 조사하고 아직 피해가 발생하지 않은 취약지역에 대한 적극적인 기후변화 적응 산림관리를 수행하기 위한 기반자료로 활용될 수 있다.