• 제목/요약/키워드: Classification and regression tree

검색결과 211건 처리시간 0.024초

Prevalence and risk factors of helminth infections in cattle of Bangladesh

  • Rahman, A.K.M.A.;Begum, N.;Nooruddin, M.;Rahman, Md. Siddiqur;Hossain, M.A.;Song, Hee-Jong
    • 한국동물위생학회지
    • /
    • 제32권3호
    • /
    • pp.265-273
    • /
    • 2009
  • A cross-sectional survey was undertaken to identify risk factors and clinical signs associated with parasitic helminth infections of cattle in Mymensignh district of Bangladesh. A nonrandom convenience sampling method was used to select 138 animals from 40 farmers/herds. The eggs per gram of faeces (epg) for nematodes and trematodes were determined by McMaster and Stoll's methods respectively. Animal-level and herd-level data were recorded by means of a questionnaire. Multi-collinearity amongst explanatory variables were assessed using $2{\times}2{\times}\;X^2$ test and one variable in a pair was dropped if $P{\leq}0.05$ formultiple logistic regression models. Association study between outcome and explanatory variables was conducted using classification tree, random forests and multiple logistic regression. A positive epg was considered as infected. Analyses were performed using $STATA^{(R)}$, version 8.0/Intercooled and $R^{(R)}$, Version 2.3.0. Seventy eight percent of the cattle were found to be infected with at least one type of helminth. Twenty four pairs of combinations of explanatory variables showed significant associations. Male animals (OR=3.3, P=.006, 95% CI=1.4, 7.7) were associated with significantly increased prevalence of nematode infection. Female cattle of the study area are mostly cross-breed, kept indoor, fed relatively good diet and not used for draught purpose. Males are used for draught purpose thereby more exposed to nematode infective stage and provided with relatively poor diet. So stressed male cattle may become more susceptible to nematode infection. All of the three statistical techniques selected gender and lumen motility as most important variables in association with nematode infection in cattle. The result of this survey can only be extrapolated to the periurban cattle population of traditional management system.

청소년 대상의 건강상태, 생활습관과 아토피 피부염의 관계 (Relationship between Health Status and Life Styles and Atopic Dermatitis in Adolescents)

  • 소은선;여지영
    • Child Health Nursing Research
    • /
    • 제18권3호
    • /
    • pp.143-149
    • /
    • 2012
  • Purpose: The aim was to explore the relationship between health status/life style and prevalence of atopic dermatitis in adolescents. Methods: Data from 1,743 adolescents (aged 13 to 18 years) derived from the fourth Korea National Health and Nutrition Examination Survey (KNHANES) were analyzed using binary logistic regression and the classification and regression tree (CART) model. Results: The prevalence rate of atopic dermatitis was 10.3%. Third quartile income class (OR=2.19, 95% CI=1.20-4.00), fair and unhealthy self-rated health (OR=1.49, 95% CI=1.06-2.11; OR= 2.73, 95% CI=1.64-4.55), past or current smoker (OR=0.41, 95% CI=0.20-0.85; OR=0.44, 95% CI=0.21-0.92), and more than average stress (OR=1.43, 95% CI=1.03-1.99) were related with increased prevalence of atopic dermatitis. The high prevalence risk groups for atopic dermatitis were adolescents who perceived themselves to be healthy on self-rated health and had more than average stress and those who perceived themselves to be unhealthy and who never smoked. Conclusion: The results of the study indicate that health status, smoking, and stress are associated with a prevalence risk for adolescent atopic dermatitis in different degrees. Therefore, for control of atopic dermatitis, various interventions for smoking and stress need to be reinforced for the high prevalence atopic dermatitis groups.

머신러닝을 활용한 대학생 중도탈락 위험군의 예측모델 비교 연구 : N대학 사례를 중심으로 (A Comparative Study of Prediction Models for College Student Dropout Risk Using Machine Learning: Focusing on the case of N university)

  • 김소현;조성현
    • 대한통합의학회지
    • /
    • 제12권2호
    • /
    • pp.155-166
    • /
    • 2024
  • Purpose : This study aims to identify key factors for predicting dropout risk at the university level and to provide a foundation for policy development aimed at dropout prevention. This study explores the optimal machine learning algorithm by comparing the performance of various algorithms using data on college students' dropout risks. Methods : We collected data on factors influencing dropout risk and propensity were collected from N University. The collected data were applied to several machine learning algorithms, including random forest, decision tree, artificial neural network, logistic regression, support vector machine (SVM), k-nearest neighbor (k-NN) classification, and Naive Bayes. The performance of these models was compared and evaluated, with a focus on predictive validity and the identification of significant dropout factors through the information gain index of machine learning. Results : The binary logistic regression analysis showed that the year of the program, department, grades, and year of entry had a statistically significant effect on the dropout risk. The performance of each machine learning algorithm showed that random forest performed the best. The results showed that the relative importance of the predictor variables was highest for department, age, grade, and residence, in the order of whether or not they matched the school location. Conclusion : Machine learning-based prediction of dropout risk focuses on the early identification of students at risk. The types and causes of dropout crises vary significantly among students. It is important to identify the types and causes of dropout crises so that appropriate actions and support can be taken to remove risk factors and increase protective factors. The relative importance of the factors affecting dropout risk found in this study will help guide educational prescriptions for preventing college student dropout.

PC용 Text-to-Speech 시스템 개발 (Development of Text-to-Speech System for PC)

  • 최무열;황철규;김순태;김정곤;이서배;장석복;표경란;안혜선;김형순
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 2호
    • /
    • pp.41-44
    • /
    • 1999
  • 본 논문에서는 PC 응용을 위한 고음질의 한국어 text-to-speech(TTS) 합성 시스템을 개발하였다. 개발된 시스템의 합성방식으로는 음의 고저 조절, 인접음 사이의 연결 처리 및 음색제어 등에서 기존의 PSOLA 방식에 비해 장점을 가지는 정현파 모델 기반의 방식을 채택하였고, 자연스러운 운율 모델링을 위하여 통계적 기법중의 하나인 Classification and regression tree(CART) 방법을 사용하였다. 또한 음소 경계의 불연속성 문제를 줄이기 위한 합성단위로 초성-중성 및 종성 단위를 사용하였고, 다양한 음색표현이 가능하도록 음색제어 기능을 갖추었다. 그리고, 표준 Speech Application Program Interface(SAPI)를 준용한 TTS engine 형태로 구현함으로써 PC 상에서의 응용 프로그램 개발 편의성을 높였다. 합성음의 청취평가 결과 음질의 우수성 및 음색제어 기능의 유효성을 확인할 수 있었다.

  • PDF

당뇨 환자의 관리행태에 대한 군집 분류 (Group Classification on Management Behavior of Diabetic Mellitus)

  • 강성홍;최순호
    • 한국산학기술학회논문지
    • /
    • 제12권2호
    • /
    • pp.765-774
    • /
    • 2011
  • 본 연구는 효율적인 당뇨관리사업을 할 수 있는 기초자료를 제공하기 위해 수행되었다. 연구를 위해 2007년, 2008년도 국민건강영양조사를 통해 검진에 참여한 당뇨인지환자 666명의 자료를 수집하여 분석하였다. 당뇨인지 환자의 관리행태에 대한 군집분류는 K-means 기법을 이용하였고 관리행태에 대한 요인분석은 의사결정나무와 다중로지스틱 회귀분석을 이용하였다. 당뇨인지환자의 군집은 크게 3개로 분류되었다. 건강행태사업 대상군은 당뇨 치료와 합병증 검사는 잘 받고 있으나 음주, 흡연, 운동실천 등 건강행태 개선이 보다 적극적으로 이루어져야 하는 집단이다, 중점관리사업 대상군은 치료를 제대로 받지 않고, 합병증검사도 하지 않으며 혈당관리를 위한 건강행태 개선도 적극적으로 하지 않는 집단이다, 합병증검사사업 대상군은 치료를 잘 받고 있으며 건강행태도 개선하고 있지만 급만성 합병증을 조기 발견하기 위한 합병증검사를 소흘히 하는 집단이다. 군집을 분류하는데 가장 중요한 요인은 고지혈증 유무로 나타났으며 그 외 성, 소득, 연령, 직업, 주관적 건강상태도 주요한 변수였다. 당뇨 조절율을 향상시키기 위해서는 각 군집의 특성에 따라 보다 특화된 당뇨관리 프로그램이 적용되어야 할 것이다.

전술제대 공격작전간 전투원 생존성에 관한 연구 (Analysis of Survivability for Combatants during Offensive Operations at the Tactical Level)

  • 김재오;조형준;김각규
    • 응용통계연구
    • /
    • 제28권5호
    • /
    • pp.921-932
    • /
    • 2015
  • 본 연구에서는 증강된 보병대대의 과학화 전투훈련 데이터 중 공격작전에 관한 장병들의 생존분석을 실시하였다. 과학화 전투훈련은 KCTC(Korea Combat Training Center)로 불리는 전투훈련장에서 MILES(Multiple Integrated Lazer Engagement System)와 중앙통제장비체계 등 과학화된 훈련장비와 체계 운용하 훈련부대가 적 전술 및 무기체계를 사용하는 전문 대항군과 실시하는 쌍방 자유기동훈련이다. 이는 훈련기간 동안 훈련지역의 모든 데이터가 저장되어 훈련통제 뿐 아니라 분석 및 사후검토를 할 수 있는 첨단화된 군사 훈련으로 통계적 분석이 가능한 데이터를 제공한다. 분석방법은 모수적 분포 가정이 필요하지 않은 Cox의 비례위험모형을 적용하였으며, 보다 풍부하고 용이한 해석을 위해 의사결정나무모형(CART(Classification and Regression Trees), GUIDE(Generalized, Unbiased, Interaction Detection and Estimation), CTREE(Conditional Inference Trees))을 활용하였다. Cox 비례위험모형의 비례성 가정을 확인하여 이를 위배하는 변수에 대해서 층화하여 분석하고, Cox 비례위험모형 결과 복무기간에 관한 해석이 용이하지 않아 단변량으로 local 회귀분석을 통해 추가적인 해석을 시도하였다. CART, GUIDE, CTREE는 모형의 특성별로 나무모형을 형성하며 이를 통하여 다양한 해석이 가능하다.

머신러닝 기반 금속외관 결함 검출 비교 분석 (Comparative analysis of Machine-Learning Based Models for Metal Surface Defect Detection)

  • 이세훈;강성환;신요섭;최오규;김시종;강재모
    • 한국정보통신학회논문지
    • /
    • 제26권6호
    • /
    • pp.834-841
    • /
    • 2022
  • 최근 스마트팩토리와 인공지능 기술의 수요 증가로 인해 다양한 분야에서 인공지능 기술을 적용하는 연구가 진행되고 있다. 결함 검사 분야에서도 인공지능 알고리즘을 도입하기 위한 노력을 기울이고 있다. 특히, 금속 외관의 결함을 검출하는 연구는 다른 소재(목재, 플라스틱, 섬유 등)의 결함을 검출하는 연구에 비해 많은 연구가 이루어지고 있다. 본 논문에서는 머신러닝 기법(서포터 벡터 머신(SVM: Support Vector Machine), 소프트맥스 회귀(Softmax Regression), 결정 트리(Decesion Tree))과 차원 축소 알고리즘(주성분 분석(PCA: Principal Component Analysis), 오토인코더(AutoEncoder))의 9가지 조합과 2가지 합성곱신경망(CNN: Convolutional Neural Network) 기법(자체 알고리즘, ResNet)의 금속 외관의 결함 분류 성능 및 속도를 비교하고 분석하는 연구를 수행하고자 한다. 두 종류의 학습 데이터셋((i) 공용 데이터셋(Public Dataset), (ii) 실측 데이터셋(Actual Dataset))에 대한 실험을 통해 각 데이터셋에 대한 성능 및 속도를 비교 분석하고, 가장 효율적인 알고리즘을 찾아낸다.

합성곱 신경망을 이용한 주가방향 예측: 상관관계 속성선택 방법을 중심으로 (Stock Price Direction Prediction Using Convolutional Neural Network: Emphasis on Correlation Feature Selection)

  • 어균선;이건창
    • 경영정보학연구
    • /
    • 제22권4호
    • /
    • pp.21-39
    • /
    • 2020
  • 딥러닝(Deep learning) 기법은 패턴분석, 이미지분류 등 다양한 분야에서 높은 성과를 나타내고 있다. 특히, 주식시장 분석문제는 머신러닝 연구분야에서도 어려운 분야이므로 딥러닝이 많이 활용되는 영역이다. 본 연구에서는 패턴분석과 분류능력이 높은 딥러닝의 일종인 합성곱신경망(Convolutional Neural Network) 모델을 활용하여 주가방향 예측방법을 제안한다. 추가적으로 합성곱신경망 모델을 효율적으로 학습시키기 위한 속성선택(Feature Selection, FS)방법이 적용된다. 합성곱신경망 모델의 성과는 머신러닝 단일 분류기와 앙상블 분류기를 벤치마킹하여 객관적으로 검증된다. 본 연구에서 벤치마킹한 분류기는 로지스틱 회귀분석(Logistic Regression), 의사결정나무(Decision Tree), 인공신경망(Neural Network), 서포트 벡터머신(Support Vector Machine), 아다부스트(Adaboost), 배깅(Bagging), 랜덤포레스트(Random Forest)이다. 실증분석 결과, 속성선택을 적용한 합성곱신경망이 다른 벤치마킹 분류기보다 분류 성능이 상대적으로 높게 나타났다. 이러한 결과는 합성곱신경망 모델과 속성선택방법을 적용한 예측방법이 기업의 재무자료에 내포된 가치를 보다 정교하게 분석할 수 있는 가능성이 있음을 실증적으로 확인할 수 있었다.

S-MTS를 이용한 강판의 표면 결함 진단 (Steel Plate Faults Diagnosis with S-MTS)

  • 김준영;차재민;신중욱;염충섭
    • 지능정보연구
    • /
    • 제23권1호
    • /
    • pp.47-67
    • /
    • 2017
  • 강판 표면 결함은 강판의 품질과 가격을 결정하는 중요한 요인 중 하나로, 많은 철강 업체는 그동안 검사자의 육안으로 강판 표면 결함을 확인해왔다. 그러나 시각에 의존한 검사는 통상 30% 이상의 판단 오류가 발생함에 따라 검사 신뢰도가 낮은 문제점을 갖고 있다. 따라서 본 연구는 Simultaneous MTS (S-MTS) 알고리즘을 적용하여 보다 지능적이고 높은 정확도를 갖는 새로운 강판 표면 결함 진단 시스템을 제안하였다. S-MTS 알고리즘은 단일 클래스 분류에는 효과적이지만 다중 클래스 분류에서 정확도가 떨어지는 기존 마할라노비스 다구찌시스템 알고리즘(Mahalanobis Taguchi System; MTS)의 문제점을 해결한 새로운 알고리즘이다. 강판 표면 결함 진단은 대표적인 다중 클래스 분류 문제에 해당하므로, 강판 표면 결함 진단 시스템 구축을 위해 본 연구에서는 S-MTS 알고리즘을 채택하였다. 강판 표면 결함 진단 시스템 개발은 S-MTS 알고리즘에 따라 다음과 같이 진행하였다. 첫째, 각 강판 표면 결함 별로 개별적인 참조 그룹 마할라노비스 공간(Mahalanobis Space; MS)을 구축하였다. 둘째, 구축된 참조 그룹 MS를 기반으로 비교 그룹 마할라노비스 거리(Mahalanobis Distance; MD)를 계산한 후 최소 MD를 갖는 강판 표면 결함을 비교 그룹의 강판 표면 결함으로 판단하였다. 셋째, 강판 표면 결함을 분류하는 데 있어 결함 간의 차이점을 명확하게 해주는 예측 능력이 높은 변수를 파악하였다. 넷째, 예측 능력이 높은 변수만을 이용해 강판 표면 결함 분류를 재수행함으로써 최종적인 강판 표면 결함 진단 시스템을 구축한다. 이와 같은 과정을 통해 구축한 S-MTS 기반 강판 표면 결함 진단 시스템의 정확도는 90.79%로, 이는 기존 검사 방법에 비해 매우 높은 정확도를 갖는 유용한 방법임을 보여준다. 추후 연구에서는 본 연구를 통해 개발된 시스템을 현장 적용하여, 실제 효과성을 검증할 필요가 있다.

중소기업 프로파일링 분석을 통한 기술유출 방지 및 보호 모형 연구 (A Study on Empirical Model for the Prevention and Protection of Technology Leakage through SME Profiling Analysis)

  • 유인진;박도형
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제27권1호
    • /
    • pp.171-191
    • /
    • 2018
  • Purpose Corporate technology leakage is not only monetary loss, but also has a negative impact on the corporate image and further deteriorates sustainable growth. In particular, since SMEs are highly dependent on core technologies compared to large corporations, loss of technology leakage threatens corporate survival. Therefore, it is important for SMEs to "prevent and protect technology leakage". With the recent development of data analysis technology and the opening of public data, it has become possible to discover and proactively detect companies with a high probability of technology leakage based on actual company data. In this study, we try to construct profiles of enterprises with and without technology leakage experience through profiling analysis using data mining techniques. Furthermore, based on this, we propose a classification model that distinguishes companies that are likely to leak technology. Design/methodology/approach This study tries to develop the empirical model for prevention and protection of technology leakage through profiling method which analyzes each SME from the viewpoint of individual. Based on the previous research, we tried to classify many characteristics of SMEs into six categories and to identify the factors influencing the technology leakage of SMEs from the enterprise point of view. Specifically, we divided the 29 SME characteristics into the following six categories: 'firm characteristics', 'organizational characteristics', 'technical characteristics', 'relational characteristics', 'financial characteristics', and 'enterprise core competencies'. Each characteristic was extracted from the questionnaire data of 'Survey of Small and Medium Enterprises Technology' carried out annually by the Government of the Republic of Korea. Since the number of SMEs with experience of technology leakage in questionnaire data was significantly smaller than the other, we made a 1: 1 correspondence with each sample through mixed sampling. We conducted profiling of companies with and without technology leakage experience using decision-tree technique for research data, and derived meaningful variables that can distinguish the two. Then, empirical model for prevention and protection of technology leakage was developed through discriminant analysis and logistic regression analysis. Findings Profiling analysis shows that technology novelty, enterprise technology group, number of intellectual property registrations, product life cycle, technology development infrastructure level(absence of dedicated organization), enterprise core competency(design) and enterprise core competency(process design) help us find SME's technology leakage. We developed the two empirical model for prevention and protection of technology leakage in SMEs using discriminant analysis and logistic regression analysis, and each hit ratio is 65%(discriminant analysis) and 67%(logistic regression analysis).