• 제목/요약/키워드: Decision Tree analysis

검색결과 729건 처리시간 0.025초

연결강도분석접근법에 의한 부도예측용 인공신경망 모형의 입력노드 선정에 관한 연구 (Selection of Input Nodes in Artificial Neural Network for Bankruptcy Prediction by Link Weight Analysis Approach)

  • 이응규;손동우
    • 지능정보연구
    • /
    • 제7권2호
    • /
    • pp.19-33
    • /
    • 2001
  • 본 연구에서는 부도예측용 인공신경망의 입력노드 선정을 위한 휴리스틱으로 연결강도분석접근법을 제안한다. 연결강도분석은 학습이 끝난 인공신경망에서 입력노드와 은닉노드를 연결하는 연결가중치의 절대값 즉, 연결강도를 분석하여 입력변수를 선정하는 접근법으로, 선정기준에 따라 약체연결뉴론제거법과 강체연결뉴론선택법을 들 수 있다. 본 연구에서는 약체연결뉴론제거법, 강체연결뉴론선택법 그리고 이 두 기법을 통합한 통합 연결강도 모형을 제안하여 각각 의사결정트리 및 다변량판별분석에 의해 선정된 입력변수를 이용한 인공신경망 모형과 예측율을 비교한다. 실험 결과 본 연구에서 제안하고 있는 방법론이 의사결정트리나 다변량판별분석 기법보다 높은 예측율을 보여주었다. 특히 두 기법의 통합연결강도 모형의 경우에는 다른 단일 기법보다 높은 예측율을 보이고 있다.

  • PDF

모발분석 결과를 이용한 대사형의 분류 (The Classification of Metabolic Type Using Tissue Mineral Analysis)

  • 한근식
    • 응용통계연구
    • /
    • 제17권2호
    • /
    • pp.197-204
    • /
    • 2004
  • 모발분석(TMA: Tissue Mineral Analysis)은 머리카락 속에 있는 30여 가지의 미네랄과 8가지의 중금속의 양과 중요 미네랄 비율을 분석하여 체내에 과잉, 결핍 및 불균형 상태를 평가할 뿐만 아니라 체내에서 미네랄들의 상호연관 관계를 평가하여 건강을 유지하는 방향을 제시하는 모발조직 경사방법을 말한다. 현재 세계 46개국 의료기관에서 임상을 위해 널리 사용중이나 국내에는 아직 인지도가 낮아 널리 활용되지 못하고 있으나 점차로 국내 대학병원을 중심으로 필요성을 인식하고 있다. 본 연구에서는 한국티이아이로 부터 제공받은 1,000명의 사례자료를 이용하여 8가지 대사형 (Metabolic Type)을 결정 트리분류기로 분류하였다.

성인 인터넷 중독진단 개선을 위한 요인분석 (Factor Analysis for Improving Adults' Internet Addiction Diagnosis)

  • 김종완;김희재
    • 한국지능시스템학회논문지
    • /
    • 제21권3호
    • /
    • pp.317-322
    • /
    • 2011
  • 한국정보화진흥원에서 개발한 한국형 성인 인터넷 중독 자가진단 척도인 K-척도는 4가지 요인의 20 문항으로 구성되어 있으며, 사용자의 설문응답값으로 인터넷 중독을 진단한다. 기존의 연구는 대부분 인터넷 중독의 원인을 찾으려는 시도였으며, 청소년 대상으로 수집된 표본을 가지고 그들의 인터넷 중독진단이 수행되었다. 본 연구의 목적은 통계 기법의 주성분분석과 데이터마이닝 기법인 의사결정트리를 이용하여 K-척도의 사용자군 분류를 판정하는 주요인을 발견하는 것이다. 실험 결과로부터 K-척도를 구성하는 4가지 요인 중 내성 및 몰입 요인이 성인 인터넷 중독진단에 가장 큰 영향을 주는 요인임을 알 수 있었다.

의사결정나무 분석기법을 이용한 뇌졸중 지식 취약군 규명 (Identification of Subgroups with Lower Level of Stroke Knowledge Using Decision-tree Analysis)

  • 김현경;정석희;강현철
    • 대한간호학회지
    • /
    • 제44권1호
    • /
    • pp.97-107
    • /
    • 2014
  • Purpose: This study was performed to explore levels of stroke knowledge and identify subgroups with lower levels of stroke knowledge among adults in Korea. Methods: A cross-sectional survey was used and data were collected in 2012. A national sample of 990 Koreans aged 20 to 74 years participated in this study. Knowledge of risk factors, warning signs, and first action for stroke were surveyed using face-to-face interviews. Descriptive statistics and decision tree analysis were performed using SPSS WIN 20.0 and Answer Tree 3.1. Results: Mean score for stroke risk factor knowledge was 7.7 out of 10. The least recognized risk factor was diabetes and four subgroups with lower levels of knowledge were identified. Score for knowledge of stroke warning signs was 3.6 out of 6. The least recognized warning sign was sudden severe headache and six subgroups with lower levels of knowledge were identified. The first action for stroke was recognized by 65.7 percent of participants and four subgroups with lower levels of knowledge were identified. Conclusion: Multi-faceted education should be designed to improve stroke knowledge among Korean adults, particularly focusing on subgroups with lower levels of knowledge and less recognition of items in this study.

러프집합을 활용한 캔들스틱 트레이딩 최적화 전략 (Using rough set to develop the optimization strategy of evolving time-division trading in the futures market)

  • 김현호;오경주
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권5호
    • /
    • pp.881-893
    • /
    • 2012
  • 본 논문에서는 선물시장에서 러프집합과 의사결정나무를 이용한 매매규칙 기반의 시스템 트레이딩 전략을 제안한다. 과거 데이터마이닝 방법론을 이용한 선물시장 투자전략에 대한 많은 연구가 진행되어 왔으나 상대적으로 다양한 변수의 조합을 통한 시스템 트레이딩에 대한 연구는 거의 없었다. 본 연구는 크게 세 가지 목적을 가지고 있다. 첫 번째 목적은 매매규칙 기반 시스템 트레이딩에서 의사결정나무 방법론의 사용이 투자성과에 어떠한 영향을 미치는가를 분석하는 것이다. 두 번째 목적은 단기매매부터 장기 매매까지 중에서 적절한 매매 시간간격을 찾아내는 것이다. 세번째 목적은 매매규칙 생성 시 사용되는 최적의 트레이닝 구간을 찾는 것이다. 이 논문의 실험결과는 제안한 투자전략의 유용성을 증명할 수 있을 것이며, 또한 이를 통해 시장참여자들에게 투자결정에 있어 도움을 줄 수 있을 것이다.

지역사회획득 폐렴 환자의 퇴원시 사망 요인 분석 (A study on analysis of factors on in-hospital mortality for community-acquired pneumonia)

  • 김유미
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권3호
    • /
    • pp.389-400
    • /
    • 2011
  • 본 연구의 목적은 행정자료를 이용하여 지역사회획득 폐렴 환자의 사망 요인을 분석하기 위해 수행되었다. 2004~2006년 퇴원손상환자 조사자료 중 지역사회획득 폐렴환자 5,353건을 연구대상으로 하였으며, 사망률의 차이분석은 카이제곱 검정을 실시하였고, 사망 요인을 분석하기 위해 데이터마이닝 기법 중 의사결정나무 모형을 이용하였다. 의사결정나무 모형 중 C4.5가 성능이 우수하였는데, 입원경로, 호흡부전, 울혈성심부전을 포함하여 연령, 동반질환, 병상규모 등이 폐렴 사망의 위험 요인으로 나타났다. 본 연구는 행정데이터를 이용하여 지역사회획득 폐렴환자의 사망 위험요인을 밝히고자 하였다. 그러나 향후 병원특성, 지역특성, 의료행태 등에 대한 보다 포괄적인 변수를 포함한 후속 연구가 필요할 것으로 생각된다.

개선된 휴리스틱 규칙 및 의사 결정 트리 분석을 이용한 P2P 트래픽 분류 기법 (P2P Traffic Classification using Advanced Heuristic Rules and Analysis of Decision Tree Algorithms)

  • 예우지엔;조경산
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권3호
    • /
    • pp.45-54
    • /
    • 2014
  • 본 논문에서는 기존 기법들의 제한점을 개선하기 위해 휴리스틱 규칙 및 기계학습 분석 결과를 이용한 두 단계의 P2P 트래픽 분류 기법을 제안한다. 첫 번째 단계는 패킷 레벨의 시그니처 기반 분류기이고, 두 번째 단계는 플로우 레벨에서 수행되는 패턴 휴리스틱 규칙 및 통계 기반 분류기이다. 제안된 패턴 휴리스틱 규칙은 분류의 정확도를 높이고 통계 기반 분류기가 처리할 트래픽의 양을 줄일 수 있다. 다양한 의사 결정 트리 알고리즘의 분석을 기반으로 통계 기반 분류기는 가장 효율적인 REPTree로 구현하고, 앙상블 알고리즘을 통해 통계 기반 분류기의 성능을 개선한다. 실제 환경의 데이터 집합을 이용한 검증 분석을 통해, 본 제안 기법이 기존 기법에 비해 높은 정확도와 낮은 과부하를 제공함을 제시한다.

데이터마이닝 기법을 활용한 맞춤형 고혈압 사후관리 모형 개발 (A Development of a Tailored Follow up Management Model Using the Data Mining Technique on Hypertension)

  • 박일수;용왕식;김유미;강성홍;한준태
    • 응용통계연구
    • /
    • 제21권4호
    • /
    • pp.639-647
    • /
    • 2008
  • 본 연구는 국민건강보험공단의 건강검진데이터, 자격 및 보험료 그리고 진료비 데이터를 활용하여 고혈압 관리를 위한 맞춤형 고혈압 사후관리모형(고혈압 진료예측모형 및 고혈압 진료순응도세분화모형)을 개발하고자 하였다. 모형 개발에는 데이터마이닝의 로지스틱 회귀모형, 의사결정나무 그리고 앙상블 모형을 활용하였다. 고혈압 진료예측모형에서는 3가지 모형 중 로지스틱 회귀모형이 가장 우수한 모형으로 채택되었으며, 고혈압 진료순응도세분화모형은 의사결정나무모형을 통해 개발되었다. 본 연구는 전국 규모의 수년간 축적된 자료를 데이터마이닝을 활용함으로써 고혈압의 진료 및 진료순응도에 이르는 고혈압 사후관리 프로세스 전반에 걸친 결과를 도출함으로써 우리나라 고혈압 사후관리체계 구축에 기여할 것으로 사료된다.

손실 비용을 고려한 공정 파라미터 허용차 산출 : 망대 특성치의 경우 (Tolerance Computation for Process Parameter Considering Loss Cost : In Case of the Larger is better Characteristics)

  • 김용준;김근식;박형근
    • 산업경영시스템학회지
    • /
    • 제40권2호
    • /
    • pp.129-136
    • /
    • 2017
  • Among the information technology and automation that have rapidly developed in the manufacturing industries recently, tens of thousands of quality variables are estimated and categorized in database every day. The former existing statistical methods, or variable selection and interpretation by experts, place limits on proper judgment. Accordingly, various data mining methods, including decision tree analysis, have been developed in recent years. Cart and C5.0 are representative algorithms for decision tree analysis, but these algorithms have limits in defining the tolerance of continuous explanatory variables. Also, target variables are restricted by the information that indicates only the quality of the products like the rate of defective products. Therefore it is essential to develop an algorithm that improves upon Cart and C5.0 and allows access to new quality information such as loss cost. In this study, a new algorithm was developed not only to find the major variables which minimize the target variable, loss cost, but also to overcome the limits of Cart and C5.0. The new algorithm is one that defines tolerance of variables systematically by adopting 3 categories of the continuous explanatory variables. The characteristics of larger-the-better was presumed in the environment of programming R to compare the performance among the new algorithm and existing ones, and 10 simulations were performed with 1,000 data sets for each variable. The performance of the new algorithm was verified through a mean test of loss cost. As a result of the verification show, the new algorithm found that the tolerance of continuous explanatory variables lowered loss cost more than existing ones in the larger is better characteristics. In a conclusion, the new algorithm could be used to find the tolerance of continuous explanatory variables to minimize the loss in the process taking into account the loss cost of the products.

Exploration of Optimal Product Innovation Strategy Using Decision Tree Analysis: A Data-mining Approach

  • Cho, Insu
    • STI Policy Review
    • /
    • 제8권2호
    • /
    • pp.75-93
    • /
    • 2017
  • Recently, global competition in the manufacturing sector is driving firms in the manufacturing sector to conduct product innovation projects to maintain their competitive edge. The key points of product innovation projects are 1) what the purpose of the project is and 2) what expected results in the target market can be achieved by implementing the innovation. Therefore, this study focuses on the performance of innovation projects with a business viewpoint. In this respect, this study proposes the "achievement rate" of product innovation projects as a measurement of project performance. Then, this study finds the best strategies from various innovation activities to optimize the achievement rate of product innovation projects. There are three major innovation activities for the projects, including three types of R&D activities: Internal, joint and external R&D, and five types of non-R&D activities - acquisition of machines, equipment and software, purchasing external knowledge, job education and training, market research and design. This study applies decision tree modeling, a kind of data-mining methodology, to explore effective innovation activities. This study employs the data from the 'Korean Innovation Survey (KIS) 2014: Manufacturing Sector.' The KIS 2014 gathered information about innovation activities in the manufacturing sector over three years (2011-2013). This study gives some practical implication for managing the activities. First, innovation activities that increased the achievement rate of product diversification projects included a combination of market research, new product design, and job training. Second, our results show that a combination of internal R&D, job training and training, and market research increases the project achievement most for the replacement of outdated products. Third, new market creation or extension of market share indicates that launching replacement products and continuously upgrading products are most important.