• 제목/요약/키워드: C4.5 algorithm

검색결과 295건 처리시간 0.031초

C4.5 알고리즘을 이용한 산업 재해의 특성 분석 (A Feature Analysis of Industrial Accidents Using C4.5 Algorithm)

  • 임영문;곽준구;황영섭
    • 한국안전학회지
    • /
    • 제20권4호
    • /
    • pp.130-137
    • /
    • 2005
  • Decision tree algorithm is one of the data mining techniques, which conducts grouping or prediction into several sub-groups from interested groups. This technique can analyze a feature of type on groups and can be used to detect differences in the type of industrial accidents. This paper uses C4.5 algorithm for the feature analysis. The data set consists of 24,887 features through data selection from total data of 25,159 taken from 2 year observation of industrial accidents in Korea For the purpose of this paper, one target value and eight independent variables are detailed by type of industrial accidents. There are 222 total tree nodes and 151 leaf nodes after grouping. This paper Provides an acceptable level of accuracy(%) and error rate(%) in order to measure tree accuracy about created trees. The objective of this paper is to analyze the efficiency of the C4.5 algorithm to classify types of industrial accidents data and thereby identify potential weak points in disaster risk grouping.

C4.5 알고리즘을 이용한 피로도 식별 시스템 구현 (Implementation of Fatigue Identification System using C4.5 Algorithm)

  • 김우진;이덕진
    • 한국융합학회논문지
    • /
    • 제10권8호
    • /
    • pp.21-26
    • /
    • 2019
  • 본 논문은 C4.5 알고리즘을 이용한 피로 인식 방법을 제안한다. 피로 평가에 대한 국내외 연구를 바탕으로 중국인의 생활습관 및 문화적 특성과 결합하여 피로 자기평가 척도를 완성하였다. 본문에서 사용한 척도는 58개 하위항목에 적용되어 있으며 피로의 유형과 정도를 평가하는 데 사용되었다. 이 항목들은 육체적 피로, 정신적 피로, 개인의 습관 및 피로의 결과 등을 측정하는 4가지 분류 항목에 포함된다. 본 연구의 목적은 피로 형성의 주요 원인을 분석하고 그에 따른 피로 정도를 인식함으로써 피로에 대한 주관적 관심을 증가시키고 과도한 피로로 인한 심뇌혈관계 질환의 위험을 감소시키는 데 있다. C4.5 알고리즘을 활용한 피로 인식 시스템의 인식률은 평균 85%로 나타나 본 제안의 유용성을 확인하였다.

Correlation Analysis of the Frequency and Death Rates in Arterial Intervention using C4.5

  • Jung, Yong Gyu;Jung, Sung-Jun;Cha, Byeong Heon
    • International journal of advanced smart convergence
    • /
    • 제6권3호
    • /
    • pp.22-28
    • /
    • 2017
  • With the recent development of technologies to manage vast amounts of data, data mining technology has had a major impact on all industries.. Data mining is the process of discovering useful correlations hidden in data, extracting executable information for the future, and using it for decision making. In other words, it is a core process of Knowledge Discovery in data base(KDD) that transforms input data and derives useful information. It extracts information that we did not know until now from a large data base. In the decision tree, c4.5 algorithm was used. In addition, the C4.5 algorithm was used in the decision tree to analyze the difference between frequency and mortality in the region. In this paper, the frequency and mortality of percutaneous coronary intervention for patients with heart disease were divided into regions.

4-색 알고리즘 (The Four Color Algorithm)

  • 이상운
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권5호
    • /
    • pp.113-120
    • /
    • 2013
  • 본 논문은 지금까지 NP-완전인 난제로 알려진 4-색 정리를 $O(n)$선형시간 복잡도로 수기식과 컴퓨터를 활용하여 증명하는 알고리즘을 제안하였다. 제안된 알고리즘은 그래프 $G=(V_1,E_1)$의 정점 집합 V를 최대 독립집합 $\bar{C_1}$와 최소 정점 피복 집합 $C_1$으로 정확히 양분하는 기법을 적용하여 $\bar{C_1}$에 첫 번째 색을 배정하고, $C_1$ 집합의 정점들로 축소된 연결 그래프 $G=(V_2,E_2)$를 대상으로 $\bar{C_2}$$C_2$로 양분하여 $\bar{C_2}$에 두 번째 색을 지정하였다. $C_2$ 집합의 정점들로 축소된 연결 그래프 $G=(V_3,E_3)$를 대상으로 $\bar{C_3}$$C_3$로 양분하여 $\bar{C_3}$에 세 번째 색을 지정하였다. 마지막으로$C_3$$\bar{C_4}$로 하여 4번째 색을 배정하였다. 2개의 실제 지도 그래프와 2개의 평면 그래프를 대상으로 제안된 알고리즘을 적용한 결과 모든 그래프에서 채색수 ${\chi}(G)=4$를 찾는데 성공하였다. 결국, 제안된 "4-색 알고리즘"은 평면 그래프의 4-색을 결정하는 일반적인 알고리즘으로 적용할 수 있을 것이다.

디인터레이싱을 위한 C4.5 분류화 기법의 적용 및 구현 (The Adopting C4.5 classification and it's Application for Deinterlacing)

  • 김동형
    • 한국산학기술학회논문지
    • /
    • 제18권1호
    • /
    • pp.8-14
    • /
    • 2017
  • 디인터레이싱이란 두 개의 필드(짝수 필드 및 홀수 필드)로 구성된 인터레이스 영상을 프로그레시브 영상으로 변환하는 기술이다. 이는 크게 공간영역에서의 디인터레이싱과 시간영역에서의 디인터레이싱 기술로 나뉠 수 있다. 공간영역에서의 기법은 하나의 독립적인 필드만을 사용하여 디인터레이싱을 수행하는 것으로 하드웨어의 구성은 용이하지만 디인터레이싱 대상 화소의 정보가 해당 필드에 존재하지 않는 경우 화질 열화가 발생할 수 있다. 반면 시간영역에서의 기법은 메모리 사용량이 높고 하드웨어의 구성이 어렵지만 보다 높은 객관적 화질을 얻을 수 있다. 하지만 움직임 추정이 잘못된 경우 현저한 화질열화가 발생한다. 제안하는 방법은 공간영역에서의 디인터레이싱 기법으로 대상화소 주변의 통계적 특성에 따라 서로 다른 기법을 사용하여 디인터레이싱을 수행한다. 이 과정에서 최적의 디인터레이싱 방법의 선택을 위해 엔트로피 기반의 대표적인 분류 알고리즘인 C4.5 알고리즘을 적용한다. 실험결과 제안하는 알고리즘은 이전의 여러 방법들과 비교하여 높은 객관적 화질을 가지는 것을 볼 수 있었으며, 주관적 화질 또한 상대적으로 유사하거나 높은 것을 볼 수 있었다.

TMS320C5416을 이용한 G.729A 보코더와 계산량 감소된 SOLA-B 알고리즘을 통합한 가변 전송율 보코더의 실시간 구현 (Real-time Implementation of Variable Transmission Bit Rate Vocoder Integrating G.729A Vocoder and Reduction of the Computational Amount SOLA-B Algorithm Using the TMS320C5416)

  • 함명규;배명진
    • 대한전자공학회논문지SP
    • /
    • 제40권6호
    • /
    • pp.84-89
    • /
    • 2003
  • 본 논문에서는 8kbps의 전송율을 가진 ITU-T C.729A 보코더에 Henja가 제안한 SOLA-B (Synchronized Overlap Add) 알고리즘을 적용하여 가변 전송율의 보코더를 TMS320C5416에 실시간 구현하였다. 이 방법은 부호화 시 SOLA-B 알고리즘을 이용하여 음성의 속도를 빠르게 해주고, 복호화 시 다시 SOLA-B 알고리즘을 이용하여 음성의 속도를 느리게 해줌으로써 정상속도의 음성을 재생시켜준다. 이때 SOLA-B 알고리즘의 계산량을 줄이기 위해 상호 상관 함수가 수행되는 샘플의 간격을 3 샘플씩 건너뛰면서 처리하였다. 실시간 구현된 G.729A 와 SOLA-B 알고리즘의 보코더는 8kbps 전송율일 때 인코더는 10.2MIPS이고 디코더에서는 2.8%MIPS의 최대 복잡도를 나타내었다. 그리고 6kbps 전송율일 때 인코더 18.3MIPS이고 디코더는 13.1MIPS의 최대 복잡도를 나타내었으며, 4kbps 전송율일 때 인코더 18.5MIPS이고 디코더에서 13.1MIPS의 최대 복잡도를 나타내었다. 사용된 메모리는 program ROM 9.7kwords, table ROM 4.5kwords, RAM 5.1kwords 정도이다. 출력된 파형은 C simulator와 Bit Exact 한 출력 결과를 보여주었다. 또한, 실시간 구현된 가변 전송율 보코더의 음질 평가를 위해 MOS 테스트를 수행한 결과 4kbp의 전송율에서 MOS값이 3.69정도로 측정되었다.

Optimization of Luffing-Tower Crane Location in Tall Building Construction

  • Lee, Dongmin;Lim, Hyunsu;Cho, Hunhee;Kang, Kyung-In
    • Journal of Construction Engineering and Project Management
    • /
    • 제5권4호
    • /
    • pp.7-11
    • /
    • 2015
  • The luffing-tower crane (T/C) is a key facility used in the vertical and horizontal transportation of materials in a tall building construction. Locating the crane in an optimal position is an essential task in the initial stages of construction planning. This paper proposes a new optimization model to locate the luffing T/C in the optimal position to minimize the transportation time. A newly developed mathematical formula is suggested to calculate the transportation time of luffing T/C correctly. An optimization algorithm, the Harmony Search (HS) algorithm, was used and the results show that HS has high performance characteristics to solve the optimization problem in a short period of time. In a case study, the proposed model offered a better position for T/C than the previous heuristic approach.

의사결정나무에서 분리 변수 선택에 관한 연구 (A Study on Selection of Split Variable in Constructing Classification Tree)

  • 정성석;김순영;임한필
    • 응용통계연구
    • /
    • 제17권2호
    • /
    • pp.347-357
    • /
    • 2004
  • 의사결정나무에서 분리 변수를 선택하는 것은 매우 중요한 일이다. C4.5는 변수 선택에 있어 연속형 변수로의 변수 선택 편의가 심각하고, QUEST는 연속형 변수와 관련해서 정규성 가정이 위반될 경우 변수 선택력이 떨어진다. 본 논문에서는 통계적 로버스트 검정 알고리즘을 제안하고, 모의 실험을 통하여 C4.5, QUEST그러고 제안된 알고리즘의 효율성을 비교하였다. 실험 결과 제안된 알고리즘이 변수 선택 편의와 변수 선택력 측면에서 로버스트함을 알 수 있었다.

이론정련 지식기반인공신경망을 이용한 귀납적 학습 (Inductive Learning using Theory-Refinement Knowledge-Based Artificial Neural Network)

  • 심동희
    • 한국멀티미디어학회논문지
    • /
    • 제4권3호
    • /
    • pp.280-285
    • /
    • 2001
  • 귀납적학습 알고리즘과 분석적학습 알고리즘을 결합한 지식기반인공신경망이 제안된 후, 이를 개선한 TopGen, TR-KBANN, THRE-KBANN과 같은 영역이론정련알고리즘이 제시되었다. 그러나 이들은 모두 KBANN과 같이 영역이론이 있을 경우에만 사용할 수 있다. 본 연구에서는 영역이론이 없이 예제만 있는 경우 KBANN으로 표기하는 알고리즘을 제시하였다. KBANN으로 표현된 영역 이론은 THRE-KBANN으로 정련화될 수 있다. 이 알고리즘을 귀납적 학습에서 사용하는 몇 개의 문제영역에 적용하여 실험한 결과 C4.5보다 좋은 성능을 나타냈다.

  • PDF

퍼지 결정트리를 이용한 패턴분류를 위한 데이터 마이닝 알고리즘 (Data Mining Algorithm Based on Fuzzy Decision Tree for Pattern Classification)

  • 이중근;김명원
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권11호
    • /
    • pp.1314-1323
    • /
    • 1999
  • 컴퓨터의 사용이 일반화됨에 따라 데이타를 생성하고 수집하는 것이 용이해졌다. 이에 따라 데이타로부터 자동적으로 유용한 지식을 얻는 기술이 필요하게 되었다. 데이타 마이닝에서 얻어진 지식은 정확성과 이해성을 충족해야 한다. 본 논문에서는 데이타 마이닝을 위하여 퍼지 결정트리에 기반한 효율적인 퍼지 규칙을 생성하는 알고리즘을 제안한다. 퍼지 결정트리는 ID3와 C4.5의 이해성과 퍼지이론의 추론과 표현력을 결합한 방법이다. 특히, 퍼지 규칙은 속성 축에 평행하게 판단 경계선을 결정하는 방법으로는 어려운 속성 축에 평행하지 않는 경계선을 갖는 패턴을 효율적으로 분류한다. 제안된 알고리즘은 첫째, 각 속성 데이타의 히스토그램 분석을 통해 적절한 소속함수를 생성한다. 둘째, 주어진 소속함수를 바탕으로 ID3와 C4.5와 유사한 방법으로 퍼지 결정트리를 생성한다. 또한, 유전자 알고리즘을 이용하여 소속함수를 조율한다. IRIS 데이타, Wisconsin breast cancer 데이타, credit screening 데이타 등 벤치마크 데이타들에 대한 실험 결과 제안된 방법이 C4.5 방법을 포함한 다른 방법보다 성능과 규칙의 이해성에서 보다 효율적임을 보인다.Abstract With an extended use of computers, we can easily generate and collect data. There is a need to acquire useful knowledge from data automatically. In data mining the acquired knowledge needs to be both accurate and comprehensible. In this paper, we propose an efficient fuzzy rule generation algorithm based on fuzzy decision tree for data mining. We combine the comprehensibility of rules generated based on decision tree such as ID3 and C4.5 and the expressive power of fuzzy sets. Particularly, fuzzy rules allow us to effectively classify patterns of non-axis-parallel decision boundaries, which are difficult to do using attribute-based classification methods.In our algorithm we first determine an appropriate set of membership functions for each attribute of data using histogram analysis. Given a set of membership functions then we construct a fuzzy decision tree in a similar way to that of ID3 and C4.5. We also apply genetic algorithm to tune the initial set of membership functions. We have experimented our algorithm with several benchmark data sets including the IRIS data, the Wisconsin breast cancer data, and the credit screening data. The experiment results show that our method is more efficient in performance and comprehensibility of rules compared with other methods including C4.5.