• 제목/요약/키워드: C4.5알고리즘

검색결과 200건 처리시간 0.026초

C4.5 알고리즘을 이용한 피로도 식별 시스템 구현 (Implementation of Fatigue Identification System using C4.5 Algorithm)

  • 김우진;이덕진
    • 한국융합학회논문지
    • /
    • 제10권8호
    • /
    • pp.21-26
    • /
    • 2019
  • 본 논문은 C4.5 알고리즘을 이용한 피로 인식 방법을 제안한다. 피로 평가에 대한 국내외 연구를 바탕으로 중국인의 생활습관 및 문화적 특성과 결합하여 피로 자기평가 척도를 완성하였다. 본문에서 사용한 척도는 58개 하위항목에 적용되어 있으며 피로의 유형과 정도를 평가하는 데 사용되었다. 이 항목들은 육체적 피로, 정신적 피로, 개인의 습관 및 피로의 결과 등을 측정하는 4가지 분류 항목에 포함된다. 본 연구의 목적은 피로 형성의 주요 원인을 분석하고 그에 따른 피로 정도를 인식함으로써 피로에 대한 주관적 관심을 증가시키고 과도한 피로로 인한 심뇌혈관계 질환의 위험을 감소시키는 데 있다. C4.5 알고리즘을 활용한 피로 인식 시스템의 인식률은 평균 85%로 나타나 본 제안의 유용성을 확인하였다.

C4.5를 이용한 CMS 잡 오류 예측 모델 (Prediction Model of CMS Job Failures using C4.5)

  • ;;최희수;박대희;정용화;조충호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 춘계학술발표대회
    • /
    • pp.773-775
    • /
    • 2015
  • 복잡한 그리드 컴퓨팅 환경에서 수행한 잡의 성패율을 낮추는 것은 그리드 환경의 효율성과 선순환을 위한 필수적인 요건이다. 본 논문에서는 데이터마이닝의 대표적인 방법인 결정트리의 C4.5 알고리즘을 이용하여 WLCG에서 수행한 CMS 잡 모니터링 결과에 대한 오류를 예측하는 모델을 설계하고 구현하였다. 제안한 예측 모델은, 1) CMS 대시보드에서 모니터링 결과 데이터를 추출하여 오라클 테이블에 로딩한다. 2) 결정트리인 C4.5 알고리즘을 기반으로 Oracle Data Miner에서 예측 모델링을 수행한다. 3) C4.5의 파라미터를 조절하여 적절한 예측결과 값을 도용한다.

의사결정나무에서 분리 변수 선택에 관한 연구 (A Study on Selection of Split Variable in Constructing Classification Tree)

  • 정성석;김순영;임한필
    • 응용통계연구
    • /
    • 제17권2호
    • /
    • pp.347-357
    • /
    • 2004
  • 의사결정나무에서 분리 변수를 선택하는 것은 매우 중요한 일이다. C4.5는 변수 선택에 있어 연속형 변수로의 변수 선택 편의가 심각하고, QUEST는 연속형 변수와 관련해서 정규성 가정이 위반될 경우 변수 선택력이 떨어진다. 본 논문에서는 통계적 로버스트 검정 알고리즘을 제안하고, 모의 실험을 통하여 C4.5, QUEST그러고 제안된 알고리즘의 효율성을 비교하였다. 실험 결과 제안된 알고리즘이 변수 선택 편의와 변수 선택력 측면에서 로버스트함을 알 수 있었다.

Decision Tree를 이용한 효과적인 유방암 진단 (Effective Diagnostic Method Of Breast Cancer Data Using Decision Tree)

  • 정용규;이승호;성호중
    • 한국인터넷방송통신학회논문지
    • /
    • 제10권5호
    • /
    • pp.57-62
    • /
    • 2010
  • 최근 의료분야에서는 대규모의 데이터를 빠르게 검색 및 추출이 가능하게 의사결정트리 기법에 대한 연구들이 진행되고 있다. 현재 CART, C4.5, CHAID 등 여러 기법이 개발되었는데, 이러한 클레시파이 기법들은 몇몇 의사결정 나무 알고리즘이 이진분리로 분류를 하는데, 나머지 데이터의 결과가 손실될 우려가 있다. 그중 C4.5는 엔트로피의 측정값에 높고 낮음으로 트리 모양을 구성해 가는 방식이고, CART 알고리즘은 엔트로피 매트릭스를 사용하여 범주형 자료나 연속형 자료에 적용할수가 있다. 이에 본 논문에서는 클래시파이 기법 중 C4.5와 CART를 유방암 환자 데이터에 대해 적용하여 실험하여, 그 결과 분석을 통한 성능 평가를 수행하였다. 실험에서는 교차검증을 통해 그 결과에 대한 정확성을 측정하였다.

4-색 알고리즘 (The Four Color Algorithm)

  • 이상운
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권5호
    • /
    • pp.113-120
    • /
    • 2013
  • 본 논문은 지금까지 NP-완전인 난제로 알려진 4-색 정리를 $O(n)$선형시간 복잡도로 수기식과 컴퓨터를 활용하여 증명하는 알고리즘을 제안하였다. 제안된 알고리즘은 그래프 $G=(V_1,E_1)$의 정점 집합 V를 최대 독립집합 $\bar{C_1}$와 최소 정점 피복 집합 $C_1$으로 정확히 양분하는 기법을 적용하여 $\bar{C_1}$에 첫 번째 색을 배정하고, $C_1$ 집합의 정점들로 축소된 연결 그래프 $G=(V_2,E_2)$를 대상으로 $\bar{C_2}$$C_2$로 양분하여 $\bar{C_2}$에 두 번째 색을 지정하였다. $C_2$ 집합의 정점들로 축소된 연결 그래프 $G=(V_3,E_3)$를 대상으로 $\bar{C_3}$$C_3$로 양분하여 $\bar{C_3}$에 세 번째 색을 지정하였다. 마지막으로$C_3$$\bar{C_4}$로 하여 4번째 색을 배정하였다. 2개의 실제 지도 그래프와 2개의 평면 그래프를 대상으로 제안된 알고리즘을 적용한 결과 모든 그래프에서 채색수 ${\chi}(G)=4$를 찾는데 성공하였다. 결국, 제안된 "4-색 알고리즘"은 평면 그래프의 4-색을 결정하는 일반적인 알고리즘으로 적용할 수 있을 것이다.

TMS320C5416을 이용한 G.729A 보코더와 계산량 감소된 SOLA-B 알고리즘을 통합한 가변 전송율 보코더의 실시간 구현 (Real-time Implementation of Variable Transmission Bit Rate Vocoder Integrating G.729A Vocoder and Reduction of the Computational Amount SOLA-B Algorithm Using the TMS320C5416)

  • 함명규;배명진
    • 대한전자공학회논문지SP
    • /
    • 제40권6호
    • /
    • pp.84-89
    • /
    • 2003
  • 본 논문에서는 8kbps의 전송율을 가진 ITU-T C.729A 보코더에 Henja가 제안한 SOLA-B (Synchronized Overlap Add) 알고리즘을 적용하여 가변 전송율의 보코더를 TMS320C5416에 실시간 구현하였다. 이 방법은 부호화 시 SOLA-B 알고리즘을 이용하여 음성의 속도를 빠르게 해주고, 복호화 시 다시 SOLA-B 알고리즘을 이용하여 음성의 속도를 느리게 해줌으로써 정상속도의 음성을 재생시켜준다. 이때 SOLA-B 알고리즘의 계산량을 줄이기 위해 상호 상관 함수가 수행되는 샘플의 간격을 3 샘플씩 건너뛰면서 처리하였다. 실시간 구현된 G.729A 와 SOLA-B 알고리즘의 보코더는 8kbps 전송율일 때 인코더는 10.2MIPS이고 디코더에서는 2.8%MIPS의 최대 복잡도를 나타내었다. 그리고 6kbps 전송율일 때 인코더 18.3MIPS이고 디코더는 13.1MIPS의 최대 복잡도를 나타내었으며, 4kbps 전송율일 때 인코더 18.5MIPS이고 디코더에서 13.1MIPS의 최대 복잡도를 나타내었다. 사용된 메모리는 program ROM 9.7kwords, table ROM 4.5kwords, RAM 5.1kwords 정도이다. 출력된 파형은 C simulator와 Bit Exact 한 출력 결과를 보여주었다. 또한, 실시간 구현된 가변 전송율 보코더의 음질 평가를 위해 MOS 테스트를 수행한 결과 4kbp의 전송율에서 MOS값이 3.69정도로 측정되었다.

이론정련 지식기반인공신경망을 이용한 귀납적 학습 (Inductive Learning using Theory-Refinement Knowledge-Based Artificial Neural Network)

  • 심동희
    • 한국멀티미디어학회논문지
    • /
    • 제4권3호
    • /
    • pp.280-285
    • /
    • 2001
  • 귀납적학습 알고리즘과 분석적학습 알고리즘을 결합한 지식기반인공신경망이 제안된 후, 이를 개선한 TopGen, TR-KBANN, THRE-KBANN과 같은 영역이론정련알고리즘이 제시되었다. 그러나 이들은 모두 KBANN과 같이 영역이론이 있을 경우에만 사용할 수 있다. 본 연구에서는 영역이론이 없이 예제만 있는 경우 KBANN으로 표기하는 알고리즘을 제시하였다. KBANN으로 표현된 영역 이론은 THRE-KBANN으로 정련화될 수 있다. 이 알고리즘을 귀납적 학습에서 사용하는 몇 개의 문제영역에 적용하여 실험한 결과 C4.5보다 좋은 성능을 나타냈다.

  • PDF

데이터마이닝 패키지에서 변수선택 편의에 관한 연구 (A Study on Variable Selection Bias in Data Mining Software Packages)

  • 송문섭;윤영주
    • 응용통계연구
    • /
    • 제14권2호
    • /
    • pp.475-486
    • /
    • 2001
  • 데이터마이닝 패키지에 구현된 분류나무 알고리즘 가운데 CART, CHAID, QUEST, C4.5에서 변수 선택법을 비교하였다. CART의 전체탐색법이 편의를 갖는다는 사실은 잘알려졌으며, 여기서는 상품화된 패키지들에서 이들 알고리즘의 편의와 선택력을 모의실험 연구를 통하여 비교하였다. 상용 패키지로는 CART, Enterprise Miner, AnswerTree, Clementine을 사용하였다. 본 논문의 제한된 모의실험 연구 결과에 의하면 C4.5와 CART는 모두 변수선택에서 심각한 편의를 갖고 있으며, CHAID와 QUEST는 비교적 안정된 결과를 보여주고 있었다.

  • PDF

TMS320C30을 이용한 실시간 음성부 검출 알고리즘 구현 (Implementation of A REal-time Endpoint Detection Algorithm Using TMS320C30)

  • 이항섭
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1993년도 학술논문발표회 논문집 제12권 1호
    • /
    • pp.229-232
    • /
    • 1993
  • 이 논문은 최근에 개발된 실시간 음성부 검출 알고리즘[1]을 TMS320C30 System board와 IBM PC486을 이용한 implementation에 관한 논문이다. 음성부 검출 알고리즘은 Energy와 LCR(Level Crossing Rate)를 이용하여 각 frame을 음성/묵음으로 분류하는 방법을 사용하였고 DSP 보드를 사용하여 한 frame이 입력되면 다음 frame이 입력되기 전에 그 frame에 대한 음성/묵음 분류를 하여 음성입력이 끝남과 동시에 음성이라고 판단되는 부분만을 DPS moemory상에 저장하므로 불필요한 memory의 낭비를 중이고 다음 단계의 음성처리를 위한 시간을 절약하였다. 이 알고리즘의 성능 평가를 위하여 Rabiner와 Sambur의 알고리즘과 한민수의 알고리즘과를 전문가가 수작업으로 찾아낸 결과와 비교 평가하였다. 알고리즘의 오차는 평균 남성 4.925ms, 여성 5.85ms로 1 frame 이내의 오차를 보였다.

  • PDF

Collection 4 와 Collection 5 MODIS 에어러솔 분석 자료의 차이와 지상관측자료와의 비교 (Difference between Collection 4 and 5 MODIS Aerosol Products and Comparison with Ground based Measurements)

  • 이권호;김영준
    • 대한원격탐사학회지
    • /
    • 제24권4호
    • /
    • pp.369-379
    • /
    • 2008
  • 인공위성 관측자료를 이용한 대기 에어러솔 원격탐사 기법은 단시간에 넓은 공간적 영역을 분석할 수 있게 하며, 대상 지역에 존재하는 에어러솔의 분포 정보 및 광학적, 물리학적 특성을 제공 해준다. MODIS 위성자료는 현재까지 가장 진보된 에어러솔 분석자료를 생산하고 있으며, 가장 최근에 개선된 에어러솔 알고리즘(Collection 5 또는 C005)은 기존의 알고리즘(Collection 4 또는 C004)에 비해 많은 부분이 개선되었다. 본 연구는 동북아 지역에서 두 가지 MODIS 에어러솔 알고리즘에 의해 생산된 에어러솔 관측자료를 비교하였고, 각각의 정확도를 검증하기 위하여 AERONET sunphotometer 관측자료와 비교분석 하였다. 2005년 한해 동안의 MODIS 에어러솔 광학두께를 이용하여 에어러솔 광학 두께 (AOT)의 차이를 분석한 결과 에어러솔의 시공간적인 분포특징은 비슷하였으나, $AOT_{C005}$$AOT_{C004}$에 비하여 약 0.035(5%) 정도의 낮은 값을 보였다. MODIS AOT와 AERONET AOT와의 비교결과 C004가 상관계수 R=0.89 (기울기=0.86)를, C005는 R=0.95 (기울기=1.00)을 보였다. 더욱이 정확도 분석에서는 C005가 C004에 비해 약 40% 정도 개선이 된 것으로 나타났다.