• 제목/요약/키워드: C4.5알고리즘

검색결과 200건 처리시간 0.021초

산업재해의 요인분석을 위한 의사결정나무 (Decision Tree Approach for Factor Analysis of Industrial Accidents)

  • 임영문;황영섭
    • 대한안전경영과학회지
    • /
    • 제8권4호
    • /
    • pp.1-11
    • /
    • 2006
  • 의사결정나무 알고리즘은 데이터마이닝 기법중 하나인데 관심이 되는 데이터들에 대하여 분류 및 예측을 가능하게 해준다. 이 기법은 데이터 형태의 특성을 분석할 수 있고 산업재해 형태의 차이점을 찾아내는데 사용될 수 있다. 본 연구에서는 산업재해 데이터의 특성을 파악하고자 C4.5 알고리즘을 사용하였다. 본 연구에서 분석을 위하여 사용된 데이터는 강원도에서 발생한 2년 동안의 산업재해 관련 데이터로서 연구에 적용된 데이터의 수는 19,909개로 구성되어 있다. 본 연구의 목적을 위하여 한 개의 목표변수와 여덟 개의 독립변수가 산업재해 형태에 따라 세분화 되었다. 분석 후 데이터는 222개의 전체 나뭇가지와 151개의 줄기가지로 분류되었다. 또한 본 연구에서는 재해자들의 위험도 관리와 감소를 위하여 이익도표를 제공하였다.

Collection 5와 Collection 6 Aqua MODIS07_L2 기온과 이슬점온도 산출물간의 비교 및 지상 관측 자료와의 비교 (Comparisons of Collection 5 and 6 Aqua MODIS07_L2 air and Dew Temperature Products with Ground-Based Observation Dataset)

  • 장근창;강신규;홍석영
    • 대한원격탐사학회지
    • /
    • 제30권5호
    • /
    • pp.571-586
    • /
    • 2014
  • Moderate Resolution Imaging Spectroradiometer(MODIS)로부터 산출된 기온과 이슬점 온도프로파일 자료는 5 km의 공간해상도로 연속적으로 지상을 감시하고 있으며, 2012년부터 기존의 산출 알고리즘(Collection 5, C005)을 개선한 Collection 6(C006) MODIS07_L2 대기프로파일 자료를 생산하고 있다. 이 연구에서는 두 가지 버전의 알고리즘으로 산출된 Aqua MODIS07_L2(MYD07_L2) 대기 프로파일 자료로부터 획득한 기온과 이슬점 온도에 대한 신뢰도를 평가하는 것으로, 전국 77 개소 정규기상관측지점을 대상으로 하였다. 또한 기온과 이슬점 온도를 이용하여 대기수증기압을 추정하여 미기상인자 산출에 대한 MYD07_L2의 적용 가능성을 살펴보았다. C006 기온은 지상 관측 자료와 비교에서 C005 기온의 오차(ME = -1.89 K, RMSE = 4.06 K)보다 개선된 결과를 보였다(ME = -0.76 K, RMSE = 3.34 K). 한편, 이슬점 온도의 경우에는 C006이 C005의 오차(ME = -0.39 K, RMSE = 5.65 K)보다 크게 나타났다. MYD07_L2 산출 고도와 지상 관측지점 간에 발생할 수 있는 고도 차이를 보정하기 위해 대기기온감률 방법을 적용한 결과, 기온의 경우 C005와 C006에서 모두 개선 효과를 확인할 수 있었지만, 이슬점 온도의 경우에는 C006에서 오차가 소폭 증가하였다(1.4%). 두 가지 버전의 MYD07_L2 자료를 이용하여 대기수증기압을 추정한 결과, C006 자료를 이용하였을 때 다소 개선된 결과를 보였다. 이 연구를 통해 한국에 대한 C006 MYD07_L2 산출물 중 기온의 신뢰도가 전반적으로 개선되었음을 확인할 수 있었다.

텍스트 마이닝을 이용한 XML 문서 분류 기술 (Classification Techniques for XML Document Using Text Mining)

  • 김천식;홍유식
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권2호
    • /
    • pp.15-23
    • /
    • 2006
  • 인터넷에는 많은 문서가 있고 지금도 새로운 문서가 만들어지고 있다. 따라서 인터넷에 존재하는 문서를 의미 있게 분류하는 것은 향후 문서의 관리 및 질의처리에서 중요한 문제이다. 하지만 지금까지 대부분은 키워드에 기초한 문서 분류방법을 사용하고 있다. 이 방법은 문서를 효율적으로 분류하지 못했다. 또한 의미를 포함한 문서의 분류를 하지 못한다. 사람이 문서를 꼼꼼하게 읽어서 문서를 분류하는 방법이 최선이지만, 시간적인 면이나 효율성에 문제가 있다. 따라서 본 논문에서는 신경망 알고리즘과 C4.5 알고리즘을 이용하여 문서를 분류하고자 한다. 실험 데이터로 XML로 만들어진 이력서 데이터를 사용하여 실험하였다. 실험결과 문서 분류에 가능성을 보였다. 또한, 다양한 문서 분류 응용에 적용하여 좋은 결과를 얻을 것으로 기대한다.

  • PDF

기초 알고리즘 학습을 위한 알고리즘 시각화 시스템의 효용성 분석 (Usability Analysis of Algorithm Visualization Tool for Learning Basic Algorithms)

  • 오경숙;이상진;김응곤;박경욱;류남훈;이혜미
    • 한국전자통신학회논문지
    • /
    • 제6권2호
    • /
    • pp.212-218
    • /
    • 2011
  • 알고리즘과 프로그래밍 교육 과정은 전자공학 및 컴퓨터 관련학과를 비롯한 많은 이공계 학과에서 매우 중요한 교과목으로 인식된다. 본 논문에서는 프로그래밍 과정 중 기본 알고리즘에 대해 쉽게 익힐 수 있도록 기초 알고리즘을 활용한 프로그래밍 언어 학습 시스템의 효용성을 분석하였다. 그 결과 본 시스템을 사용한 실험 단체가 비실험 단체보다 학업성취도가 15점 이상 높았다. 그리고 실험 참가 학생들의 C 언어 프로그램에 대한 흥미도, 집중도, 이해도, 효과성, 편리성, 적합성, 다음 학기 수업 희망 사항 등에서도 5점 척도 평균값이 약 4점 이상으로 높게 나타났다.

의사결정 트리의 효용성 제고 방안에 관한 비교 연구 (A Comparative Study on The Effective Use of Decision Tree Algorithms)

  • 석현태
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2008년도 제39차 동계학술발표논문집 16권2호
    • /
    • pp.321-324
    • /
    • 2009
  • 비교적 적은 크기이면서 예측력에 있어 만족할 만한 의사결정목을 생성하는 방법으로서 적절한 크기의 샘플링을 제안하였다. 일반적으로 샘플의 크기가 작을수록 작은 의사결정목이 생성되므로 적절한 예측 정확도를 갖는 작은 트리를 생성하기를 원할 경우 적당한 크기의 샘플링을 하는 것이 트리의 최적화를 위한 계산을 더 시행하는 것보다 바람직하다고 할 수 있으며, 이와 같은 사실은 현재 알려진 가장 대표적 의사결정목 생성 알고리즘인 C4.5 및 CART를 사용하여 실험으로서 보여주었다.

  • PDF

냉동컨테이너 온도 제어 알고리즘에 관한 연구 (Temperature Control Algorithm for Reefer Container)

  • 문영식;박신준;정준우;최형림;김재중
    • 한국정보통신학회논문지
    • /
    • 제21권12호
    • /
    • pp.2380-2386
    • /
    • 2017
  • 국내에서 생산되는 신선농산물은 현재 정부의 보조금 지원을 받으며 비싼 항공운송을 이용하여 해외로 수출되고 있다. 하지만 2023년부터 정부의 보조금 지급이 중단됨에 따라 저렴한 비용으로 많은 화물 운송이 가능한 해상운송을 이용할 필요가 있다. 신선농산물의 해상운송에는 냉동컨테이너가 사용되는데 현재 냉동컨테이너는 화물 적재부 내부 온도편차가 크게 발생하여 운송 중 신선화물의 부패 등에 따른 문제가 있다. 이를 해결하기 위해 본 연구에서는 냉동컨테이너 내부 온도를 일정하게 유지하며, 편차를 최소화 할 수 있는 냉동컨테이너 온도 제어 알고리즘을 개발하였다. 개발한 알고리즘을 참외 싱가포르 해상운송 경로에 적용하여 그 기능을 검증하였다. 검증 결과 설정온도 $4.0^{\circ}C$를 기준으로 최대 $0.5^{\circ}C$이내에서 화물 적재함 내부 온도가 유지되는 것을 확인 할 수 있었다.

C4.5 알고리즘을 이용한 산업 재해의 특성 분석 (A Feature Analysis of Industrial Accidents Using C4.5 Algorithm)

  • 임영문;곽준구;황영섭
    • 한국안전학회지
    • /
    • 제20권4호
    • /
    • pp.130-137
    • /
    • 2005
  • Decision tree algorithm is one of the data mining techniques, which conducts grouping or prediction into several sub-groups from interested groups. This technique can analyze a feature of type on groups and can be used to detect differences in the type of industrial accidents. This paper uses C4.5 algorithm for the feature analysis. The data set consists of 24,887 features through data selection from total data of 25,159 taken from 2 year observation of industrial accidents in Korea For the purpose of this paper, one target value and eight independent variables are detailed by type of industrial accidents. There are 222 total tree nodes and 151 leaf nodes after grouping. This paper Provides an acceptable level of accuracy(%) and error rate(%) in order to measure tree accuracy about created trees. The objective of this paper is to analyze the efficiency of the C4.5 algorithm to classify types of industrial accidents data and thereby identify potential weak points in disaster risk grouping.

순차 Shear-Warp 알고리즘을 이용한 병렬볼륨렌더링의 구현 (Implementation of Parallel Volume Rendering Using the Sequential Shear-Warp Algorithm)

  • 김응곤
    • 한국정보처리학회논문지
    • /
    • 제5권6호
    • /
    • pp.1620-1632
    • /
    • 1998
  • 본 논문에서는 볼륨렌더링을 위한 빠른 병렬 알고리즘을 제안하고, 이를 4,096개의 프로세서를 가진 MasPar MP-2범용병렬 컴퓨터에서 C 언어와 MPL(MasPar Programming Language)언어를 이용하여 구현하였다. 본 알고리즘은 현재 가장 빠른 순차 볼륨 렌더링 알고리즘으로 알려진 Lacroute의 Shear-Warp 알고리즘을 병렬화한 것이다. 본 병렬 알고리즘은 밀림변환 공간 분할 기법과 이전의 렌더링 단계에서 얻은 부하정보를 이용하여 다음 렌더링시 부하를 균형화하는 부하균형화 기법을 이용함으로써 통신 오버헤드를 줄이며, 연속길이부호화 기법에 의한 볼륨 데이터 구조를 이용함으로써 처리할 복셀의 수를 크게 줄인다. MasPar MP-23에서 $128\times128\times128$복셀로 구성된 인체 두뇌 볼륨 데이터세트에 대하여 실험한 결과 초당 3~4프레임의 속도로 렌더링하였으며 본 알고리즘의 확장성에 의하여 16,384개의 프로세서를 가진 MasPar MP-2 시스템에서는 초당 12~16프레임의 렌더링이 가능할 것으로 기대된다. 또한 더 큰 볼륨에 대해서도 최근의 SIMD 또는 MIMD 머신상에서는 초당 30~60프레임의 렌더링이 가능할 것으로 기대된다.

  • PDF

의사결정나무에서 순서형 분리변수 선택에 관한 연구 (Ordinal Variable Selection in Decision Trees)

  • 김현중
    • 응용통계연구
    • /
    • 제19권1호
    • /
    • pp.149-161
    • /
    • 2006
  • CART로 대표되는 의사결정나무의 알고리즘에서 가장 중요한 요소는 분리변수의 선택방법이다. 대부분의 알고리즘은 변수의 형태가 연속형인지, 혹은 명목형(nominal)인지에 따라 별개의 변수선택방법을 적용한다. 하지만 변수의 형태가 순서형(ordinal)인 경우에는 그 변수를 연속형으로 취급하여 연속형 변수선택방법을 적용하는 것이 대부분이다. 이것은 CART와 같은 Greedy탐색을 이용하는 방법에는 문제점이 발생하지 않는다. 하지만 Greedy탐색의 약점을 보완하기 위해 통계이론을 이용하여 개발된 최근의 방법들에는 최선의 대처방법이 아니다. 따라서 본 연구에서는 의사결정 나무에서 분리변수를 선택하는데 있어서 비모수적 접근 방법인 Clamor-von Mises 검정을 이용한 방법을 순서형 변수에 사용하는 것을 제안하고, CART, C4.5, QUEST, CRUISE등 기존 알고리즘과 본 연구에서 제안하는 방법의 순서형 변수 선택력을 비교하였다. 모의실험의 결과, Clamor-von Mises 검정을 이용한 변수선택방법은 순서형 변수의 분류력을 기존 방법들에 비해 더 정확히 예측하는 좋은 성과를 보여주었다.

낮은 부엽 준위를 갖는 이중 대역 다이폴 배열 안테나 (GA-Enhanced Dual-Band Aperiodic Linear Dipole Array with Low Sidelobe Level)

  • 트린반손;권지나;황금철;박준영;김선주;김동환
    • 한국통신학회논문지
    • /
    • 제37C권12호
    • /
    • pp.1296-1302
    • /
    • 2012
  • 본 논문에서는 유전 알고리즘(genetic algorithm)을 이용하여 이중대역 다이폴 배열(dipole array) 안테나의 설계 및 최적화 문제에 대해서 고찰하였다. 다이폴로 구성된 이중대역, 개구면 공유형 선형 배열은 4 GHz와 9.5 GHz에서 동작하도록 설계하였다. 또한, 다이폴의 전류 분포는 모멘트 기법(method of moment)을 이용하여 계산되었으며, 계산 과정에서 다이폴 간 상호 결합(mutual coupling)을 고려하였다. 두 공진 주파수 대역에서 낮은 부엽 준위를 도출하기 위해서 비주기 다이폴 배열 설계에 유전 알고리즘을 적용하였고, 최적 설계된 이중대역 다이폴 배열 안테나는 4 GHz와 9.5 GHz에서 각각 -15.7 dB, -17 dB로 낮은 PSL 특성을 나타내었다. 또한, 이 결과를 상용 시뮬레이션 결과와 비교 분석하였다.