• 제목/요약/키워드: C4.5 algorithm

검색결과 295건 처리시간 0.024초

TMS320C5416을 이용한 SOLA-B 알고리즘과 G.729A 보코더의 음질 향상된 가변 전송률 보코더의 실시간 구현 (Real-time Implementation of Variable Transmission Bit Rate Vocoder Improved Speech Quality in SOLA-B Algorithm & G.729A Vocoder Using on the TMS320C5416)

  • 함명규;배명진
    • 음성과학
    • /
    • 제10권3호
    • /
    • pp.241-250
    • /
    • 2003
  • In this paper, we implemented the vocoder of variable rate by applying the SOLA-B algorithm to the G.729A to the TMS320C5416 in real-time. This method using the SOLA-B algorithm is that it is reduced the duration of the speech in encoding and is played at the speed of normal by extending the duration of the speech in decoding. But the method applied to the existed G.729A and SOLA-B algorithm is caused the loss of speech quality in G.729A which is not reflected about length variation of speech. Therefore the proposed method is encoded according as it is modified the structure of LSP quantization table about the length of speech is reduced by using the SOLA-B algorithm. The vocoder of variable rate by applying the G.729A and SOLA-B algorithm is represented the maximum complexity of 10.2MIPS about encoder and 2.8MIPS about decoder in 8kbps transmission rate. Also it is evaluated 17.3MIPS about encoder, 9.9MIPS about decoder in 6kbps and 18.5MIPS about encoder, 11.1MIPS about decoder in 4kbps according to the transmission rate. The used memory is about program ROM 9.7kwords, table ROM 4.69kwords, RAM 5.2kwords. The waveform of output is showed by the result of C simulator and Bit Exact. Also, the result of MOS test for evaluation of speech quality of the vocoder of variable rate which is implemented in real-time, it is estimated about 3.68 in 4kbps.

  • PDF

Decision Tree를 이용한 효과적인 유방암 진단 (Effective Diagnostic Method Of Breast Cancer Data Using Decision Tree)

  • 정용규;이승호;성호중
    • 한국인터넷방송통신학회논문지
    • /
    • 제10권5호
    • /
    • pp.57-62
    • /
    • 2010
  • 최근 의료분야에서는 대규모의 데이터를 빠르게 검색 및 추출이 가능하게 의사결정트리 기법에 대한 연구들이 진행되고 있다. 현재 CART, C4.5, CHAID 등 여러 기법이 개발되었는데, 이러한 클레시파이 기법들은 몇몇 의사결정 나무 알고리즘이 이진분리로 분류를 하는데, 나머지 데이터의 결과가 손실될 우려가 있다. 그중 C4.5는 엔트로피의 측정값에 높고 낮음으로 트리 모양을 구성해 가는 방식이고, CART 알고리즘은 엔트로피 매트릭스를 사용하여 범주형 자료나 연속형 자료에 적용할수가 있다. 이에 본 논문에서는 클래시파이 기법 중 C4.5와 CART를 유방암 환자 데이터에 대해 적용하여 실험하여, 그 결과 분석을 통한 성능 평가를 수행하였다. 실험에서는 교차검증을 통해 그 결과에 대한 정확성을 측정하였다.

A Study on the Prediction of Community Smart Pension Intention Based on Decision Tree Algorithm

  • Liu, Lijuan;Min, Byung-Won
    • International Journal of Contents
    • /
    • 제17권4호
    • /
    • pp.79-90
    • /
    • 2021
  • With the deepening of population aging, pension has become an urgent problem in most countries. Community smart pension can effectively resolve the problem of traditional pension, as well as meet the personalized and multi-level needs of the elderly. To predict the pension intention of the elderly in the community more accurately, this paper uses the decision tree classification method to classify the pension data. After missing value processing, normalization, discretization and data specification, the discretized sample data set is obtained. Then, by comparing the information gain and information gain rate of sample data features, the feature ranking is determined, and the C4.5 decision tree model is established. The model performs well in accuracy, precision, recall, AUC and other indicators under the condition of 10-fold cross-validation, and the precision was 89.5%, which can provide the certain basis for government decision-making.

퍼지 결정 트리를 이용한 효율적인 퍼지 규칙 생성 (Efficient Fuzzy Rule Generation Using Fuzzy Decision Tree)

  • 민창우;김명원;김수광
    • 전자공학회논문지C
    • /
    • 제35C권10호
    • /
    • pp.59-68
    • /
    • 1998
  • 데이터 마이닝의 목적은 유용한 패턴을 찾음으로써 데이터를 이해하는데 있으므로, 찾아진 패턴은 정확할뿐 아니라 이해하기 쉬워야한다. 따라서 정확하고 이해하기 쉬운 패턴을 추출하는 데이터 마이닝에 대한 연구가 필요하다. 본 논문에서는 퍼지 결정 트리를 이용한 효과적인 데이터 마이닝 알고리즘을 제안한다. 제안된 알고리즘은 ID3, C4.5와 같은 결정 트리 알고리즘의 이해하기 쉬운 장점과 퍼지의 표현력을 결합하여 간결하고 이해하기 쉬운 규칙을 생성한다. 제안된 알고리즘은 히스토그램에 기반하여 퍼지 소속함수를 생성하는 단계와 생성된 소속 함수를 이용하여 퍼지 결정 트리를 구성하는 두 단계로 이루어진다. 또한 제안된 방법의 타당성을 검증하기 위하여 표준적인 패턴 분류 벤치마크 데이터인 Iris 데이터와 Wisconsin Breast Cancer 데이터에 대한 실험 결과를 보인다.

  • PDF

Collection 4 와 Collection 5 MODIS 에어러솔 분석 자료의 차이와 지상관측자료와의 비교 (Difference between Collection 4 and 5 MODIS Aerosol Products and Comparison with Ground based Measurements)

  • 이권호;김영준
    • 대한원격탐사학회지
    • /
    • 제24권4호
    • /
    • pp.369-379
    • /
    • 2008
  • 인공위성 관측자료를 이용한 대기 에어러솔 원격탐사 기법은 단시간에 넓은 공간적 영역을 분석할 수 있게 하며, 대상 지역에 존재하는 에어러솔의 분포 정보 및 광학적, 물리학적 특성을 제공 해준다. MODIS 위성자료는 현재까지 가장 진보된 에어러솔 분석자료를 생산하고 있으며, 가장 최근에 개선된 에어러솔 알고리즘(Collection 5 또는 C005)은 기존의 알고리즘(Collection 4 또는 C004)에 비해 많은 부분이 개선되었다. 본 연구는 동북아 지역에서 두 가지 MODIS 에어러솔 알고리즘에 의해 생산된 에어러솔 관측자료를 비교하였고, 각각의 정확도를 검증하기 위하여 AERONET sunphotometer 관측자료와 비교분석 하였다. 2005년 한해 동안의 MODIS 에어러솔 광학두께를 이용하여 에어러솔 광학 두께 (AOT)의 차이를 분석한 결과 에어러솔의 시공간적인 분포특징은 비슷하였으나, $AOT_{C005}$$AOT_{C004}$에 비하여 약 0.035(5%) 정도의 낮은 값을 보였다. MODIS AOT와 AERONET AOT와의 비교결과 C004가 상관계수 R=0.89 (기울기=0.86)를, C005는 R=0.95 (기울기=1.00)을 보였다. 더욱이 정확도 분석에서는 C005가 C004에 비해 약 40% 정도 개선이 된 것으로 나타났다.

NCW 환경에서 C4I 체계 전투력 상승효과 평가 알고리즘 : 기술 및 인적 요소 고려 (A Combat Effectiveness Evaluation Algorithm Considering Technical and Human Factors in C4I System)

  • 정환식;박건우;이재영;이상훈
    • 지능정보연구
    • /
    • 제16권2호
    • /
    • pp.55-72
    • /
    • 2010
  • 최근, NCW에 적합한 C4I 체계의 전투력 상승효과 평가의 필요성이 제기되고 있다. 기존의연구는 체계 자체에 중점을 두었으며, 인적 요소를 중요한 요소로 고려하지 않았다. 따라서, C4I 체계의 전투력 상승효과 평가 시 기술 및 인적 요소를 고려하여 평가하는 것이 필요한 시점이라고 할 수 있다. 이에 본 연구에서는 E-TechMan(A Combat Effectiveness Evaluation Algorithm Considering Technical and Human Factors in C4I System)이라 불리는 전투력 상승효과 평가 알고리즘을 제안한다. E-TechMan 알고리즘은 합동화력체계(Joint Fire Operating System-Korea)에 적용되어 전투력 상승효과를 평가해보았다. 또한, 기존의 연구방법인 C2 이론 및 고전 역학에 의한 결과와 비교를 하였다. 본 연구는 인적요소에 의한 영향을 반영함으로써 기존의 연구보다 현실적인 전투력 상승효과 결과를 제시했다는데 가치가 있다.

Collection 5와 Collection 6 Aqua MODIS07_L2 기온과 이슬점온도 산출물간의 비교 및 지상 관측 자료와의 비교 (Comparisons of Collection 5 and 6 Aqua MODIS07_L2 air and Dew Temperature Products with Ground-Based Observation Dataset)

  • 장근창;강신규;홍석영
    • 대한원격탐사학회지
    • /
    • 제30권5호
    • /
    • pp.571-586
    • /
    • 2014
  • Moderate Resolution Imaging Spectroradiometer(MODIS)로부터 산출된 기온과 이슬점 온도프로파일 자료는 5 km의 공간해상도로 연속적으로 지상을 감시하고 있으며, 2012년부터 기존의 산출 알고리즘(Collection 5, C005)을 개선한 Collection 6(C006) MODIS07_L2 대기프로파일 자료를 생산하고 있다. 이 연구에서는 두 가지 버전의 알고리즘으로 산출된 Aqua MODIS07_L2(MYD07_L2) 대기 프로파일 자료로부터 획득한 기온과 이슬점 온도에 대한 신뢰도를 평가하는 것으로, 전국 77 개소 정규기상관측지점을 대상으로 하였다. 또한 기온과 이슬점 온도를 이용하여 대기수증기압을 추정하여 미기상인자 산출에 대한 MYD07_L2의 적용 가능성을 살펴보았다. C006 기온은 지상 관측 자료와 비교에서 C005 기온의 오차(ME = -1.89 K, RMSE = 4.06 K)보다 개선된 결과를 보였다(ME = -0.76 K, RMSE = 3.34 K). 한편, 이슬점 온도의 경우에는 C006이 C005의 오차(ME = -0.39 K, RMSE = 5.65 K)보다 크게 나타났다. MYD07_L2 산출 고도와 지상 관측지점 간에 발생할 수 있는 고도 차이를 보정하기 위해 대기기온감률 방법을 적용한 결과, 기온의 경우 C005와 C006에서 모두 개선 효과를 확인할 수 있었지만, 이슬점 온도의 경우에는 C006에서 오차가 소폭 증가하였다(1.4%). 두 가지 버전의 MYD07_L2 자료를 이용하여 대기수증기압을 추정한 결과, C006 자료를 이용하였을 때 다소 개선된 결과를 보였다. 이 연구를 통해 한국에 대한 C006 MYD07_L2 산출물 중 기온의 신뢰도가 전반적으로 개선되었음을 확인할 수 있었다.

의사결정트리의 분류 정확도 향상 (Classification Accuracy Improvement for Decision Tree)

  • 메하리 마르타 레제네;박상현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.787-790
    • /
    • 2017
  • Data quality is the main issue in the classification problems; generally, the presence of noisy instances in the training dataset will not lead to robust classification performance. Such instances may cause the generated decision tree to suffer from over-fitting and its accuracy may decrease. Decision trees are useful, efficient, and commonly used for solving various real world classification problems in data mining. In this paper, we introduce a preprocessing technique to improve the classification accuracy rates of the C4.5 decision tree algorithm. In the proposed preprocessing method, we applied the naive Bayes classifier to remove the noisy instances from the training dataset. We applied our proposed method to a real e-commerce sales dataset to test the performance of the proposed algorithm against the existing C4.5 decision tree classifier. As the experimental results, the proposed method improved the classification accuracy by 8.5% and 14.32% using training dataset and 10-fold crossvalidation, respectively.

의사결정나무에서 순서형 분리변수 선택에 관한 연구 (Ordinal Variable Selection in Decision Trees)

  • 김현중
    • 응용통계연구
    • /
    • 제19권1호
    • /
    • pp.149-161
    • /
    • 2006
  • CART로 대표되는 의사결정나무의 알고리즘에서 가장 중요한 요소는 분리변수의 선택방법이다. 대부분의 알고리즘은 변수의 형태가 연속형인지, 혹은 명목형(nominal)인지에 따라 별개의 변수선택방법을 적용한다. 하지만 변수의 형태가 순서형(ordinal)인 경우에는 그 변수를 연속형으로 취급하여 연속형 변수선택방법을 적용하는 것이 대부분이다. 이것은 CART와 같은 Greedy탐색을 이용하는 방법에는 문제점이 발생하지 않는다. 하지만 Greedy탐색의 약점을 보완하기 위해 통계이론을 이용하여 개발된 최근의 방법들에는 최선의 대처방법이 아니다. 따라서 본 연구에서는 의사결정 나무에서 분리변수를 선택하는데 있어서 비모수적 접근 방법인 Clamor-von Mises 검정을 이용한 방법을 순서형 변수에 사용하는 것을 제안하고, CART, C4.5, QUEST, CRUISE등 기존 알고리즘과 본 연구에서 제안하는 방법의 순서형 변수 선택력을 비교하였다. 모의실험의 결과, Clamor-von Mises 검정을 이용한 변수선택방법은 순서형 변수의 분류력을 기존 방법들에 비해 더 정확히 예측하는 좋은 성과를 보여주었다.

A New Incremental Learning Algorithm with Probabilistic Weights Using Extended Data Expression

  • Yang, Kwangmo;Kolesnikova, Anastasiya;Lee, Won Don
    • Journal of information and communication convergence engineering
    • /
    • 제11권4호
    • /
    • pp.258-267
    • /
    • 2013
  • New incremental learning algorithm using extended data expression, based on probabilistic compounding, is presented in this paper. Incremental learning algorithm generates an ensemble of weak classifiers and compounds these classifiers to a strong classifier, using a weighted majority voting, to improve classification performance. We introduce new probabilistic weighted majority voting founded on extended data expression. In this case class distribution of the output is used to compound classifiers. UChoo, a decision tree classifier for extended data expression, is used as a base classifier, as it allows obtaining extended output expression that defines class distribution of the output. Extended data expression and UChoo classifier are powerful techniques in classification and rule refinement problem. In this paper extended data expression is applied to obtain probabilistic results with probabilistic majority voting. To show performance advantages, new algorithm is compared with Learn++, an incremental ensemble-based algorithm.