• 제목/요약/키워드: Feature Classification

검색결과 2,155건 처리시간 0.031초

근전도 신호기반 손목 움직임의 추정을 위한 다중 특징점 추출 기법 알고리즘 (Improvements of Multi-features Extraction for EMG for Estimating Wrist Movements)

  • 김서준;정의철;이상민;송영록
    • 전기학회논문지
    • /
    • 제61권5호
    • /
    • pp.757-762
    • /
    • 2012
  • In this paper, the multi feature extraction algorithm for estimation of wrist movements based on Electromyogram(EMG) is proposed. For the extraction of precise features from the EMG signals, the difference absolute mean value(DAMV), the mean absolute value(MAV), the root mean square(RMS) and the difference absolute standard deviation value(DASDV) to consider amplitude characteristic of EMG signals are used. We figure out a more accurate feature-set by combination of two features out of these, because of multi feature extraction algorithm is more precise than single feature method. Also, for the motion classification based on EMG, the linear discriminant analysis(LDA), the quadratic discriminant analysis(QDA) and k-nearest neighbor(k-NN) are used. We implemented a test targeting twenty adult male to identify the accuracy of EMG pattern classification of wrist movements such as up, down, right, left and rest. As a result of our study, the LDA, QDA and k-NN classification method using feature-set with MAV and DASDV showed respectively 87.59%, 89.06%, 91.75% accuracy.

Semi-supervised Software Defect Prediction Model Based on Tri-training

  • Meng, Fanqi;Cheng, Wenying;Wang, Jingdong
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권11호
    • /
    • pp.4028-4042
    • /
    • 2021
  • Aiming at the problem of software defect prediction difficulty caused by insufficient software defect marker samples and unbalanced classification, a semi-supervised software defect prediction model based on a tri-training algorithm was proposed by combining feature normalization, over-sampling technology, and a Tri-training algorithm. First, the feature normalization method is used to smooth the feature data to eliminate the influence of too large or too small feature values on the model's classification performance. Secondly, the oversampling method is used to expand and sample the data, which solves the unbalanced classification of labelled samples. Finally, the Tri-training algorithm performs machine learning on the training samples and establishes a defect prediction model. The novelty of this model is that it can effectively combine feature normalization, oversampling techniques, and the Tri-training algorithm to solve both the under-labelled sample and class imbalance problems. Simulation experiments using the NASA software defect prediction dataset show that the proposed method outperforms four existing supervised and semi-supervised learning in terms of Precision, Recall, and F-Measure values.

Hybrid Case-based Reasoning and Genetic Algorithms Approach for Customer Classification

  • Kim Kyoung-jae;Ahn Hyunchul
    • Journal of information and communication convergence engineering
    • /
    • 제3권4호
    • /
    • pp.209-212
    • /
    • 2005
  • This study proposes hybrid case-based reasoning and genetic algorithms model for customer classification. In this study, vertical and horizontal dimensions of the research data are reduced through integrated feature and instance selection process using genetic algorithms. We applied the proposed model to customer classification model which utilizes customers' demographic characteristics as inputs to predict their buying behavior for the specific product. Experimental results show that the proposed model may improve the classification accuracy and outperform various optimization models of typical CBR system.

웨이블릿 신경망을 이용한 패턴 분류 시스템 설계 및 EEG 신호 분류에 대한 연구 (A Study of Pattern Classification System Design Using Wavelet Neural Network and EEG Signal Classification)

  • 임성길;박찬호;이현수
    • 전자공학회논문지CI
    • /
    • 제39권3호
    • /
    • pp.32-43
    • /
    • 2002
  • 본 논문에서는 신경망에 기반한 디지털 신호를 위한 패턴분류 시스템을 제안한다. 제안하는 시스템은 두 가지 신경망 모델로 구성된다. 첫 번째 부분은 특징 추출의 역할을 하는 웨이블릿 신경망이다. 이 부분을 위해 기존의 웨이블릿 신경망 모델들을 비교한 후, 특징 추출을 위한 새로운 웨이블릿 신경망 모델을 제안한다. 다른 부분은 패턴 분류를 위한 웨이블릿 신경망이다. 패턴 분류에 적용하기 위해 기존의 웨이블릿 신경망 구조를 수정하고 학습 방법을 제안한다. 패턴 분류 웨이블릿 신경망의 입력은 특징 추출 신경망의 은닉노드의 연결강도, 확장 및 이동 파라미터로 구성되었다. 또 출력은 특징 추출 신경망의 입력 신호가 속한 부류를 나타낸다. 제안한 시스템을 EEG 신호를 주파수에 따라서 분류하는 문제에 적용하였다.

An Improved 2-D Moment Algorithm for Pattern Classification

  • Yoon, myoung-Young
    • 한국산업정보학회논문지
    • /
    • 제4권2호
    • /
    • pp.1-6
    • /
    • 1999
  • 화상 데이터의 특성을 표현하는데 적합한 깁스분포를 바탕으로 특징벡터를 추출하여 패턴을 분류하는 새로운 알고리즘을 제안하였다. 특징벡터는 화상의 크기, 위치, 회전에 대해서 불변이며 접영에 대해서도 덜 민감한 특징을 갖는 2차원 모멘트들의 원소로 만들어진다. 알고리즘은 공간정보를 갖는 2차원 모멘트를 이용하여 특징벡터를 추출하는 과정과 거리함수를 이용하여 패턴을 분류하는 과정으로 구축하였다. 특징벡터는 깁스분포의 묘수를 추정하여 2차원 조건부 모멘트를 추출하여 구성한다. 패턴 분류 과정은 추출된 특징벡터로부터 제안된 판별거리함수를 계산하여 여러 원형 패턴 가운데 최소거리를 산출한 미지의 패턴을 원형패턴으로 분류한다. 제안된 방법의 성능을 검증하기 위하여 대문자와 소문자 52자로 구성된 훈련 데이터를 만들어 SUN ULTRA 10 워크스테이션에서 실험을 한 결과 98%이상의 분류성능이 있음을 밝혔다.

  • PDF

점진적 특징 가중치 기법을 이용한 나이브 베이즈 문서분류기의 성능 개선 (Improving Naïve Bayes Text Classifiers with Incremental Feature Weighting)

  • 김한준;장재영
    • 정보처리학회논문지B
    • /
    • 제15B권5호
    • /
    • pp.457-464
    • /
    • 2008
  • 실제 운용 환경에서 자동문서분류시스템의 성공을 위해서 충분하지 못한 학습문서의 문제와 특징 공간들에 대한 사전지식이 없는 상황을 해결하는 것이 관건이다. 이런 맥락에서 많은 자동문서분류 시스템의 구축을 위해 나이브 베이즈 문서분류 알고리즘을 사용한다. 이는 기존 학습된 분류모델과 특징 공간을 점진적으로 갱신함으로써 분류모델을 향상시키는 것이 매우 용이하기 때문이다. 본 논문에서는 특징 가중치를 이용하여 문서분류기의 성능을 향상시키는 기법을 제안한다. 기본 아이디어는 문서분류 모델의 인자로서 특징들의 분포뿐만 아니라 각 특징들의 중요도를 반영하는 것이다. 속성 선택을 미리 수행하여 학습모델을 만드는 것이 아니라, 속성 중요도를 나이브 베이즈 학습 모델에 포함시킴으로써 보다 정확한 모델을 생성할 수 있다. 또한 동적 환경에서 점진적인 특징 가중치 부여를 위해 기존의 특징 갱신 기법을 확장한 알고리즘도 제안한다. 본 논문에서 제안된 기법을 평가하기 위해서 Reuters-21578과 20Newsgroup 문서집합 이용한 실험을 실시하여, 제안된 기법이 전통적인 나이브 베이즈 분류기의 성능을 크게 향상시킴을 증명한다.

문서 분류 알고리즘을 이용한 한국어 스팸 문서 분류 성능 비교 (Comparing Korean Spam Document Classification Using Document Classification Algorithms)

  • 송철환;유성준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (C)
    • /
    • pp.222-225
    • /
    • 2006
  • 한국은 다른 나라에 비해 많은 인터넷 사용자를 가지고 있다. 이에 비례해서 한국의 인터넷 유저들은 Spam Mail에 대해 많은 불편함을 호소하고 있다. 이러한 문제를 해결하기 위해 본 논문은 다양한 Feature Weighting, Feature Selection 그리고 문서 분류 알고리즘들을 이용한 한국어 스팸 문서 Filtering연구에 대해 기술한다. 그리고 한국어 문서(Spam/Non-Spam 문서)로부터 영사를 추출하고 이를 각 분류 알고리즘의 Input Feature로써 이용한다. 그리고 우리는 Feature weighting 에 대해 기존의 전통적인 방법이 아니라 각 Feature에 대해 Variance 값을 구하고 Global Feature를 선택하기 위해 Max Value Selection 방법에 적용 후에 전통적인 Feature Selection 방법인 MI, IG, CHI 들을 적용하여 Feature들을 추출한다. 이렇게 추출된 Feature들을 Naive Bayes, Support Vector Machine과 같은 분류 알고리즘에 적용한다. Vector Space Model의 경우에는 전통적인 방법 그대로 사용한다. 그 결과 우리는 Support Vector Machine Classifier, TF-IDF Variance Weighting(Combined Max Value Selection), CHI Feature Selection 방법을 사용할 경우 Recall(99.4%), Precision(97.4%), F-Measure(98.39%)의 성능을 보였다.

  • PDF

유전알고리즘을 이용한 최적 k-최근접이웃 분류기 (Optimal k-Nearest Neighborhood Classifier Using Genetic Algorithm)

  • 박종선;허균
    • Communications for Statistical Applications and Methods
    • /
    • 제17권1호
    • /
    • pp.17-27
    • /
    • 2010
  • 분류분석에 사용되는 k-최근접이웃 분류기에 유전알고리즘을 적용하여 의미 있는 변수들과 이들에 대한 가중치 그리고 적절한 k를 동시에 선택하는 알고리즘을 제시하였다. 다양한 실제 자료에 대하여 기존의 여러 방법들과 교차타당성 방법을 통하여 비교한 결과 효과적인 것으로 나타났다.

Classifying Articles in Chinese Wikipedia with Fine-Grained Named Entity Types

  • Zhou, Jie;Li, Bicheng;Tang, Yongwang
    • Journal of Computing Science and Engineering
    • /
    • 제8권3호
    • /
    • pp.137-148
    • /
    • 2014
  • Named entity classification of Wikipedia articles is a fundamental research area that can be used to automatically build large-scale corpora of named entity recognition or to support other entity processing, such as entity linking, as auxiliary tasks. This paper describes a method of classifying named entities in Chinese Wikipedia with fine-grained types. We considered multi-faceted information in Chinese Wikipedia to construct four feature sets, designed different feature selection methods for each feature, and fused different features with a vector space using different strategies. Experimental results show that the explored feature sets and their combination can effectively improve the performance of named entity classification.

초음파 간영상의 특징벡터 분류 및 진단시스템 구현에 관한 연구 (A Study on the Classification of Ultrasonic Liver Image Feature Vectors and the Design of Diagnosis System)

  • 정정원;김동윤
    • 대한의용생체공학회:학술대회논문집
    • /
    • 대한의용생체공학회 1995년도 추계학술대회
    • /
    • pp.177-182
    • /
    • 1995
  • Since one property(i.e. coarseness, orientation, regularity, granularity etc.) of ultrasound liver images was not sufficiently enough to classify the characteristics of livers, we used the multi-feature vectors from ultrasound images to diagnose the liver disease. The proposed classifier, which uses the multi-feature vectors and Bayes decision rule, performed well for the classification of normal, fat and cirrhosis liver. In our simulation, we used the Battacharyya distance and Hotelling Trace Criterion to select the best multi-feature vectors for the classifier and obtained less classification errors than other methods using single feature vector.

  • PDF