• 제목/요약/키워드: classifier comparison

검색결과 145건 처리시간 0.023초

한글 전자메일에 대한 베이지언 필터의 성능비교 (Comparison of Performance for Korean E-mail Filtering using Bayesian Classifier)

  • 이창범;김지수;김수형;박혁로
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2004년도 제16회 한글.언어.인지 한술대회
    • /
    • pp.214-219
    • /
    • 2004
  • 전자 메일은 매우 많은 사람들이 사용하는 편리하고 효율적인 통신 수단이다. 그러나 전자메일 주소를 쉽게 획득할 수 있다면 점을 악용하기 때문에 사용자가 원하지 않는 메일 즉 스팸 메일에 대한 문제가 심각해지고 있다. 이러한 스팸 메일을 자동으로 분류해주는 스팸 필터는 주로 영어를 대상으로 하고 있으며, 규칙 기반 필터링보다는 통계적 학습을 통한 필터링 방법을 주로 사용하고 있다. 본 논문에서는 베이즈 정리를 기반으로 하는 3가지 분류 알고리즘을 한글 전자메일을 대상으로 하여 스팸 메일 특히 음란성 메일을 분류하는데 있어 그 성능을 평가하고자 한다. 실험 결과, 단어의 스팸일 확률만을 이용하는 방법이 나이브 베이즈 알고리즘이나 m-estimate를 이용하는 방법보다는 성능이 우수함을 알 수 있었다 특히, 단어의 스팸일 확률만을 이용하는 방법은 false positive rate를 0%로 유지하면서도 다른 방법들보다는 필터링을 잘 해내고 있음을 확인할 수 있었다. 그리고, 자질 선정에서는 명사나 명사/형용사를 사용할 경우에 그 에러율이 가장 적었다.

  • PDF

GAVaPS를 이용한 다수 K-Nearest Neighbor classifier들의 Feature 선택 (Feature Selection for Multiple K-Nearest Neighbor classifiers using GAVaPS)

  • 이희성;이제헌;김은태
    • 한국지능시스템학회논문지
    • /
    • 제18권6호
    • /
    • pp.871-875
    • /
    • 2008
  • 본 논문은 개체 변환 유전자 알고리즘을 (GAVaPS) 이용하여 k-nearest neighbor (k-NN) 분류기에서 사용되는 특징들을 선정하는 방법을 제시한다. 우리는 다수의 k-NN 분류기들을 사용하기 때문에 사용되는 특징들을 선정하는 문제는 매우 탐색 영역이 크고 해결하기 어려운 문제이다. 따라서 우리는 효과적인 특징득의 선정을 위해 일반적인 유전자 알고리즘 (GA) 보다 효율적이라고 알려진 개체군 변환 유전자 알고리즘을 사용한다. 또한 다수 k-NN 분류기를 개체군 변환 유전자 알고리즘으로 효과적으로 결합하는 방법을 제시한다. 제안하는 알고리즘의 우수성을 여러 실험을 통해 보여준다.

Indirect structural health monitoring of a simplified laboratory-scale bridge model

  • Cerda, Fernando;Chen, Siheng;Bielak, Jacobo;Garrett, James H.;Rizzo, Piervincenzo;Kovacevic, Jelena
    • Smart Structures and Systems
    • /
    • 제13권5호
    • /
    • pp.849-868
    • /
    • 2014
  • An indirect approach is explored for structural health bridge monitoring allowing for wide, yet cost-effective, bridge stock coverage. The detection capability of the approach is tested in a laboratory setting for three different reversible proxy types of damage scenarios: changes in the support conditions (rotational restraint), additional damping, and an added mass at the midspan. A set of frequency features is used in conjunction with a support vector machine classifier on data measured from a passing vehicle at the wheel and suspension levels, and directly from the bridge structure for comparison. For each type of damage, four levels of severity were explored. The results show that for each damage type, the classification accuracy based on data measured from the passing vehicle is, on average, as good as or better than the classification accuracy based on data measured from the bridge. Classification accuracy showed a steady trend for low (1-1.75 m/s) and high vehicle speeds (2-2.75 m/s), with a decrease of about 7% for the latter. These results show promise towards a highly mobile structural health bridge monitoring system for wide and cost-effective bridge stock coverage.

영상분류문제를 위한 역전파 신경망과 Support Vector Machines의 비교 연구 (A Comparison Study on Back-Propagation Neural Network and Support Vector Machines for the Image Classification Problems)

  • 서광규
    • 한국산학기술학회논문지
    • /
    • 제9권6호
    • /
    • pp.1889-1893
    • /
    • 2008
  • 본 논문은 영상 분류 문제를 위한 support vector machines (SVMs)의 적용을 통한 분류의 성능을 다루고 있다. 본 연구에서는 영상 분류 문제에서 자연영상을 대상으로 색상, 질감, 형상 특징벡터를 추출하고, 각각의 특징벡터와 이들을 결합한 특징벡터를 사용하여 역전파 신경망과 SVM 기반의 방법을 적용하여 영상 분류의 정확성을 비교한다. 실험결과는 각각의 특징벡터중에는 색상 특징벡터값을 이용한 영상 분류가 그리고 각각의 특징벡터보다는 이들을 결합한 특징벡터를 이용한 영상 분류가 보다 우수함을 보여준다. 그리고 알고리즘간의 비교에서는 정확성과 일반화성능 측면에서 역전파 신경망보다 SVMs이 우수함을 보였다.

심전도 자동 진단 알고리즘 및 장치 구현(V) - 진단 파라미터 추출 및 진단기 (An implementation of automated ECG interpretation algorithm and system(IV) - diagnosis parameter extractor and classifier)

  • 권혁제;정기삼;이정환;신건수;이명호
    • 대한의용생체공학회:학술대회논문집
    • /
    • 대한의용생체공학회 1996년도 춘계학술대회
    • /
    • pp.298-302
    • /
    • 1996
  • The representative beat with high SNR could be obtained by the signal averaging, correct and fast detection of significant points and waveform boundary could be obtained by adoption of search interval. All experimental results of waveform boundary were compared with CSE database which had the 5 referees results and 11 ECG measurement programs. All results were within tolerance made by referees, especially the end point of T wave were more close to the referee's results than other 11 measurement programs. The diagnosis parameters that might be used in the Minnsota code criteria were extracted from the representative beat. The diagnostic classification were fulfilled using Minnsota code criteria. Through the comparison on the diagnosis results from designed automated ECG analyzer(YECGA) and the results ECG analyzer manufactured by Fukuda denshi(FCG-2201) in Japan, reliance of the performance on designed system(YECGA) could be validated.

  • PDF

Multidimensional Discretization과 Event-Codification 기법을 이용한 레이저 용접 불량 검출 (Defect Detection in Laser Welding Using Multidimensional Discretization and Event-Codification)

  • 백수정;오록규;김덕영
    • 한국정밀공학회지
    • /
    • 제32권11호
    • /
    • pp.989-995
    • /
    • 2015
  • In the literature, various stochastic anomaly detection methods, such as limit checking and PCA-based approaches, have been applied to weld defect detection. However, it is still a challenge to identify meaningful defect patterns from very limited sensor signals of laser welding, characterized by intermittent, discontinuous, very short, and non-stationary random signals. In order to effectively analyze the physical characteristics of laser weld signals: plasma intensity, weld pool temperature, and back reflection, we first transform the raw data of laser weld signals into the form of event logs. This is done by multidimensional discretization and event-codification, after which the event logs are decoded to extract weld defect patterns by $Na{\ddot{i}}ve$ Bayes classifier. The performance of the proposed method is examined in comparison with the commercial solution of PRECITEC's LWM$^{TM}$ and the most recent PCA-based detection method. The results show higher performance of the proposed method in terms of sensitivity (1.00) and specificity (0.98).

검출된 얼굴 영역 안정화를 위한 하드웨어 구현 (Hardware Implementation for Stabilization of Detected Face Area)

  • 조호상;장경훈;강현중;강봉순
    • 융합신호처리학회논문지
    • /
    • 제13권2호
    • /
    • pp.77-82
    • /
    • 2012
  • 본 논문은 얼굴 검출 시스템에서 검출된 얼굴의 크기와 위치 정보를 이용한 얼굴 영역 안정화 알고리즘의 하드웨어 구현에 관한 것이다. adaboost 알고리즘을 이용한 얼굴 검출 시스템은 입력되는 영상을 이용하여 얼굴이라고 판단될 수 있는 템플릿 패턴, 얼굴 특징을 추출 하거나 미리 학습된 데이터와 비교하여 얼굴을 검출한다. 하지만 미세한 흔들림에도 얼굴 정보의 위치나 크기가 달라진다. 검출된 얼굴 영역의 안정화를 위해서 본 논문은 검출된 현재 얼굴 정보와 이전 프레임의 얼굴 정보를 기반으로 얼굴 영역의 흔들림을 줄이는 고주파 억제 필터, 얼굴 거리와 영역 비교, 얼굴 영역 확대-축소 연산을 이용한 얼굴 검출 안정화 하드웨어를 구현하여 실시간으로 피드백이 가능하도록 하였다.

점진적으로 계산되는 분류정보와 링크정보를 이용한 하이퍼텍스트 문서 분류 방법 (A Hypertext Categorization Method using Incrementally Computable Class Link Information)

  • 오효정;맹성현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권7호
    • /
    • pp.498-509
    • /
    • 2002
  • 본 논문은 하이퍼텍스트가 갖는 중요한 특성인 링크 정보를 활용한 문서 분류 모델을 제안한다. 제안된 모델의 주안점은 대상 문서와 링크로 연결된 이웃한 문서의 내용 및 범주를 분석하여 대상 문서 벡터를 조정하고, 이를 근거로 대상 문서가 어느 범주에 해당하는지를 결정한다. 또한, 이웃 문서에 포함된 용어를 반영함으로써 대상 문서의 내용을 확장 해석하고, 이웃 문서의 가용 분류 정보가 있는 경우 이를 참조함으로써 정확도 향상을 기한다. 이러한 접근 방법은 일반 웹 환경에 적용할 수 있는데, 특히 하이퍼텍스트를 주제별로 분류하여 관리하는 검색 엔진의 경우 매일 쏟아져 나오는 새로운 문서와 기존 문서간의 링크를 활용함으로써 전체 시스템의 점진적인 분류에 매우 유용하다. 제안된 모델을 검증하기 위하여 Reuter-21578과 계몽사(ETRl-Kyemong) 자료를 대상으로 실험한 결과 최고 18.5%의 성능 향상을 얻었다.

Analysis of Weights and Feature Patterns in Popular 2D Deep Neural Networks Models for MRI Image Classification

  • Khagi, Bijen;Kwon, Goo-Rak
    • Journal of Multimedia Information System
    • /
    • 제9권3호
    • /
    • pp.177-182
    • /
    • 2022
  • A deep neural network (DNN) includes variables whose values keep on changing with the training process until it reaches the final point of convergence. These variables are the co-efficient of a polynomial expression to relate to the feature extraction process. In general, DNNs work in multiple 'dimensions' depending upon the number of channels and batches accounted for training. However, after the execution of feature extraction and before entering the SoftMax or other classifier, there is a conversion of features from multiple N-dimensions to a single vector form, where 'N' represents the number of activation channels. This usually happens in a Fully connected layer (FCL) or a dense layer. This reduced 2D feature is the subject of study for our analysis. For this, we have used the FCL, so the trained weights of this FCL will be used for the weight-class correlation analysis. The popular DNN models selected for our study are ResNet-101, VGG-19, and GoogleNet. These models' weights are directly used for fine-tuning (with all trained weights initially transferred) and scratch trained (with no weights transferred). Then the comparison is done by plotting the graph of feature distribution and the final FCL weights.

Machine Learning Methods for Trust-based Selection of Web Services

  • Hasnain, Muhammad;Ghani, Imran;Pasha, Muhammad F.;Jeong, Seung R.
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권1호
    • /
    • pp.38-59
    • /
    • 2022
  • Web services instances can be classified into two categories, namely trusted and untrusted from users. A web service with high throughput (TP) and low response time (RT) instance values is a trusted web service. Web services are not trustworthy due to the mismatch in the guaranteed instance values and the actual values achieved by users. To perform web services selection from users' attained TP and RT values, we need to verify the correct prediction of trusted and untrusted instances from invoked web services. This accurate prediction of web services instances is used to perform the selection of web services. We propose to construct fuzzy rules to label web services instances correctly. This paper presents web services selection using a well-known machine learning algorithm, namely REPTree, for the correct prediction of trusted and untrusted instances. Performance comparison of REPTree with five machine learning models is conducted on web services datasets. We have performed experiments on web services datasets using a ten k-fold cross-validation method. To evaluate the performance of the REPTree classifier, we used accuracy metrics (Sensitivity and Specificity). Experimental results showed that web service (WS1) gained top selection score with the (47.0588%) trusted instances, and web service (WS2) was selected the least with (25.00%) trusted instances. Evaluation results of the proposed web services selection approach were found as (asymptotic sig. = 0.019), demonstrating the relationship between final selection and recommended trust score of web services.