• 제목/요약/키워드: SVM 분류기

검색결과 302건 처리시간 0.023초

SVM 분류 알고리즘을 이용한 스팸메일 필터링 (SPam-mail Filtering Using SVM Classifier)

  • 민도식;송무희;손기준;이상조
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.552-554
    • /
    • 2003
  • 전자우편은 기존 우편 기능을 대체하는 대표적인 정보 전달 수단으로 자리 잡고 있다. 전자매일 사용자의 증가에 따라 망은 기업들은 전자 메일을 통해 광고를 하게 되었다. 이에 따라 전자매일 사용자들은 인터넷 상에 개인 전자메일 주소가 노출됨으로 많은 스팸메일을 수신하게 되는데, 이것은 전자메일 사용자에게 많은 부담이 되고있다. 본 논문은 전자우편 문서내의 단어들을 대상으로 통계적 방법의 SVM을 이용하여 스팸메일을 필터링 하였으며, 학습 단계에서 단어 자질공간의 축소를 위해 DF값 변화에 따른 학습을 통하여 분류의 성능을 비교하였다. SVM의 성능 평가를 위해 확률적 방법의 나이브 베이지안과 벡터 모텔을 이용한 분류기와 성능을 비교함으로써 SVM 방법이 우수한 성능을 보임을 검증하였다.

  • PDF

k-NN과 SVM을 이용한 유도전동기 고장 분류 (Fault Classification of Induction Motors by k-NN and SVM)

  • 박성무;이대종;권석영;김용삼;전명근
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2006년도 추계학술대회 학술발표 논문집 제16권 제2호
    • /
    • pp.109-112
    • /
    • 2006
  • 본 논문에서는 PCA에 의한 특징추출과 k-NN과 SVM에 기반을 계층구조의 분류기에 의한 유도전동기의 고장진단 알고리즘을 제안한다. 제안된 방법은 k-NN에 의해 선형적으로 분류 가능한 고장패턴을 분류한 후, 분류가 되지 않는 부분을 커널 함수에 의해 고차원 공간으로 입력패턴을 매핑한 후 SVM에 의해 고장을 진단하는 계층구조를 갖는다. 실험장치를 구축한 후, 다양한 부하에 대하여 몇몇의 전기적 고장과 기계적 고장 하에서 획득한 데이터를 이용하여 제안된 방법의 타당성을 검증한다.

  • PDF

휴대폰 SMS를 위한 SVM 기반의 스팸 필터링 시스템 (A SVM-based Spam Filtering System for Short Message Service (SMS))

  • 조인휘;심혜택
    • 한국통신학회논문지
    • /
    • 제34권9B호
    • /
    • pp.908-913
    • /
    • 2009
  • 휴대 전화는 이제 우리의 일상생활에서 없어서는 안 될 중요한 가전 기기로 자리 잡았다. 이러는 와중에 휴대폰에서 사용하는 문자 메시지 사용량 역시 꾸준하게 증가하여 현재는 음성 통화 이용량의 1.5배에서 2배에 이르고 있다. 문자 메시지의 사용량이 증가함에 따라 스팸 문자 메시지도 따라서 증가하였는데 기존의 모바일 기기에서의 스팸 필터링 방식은 단순 문자열 비교나 특정 번호 차단과 같은 아주 기초적인 수준으로 스팸 메시지를 필터링하고 있는 실정이다. 본 논문에서는 SVM(Support Vector Machine)과 시소러스(thesaurus) 사전을 이용하여 좀 더 강력하고 적응적인 스팸 필터링 시스템을 제안하였다. 제안한 시스템은 샘플 문자 메시지로부터 전처리 기를 이용하여 문자 메시지 속에 담겨 있는 단어를 추출 한 후, 추출된 단어를 시소러스 사전을 이용하여 해당 의미가 가지는 대표 단어로 변경하였다. 변경된 단어들에서 카이 제곱 통계량을 계산하여 그 값이 높은 단어들을 특징 단어로 선정하였고 선정된 특징 단어들을 가지고 SVM 분류기로 학습을 진행하였다. 그 후 학습된 분류기를 이용하여 테스트 문자 메시지의 스팸 여부를 분류하였으며 평균 92%의 인식률을 보였다. 제안된 시스템은 PC에서 구현되어 있으며 실험을 통하여 그 성능을 확인하였다.

Histogram Of Gradients (HOG) 피쳐와 Support Vector Machine (SVM) 분류기를 이용한 위성영상에서 관심물체 탐색 방법 (Detection method of objects with a special pattern in satellite images using Histogram Of Gradients (HOG) feature and Support Vector Machine (SVM) classifier)

  • 임인근;김수환;최종국
    • 대한원격탐사학회지
    • /
    • 제30권4호
    • /
    • pp.537-546
    • /
    • 2014
  • 본 논문은 비 접근 지역에 존재하는 관심물체의 위치를 고해상도 광학 위성영상을 이용하여 찾아내기 위한 방법을 제안한다. 관심물체는 정확하게 규정된 크기와 모양을 갖는 것이 아니라, 개념적으로 유사한 패턴을 가진 물체들의 집합이다. 본 논문에서는 유사 객체 검색에서 Histogram of Gradients (HOG) feature를 이용하여 입력 영상의 관심물체의 특징을 추출하고, 추출된 특징 데이터를 이용하여 다른 영상들의 관심물체를 탐색하는 Support Vector Machine (SVM) 학습 및 분류기를 개발하였다. 제안한 방법은 관심물체를 자동으로 찾아줌으로써, 넓은 영역에서 수동으로 관심물체를 탐색하는데 소요되는 시간과 노력을 줄일 수 있는 효과가 있음을 확인하였다.

스마트폰 사용과 MBTI 사용자 특성간의 관계 평가 (Assessing the Relationship between MBTI User Personality and Smartphone Usage)

  • 라저스리 소카세인;김경백
    • 한국빅데이터학회지
    • /
    • 제1권1호
    • /
    • pp.33-39
    • /
    • 2016
  • 최근 스마트폰 사용 형태의 도움을 받아 사용자 특성을 예측하는 것은 매우 흥미롭고 주의를 사로잡는 연주 주제이다. 현재 몇몇 연구들은 사용자의 특성을 예측하기 위해 전화 사용 기록, 문자 메시지 사용 기록, 소셜 네트워크 서비스 사용 기록 등을 이용하고 있다. 이 논문에서, 우리는 MBTI 사용자 특성과 스마트폰 사용로그 간의 관계를 평가한다. 이를 위해, 스마트폰 사용 기록에서 부터 몇몇 특징들을 추출하고 이를 Naive Bayes와 SVM등의 분류기에 적용하여 사용자의 특성을 구분하였다. 사용자 특성 분석 결과의 분석을 통해 facebook사용 기록이 외향적인 사람과 내향적인 사람을 가장 잘 구분하는 것을 알 수 있었고, SVM 분류기가 Naive Bayes보다 사용자의 특성을 잘 예측하는 것을 확인하였다.

  • PDF

카이제곱 통계량과 지지벡터기계를 이용한 스팸메일 필터 (Spam Filter by Using X2 Statistics and Support Vector Machines)

  • 이성욱
    • 정보처리학회논문지B
    • /
    • 제17B권3호
    • /
    • pp.249-254
    • /
    • 2010
  • 본 논문은 지지벡터기계를 이용하여 스팸메일을 자동으로 분류하는 시스템을 제안한다. 이메일에 포함된 단어의 어휘 정보와 품사 태그 정보를 지지벡터기계의 자질로 사용한다. 우리는 카이제곱 통계량을 이용하여 자질을 선택한 후 각각의 자질을 TF, TF-IDF, 이진 가중치 등으로 표현하여 실험하였다. 카이제곱 통계량을 이용하여 선택된 자질들을 이용하여 SVM을 학습한 후, SVM분류기는 각각의 이메일의 스팸 여부를 결정한다. 실험 결과, 선택되어진 자질들이 성능향상을 가져왔으며, TREC05-p1 스팸 말뭉치에 대해 약 98.9%의 정확도를 얻었다.

SVM음성인식기 구현을 위한 강인한 특징 파라메터 (Robust Feature Parameter for Implementation of Speech Recognizer Using Support Vector Machines)

  • 김창근;박정원;허강인
    • 대한전자공학회논문지SP
    • /
    • 제41권3호
    • /
    • pp.195-200
    • /
    • 2004
  • 본 논문은 두 가지 비교 실험을 통하여 효과적 음성인식 시스템을 제안한다. 분별적 이진 패턴 분류기인 SVM(Support Vector Machines)은 특징 공간에서 비선형 경계를 찾아 분류하는 방법으로 적은 학습 데이터에서도 좋은 분류 성능을 나타낸다고 알려져 있다. 본 논문에서는 학습데이터 수에 따른 HMM(Hidden Markov Model)과 SVM의 인식 성능을 비교하고, 최적의 특징 파라메터를 선택하기 위해 SVM을 이용하여 주성분해석과 독립성분분석을 적용하여 MFCC(Mel Frequency Cepstrum Coefficient)의 특징 공간을 변화시키면서 각각의 인식 성능을 비교 검토하였다. 실험 결과 SVM은 HMM에 비해 적은 학습데이터에서도 높은 인식 성능을 보여주었고, 독립성분분석에 의한 특징 파라메터가 특징 공간상에서의 높은 선형 분별성에 의해 다른 특징 파라메터보다 인식 성능에서 우수함을 확인 할 수 있었다.

SVM을 이용하여 HMM과 심잡음 점수를 결합한 심음 기반 심장질환 분류기 (Heart Sound-Based Cardiac Disorder Classifiers Using an SVM to Combine HMM and Murmur Scores)

  • 곽철;권오욱
    • 한국음향학회지
    • /
    • 제30권3호
    • /
    • pp.149-157
    • /
    • 2011
  • 본 논문은 support vector machine (SVM)을 사용하여 은닉 마코프 모델 (HMM)과 심잡음 존재 정보를 결합한 새로운 심장질환 분류 방법을 제안한다. 켑스트럼 특징과 HMM 비터비 (Viterbi) 알고리듬을 이용하여 입력 신호를 모든 심장질환 모델에 대하여 상태 단위로 분할하여 상태별로 로그우도 (점수)를 계산한다. 심잡음 신호의 시간적 위치 특성을 이용하기 위하여 입력신호를 두 개의 부대역으로 나누고 부대역별로 프레임 단위의 심잡음 점수를 계산한 다음, 비터비 알고리듬으로부터 구한 상태 분할 정보를 이용하여 상태단위의 심잡음 점수를 구한다. SVM은 모든 심장질환 종류에 대한 상태 단위의 HMM과 심잡음 점수를 입력으로 하여 최종적으로 심장질환을 판정한다. 심장질환 분류 실험결과, 제안한 방법은 기존의 켑스트럼 특징과 HMM 분류기를 이용한 방법에 비하여 20.4 %의 상대적 개선율을 보여준다.

SVM 커널함수의 파라미터 값에 따른 능동소나 표적신호의 식별 성능 분석 (Analysis of target classification performances of active sonar returns depending on parameter values of SVM kernel functions)

  • 박정현;황찬식;배건성
    • 한국정보통신학회논문지
    • /
    • 제17권5호
    • /
    • pp.1083-1088
    • /
    • 2013
  • 수중 천해 환경에서 능동소나의 반향 신호로 기뢰를 탐지 및 식별하는 일은 복잡한 해양 환경의 영향으로 어려운 문제이다. SVM은 패턴인식 문제에서 최적의 해를 제공하는 이진 분류기이다. 본 논문에서는 SVM을 이용하여 능동소나의 반향 데이터로 기뢰와 같은 금속 물체와 바위를 식별하는 실험을 수행하면서, SVM에 사용되는 커널함수의 파라미터 값의 변화에 따른 식별 성능을 분석하고 제시하였다.

결함유형별 최적 특징과 Support Vector Machine 을 이용한 회전기계 결함 분류 (Fault Classification for Rotating Machinery Using Support Vector Machines with Optimal Features Corresponding to Each Fault Type)

  • 김양석;이도환;김성국
    • 대한기계학회논문집A
    • /
    • 제34권11호
    • /
    • pp.1681-1689
    • /
    • 2010
  • Support Vector Machine(SVM)을 이용한 회전기계 진단 연구가 많이 수행되어 왔으나 결함 분류성능은 입력 특징과 더불어 다중 분류 방법, 이진분류기, 커널함수 등에 따라 다르다. SVM 을 이용한 대부분의 기존 연구들은 한번 입력 특징들을 선정하면 결함 분류시 동일한 특징데이터를 이용한다. 본 논문에서는 회전기계의 다양한 결함조건에서 측정한 진동신호로부터 추출한 통계적 특징들을 이용하여 각각의 결함을 분류하기 위한 최적 특징들을 선정한 후, 해당 결함상태를 분류하기 위한 SVM 학습과 분류에 각각 이용하였다. 실험자료를 이용한 검증 결과, 제안한 단계 분류 방법이 상대적으로 적은 학습시간으로 단일 다중 분류 방법과 유사한 분류 성능을 얻을 수 있었다.