• 제목/요약/키워드: SVM 분류기

검색결과 301건 처리시간 0.039초

복합특징과 SVM 분류기를 이용한 필기체 숫자인식 (Handwritten Numeral Recognition using Composite Features and SVM classifier)

  • 박중조;김태웅;김경민
    • 한국정보통신학회논문지
    • /
    • 제14권12호
    • /
    • pp.2761-2768
    • /
    • 2010
  • 본 논문에서는 숫자의 전경특징과 배경특징을 이용하고 SVM 분류기를 사용하여 오프라인 필기체 숫자인식에서 인식률을 향상시키는 방안을 제시한다. 숫자의 전경특징은 숫자의 에지선을 추출한 Kirsch 방향특징과 숫자선 자체를 추출한 projection 방향특징으로 구성되며, 숫자의 배경특징은 숫자의 볼록외피로 부터 추출되는 오목특징이다. 여기서 오목특징은 방향특징에 대해 보완적인 특징으로 작용하여 분류 성능 향상에 기여한다. 인식기로는 RBF 커널을 이용한 SVM 분류기를 사용하고, CENPAMI 숫자특징 데이터베이스를 사용하여 제시된 방법의 성능을 검사하였다. 실험 결과 각기 다른 분류 성능을 갖는 이들 3종의 특징들이 상호 보완적으로 작용하여 인식률 향상에 기여함을 확인할 수 있었으며, 제시된 복합특징에 의해 98.90%의 인식률을 달성하였다.

부정맥 증상을 자동으로 판별하는 Random Forest 분류기의 정확도 향상을 위한 수정 알고리즘에 대한 연구 (Research on the modified algorithm for improving accuracy of Random Forest classifier which identifies automatically arrhythmia)

  • 이현주;신동규;박희원;김수한;신동일
    • 정보처리학회논문지B
    • /
    • 제18B권6호
    • /
    • pp.341-348
    • /
    • 2011
  • 생체신호의 한 분야인 심전도는 분류알고리즘을 사용한 실험이 일반적이다. 심전도를 실험한 논문에서 사용된 분류알고리즘은 대부분 SVM(Support Vector Machine), MLP(Multilayer Perceptron) 이었으나, 본 실험은 Random Forest 분류기를 시도하였다. 실험방법은 Random Forest 알고리즘을 실험데이터의 신호의 특징에 기반하여 분석하도록 수정하였고, 분류기의 수정된 알고리즘 성능을 규명하기 위하여 SVM과 MLP 분류기와 정확도를 비교 분석하였다. 실험에서는 심전도 신호의 R-R interval을 추출하여 시행하였으며 또한 동일한 데이터를 사용한 타 논문의 결과와 본 실험의 결과를 비교 분석하였다. 결과는 수정된 Random Forest 분류기가 SVM, MLP 분류기, 그리고 타 실험의 결과보다 정확도 부분에서는 우수한 결과를 도출하였다. 본 실험의 전처리 과정에서는 대역통과필터를 사용하여 R-R interval을 추출하였다. 그러나 심전도 실험에서는 대역통과 필터 뿐 아니라, 웨이블릿 변환, 메디안 필터, 유한 임펄스 필터 등으로 실험하는 경우가 많다. 따라서 향후에는 전처리과정에서 기저선 잡음(baseline wandering)을 효율적으로 제거하는 필터의 선택이 필요하며, R-R interval을 정확하게 추출할 수 있는 방법에 대한 연구가 필요하다고 사려된다.

카이 제곱 통계량과 지지벡터기계를 이용한 자동 스팸 메일 분류기 (An Automatic Spam e-mail Filter System Using χ2 Statistics and Support Vector Machines)

  • 이성욱
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2009년도 춘계학술대회
    • /
    • pp.592-595
    • /
    • 2009
  • 우리는 지지벡터기계를 이용하여 스팸 이메일을 자동으로 분류하는 시스템을 제안한다. 단어의 어휘 정보와 품사 태그 정보를 지지벡터기계의 자질로 사용한다. 우리는 카이 제곱 통계량을 이용하여 유용한 자질을 선택한 후 각각의 자질을 문서 빈도(TF)와 역문헌빈도(IDF) 값으로 표현하였다. 자질들을 이용하여 SVM을 학습한 후, SVM 분류기는 각각의 이메일의 스팸 유무를 결정한다. 실험 결과, 웹메일 시스템에서 수집한 이메일 데이터에 대해 약 82.7%의 정확률을 얻었다.

  • PDF

앙상블 구성을 이용한 SVM 분류성능의 향상 (Improving SVM Classification by Constructing Ensemble)

  • 제홍모;방승양
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권3_4호
    • /
    • pp.251-258
    • /
    • 2003
  • Support Vector Machine(SVM)은 이론상으로 좋은 일반화 성능을 보이지만, 실제적으로 구현된 SVM은 이론적인 성능에 미치지 못한다. 주 된 이유는 시간, 공간상의 높은 복잡도로 인해 근사화된 알고리듬으로 구현하기 때문이다. 본 논문은 SVM의 분류성능을 향상시키기 위해 Bagging(Bootstrap aggregating)과 Boosting을 이용한 SVM 앙상블 구조의 구성을 제안한다. SVM 앙상블의 학습에서 Bagging은 각각의 SVM의 학습데이타는 전체 데이타 집합에서 임의적으로 일부 추출되며, Boosting은 SVM 분류기의 에러와 연관된 확률분포에 따라 학습데이타를 추출한다. 학습단계를 마치면 다수결 (Majority voting), 최소자승추정법(LSE:Least Square estimation), 2단계 계층적 SVM등의 기법에 개개의 SVM들의 출력 값들이 통합되어진다. IRIS 분류, 필기체 숫자인식, 얼굴/비얼굴 분류와 같은 여러 실험들의 결과들은 제안된 SVM 앙상블의 분류성능이 단일 SVM보다 뛰어남을 보여준다.

다중 클래스 분류를 위한 강인한 SVM 설계 방법 - 생체 인식 데이터에의 적용 - (Robust SVM Design for Multi-Class Classification - Application to Biometric data -)

  • 조민국;박혜영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.760-762
    • /
    • 2005
  • Support vector machine(SVM)은 졸은 일반화 능력을 가진 학습시스템으로, 최근 다양한 패턴 인식 분야에서 적용되고 있다. SVM은 기본적으로 이진 분류기이므로 두 개 이상의 클래스를 분류하기 위해서는 다중 클래스 분류가 가능한 형태로의 설계 방법이 필요하다. 이를 위해 각 클래스별로 독립적인 SVM들을 만들어 결과를 병합하는 방식이 주로 사용되어 왔다. 그러나 이러한 방법은 클래스의 수는 않고 한 클래스 내의 데이터의 수가 많지 않은 경우에는 SVM의 일반화 성능을 저하시키고 노이즈에 민감해지는 문제점을 가지고 있다. 이를 해결하기 위해 본 논문에서는 각 클래스내의 데이터간의 유사도 측정을 위한 통계적 정보를 안정적으로 추출하기 위해 두 데이터의 쌍을 입력으로 받는 새로운 SVM 설계 방법을 제시한다. 제안한 방법을 실제 생체인식 데이터에 적용한 실험에서 기존의 방법보다 우수한 분류 성능을 보임을 확인할 수 있었다.

  • PDF

DTW를 이용한 SVM 기반 이진트리 구조 설계 (Binary Tree Architecture Design for Support Vector Machine Using Dynamic Time Warping)

  • 강윤정;이재일;배진호;이승우;이종현
    • 전자공학회논문지
    • /
    • 제51권6호
    • /
    • pp.201-208
    • /
    • 2014
  • 본 논문은 DTW 결과를 이용하여 분류기 구조를 설계하는 알고리즘을 제안한다. 제안된 알고리즘은 다수 클래스의 데이터를 분류하기 위한 SVM 기반 이진트리 구조를 설계하는데 있어 DTW 결과를 이용한다. 각 클래스에 대한 데이터를 DTW의 입력으로 하여 얻어진 결과행렬의 열의 합을 이용하여 계산된 임계치를 기준으로 SVM 기반 이진트리 구조(SVM-BTA)를 설계한다. 제안된 알고리즘의 성능 비교를 위해 데이터베이스와 k-means 알고리즘을 이용한 이진트리 구조의 분류 결과를 비교한다. 분류에 사용된 데이터는 수중과도소음 데이터베이스의 18개 클래스 333개의 데이터이다. 제안된 분류기는 데이터베이스의 체계를 이용한 분류기에 비해 분류성능이 향상되었고, k-means 알고리즘을 이용한 분류기에 비해 비 생물소음의 검출 확률이 향상되었다. 제안된 SVM-BTA는 생물 소음(BO) 68.77%, 기계 소음인 체인(CHAN) 92.86%, 그 외의 기계 소음 및 음향학적 소음, 기타소음의 6종은 100%로 분류한다.

HOG 기술자를 이용한 중이염 자동 판별 방법 (Middle Ear Disease Decision Scheme using HOG Descriptor)

  • 정나라;송재욱;강현수
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2015년도 추계학술대회
    • /
    • pp.693-694
    • /
    • 2015
  • 본 논문은 소아 및 성인의 중이염을 자동 판별할 수 있는 알고리즘을 제안한다. 제안 방법은 중이염 영상과 정상 영상 데이터베이스에서 HOG(histogram of oriented gradient) 기술자를 사용하여 특징을 추출한 다음 SVM(support vector machine) 분류기를 통하여 추출된 특징들을 학습시킨다. 입력 영상이 학습된 특징들의 모델을 기반으로 SVM 분류기를 통하여 중이염 여부가 판별된다. 실험결과 제안한 방법이 정확도 90% 이상의 판별 성능을 나타내었다.

  • PDF

지지 벡터 기계를 이용한 계층적 문서 분류 (Hierarchical Text Categorization using Support Vector Machine)

  • 윤용욱;이창기;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2003년도 제15회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.7-13
    • /
    • 2003
  • 인터넷을 통해 생성, 전달되는 문서 량이 급격히 많아짐에 따라, 정보의 접근을 용이하게 하기 위한 문서의 자동 분류 기능이 절실히 요구되고 있다. SVM(Support Vector Machine)은 최근에 문서 분류에 널리 쓰이고 있는 기법으로 다른 분류기에 비하여 좋은 성능을 보여주고 있다. 하지만 SVM은 현재까지 주로 비 계층 평탄화(flat)된 분류 응용에 효과적으로 적용되어 왔다. 이와 달리 본 논문은 문서 분류에 있어서 최종 분류 class를 한번에 출력하는 비 계층 분류보다는, 비슷한 성질을 갖는 class의 집합을 계층적 구조로 묶어 분류하는 계층적 분류 기법이 보다 사람이 이해하기 쉽고 사용하기 편리하며 더 효과적이라는 것을 보이고, 실험을 통해 계층적 분류를 위한 효과적인 SVM분류기를 개발하여 비 계층 분류보다 좋은 분류 성능을 보여 줄 수 있음을 확인한다.

  • PDF

규칙 및 SVM 기반 알고리즘에 의한 심전도 신호의 리듬 분류 (Rhythm Classification of ECG Signal by Rule and SVM Based Algorithm)

  • 김성완;김대환
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권9호
    • /
    • pp.43-51
    • /
    • 2013
  • 신뢰성 있는 부정맥 진단을 위해서는 리듬 구간 및 심박 단위의 종합적인 분석을 통하여 심전도 신호에 대한 분류 결과가 제시되어야 한다. 본 논문에서는 심전도 신호의 특징점에 기반하여 규칙기반 분류를 이용한 일정 구간의 리듬 분석을 수행하고 SVM기반 분류를 이용한 심박 단위의 리듬분석을 첨가하였다. 규칙기반 분류에서는 리듬 구간의 특징에 대하여 임상 자료로부터 도출된 규칙 베이스를 이용하여 리듬 유형을 분류하도록 하며, SVM기반 분류에서는 심박 단위의 특징에 대하여 미리 학습된 다중 SVM 분류기를 이용하여 단조 리듬 및 주요 비정상 심박을 분류하도록 한다. MIT-BIH 부정맥 데이터베이스를 이용한 실험을 통하여 11가지 리듬 유형에 대하여 규칙기반 방법만을 적용하였을 경우 68.52%, 규칙기반과 SVM기반의 융합 방법을 적용하였을 경우 87.04%의 분류 성능을 각각 보였다. SVM기반 방법으로 단조 리듬과 배열 리듬에 대한 오분류 개선을 통하여 분류 성능에서 19% 정도가 향상됨을 확인하였다.

CNN과 다양한 분류 방법의 결합에 의한 성능 비교 (Performance Comparison by Combining CNN with Various Classification Methods)

  • 한정수;곽근창
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2016년도 추계학술발표대회
    • /
    • pp.609-610
    • /
    • 2016
  • 본 논문에서는 컨볼루션 신경회로망(CNN: Convolutional Neural Network)과 다양한 분류기들의 결합을 통해 분류성능을 비교하고자 한다. 현재 일반적인 분류기로 알려진 것은 나이브 베이즈(Naive bayes), 트리(Tree), 판별 분석(Discriminant Analysis), 서포트 벡터 머신(SVM: Support Vector Machine) 등이 존재한다. 분류기들은 각각 다른 원리로 분류하기 때문에, 각각 성능을 비교해볼 필요가 있다. 분류기들의 성능을 비교하기 위한 사용한 데이터는 CNN에서 자주 사용되고 있는 MNIST 데이터를 사용하였다. 실험 결과로는 CNN에 선형 SVM을 결합하여 사용한 것이 분류율과 분류속도 측면에서 다른 분류기들의 성능보다 좋은 성능을 보이는 것을 확인할 수 있었다.