• 제목/요약/키워드: Binary classification

검색결과 468건 처리시간 0.024초

Multi-Label Classification Approach to Location Prediction

  • Lee, Min Sung
    • 한국컴퓨터정보학회논문지
    • /
    • 제22권10호
    • /
    • pp.121-128
    • /
    • 2017
  • In this paper, we propose a multi-label classification method in which multi-label classification estimation techniques are applied to resolving location prediction problem. Most of previous studies related to location prediction have focused on the use of single-label classification by using contextual information such as user's movement paths, demographic information, etc. However, in this paper, we focused on the case where users are free to visit multiple locations, forcing decision-makers to use multi-labeled dataset. By using 2373 contextual dataset which was compiled from college students, we have obtained the best results with classifiers such as bagging, random subspace, and decision tree with the multi-label classification estimation methods like binary relevance(BR), binary pairwise classification (PW).

아이다부스트(Adaboost)와 원형기반함수를 이용한 다중표적 분류 기법 (Multi-target Classification Method Based on Adaboost and Radial Basis Function)

  • 김재협;장경현;이준행;문영식
    • 전자공학회논문지CI
    • /
    • 제47권3호
    • /
    • pp.22-28
    • /
    • 2010
  • 최근 기계학습 분야에서 커널머신을 이용한 대표적 분류기로 Adaboost가 주목받고 있다. Adaboost는 통계적 학습이론에 기반하여 뛰어난 일반화 성능을 보여주며, 다양한 패턴인식 문제에 적용되고 있다. 그러나, Adaboost는 이진 분류기이므로 다중표적 분류 문제에 곧바로 적용할 수 없다. 일반적으로 다중 분류 문제를 해결하는 기법으로 One-Vs-All 기법과 Pair-Wise 기법이 대표적이다. 이러한 두 기법은 다중 분류 문제를 여러 개의 이진 분류 문제로 분할하고, 이들을 다시 종합하여 최종 결정을 내리는 출력코딩이라는 일반적인 기법으로 실제 시스템 구성에 적합할만한 분류 성능을 보여주지 못하는 경우가 대부분이다. 본 논문에서는 이진 분류기인 Adaboost의 다중 분류 확장 방안으로 원형 기반 함수를 약한 분류기로 이용하는 Adaboost 기반 다중표적 분류 기법을 제안한다.

패치 기반 영상처리를 위한 텍스쳐 분류 알고리즘 (Texture Classification Algorithm for Patch-based Image Processing)

  • 유승완;송병철
    • 전자공학회논문지
    • /
    • 제51권11호
    • /
    • pp.146-154
    • /
    • 2014
  • 텍스쳐 분류에 사용되는 방식 중 하나인 지역적 이진화 패턴은 일반적으로 영상 내의 평탄한 부분, 에지, 코너의 분포를 사용한다. 그러나 영상이 가지는 방향성을 고려하지 않고, 단순히 크고 작음만을 비교하는 지역적 이진화 패턴의 특성때문에 화소간 차이를 반영하지 못하는 문제점이 있다. 또한 영상의 분포를 사용하기 때문에 작은 크기의 영상에 대해서는 분류 성능이 저하된다. 이런 문제를 해결하기 위해 본 논문에서는 영상의 방향성 분포와 고유치 행렬을 이용한 세부 분류 기법을 제안한다. 지역적 이진화 패턴으로 초기 분류에서 누락된 텍스쳐 영상에 대하여 두 가지 특징을 이용하여 세부적으로 분류한다. 첫째, 영상이 가질 수 있는 방향을 여덟 가지로 양자화하고 그 방향들의 분포를 계산한다. 둘째, 구조 행렬을 이용하여 나온 고유치 중 큰 값의 분포를 구한다. 모의 실험을 통해 지역적 이진화 패턴만을 사용하였을 때 대비 제안 방법이 약 8% 정도 분류 정확도가 향상됨을 보였다.

Discriminant Analysis of Binary Data with Multinomial Distribution by Using the Iterative Cross Entropy Minimization Estimation

  • Lee Jung Jin
    • Communications for Statistical Applications and Methods
    • /
    • 제12권1호
    • /
    • pp.125-137
    • /
    • 2005
  • Many discriminant analysis models for binary data have been used in real applications, but none of the classification models dominates in all varying circumstances(Asparoukhov & Krzanowski(2001)). Lee and Hwang (2003) proposed a new classification model by using multinomial distribution with the maximum entropy estimation method. The model showed some promising results in case of small number of variables, but its performance was not satisfactory for large number of variables. This paper explores to use the iterative cross entropy minimization estimation method in replace of the maximum entropy estimation. Simulation experiments show that this method can compete with other well known existing classification models.

Customer Level Classification Model Using Ordinal Multiclass Support Vector Machines

  • Kim, Kyoung-Jae;Ahn, Hyun-Chul
    • Asia pacific journal of information systems
    • /
    • 제20권2호
    • /
    • pp.23-37
    • /
    • 2010
  • Conventional Support Vector Machines (SVMs) have been utilized as classifiers for binary classification problems. However, certain real world problems, including corporate bond rating, cannot be addressed by binary classifiers because these are multi-class problems. For this reason, numerous studies have attempted to transform the original SVM into a multiclass classifier. These studies, however, have only considered nominal classification problems. Thus, these approaches have been limited by the existence of multiclass classification problems where classes are not nominal but ordinal in real world, such as corporate bond rating and multiclass customer classification. In this study, we adopt a novel multiclass SVM which can address ordinal classification problems using ordinal pairwise partitioning (OPP). The proposed model in our study may use fewer classifiers, but it classifies more accurately because it considers the characteristics of the order of the classes. Although it can be applied to all kinds of ordinal multiclass classification problems, most prior studies have applied it to finance area like bond rating. Thus, this study applies it to a real world customer level classification case for implementing customer relationship management. The result shows that the ordinal multiclass SVM model may also be effective for customer level classification.

패킷 분류를 위한 이차원 이진 프리픽스 트리 (A Two-Dimensional Binary Prefix Tree for Packet Classification)

  • 정여진;김혜란;임혜숙
    • 한국정보과학회논문지:정보통신
    • /
    • 제32권4호
    • /
    • pp.543-550
    • /
    • 2005
  • 인터넷은 그 급속한 성장과 더불어 점차 더 나은 서비스를 제공할 것을 요구받게 되었다. 이에 따라 차세대 인터넷 라우터들에서의 지능적인 패킷 분류 기능은 필수 불가결한 것으로 여겨지고 있다. 패킷 분류란 미리 정의된 classifier에 의거하여 입력된 패킷에 매치하는 가장 순위가 높은 룰을 찾는 과정이다. 기존에 나와있는 많은 패킷 분류 검색 구조들이 출발지, 목적지 프리픽스 필드에 기반하여 룰을 추려내는 접근 방법을 사용하고 있다. 그러나 대부분의 검색 구조들은 출발지, 목적지 프리픽스 검색을 위하여 트라이 구조에 바탕을 둔 순차적인 일차원 검색을 따르고 있으며, 매우 큰 메모리를 요구한다는 단점을 가지고 있다. 본 논문에서는 메모리를 매우 효율적으로 사용하면서도 출발지-목적지 프리픽스 쌍에 기반한 이차원 패킷 분류 구조를 제안하고자 한다. 코드워드로 구성된 이진 프리픽스 트리를 구성함으로써, 출발지 프리픽스 검색과 목적지 프리픽스 검색이 하나의 이진 트리를 통해 동시에 가능하도록 하였다. 또한 본 논문에서 제안하는 구조인 이차원 이진 프리픽스 트리는 트리 구조 내부에 비어있는 노드를 포함하고 있지 않으므로 트라이 구조가 가지고 있는 메모리의 비효율성 문제를 완전히 제거하였다.

특징 추출 알고리즘과 Adaboost를 이용한 이진분류기 (Binary classification by the combination of Adaboost and feature extraction methods)

  • 함승록;곽노준
    • 전자공학회논문지CI
    • /
    • 제49권4호
    • /
    • pp.42-53
    • /
    • 2012
  • 패턴 인식과 기계 학습 분야에서 분류는 가장 기본적으로 해결해야 하는 문제의 유형이다. Adaboost 알고리즘은 Boosting 알고리즘의 아이디어를 실제 데이터분석에 이용할 수 있도록 개량한 방법으로써, 단계를 반복하여 나온 여러 개의 약한 분류기와 가중치 값들의 조합으로 강한 분류기를 생성하는 두 개의 클래스를 분류하는 분류기이다. 주성분 분석법과 선형 판별 분석법은 높은 차원의 특징 벡터를 낮은 차원의 특징 벡터로 축소하는 특징 벡터의 차원 감소와 데이터의 특징 추출에도 유용하게 사용되는 방법들이다. 본 논문에서는, 주성분 분석법과 선형 판별 분석법을 이용하여 추출한 특징을 Adaboost 알고리즘의 약 분류기로 사용함으로써, 특징 추출과 분류를 동시에 하고, 인식률을 높이는 효율적인 Boosted-PCA와 Boosted-LDA 알고리즘을 제안한다. 마지막 장에서는, 제안하는 알고리즘으로 UCI Data-Set 중 2 Class-Data와 FRGC Data의 남자와 여자 영상에 대해서 분류 실험을 진행하였다. 실험의 결과로 제안한 Boosted-PCA와 Boosted-LDA 알고리즘이 기존의 특징 추출 알고리즘과 최근접 이웃 분류기, SVM을 이용한 분류기 방법과 비교하여 인식률이 향상됨을 보인다.

유전 알고리즘을 이용한 이진 결정 트리의 설계와 응용 (A design of binary decision tree using genetic algorithms and its applications)

  • 정순원;박귀태
    • 전자공학회논문지B
    • /
    • 제33B권6호
    • /
    • pp.102-110
    • /
    • 1996
  • A new design scheme of a binary decision tree is proposed. In this scheme a binary decision tree is constructed by using genetic algorithm and FCM algorithm. At each node optimal or near-optimal feature subset is selected which optimizes fitness function in genetic algorithm. The fitness function is inversely proportional to classification error, balance between cluster, number of feature used. The binary strings in genetic algorithm determine the feature subset and classification results - error, balance - form fuzzy partition matrix affect reproduction of next genratin. The proposed design scheme is applied to the tire tread patterns and handwriteen alphabetic characters. Experimental results show the usefulness of the proposed scheme.

  • PDF

지역 근처 차이를 이용한 텍스쳐 분류에 관한 연구 (Texture Classification Using Local Neighbor Differences)

  • 뮤잠멜;팽소호;박민욱;김덕환
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 춘계학술발표대회
    • /
    • pp.377-380
    • /
    • 2010
  • This paper proposes texture descriptor for texture classification called Local Neighbor Differences (LND). LND is a high discriminating texture descriptor and also robust to illumination changes. The proposed descriptor utilizes the sign of differences between surrounding pixels in a local neighborhood. The differences of those pixels are thresholded to form an 8-bit binary codeword. The decimal values of these 8-bit code words are computed and they are called LND values. A histogram of the resulting LND values is created and used as feature to describe the texture information of an image. Experimental results, with respect to texture classification accuracies using OUTEX_TC_00001 test suite has been performed. The results show that LND outperforms LBP method, with average classification accuracies of 92.3% whereas that of local binary patterns (LBP) is 90.7%.

영상 압축을 위한 이진 순방향 분류 기반 엔트로피 부호기 (Entropy Coders Based on Binary Forword Classification for Image Compression)

  • 유훈;정제창
    • 한국통신학회논문지
    • /
    • 제25권4B호
    • /
    • pp.755-762
    • /
    • 2000
  • 엔트로피 부호화기는 무손실 압축 방법으로써 영상 압축 및 기타 압축 분야에서 최종단 압축 방법으로써 널리 사용되고 있고 엔트로피 부호화기의 성능 향상과 복잡도를 낮추려는 많은 노력이 있었다. 본 논문에서는 이진 순방향 분류(Binary Forward Classification)에 의한 엔트로피 부호화기를 제안한다. BFC는 매 심벌마다 분류를 위한 추가 정보를 부가하게 되지만 분류 전 정보량과 분류 후의 전체 정보량은 변화가 없다는 특성을 갖는다. 본 논문에서는 이 특성을 증명하고 BFC를 응용한 압축 방법인 BFC와 Golomb-Rice 부호기를 결합형태 (BFG+GR)와 산술 부호기와 결합형태(BFG+A) 등을 제시한다. 설계된 엔트로피 부호기는 BFG를 응용하여 복호기의 복잡도에는 영향을 주지 않는다. 또한 성능 분석결과 유사한 복잡도를 갖는 엔트로피 부호기와 비교하여 향상된 성능을 보여준다.

  • PDF