• 제목/요약/키워드: support vector machines

검색결과 430건 처리시간 0.026초

빅 데이터 분석을 위한 지지벡터기계 (Support vector machines for big data analysis)

  • 최호식;박혜원;박창이
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권5호
    • /
    • pp.989-998
    • /
    • 2013
  • 최근 산/학계에서 주목받고 있는 빅 데이터는 정의상 한꺼번에 자료를 메모리에 올려 분석할 수 없기 때문에 기존의 데이터마이닝 시대에 개발된 일괄처리 (batch processing) 방식의 알고리즘을 적용할 수 없게 된다. 따라서 가장 시급히 해결해야 하는 문제는 기존의 여러 가지 기계학습방법을 빅 데이터에 적용할 수 있도록 분산처리 (distributed processing)를 수행하는 적절한 알고리즘을 개발하는 것이라 볼 수 있다. 본 논문에서는 분류문제에서 각광받는 지지벡터기계 (support vector machines)의 여러 알고리즘을 살펴보고자 한다. 특히 빅 데이터 분류문제에 유용할 것으로 예상되는 온라인 타입 알고리즘과 병렬처리 알고리즘에 대하여 소개하고, 이러한 알고리즘들의 성능 및 장단점을 선형분류에 대한 모의실험을 통해서 살펴본다.

Two dimensional reduction technique of Support Vector Machines for Bankruptcy Prediction

  • Ahn, Hyun-Chul;Kim, Kyoung-Jae;Lee, Ki-Chun
    • 한국경영정보학회:학술대회논문집
    • /
    • 한국경영정보학회 2007년도 International Conference
    • /
    • pp.608-613
    • /
    • 2007
  • Prediction of corporate bankruptcies has long been an important topic and has been studied extensively in the finance and management literature because it is an essential basis for the risk management of financial institutions. Recently, support vector machines (SVMs) are becoming popular as a tool for bankruptcy prediction because they use a risk function consisting of the empirical error and a regularized term which is derived from the structural risk minimization principle. In addition, they don't require huge training samples and have little possibility of overfitting. However. in order to Use SVM, a user should determine several factors such as the parameters ofa kernel function, appropriate feature subset, and proper instance subset by heuristics, which hinders accurate prediction results when using SVM In this study, we propose a novel hybrid SVM classifier with simultaneous optimization of feature subsets, instance subsets, and kernel parameters. This study introduces genetic algorithms (GAs) to optimize the feature selection, instance selection, and kernel parameters simultaneously. Our study applies the proposed model to the real-world case for bankruptcy prediction. Experimental results show that the prediction accuracy of conventional SVM may be improved significantly by using our model.

  • PDF

Customer Level Classification Model Using Ordinal Multiclass Support Vector Machines

  • Kim, Kyoung-Jae;Ahn, Hyun-Chul
    • Asia pacific journal of information systems
    • /
    • 제20권2호
    • /
    • pp.23-37
    • /
    • 2010
  • Conventional Support Vector Machines (SVMs) have been utilized as classifiers for binary classification problems. However, certain real world problems, including corporate bond rating, cannot be addressed by binary classifiers because these are multi-class problems. For this reason, numerous studies have attempted to transform the original SVM into a multiclass classifier. These studies, however, have only considered nominal classification problems. Thus, these approaches have been limited by the existence of multiclass classification problems where classes are not nominal but ordinal in real world, such as corporate bond rating and multiclass customer classification. In this study, we adopt a novel multiclass SVM which can address ordinal classification problems using ordinal pairwise partitioning (OPP). The proposed model in our study may use fewer classifiers, but it classifies more accurately because it considers the characteristics of the order of the classes. Although it can be applied to all kinds of ordinal multiclass classification problems, most prior studies have applied it to finance area like bond rating. Thus, this study applies it to a real world customer level classification case for implementing customer relationship management. The result shows that the ordinal multiclass SVM model may also be effective for customer level classification.

Early warning of hazard for pipelines by acoustic recognition using principal component analysis and one-class support vector machines

  • Wan, Chunfeng;Mita, Akira
    • Smart Structures and Systems
    • /
    • 제6권4호
    • /
    • pp.405-421
    • /
    • 2010
  • This paper proposes a method for early warning of hazard for pipelines. Many pipelines transport dangerous contents so that any damage incurred might lead to catastrophic consequences. However, most of these damages are usually a result of surrounding third-party activities, mainly the constructions. In order to prevent accidents and disasters, detection of potential hazards from third-party activities is indispensable. This paper focuses on recognizing the running of construction machines because they indicate the activity of the constructions. Acoustic information is applied for the recognition and a novel pipeline monitoring approach is proposed. Principal Component Analysis (PCA) is applied. The obtained Eigenvalues are regarded as the special signature and thus used for building feature vectors. One-class Support Vector Machine (SVM) is used for the classifier. The denoising ability of PCA can make it robust to noise interference, while the powerful classifying ability of SVM can provide good recognition results. Some related issues such as standardization are also studied and discussed. On-site experiments are conducted and results prove the effectiveness of the proposed early warning method. Thus the possible hazards can be prevented and the integrity of pipelines can be ensured.

Support vector machines with optimal instance selection: An application to bankruptcy prediction

  • Ahn Hyun-Chul;Kim Kyoung-Jae;Han In-Goo
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2006년도 춘계학술대회
    • /
    • pp.167-175
    • /
    • 2006
  • Building accurate corporate bankruptcy prediction models has been one of the most important research issues in finance. Recently, support vector machines (SVMs) are popularly applied to bankruptcy prediction because of its many strong points. However, in order to use SVM, a modeler should determine several factors by heuristics, which hinders from obtaining accurate prediction results by using SVM. As a result, some researchers have tried to optimize these factors, especially the feature subset and kernel parameters of SVM But, there have been no studies that have attempted to determine appropriate instance subset of SVM, although it may improve the performance by eliminating distorted cases. Thus in the study, we propose the simultaneous optimization of the instance selection as well as the parameters of a kernel function of SVM by using genetic algorithms (GAs). Experimental results show that our model outperforms not only conventional SVM, but also prior approaches for optimizing SVM.

  • PDF

지지벡터기계의 변수 선택방법 비교 (Comparison of Feature Selection Methods in Support Vector Machines)

  • 김광수;박창이
    • 응용통계연구
    • /
    • 제26권1호
    • /
    • pp.131-139
    • /
    • 2013
  • 지지벡터기계는 잡음변수가 존재하는 경우에 성능이 저하될 수 있다. 또한 최종 분류기에서 각 변수들의 중요도를 알리 어려운 단점이 있다. 따라서 변수선택은 지지벡터기계의 해석력과 정확도를 높일 수 있다. 기존의 문헌상의 대부분의 연구는 선형 지지벡터기계에서 성근 해를 주는 벌점함수를 통해 변수를 선택에 관한 것이다. 실제로는 분류의 정확도를 높이기 위해 비선형 커널을 사용하는 경우가 일반적이다. 따라서 변수선택은 비선형 지지벡터기계에서도 마찬가지로 필요하다. 본 논문에서는 모의실험 및 실제자료를 통하여 비선형 지지벡터의 대표적인 변수선택법인 COSSO(component selection and smoothing operator)와 KNIFE(kernel iterative feature extraction)의 성능을 비교한다.

복합 특성 정보와 SVM을 이용한 차량 번호판 추출 및 검증 (Vehicle License Plate Extraction and Verification Using Compounded Feature Information and Support Vector Machines)

  • 김하영;안명석;차의영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 춘계종합학술대회
    • /
    • pp.493-496
    • /
    • 2005
  • 본 논문에서는 번호판 고유의 복합 색상 정보와 수직 에지 정보를 이용한 번호판 후보 영역 추출기법을 제안한다. 또한 추출된 번호판 영역의 정확성을 높이기 위해서, Fast DCT를 거쳐 압축된 이미지에 대하여 Support Vector Machines(SVM)을 이용한 검증 과정을 제안한다. 제안하는 기법은 차량번호판 인식의 대상이 되는 자동차의 위치가 정면, 후면을 구분하지 않는 다양함을 가지고, 주변 배경이 충분히 포함되는 상황에서 다양한 크기를 가지는 355장의 영상들을 대상으로 한다. 실험 결과, SVM을 이용한 검증 과정을 거친 방법이 그렇지 않은 경우보다 20%이상 향상된 번호판 추출 성공률을 나타내었다.

  • PDF

One-Class 서포트 벡터 머신을 이용한 레벨 셋 트리 생성 (Creating Level Set Trees Using One-Class Support Vector Machines)

  • 이계민
    • 정보과학회 논문지
    • /
    • 제42권1호
    • /
    • pp.86-92
    • /
    • 2015
  • 레벨 셋 트리는 다차원에 정의된 확률 밀도 함수를 표현하는데 유용하다. 복잡한 데이터의 구조를 트리 형태로 시각화하여 데이터의 형태를 효율적으로 파악할 수 있으며 클러스터링 분석에 효과적으로 이용할 수 있다. 본 논문에서는 미지의 확률 밀도 함수에서 생성된 데이터 샘플로부터 레벨 셋 트리를 생성하는 알고리즘을 제안한다. 제안된 알고리즘은 레벨을 0에서부터 무한대로 증가시키며 밀도 함수의 각 레벨 셋을 추정하고, 이로부터 레벨 셋 트리를 생성한다. 이를 위해 본 논문에서는 one-class 서포트 벡터 머신 (OC-SVM)을 이용하여 직접적으로 레벨 셋을 추정한다. 이때 다양한 레벨 값에 대해 OC-SVM 학습을 반복해야 하는데, OC-SVM 솔루션 path 알고리즘을 통해 빠른 시간 안에 모든 레벨값에 해당하는 레벨 셋를 추정할 수 있다.

금속 벨로우즈 용접의 결점 탐지를 위한 서포터 벡터 머신의 이용 (Use of Support Vector Machines for Defect Detection of Metal Bellows Welding)

  • 박민철;변영태;김동원
    • 한국컴퓨터정보학회논문지
    • /
    • 제20권1호
    • /
    • pp.11-20
    • /
    • 2015
  • 기존 벨로우즈의 용접 불량은 현미경을 이용한 작업자의 수작업과 육안확인으로 진행되고 있어 효율과 능률면에서 많은 부작용이 있다. 본 논문에서 이러한 문제점을 해결하고자 서포트 벡터 머신을 이용한다. 제안된 시스템은 서포트 벡터 머신을 이용하여 작업자의 경험적인 방법을 대체하고, 이미지 처리 과정에서 작업자로부터 발생하는 불규칙성을 극복할 수 있다. 또한 현미경과 3D 디스플레이 시스템을 통하여 제품불량을 쉽게 확인할 수 있다. 자동화 측정 장치로부터 얻어진 실험결과를 통하여 용접불량은 허용되는 에러 범위 아래로 개선됐음을 알 수 있다.

Vibration based bridge scour evaluation: A data-driven method using support vector machines

  • Zhang, Zhiming;Sun, Chao;Li, Changbin;Sun, Mingxuan
    • Structural Monitoring and Maintenance
    • /
    • 제6권2호
    • /
    • pp.125-145
    • /
    • 2019
  • Bridge scour is one of the predominant causes of bridge failure. Current climate deterioration leads to increase of flooding frequency and severity and thus poses a higher risk of bridge scour failure than before. Recent studies have explored extensively the vibration-based scour monitoring technique by analyzing the structural modal properties before and after damage. However, the state-of-art of this area lacks a systematic approach with sufficient robustness and credibility for practical decision making. This paper attempts to develop a data-driven methodology for bridge scour monitoring using support vector machines. This study extracts features from the bridge dynamic responses based on a generic sensitivity study on the bridge's modal properties and selects the features that are significantly contributive to bridge scour detection. Results indicate that the proposed data-driven method can quantify the bridge scour damage with satisfactory accuracy for most cases. This paper provides an alternative methodology for bridge scour evaluation using the machine learning method. It has the potential to be practically applied for bridge safety assessment in case that scour happens.