• 제목/요약/키워드: Binary Classifier

검색결과 133건 처리시간 0.025초

지형학적 인자를 이용한 광역 홍수범람 위험지역 분석 (Analysis of large-scale flood inundation area using optimal topographic factors)

  • 이경상;이대업;정성호;이기하
    • 한국수자원학회논문집
    • /
    • 제51권6호
    • /
    • pp.481-490
    • /
    • 2018
  • 최근 기후변화와 이상기후의 영향으로 인한 홍수재해의 시 공간적 패턴의 변화가 복잡해짐에 따라 홍수범람 예측은 점점 어려워지고 있다. 이러한 기상이변에 따른 홍수피해를 예방하고 대응하기 위한 비구조적 대책으로 홍수위험등급 및 범람범위 등의 정보를 포함하고 있는 홍수위험지도의 작성이 필요하다. 실제로 고정밀도 홍수위험지도를 작성하기 위해서는 1차적으로 지형, 지질, 토지피복, 기상 등의 자료를 기반으로 강우-유출-범람해석을 통해 침수면적 및 침수깊이 등 범람 정보를 획득해야 되며, 2차적으로 피해액 산정을 위해 사회 경제와 관련된 다양한 DB를 필요로 한다. 하지만 개발도상국에서는 이러한 자료가 부족하고, 일부지역에서는 자료자체를 획득할 수가 없어 홍수위험지도 제작이 불가능하거나 그 정확도가 매우 낮은 실정이다. 본 연구에서는 ASTER 또는 SRTM과 같은 범용 지형자료로부터 주요 지형학적 인자를 선정하고, 선형이진분류법(Liner binary classifiers)과 ROC분석(Receiver Operation Characteristics)을 사용하여 실제 홍수유역을 유사하게 모의하는 최적 지형학적 인자를 도출하고, 이를 기반으로 광역 홍수범람지도를 작성하는 방안을 제시한다. 본 연구에서 제시하는 방법론의 정확도 검증을 위해 북한(2007), 방글라데시(2007), 인도네시아(2010), 태국(2011), 미얀마(2015) 5개국의 대규모 홍수범람에 대해 적용하였다. 실제 홍수범람 영상정보에서 획득된 침수면적과의 공간적 비교 검토 결과, 최저(38%, 방글라데시), 최고(78%)으로 평균적으로 약 60%의 정확도를 나타내는 것으로 분석되었다. 본 연구에서 제시하는 지형학적 인자 기반의 홍수범람지도 작성방법은 미계측유역에 대해서도 DEM만을 사용하여 홍수위험 지역을 쉽게 구분할 수 있다는 장점을 가지고 있어 1 2차원 범람해석 모형의 적용이 어려운 대유역에 대해 홍수범람 우려지역에 대한 공간정보를 제공해줄 수 있을 것으로 판단된다.

개선된 데이터마이닝을 위한 혼합 학습구조의 제시 (Hybrid Learning Architectures for Advanced Data Mining:An Application to Binary Classification for Fraud Management)

  • Kim, Steven H.;Shin, Sung-Woo
    • 정보기술응용연구
    • /
    • 제1권
    • /
    • pp.173-211
    • /
    • 1999
  • The task of classification permeates all walks of life, from business and economics to science and public policy. In this context, nonlinear techniques from artificial intelligence have often proven to be more effective than the methods of classical statistics. The objective of knowledge discovery and data mining is to support decision making through the effective use of information. The automated approach to knowledge discovery is especially useful when dealing with large data sets or complex relationships. For many applications, automated software may find subtle patterns which escape the notice of manual analysis, or whose complexity exceeds the cognitive capabilities of humans. This paper explores the utility of a collaborative learning approach involving integrated models in the preprocessing and postprocessing stages. For instance, a genetic algorithm effects feature-weight optimization in a preprocessing module. Moreover, an inductive tree, artificial neural network (ANN), and k-nearest neighbor (kNN) techniques serve as postprocessing modules. More specifically, the postprocessors act as second0order classifiers which determine the best first-order classifier on a case-by-case basis. In addition to the second-order models, a voting scheme is investigated as a simple, but efficient, postprocessing model. The first-order models consist of statistical and machine learning models such as logistic regression (logit), multivariate discriminant analysis (MDA), ANN, and kNN. The genetic algorithm, inductive decision tree, and voting scheme act as kernel modules for collaborative learning. These ideas are explored against the background of a practical application relating to financial fraud management which exemplifies a binary classification problem.

  • PDF

Customer Level Classification Model Using Ordinal Multiclass Support Vector Machines

  • Kim, Kyoung-Jae;Ahn, Hyun-Chul
    • Asia pacific journal of information systems
    • /
    • 제20권2호
    • /
    • pp.23-37
    • /
    • 2010
  • Conventional Support Vector Machines (SVMs) have been utilized as classifiers for binary classification problems. However, certain real world problems, including corporate bond rating, cannot be addressed by binary classifiers because these are multi-class problems. For this reason, numerous studies have attempted to transform the original SVM into a multiclass classifier. These studies, however, have only considered nominal classification problems. Thus, these approaches have been limited by the existence of multiclass classification problems where classes are not nominal but ordinal in real world, such as corporate bond rating and multiclass customer classification. In this study, we adopt a novel multiclass SVM which can address ordinal classification problems using ordinal pairwise partitioning (OPP). The proposed model in our study may use fewer classifiers, but it classifies more accurately because it considers the characteristics of the order of the classes. Although it can be applied to all kinds of ordinal multiclass classification problems, most prior studies have applied it to finance area like bond rating. Thus, this study applies it to a real world customer level classification case for implementing customer relationship management. The result shows that the ordinal multiclass SVM model may also be effective for customer level classification.

단어 중의성 해소를 위한 SVM 분류기 최적화에 관한 연구 (A Study on Optimization of Support Vector Machine Classifier for Word Sense Disambiguation)

  • 이용구
    • 정보관리연구
    • /
    • 제42권2호
    • /
    • pp.193-210
    • /
    • 2011
  • 이 연구는 단어 중의성 해소를 위해 SVM 분류기가 최적의 성능을 가져오는 문맥창의 크기와 다양한 가중치 방법을 파악하고자 하였다. 실험집단으로 한글 신문기사를 적용하였다. 문맥창의 크기로 지역 문맥은 좌우 3단어, 한 문장, 그리고 좌우 50바이트 크기를 사용하였으며, 전역문맥으로 신문기사 전체를 대상으로 하였다. 가중치 부여 기법으로는 단순빈도인 이진 단어빈도와 단순 단어빈도를, 정규화 빈도로 단순 또는 로그를 취한 단어빈도 ${\times}$ 역문헌빈도를 사용하였다. 실험 결과 문맥창의 크기는 좌우 50 바이트가 가장 좋은 성능을 보였으며, 가중치 부여 방법은 이진 단어빈도가 가장 좋은 성능을 보였다.

다중 클래스 아다부스트 알고리즘 (Multiclass-based AdaBoost Algorithm)

  • 김태현;박동철
    • 전자공학회논문지CI
    • /
    • 제48권1호
    • /
    • pp.44-50
    • /
    • 2011
  • 본 논문은 다중 클래스 데이터의 효율적 분류를 위한 새로운 아다부스트 알고리즘을 제안한다. 기존의 아다부스트 알고리즘은 기본적으로 이진 분류기이므로 다중 클래스 데이터 분류의 적용에는 매우 제한적이었다. 이를 극복하기 위하여 제안된 알고리즘은 여러 개의 이진 분류기 대신 하나의 다중 분류기를 약 분류기로 사용함으로써 학습시간을 단축시키고 안정적인 정확도를 얻을 수 있는 장점이 있다. 제안하는 알고리즘의 성능을 평가하기 위하여 Caltech 영상 데이터베이스에서 4가지클래스의 영상 데이터를 총 800개 수집하여 영상 분류 실험을 진행하였다. 실험의 결과 제안된 다중 클래스 아다부스트 알고리즘은 Adaboost.M2 알고리즘에 비해 분류정확도는 대등한 결과를 얻었지만, 학습시간을 학습단계에 따라 83.1%까지 감소시킬 수 있었다.

Seismic risk priority classification of reinforced concrete buildings based on a predictive model

  • Isil Sanri Karapinar;Ayse E. Ozsoy Ozbay;Emin Ciftci
    • Structural Engineering and Mechanics
    • /
    • 제91권3호
    • /
    • pp.279-289
    • /
    • 2024
  • The purpose of this study is to represent a useful alternative for the preliminary seismic vulnerability assessment of existing reinforced concrete buildings by introducing a statistical approach employing the binary logistic regression technique. Two different predictive statistical models, namely full and reduced models, were generated utilizing building characteristics obtained from the damage database compiled after 1999 Düzce earthquake. Among the inspected building parameters, number of stories, overhang ratio, priority index, soft story index, normalized redundancy ratio and normalized lateral stiffness index were specifically selected as the predictor variables for vulnerability classification. As a result, normalized redundancy ratio and soft story index were identified as the most significant predictors affecting seismic vulnerability in terms of life safety performance level. In conclusion, it is revealed that both models are capable of classifying the set of buildings being severely damaged or collapsed with a balanced accuracy of 73%, hence, both are able to filter out high-priority buildings for life safety performance assessment. Thus, in this study, having the same high accuracy as the full model, the reduced model using fewer predictors is proposed as a simple and viable classifier for determining life safety levels of reinforced concrete buildings in the preliminary seismic risk assessment.

Multitree 형상 인식 기법의 성능 개선에 관한 연구 (A Study on the Improvement of Multitree Pattern Recognition Algorithm)

  • 김태성;이정희;김성대
    • 한국통신학회논문지
    • /
    • 제14권4호
    • /
    • pp.348-359
    • /
    • 1989
  • 본 논문은 [1]와 [2]에 의해 제안된 multitree 형상 인식 기법의 성능 개선에 관한 논문이다. Multitree 형상 인식 기법의 기본적인 생각은, Classifier 설계과정에서 각 특징별로 Binary Decision Tree 를 구성하고, 이들의 탐색 순서를 결정하며, 인식 과정에서는 앞에서 정한 탐색 순서에 의거하여, BDT(Binary Decision Tree)를 탐색해 나간다는 것이다. 이때 BDT를 추가하여 탐색하기 전에 그때까지 얻은 정보를 이용하여 입력 물체를 인식할 수 있는지에 대한 여부를 결정하며, 인식이 가능한 경우 BDT의 탐색을 멈추고, 인식이 불가능한 경우 BDT의 탐색을 계속해 나간다. 이 방법은 BDT를 각 특징별로 만들기 때문에 새로운 특징의 삭제나 첨가가 상당히 용이하며 인식에 사용되는 특징의 갯수가 감소하게 된다. 따라서 이 알고리즘은 특징의 수가 많거나 class수가 많을 경우 쉽게 이용될 수 있다. 본 논문은 각 특징에서 구한 근사화된 확률 분포로부터 입력 특징값에 대한 확률값을 구해 인식에 이용하였으며, 이 값을 이용한ㄴ 여러가지 인식 방법을 제안하였다. 그리고 Branch and Bound 방법을 사용하여 특징의 선택 순서와 탐색 범위를 구하였다. 위에서 제안한 것들을 실험한 결과 기존의 multitree형상 인식 기법보다 본 논문에서 제안한 기법의 성능이 향상되었다.

  • PDF

WLDF: Effective Statistical Shape Feature for Cracked Tongue Recognition

  • Li, Xiao-qiang;Wang, Dan;Cui, Qing
    • Journal of Electrical Engineering and Technology
    • /
    • 제12권1호
    • /
    • pp.420-427
    • /
    • 2017
  • This paper proposes a new method using Wide Line Detector based statistical shape Feature (WLDF) to identify whether or not a tongue is cracked; a cracked tongue is one of the most frequently used visible features for diagnosis in traditional Chinese Medicine (TCM). We first detected a wide line in the tongue image, and then extracted WLDF, such as the maximum length of each detected region, and the ratio between maximum length and the area of the detected region. We trained a binary support vector machine (SVM) based on the WLDF to build a classifier for cracked tongues. We conducted an experiment based on our proposed scheme, using 196 samples of cracked tongues and 245 samples of non-cracked tongues. The results of the experiment indicate that the recognition accuracy of the proposed method is greater than 95%. In addition, we provide an analysis of the results of this experiment with different parameters, demonstrating the feasibility and effectiveness of the proposed scheme.

컴퓨터 모니터용 유리 패널의 문자 마크 인식 (Recognition of Patterns and Marks on the Glass Panel of Computer Monitor)

  • 안인모;이기상
    • 전기학회논문지P
    • /
    • 제52권1호
    • /
    • pp.35-41
    • /
    • 2003
  • In this paper, a machine vision system for recognizing and classifying the patterns and marks engraved by die molding or laser marking on the glass panels of computer monitors is suggested and evaluated experimentally. The vision system is equipped with a neural network and an NGC pattern classifier including searching process based on normalized grayscale correlation and adaptive binarization. This system is found to be applicable even to the cases in which the segmentation of the pattern area from the background using ordinary blob coloring technique is quite difficult. The inspection process is accomplished by the use of the NGC hypothesis and ANN verification. The proposed pattern recognition system is composed of three parts: NGC matching process and the preprocessing unit for acquiring the best quality of binary image data, a neural network-based recognition algorithm, and the learning algorithm for the neural network. Another contribution of this paper is the method of generating the training patterns from only a few typical product samples in place of real images of all types of good products.

유전자 알고리즘을 결합한 Support Vector Machine의 화자인증에서의 성능분석 (Speaker Verification System Using Support Vector Machine with Genetic Algorithms)

  • 최우용;이경희;반성범
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 신호처리소사이어티 추계학술대회 논문집
    • /
    • pp.557-560
    • /
    • 2003
  • Voice is one of the promising biometrics because it is one of the most convenient ways human would distinguish someone from others. The target of speaker verification is to divide the client from imposters. Support Vector Machine(SVM) is in the limelight as a binary classifier, so it can work well in speaker verification. In this paper, we combined SVM with genetic algorithm(GA) to reduce the dimensionality of input feature. Experiments were conducted with Korean connected digit database using different feature dimensions. The verification accuracy of SVM with GA is slightly lower than that of SVM, but the proposed algorithm has greater strength in the memory limited systems.

  • PDF