• 제목/요약/키워드: 최적분류점

Search Result 120, Processing Time 0.03 seconds

Classification accuracy measures with minimum error rate for normal mixture (정규혼합분포에서 최소오류의 분류정확도 측도)

  • Hong, C.S.;Lin, Meihua;Hong, S.W.;Kim, G.C.
    • Journal of the Korean Data and Information Science Society
    • /
    • v.22 no.4
    • /
    • pp.619-630
    • /
    • 2011
  • In order to estimate an appropriate threshold and evaluate its performance for the data mixed with two different distributions, nine kinds of well-known classification accuracy measures such as MVD, Youden's index, the closest-to- (0,1) criterion, the amended closest-to- (0,1) criterion, SSS, symmetry point, accuracy area, TA, TR are clustered into five categories on the basis of their characters. In credit evaluation study, it is assumed that the score random variable follows normal mixture distributions of the default and non-default states. For various normal mixtures, optimal cut-off points for classification measures belong to each category are obtained and type I and II error rates corresponding to these cut-off points are calculated. Then we explore the cases when these error rates are minimized. If normal mixtures might be estimated for these kinds of real data, we could make use of results of this study to select the best classification accuracy measure which has the minimum error rate.

Comparing the Performances of Intent Classifications by Encoder Layer (Encoder Layer를 이용한 의도 분류 성능 비교)

  • Ahn, Hyeok-Ju;Kim, Hye-Young
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.410-413
    • /
    • 2021
  • 본 논문에서는 분류 모델의 주류로 사용되고 있는 Encoder 기반 사전학습 모델(BERT, ALBERT, ELECTRA)의 내부 Encoder Layer가 하부 Layer에서는 Syntactic한 분석을 진행하고 상부 Layer로 갈수록 Semantic 한 분석을 진행하는 점, Layer가 구성됨에 따라 Semantic 정보가 Syntactic 정보를 개선해 나간다 점에 기반한 기존 연구 결과를 바탕으로 Encoder Layer를 구성함에 따라 어떻게 성능이 변화하는지 측정한다. 그리고 의도 분류를 위한 학습 데이터 셋도 분류하고자 하는 성격에 따라 Syntactic한 구성과 Semantic한 구성을 보인다는 점에 착안하여 ALBERT 및 ELECTRA를 이용한 의도 분류 모델을 구축하고 각 데이터 셋에 맞는 최적의 Encoder Layer 구성을 가지는 모델을 비교한 결과, 두 데이터 셋 간에 다른 Layer 구성을 보이는 점과 기존 모델보다 성능이 향상됨을 확인하였다.

  • PDF

A Prediction of Coal Ash Slagging for Entrained Flow Gasifiers (분류층 석탄가스화기 Slag 용융특성 예측)

  • Koo, Jahyung;Kim, Bongkeum;Kim, Youseok
    • 한국신재생에너지학회:학술대회논문집
    • /
    • 2010.06a
    • /
    • pp.108.1-108.1
    • /
    • 2010
  • 분류층 가스화기는 석탄과 산소(공기) 및 수증기가 반응하여 $1200{\sim}1600^{\circ}C$의 고온, 20~60기압의 고압에서 작동되어 합성가스를 생성하며 합성가스에 포함된 입자 및 황화합물 등을 정제설비를 통하여 정제 후 발전 및 화학원료로 사용한다. 석탄가스화 중 석탄에 포함된 대부분의 회분은 용융슬래그 형태로 가스화기 벽면을 따라 흘러 내려 가스화기 하부의 냉각수조에서 급랭되어 배출된다. 이때 용융슬래그의 원활한 배출을 위해서는 일정범위의 점도를 유지하는 것이 필요하다. 슬래그의 점도는 가스화기 온도 및 Ash의 조성에 따라 크게 변하며 가스화기 설계 및 운전 시 매우 중요한 변수이다. 따라서 최적의 설계 및 운전을 위해서는 Ash의 점도예측이 중요하며, 분류층 가스화기내부에서 Ash 점도 예측을 위한 DooVisco 프로그램을 개발하였다. DooVisco는 가스화기 내부에서 슬래그 용융온도 및 온도별 점도, 가스화기 최소 운전온도 및 석회석 투입 효과 분석뿐만 아니라 석탄의 혼합 사용 시의 특성 예측도 가능하도록 개발되었다. DooVisco는 슬래그 주요 4성분인 SiO2, Al2O3, CaO, FeO 성분에 대한 Phase Diagram을 이용하여 1차적으로 슬래그용융온도(Liquidus Temperature)를 예측하고, 주요 4 성분 외에 Na2O, MgO, K2O, TiO2 등을 고려한 Kalmanovich Model을 이용하여 점도를 예측한다. 최종적으로 슬래그 용융온도와 점도를 활용하여 분류층 가스화기 운전가능 온도범위를 예측한다. 개발된 DooVisco를 활용하여 300MW급 실증 IGCC 플랜트에 사용가능성이 있는 석탄을 대상으로 슬래그의 용융온도 및 점도 등을 예측하였으며 최적 운전을 위한 슬form점도 조절용 Flux인 석회석 투입량 등을 평가하였다. 평가 결과 슬래그 용융온도가 $1700^{\circ}C$ 이상으로 석회석 투입이 필요하다고 판단되었다. 약 가스화기 내부 온도를 $1500^{\circ}C$ 정도에서 원활한 운전을 위해서는 석탄 대비 약 10% 내외의 석회석 투입이 필요할 것으로 평가되었다. DooVisco는 분류층 가스화기 설 계시 가스화기 최적 운전 온도 설정 및 Flux 투입필요성, 종류, 투입량 선정에 활용될 수 있을 뿐만 아니라 플랜트 운전시 석탄의 탄종 적합성 등을 판단하는데 활용될 수 있을 것이라 판단된다.

  • PDF

The database construction of a classification system using an optimal cluster analysis model (최적 클러스터 분석 모델을 이용한 분류시스템의 데이터베이스 구축)

  • 이현숙
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.23 no.4
    • /
    • pp.1045-1050
    • /
    • 1998
  • Classification techniques are often an importand component of intelligent systems and are use for both deta preprocessing and decision making. In the design of a classification system, the labled samples must be given to provide a priori information for the classification. Moreover, the number of classes to be categorized must be known a priori information, called OFCAM. In OFCAM, an unsupervised by OFCAM, the database of a classification system, called PCSDB, is constructed. Then, PCSDB can be effectively used in the decision process of the system.

  • PDF

Optimal Criterion of Classification Accuracy Measures for Normal Mixture (정규혼합에서 분류정확도 측도들의 최적기준)

  • Yoo, Hyun-Sang;Hong, Chong-Sun
    • Communications for Statistical Applications and Methods
    • /
    • v.18 no.3
    • /
    • pp.343-355
    • /
    • 2011
  • For a data with the assumption of the mixture distribution, it is important to find an appropriate threshold and evaluate its performance. The relationship is found of well-known nine classification accuracy measures such as MVD, Youden's index, the closest-to-(0, 1) criterion, the amended closest-to-(0, 1) criterion, SSS, symmetry point, accuracy area, TA, TR. Then some conditions of these measures are categorized into seven groups. Under the normal mixture assumption, we calculate thresholds based on these measures and obtain the corresponding type I and II errors. We could explore that which classification measure has minimum type I and II errors for estimated mixture distribution to understand the strength and weakness of these classification measures.

Feature Extraction based on Auto Regressive Modeling and an Premature Contraction Arrhythmia Classification using Support Vector Machine (Auto Regressive모델링 기반의 특징점 추출과 Support Vector Machine을 통한 조기수축 부정맥 분류)

  • Cho, Ik-sung;Kwon, Hyeog-soong;Kim, Joo-man;Kim, Seon-jong
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.23 no.2
    • /
    • pp.117-126
    • /
    • 2019
  • Legacy study for detecting arrhythmia have mostly used nonlinear method to increase classification accuracy. Most methods are complex to process and manipulate data and have difficulties in classifying various arrhythmias. Therefore it is necessary to classify various arrhythmia based on short-term data. In this study, we propose a feature extraction based on auto regressive modeling and an premature contraction arrhythmia classification method using SVM., For this purpose, the R-wave is detected in the ECG signal from which noise has been removed, QRS and RR interval segment is modelled. Also, we classified Normal, PVC, PAC through SVM in realtime by extracting four optimal segment length and AR order. The detection and classification rate of R wave and PVC is evaluated through MIT-BIH arrhythmia database. The performance results indicate the average of 99.77% in R wave detection and 99.23%, 97.28%, 96.62% in Normal, PVC, PAC classification.

Detailed Recognition of Similar Characters Based on Optimum Linear Transform (최적선형변환에 의한 유사문자의 상세분류인식)

  • 김형원;김성원;양윤모
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.493-495
    • /
    • 2001
  • 본 논문에서는 문자 인식에서 두 단계의 식별과정을 통하여 인식률을 향상시키는 방법에 대하여 연구하였다. 한글 문자인식에서의 어려움은 인식대상 클래스가 많고 유사문자가 많은 반면, 여러 폰트의 글자를 하나의 글자를 하나의 클래스로 할 경우에는 그 문자의 분산이 더욱 커지게 되는 점이다. 따라서 본 연구에서는 문자의 분포를 고려하여 거리를 계산하는 Bayes에 의한 식별 함수를 1단계 인식과정에서 사용하여 1위 후보문자를 인식하였다. 2단계에서는 미리 준비된 1위 후부문자의 유사문자세트의 최적선형변환 공간에서 상세분류를 행하였다. 결과적으로 1단계의 Bayes거리반에 의한 인식률(91.1%)보다도, 또한 처음부터 모든 클래스에 대하여 최적선형변환에 의한 인식률(87.9%)보다 좋은 결과(92.9%)를 얻게되었다. 이로서 1단계의 대규모 문자세트에 대한 대분류에서는 문자의 분포를 고려하는 Bayes에 의한 인식이 유효하고, 2단계의 최적선형변환에 의한 인식은 소수의 유사문자들에 대한 변별력을 높이는데 유효함을 입증하였다.

  • PDF

Bivariate ROC Curve (이변량 ROC곡선)

  • Hong, C.S.;Kim, G.C.;Jeong, J.A.
    • Communications for Statistical Applications and Methods
    • /
    • v.19 no.2
    • /
    • pp.277-286
    • /
    • 2012
  • For credit assessment models, the ROC curves evaluate the classification performance using two univariate cumulative distribution functions of the false positive rate and true positive rate. In this paper, it is extended to two bivariate normal distribution functions of default and non-default borrowers; in addition, the bivariate ROC curves are proposed to represent the joint cumulative distribution functions by making use of the linear function that passes though the mean vectors of two score random variables. We explore the classification performance based on these ROC curves obtained from various bivariate normal distributions, and analyze with the corresponding AUROC. The optimal threshold could be derived from the bivariate ROC curve using many well known classification criteria and it is possible to establish an optimal cut-off criteria of bivariate mixture distribution functions.

전자해도 수심객체 최적표현 방안 연구

  • O, Se-Ung;Go, Hyeon-Ju;Park, Jong-Min;Lee, Mun-Jin
    • Proceedings of the Korean Institute of Navigation and Port Research Conference
    • /
    • 2010.10a
    • /
    • pp.7-9
    • /
    • 2010
  • 전자해도에는 해안선, 등심선, 수심, 항로표지, 위험물, 항로 등 선박의 항해와 관련된 모든 해도정보를 포함하고 있으며, 각 정보는 속성정보와 공간정보를 가지고 데이터 레코드 단위로 저장된다. 수심 정보의 경우 점 형태의 공간정보로서 전자해도 격자 구역에 포함되는 수백에서 수천 개의 수심 위경도 좌표와 수심정보를 포함하고 있다. 수심 정보는 전자해도 중첩의 주된 원인이 되어 수심정보의 최적표현 기법 개발이 요구되었다. 본 연구에서는 전자해도 수심정보의 표현 기준을 수립하고, 기준에 따라 수심정보의 최적표현 방법을 제안하였다. 세부 내용으로 전자해도 수심정보 표현기준을 작성하고 전자해도에서 수심정보를 추출한 다음 기준에 따라 수심정보를 분류 하였다. 또한 분류한 수심정보를 전자해도에 저장하고 그 결과를 확인 하였다.

  • PDF

Block Classifier for Fractal Image Coding (프랙탈 영상 부호화용 블럭 분류기)

  • Park, Gyeong-Bae;Jeong, U-Seok;Kim, Jeong-Il;Jeong, Geun-Won;Lee, Gwang-Bae;Kim, Hyeon-Uk
    • The Transactions of the Korea Information Processing Society
    • /
    • v.2 no.5
    • /
    • pp.691-700
    • /
    • 1995
  • Most fractal image codings using fractal concept require long encoding time because a large amount of computation is needed to find an optimal affine transformation point. Such a problem can be solved by designing a block classifier fitted to characteristics of image blocks. In general, it is possible to predict more precise and various types of blocks in frequency domain than in spatial domain. In this paper, we propose a block classifier to predict the block type using characteristics of DCT(Discrete Cosine Transform). This classifier has merits to enhance the quality of decoded images as well as to reduce the encoding time meeting fractal features. AC coefficient values in frequency domain make it possible to predict various types of blocks. As the results, the number of comparisons between a range block and the correspoding domain blocks to reach an optimal affine transformation point can be reduced. Specially, signs of DCT coefficients help to find the optimal affine transformation point with only two isometric transformations by eliminating unnecessary isometric transformations among eight isometric transformations used in traditional fractal codings.

  • PDF