• Title/Summary/Keyword: 최적분류기준

Search Result 118, Processing Time 0.038 seconds

Alternative Optimal Threshold Criteria: MFR (대안적인 분류기준: 오분류율곱)

  • Hong, Chong Sun;Kim, Hyomin Alex;Kim, Dong Kyu
    • The Korean Journal of Applied Statistics
    • /
    • v.27 no.5
    • /
    • pp.773-786
    • /
    • 2014
  • We propose the multiplication of false rates (MFR) which is a classification accuracy criteria and an area type of rectangle from ROC curve. Optimal threshold obtained using MFR is compared with other criteria in terms of classification performance. Their optimal thresholds for various distribution functions are also found; consequently, some properties and advantages of MFR are discussed by comparing FNR and FPR corresponding to optimal thresholds. Based on general cost function, cost ratios of optimal thresholds are computed using various classification criteria. The cost ratios for cost curves are observed so that the advantages of MFR are explored. Furthermore, the de nition of MFR is extended to multi-dimensional ROC analysis and the relations of classification criteria are also discussed.

전자해도 수심객체 최적표현 방안 연구

  • O, Se-Ung;Go, Hyeon-Ju;Park, Jong-Min;Lee, Mun-Jin
    • Proceedings of the Korean Institute of Navigation and Port Research Conference
    • /
    • 2010.10a
    • /
    • pp.7-9
    • /
    • 2010
  • 전자해도에는 해안선, 등심선, 수심, 항로표지, 위험물, 항로 등 선박의 항해와 관련된 모든 해도정보를 포함하고 있으며, 각 정보는 속성정보와 공간정보를 가지고 데이터 레코드 단위로 저장된다. 수심 정보의 경우 점 형태의 공간정보로서 전자해도 격자 구역에 포함되는 수백에서 수천 개의 수심 위경도 좌표와 수심정보를 포함하고 있다. 수심 정보는 전자해도 중첩의 주된 원인이 되어 수심정보의 최적표현 기법 개발이 요구되었다. 본 연구에서는 전자해도 수심정보의 표현 기준을 수립하고, 기준에 따라 수심정보의 최적표현 방법을 제안하였다. 세부 내용으로 전자해도 수심정보 표현기준을 작성하고 전자해도에서 수심정보를 추출한 다음 기준에 따라 수심정보를 분류 하였다. 또한 분류한 수심정보를 전자해도에 저장하고 그 결과를 확인 하였다.

  • PDF

Bivariate ROC Curve (이변량 ROC곡선)

  • Hong, C.S.;Kim, G.C.;Jeong, J.A.
    • Communications for Statistical Applications and Methods
    • /
    • v.19 no.2
    • /
    • pp.277-286
    • /
    • 2012
  • For credit assessment models, the ROC curves evaluate the classification performance using two univariate cumulative distribution functions of the false positive rate and true positive rate. In this paper, it is extended to two bivariate normal distribution functions of default and non-default borrowers; in addition, the bivariate ROC curves are proposed to represent the joint cumulative distribution functions by making use of the linear function that passes though the mean vectors of two score random variables. We explore the classification performance based on these ROC curves obtained from various bivariate normal distributions, and analyze with the corresponding AUROC. The optimal threshold could be derived from the bivariate ROC curve using many well known classification criteria and it is possible to establish an optimal cut-off criteria of bivariate mixture distribution functions.

Selecting the optimal threshold based on impurity index in imbalanced classification (불균형 자료에서 불순도 지수를 활용한 분류 임계값 선택)

  • Jang, Shuin;Yeo, In-Kwon
    • The Korean Journal of Applied Statistics
    • /
    • v.34 no.5
    • /
    • pp.711-721
    • /
    • 2021
  • In this paper, we propose the method of adjusting thresholds using impurity indices in classification analysis on imbalanced data. Suppose the minority category is Positive and the majority category is Negative for the imbalanced binomial data. When categories are determined based on the commonly used 0.5 basis, the specificity tends to be high in unbalanced data while the sensitivity is relatively low. Increasing sensitivity is important when proper classification of objects in minority categories is relatively important. We explore how to increase sensitivity through adjusting thresholds. Existing studies have adjusted thresholds based on measures such as G-Mean and F1-score, but in this paper, we propose a method to select optimal thresholds using the chi-square statistic of CHAID, the Gini index of CART, and the entropy of C4.5. We also introduce how to get a possible unique value when multiple optimal thresholds are obtained. Empirical analysis shows what improvements have been made compared to the results based on 0.5 through classification performance metrics.

Optimal Criterion of Classification Accuracy Measures for Normal Mixture (정규혼합에서 분류정확도 측도들의 최적기준)

  • Yoo, Hyun-Sang;Hong, Chong-Sun
    • Communications for Statistical Applications and Methods
    • /
    • v.18 no.3
    • /
    • pp.343-355
    • /
    • 2011
  • For a data with the assumption of the mixture distribution, it is important to find an appropriate threshold and evaluate its performance. The relationship is found of well-known nine classification accuracy measures such as MVD, Youden's index, the closest-to-(0, 1) criterion, the amended closest-to-(0, 1) criterion, SSS, symmetry point, accuracy area, TA, TR. Then some conditions of these measures are categorized into seven groups. Under the normal mixture assumption, we calculate thresholds based on these measures and obtain the corresponding type I and II errors. We could explore that which classification measure has minimum type I and II errors for estimated mixture distribution to understand the strength and weakness of these classification measures.

Development of the GIS Method for Extracting a Specific Geomorphic Surface of Coastal Terrace at Gampo Area, Southeastern Coast in Korea (GIS를 이용한 해안단구 지형면 분류 기법 연구 - 감포지역을 사례로 -)

  • 박한산;윤순옥;황상일
    • Journal of the Korean Geographical Society
    • /
    • v.36 no.4
    • /
    • pp.458-473
    • /
    • 2001
  • The classified map of geomorphic surfaces is the most basic data for the geomorphological research. Up to recent days, the traditional methods extracting specific geomorphic surfaces are accomplished by analyzing the aerial photographs and topographical maps, and field works. Also it needs a lot of time and expertness. Furthermore it is difficult to gain the aerial photographs in Korea. Since digital maps in Korean Peninsula are almost completed recently, we tried to extract specific surfaces by analyzing the characteristics of marine terraces based on the level of paleoshoreline and slope analysis on the terrace surface using GIS. However, research used GIS was hardly found up to date, therefore many problems are not be solved yet. The aim of this study is to develop the more efficient and objective method for the extraction and classification of specific geomorphic surfaces by using GIS in Gampo-eup, Gyeongju city, Southeastem Coast in Korea, where a lot of traditional research has already accomplished. For this aim, we have designed the process of extracting specific geomorphic surfaces, chosen the factors that was Gyeongiu city, Southeastem Coast in Korea, where a lot of traditional research has already accomplished. For this aim, we have designed the process of extracting specific geomorphic surfaces, chosen the factors that was suitable for classification of specific geomorphic surface, and presented method of setting up optimum criteria of extraction. As last, effectiveness and problems of these methods were investigated through conincidence rate and error rate.

  • PDF

Kernel Pattern Recognition using K-means Clustering Method (K-평균 군집방법을 이요한 가중커널분류기)

  • 백장선;심정욱
    • The Korean Journal of Applied Statistics
    • /
    • v.13 no.2
    • /
    • pp.447-455
    • /
    • 2000
  • We propose a weighted kernel pattern recognition method using the K -means clustering algorithm to reduce computation and storage required for the full kernel classifier. This technique finds a set of reference vectors and weights which are used to approximate the kernel classifier. Since the hierarchical clustering method implemented in the 'Weighted Parzen Window (WP\V) classifier is not able to rearrange the proper clusters, we adopt the K -means algorithm to find reference vectors and weights from the more properly rearranged clusters \Ve find that the proposed method outperforms the \VP\V method for the repre~entativeness of the reference vectors and the data reduction.

  • PDF

A Pre-Study on the Estimation of NPP Decommissioning Radioactive Waste and Disposal costs for Applying New Classification Criteria (신 분류기준을 적용하기 위한 원전 해체폐기물량 및 처분 비용 산정에 대한 사전 연구)

  • Song, Jong Soon;Kim, Young-Guk;Lee, Sang-Heon
    • Journal of Nuclear Fuel Cycle and Waste Technology(JNFCWT)
    • /
    • v.13 no.1
    • /
    • pp.45-53
    • /
    • 2015
  • Since the commercial operation of Kori Unit #1 nuclear power plant(NPP) started in 1978, 23 units at present are operating in Korea. Radioactive wastes will be steadily generated from these units and accumulated. In addition, the life-extension of NPPs, construction of new NPPs and decontamination and decommissioning research facilities will cause radioactive wastes to increase. Recently, Korea has revised the new classification criteria as was proposed by IAEA. According to the revised classification criteria, low-level, very-low-level and exempt waste are estimated to about 98% of total disposal amount. In this paper, current status of overseas cases and disposal method with new classification criteria are analyzed to propose the most reasonable method for estimating the amount of decommissioning waste when applying the new criteria.

분산 환경하에서의 데이타관리 분류체계에 대한 연구

  • 박주석;편흥렬
    • Proceedings of the Korean Operations and Management Science Society Conference
    • /
    • 1994.04a
    • /
    • pp.49-57
    • /
    • 1994
  • 진정한 의미의 다운사이징을 구현하기 위해서는 필요한 분산데이타베이스의 구현은 현재 여러가지 기술적인 문제점들을 안고 있다. 따라서 동시성 제어(concurrency control)와 갱신 (update propagation), 복구(recovery), 질의어 처리(query processing), 카달로그 관리(catalog management)등과 같은 분산 환경에서의 데이타베이스에 관련된 기술적인 문제점들을 해결하기 위해서는 어떠한 최적의 방법들을 개발해야만 한다. 이러한 방법들의 개발은 관계형 데이타베이스의 데이타관리 분류체계를 통한 대안들의 선택과 운용에 의해 가능할 것이다. 분산 환경하에서 사용되어질 수 있는 관계형 데이타베이스의 데이타관리 분류체계를 availability, expression, currency의 관점에서 Basic table과 view로 구분하여 정립해 보았다. Basic table은 current update가 필수적이므로 availability와 expression의 관점에서 분류하였고, view는 physical file의 존재성 유무와 시간적 실행의 차이를 기준으로 분류하였다. 그리고 이러한 분류기준에 따른 특성들을 분산데이타베이스 구축에 이용하는 방법들에 대해 이야기 하였다. 다시 말해 non-current materialized view 뿐만 아니라 current materialized view를 동시에 지원하는 하나의 distributed view update architecture를 개발하는 것에 대해 하나의 방법으로 제시하였다. 즉 immediate update와 deferred update는 current view를 이용하고 periodical update는 non-current view를 이용하여 100%의 distributed data resources를 관리 할 수 있는 효율적인 distributed system를 개발하는 것을 제시하였다. 본 논문은 데이타베이스론의 입장에서 아직 정립되어 있지 않은 분산 환경하에서의 관계형 데이타베이스의 데이타관리의 분류체계를 나름대로 정립하였다는데 그 의의가 있다. 또한 이것의 응용은 현재 분산데이타베이스 구축에 있어 나타나는 기술적인 문제점들을 어느정도 보완할 수 있다는 점에서 그 중요성이 있다.

A study on changes in runoff characteristics through period classification of SSP scenarios (SSP 시나리오의 기간 구분을 통한 유출 특성 변화 연구)

  • Nam Ki Moon;Dong Hyeok Park;Sang Woo Yim;Jaehyun Ahn
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2023.05a
    • /
    • pp.393-393
    • /
    • 2023
  • 최근 기후변화에 대한 관심이 높아짐에 따라 전 세계적으로 미래 기후변화 예측 전망에 대한 다양한 연구들이 수행되었으며, 특히 IPCC(Intergovernmental Panel on Climate Change)의 기후변화 6차 보고서에 채택된 SSP(Shared Socio-economic Pathway) 시나리오를 이용한 연구가 활발한 상황이다. 이들 연구에서는 미래 기후변화의 양상 비교를 위한 기간 구분은 통상적으로 F1(2011-2040), F2(2041-2070), F3(2071-2100)으로 구성된다. 하지만 이는 단순하게 동일한 기간으로 나누어 설정한 것으로, 통계적 근거가 부족할 뿐만 아니라 변화 추이를 확인하기 위한 수단으로 사용하기에 부족할 수 있다는 한계점이 존재한다. 이 연구에서는 기후변화 패턴에 대한 기존 연구의 한계, 특히 미래 기후변화를 비교하기 위해 사용되는 기간 분류와 관련하여 한계점을 보완하고자 한다. SSP 시나리오 모델 중 UKESM1 모델을 활용하여 ASOS(Automated Synoptic Observation System) 기상관측소 기준 59개 지점에서 추출한 강수량 데이터를 분석하였다. 이후, 기후변화 비교를 위한 최적의 분류를 결정하기 위해 장마철인 6월부터 9월까지의 강수 데이터에 대해 통계분석 및 Pettitt 검정을 수행해 최적 기간을 산정하였다. 이를 통해 기존의 F1, F2, F3 분류 방식과 통계분석을 통해 도출한 최적 시기의 유출 특성 분석결과의 변화양상을 비교하였으며, 각 방법에 대한 비교를 통해 기후변화 추이에 대한 이해를 제공할 수 있을 것으로 판단하였다. 결과적으로 이 연구는 기후변화 시나리오를 활용하는 연구 수행 시 기간 구분에 대한 발전된 접근 방식을 제시하고자 한다.

  • PDF