• Title/Summary/Keyword: Misclassification probability

Search Result 33, Processing Time 0.027 seconds

판별식(判別式)에 의한 수목분류법(樹木分類法)에 관(關)하여 (I) -독일(獨逸)가문비와 종비(樅榧)나무와의 판별분석(判別分析)- (On the Distinction between Picea koraiensis Nak. and Picea abies(L.) Karsten based on the Discriminant Function (I))

  • 이광남
    • 한국산림과학회지
    • /
    • 제58권1호
    • /
    • pp.48-53
    • /
    • 1982
  • 현행(現行)의 형태학적수목분류법(形態學的樹木分類法)에 계획적특성(計劃的特性)을 이용(利用)한 소위(所謂) 판별분석법(判別分析法)에 의(依)할 독일(獨逸)가문비(Picea abies(L.) Karsten)와 종비나무(樅榧)(Picea koraiensis Nak.)와의 분류시험(分類試驗)을 실시(實施)하고 그 결과(結果)를 다음과 같이 요약(要約)한다. 1) 본(本) 시험(試驗)에서 얻은 판별식(判別式)과 판별영역(判別領域)은, Z(x)=Z($x_1,\;x_2$)=$0.000379x_1+0.004354x_2-0.311061$ 또는 Z(x)=Z($x_1,\;x_2$)=$0.000379(x_1-60.4428)+0.004354(x_2-66.1851)$, $$R_1=\{x{\mid}0.000379x_1+0.004354x_2-0.311061{\geq_-}0\}$$, $R_2$={$x{\mid}0.000379x_1+0.004354x_2-0.311061$ <0)} 또는 $$R_1=\{x{\mid}0.000379(x_1-60.4428)+0.004354(x_2-66.1851){\geq_-}0%\}$$, $R_2$={$x{\mid}0.000379(x_1-60.4428)+0.004354(x_2-66.1851)$ <0}. 2) 위의 판별영역(判別領域)에 의(依)한 오판율(誤判率)(오분류확율(誤分類確率))은, P($2{\mid}1$)=($P1{\mid}2$)=0.444로서, P($2{\mid}1$)와 P($P1{\mid}2$)의 동시오판율(同時誤判率)은 P=44.4%. 3) 본(本) 시험(試驗)에서 얻은 판별식(判別式)에 의(依)한 오판율(誤判率)은 상당(相當)히 높게 나타났지만 그의 정도(精度)보다는 오히려 판별(判別)에 대(對)한 신뢰도(信賴度)를 알 수 있다는데 보다 큰 의의(意義)가 있는 것으로 사료(思料)된다.

  • PDF

Data-Adaptive ECOC for Multicategory Classification

  • Seok, Kyung-Ha
    • Journal of the Korean Data and Information Science Society
    • /
    • 제19권1호
    • /
    • pp.25-36
    • /
    • 2008
  • Error Correcting Output Codes (ECOC) can improve generalization performance when applied to multicategory classification problem. In this study we propose a new criterion to select hyperparameters included in ECOC scheme. Instead of margins of a data we propose to use the probability of misclassification error since it makes the criterion simple. Using this we obtain an upper bound of leave-one-out error of OVA(one vs all) method. Our experiments from real and synthetic data indicate that the bound leads to good estimates of parameters.

  • PDF

Hyperparameter Selection for APC-ECOC

  • Seok, Kyung-Ha
    • Journal of the Korean Data and Information Science Society
    • /
    • 제19권4호
    • /
    • pp.1219-1231
    • /
    • 2008
  • The main object of this paper is to develop a leave-one-out(LOO) bound of all pairwise comparison error correcting output codes (APC-ECOC). To avoid using classifiers whose corresponding target values are 0 in APC-ECOC and requiring pilot estimates we developed a bound based on mean misclassification probability(MMP). It can be used to tune kernel hyperparameters. Our empirical experiment using kernel mean squared estimate(KMSE) as the binary classifier indicates that the bound leads to good estimates of kernel hyperparameters.

  • PDF

화질의 국소적 변화를 고려한 의용화상처리 (Medical Image Processing with Local Variati on of the Image Quality)

  • 홍승홍
    • 대한전자공학회논문지
    • /
    • 제12권1호
    • /
    • pp.1-6
    • /
    • 1975
  • 잡음을 포함한 저화질의용화상의 배경과 목적대상정을 분할하는 환경영역은 중요한 정보로 의학상 진단에 큰 의의를 갖고 있다. 이 논문의 목적은 화상의 농도변화를 정총화하여 통계적수법에 의해 환경영역을 결정하는 threshold를 구하는 방법을 제시하고 이를 비 scintigram에 적용하여 실험을 행했다. 전화상을 64개의 소영역으로 나누고 경계영역이 존재하는 부분온 선택하며 이 부분에 maximum likelihood법을 적용하여 threshold를 결정한뒤 내삽법에 의해 전화소에 대한 threshold를 구하고 수곽을 포함한 2식화면을 구했다. 이의 결과는 인간의 인식과 거의 같은 결과로 동적해석방법의 유효성이 증명되었다. The boundary has been one of the most important information in radiographic images and the degrees of difficulty involved varies greatly with the quality of the picture. These Buantifications are the means to diagnoses. The purpose of this paper is to quantify intensity variation and the threshold decision which is based on statistical principles and is developed to detect limits in liver scintigrams the entire picture is devide4 into 64 small regions. The kurtosis and variances for each smal region are used as indications to select the histograms the thresholds are computed according to the method o(maximum likelihood which minimizes the probability o( misclassification. Therefore Ive have demonstrated the applicability of the boundary detection and proved good agreement with human recognition, and we can use it for the diagnosis data of liver disease.

  • PDF

다층퍼셉트론의 출력 노드 수 증가에 의한 성능 향상 (Performance Improvement of Multilayer Perceptrons with Increased Output Nodes)

  • 오상훈
    • 한국콘텐츠학회논문지
    • /
    • 제9권1호
    • /
    • pp.123-130
    • /
    • 2009
  • 일반적으로 다층퍼셉트론을 패턴인식 문제에 적용할 경우 클래스 당 하나의 출력 노드를 배정하고, 이 출력 노드의 인덱스가 입력 패턴의 클래스를 뜻하도록 한다. 이 논문에서는 이와 달리 다층퍼셉트론의 성능 향상을 위하여 클래스 당 출력노드 수를 증가시키는 방법을 제안한다. 두 개의 클래스 문제를 대상으로 클래스 발생확률이 동일하고 각 클래스 내에서 출력노드가 균일분포를 지닌다는 가정 하에, 이 방법의 효용성을 확률론적인 유도를 통하여 증명하였다. 그리고, 50개의 고립단어 인식의 시뮬레이션으로 출력노드를 증가 시킬 경우 성능이 향상됨을 확인하였다.

다항분류상 편의에 관한 연구 (A Note on the Bias in the Multi-nomial Classification)

  • 윤용운
    • 산업경영시스템학회지
    • /
    • 제1권1호
    • /
    • pp.45-48
    • /
    • 1978
  • If two inspectors classify items in a lot into m classes, it is possible that each of them makes wrong classification in some cases, thus causing bias. Expressions have been obtained for the limits of this bias in estimating the proportion of the different classes. From the results of the classification they obtained limit for the estimates of Proportions have been worked out, based on assumption regarding the magnitudes of probabilities of misclassification. Now we suppose that $P_{ti}{\;}(t=1.2)$ is the probability that t the inspector classifies correctly an item in class $A_i$ and $q_{tji}$ is the probability that he misclassifies in $A_j$ an item actually belonging to $A_i$, therefor, $P_{ti}+ \sum\limits_{j{\neq}i}q_{tji}=1$ An estimate for the proportion $P_k$ of the class $A_k$ in the lot would be $\hat{P}_k=r_{kk}+(\frac{1}{2})\sum\limits_{j{\neq}k}r_{kj}+r_{jk}$ The % Bias in proportion $\hat{P}_k$ is $\frac{E(\hat{P}_k)-P_k}{P_k}{\times}100$

  • PDF

베이지안 신경망을 이용한 분류분석 (A Classification Analysis using Bayesian Neural Network)

  • 황진수;최성용;전홍석
    • Journal of the Korean Data and Information Science Society
    • /
    • 제12권2호
    • /
    • pp.11-25
    • /
    • 2001
  • 자료들 사이에 존재하는 관계, 패턴, 규칙등을 찾아내서 모형화 하는 통계적인 분류기법은 여러가지가 있다. 그러나 우리가 얻게 되는 지식은 어떤 일련의 분류규칙에 의해서가 아닌 관찰과 학습을 통한 훈련으로부터 얻게 된다. 본 베이지안 학습은 모든 형태의 불확실성을 표현하는 확률로써 우리의 믿음의 정도를 표현하는 것으로 해석될 수 있으며, 확실한 결과가 알려짐에 따라 확률이론 법칙을 사용하여 이러한 확률들을 갱신한다. 또한 신경망 모형은 이미 알고 있는 속성들에 근거하여 아직 알지 못하는 집단이나 특질들을 예측하게 해준다. 본 논문에서는 이러한 두 가지 방법을 결합한 베이지안 신경망과 기존의 CHAID, CART, QUBST 분류 알고리즘에 있어서 각각 오분류율을 비교연구하였다.

  • PDF

Likelihood Based Confidence Intervals for the Difference of Proportions in Two Doubly Sampled Data with a Common False-Positive Error Rate

  • Lee, Seung-Chun
    • Communications for Statistical Applications and Methods
    • /
    • 제17권5호
    • /
    • pp.679-688
    • /
    • 2010
  • Lee (2010) developed a confidence interval for the difference of binomial proportions in two doubly sampled data subject to false-positive errors. The confidence interval seems to be adequate for a general double sampling model subject to false-positive misclassification. However, in many applications, the false-positive error rates could be the same. On this note, the construction of asymptotic confidence interval is considered when the false-positive error rates are common. The coverage behaviors of nine likelihood based confidence intervals are examined. It is shown that the confidence interval based Rao score with the expected information has good performance in terms of coverage probability and expected width.

Payleigh 페이딩 채널에서 BPSK와 QPSK 신호의 변조 분류 (Modulation classification for BPSK and QPSK signals over rayleigh fading channel)

  • 윤동원;한영열
    • 한국통신학회논문지
    • /
    • 제21권4호
    • /
    • pp.1019-1026
    • /
    • 1996
  • 이제까지 변조 분류에 대한 연구는 가산성 백색 가우시안 잡음에서만 해석되어 연구되어 왔다. 이 논문에서는 Rayleigh 페이딩 채널에서 통계적 모멘트에 근거한 BPSK와 QPSK 신호의 디지틀 변조 분류기를 제시하고 성능을 분석한다. 백색 가우시안 잡음과 Rayleigh 페이딩이 존재하는 환경에서 복조된 신호의 샘플 모멘트를 계산한다. 계산된 모멘트 값을 바탕으로 중심 극한 정리를 이용하여 샘플 모멘트의 평균과 분산을 계산한다. 이로부터 샘플 모멘트의 확률 밀도 함수를 구하고 베이즈 검정을 적용하여 통계적 모멘트에 기초한 BPSK와 QPSK 신호의 디지틀 변조 분류기를 제시하고 오분류 확률을 유도하여 성능을 분석한다.

  • PDF

지진파 스펙트럼특성과 선형판별분석을 이용한 자연지진과 인공지진 식별 (Discrimination between earthquake and explosion by using seismic spectral characteristics and linear discriminant analysis)

  • 제일영;전정수;이희일
    • 한국지진공학회:학술대회논문집
    • /
    • 한국지진공학회 2003년도 추계 학술발표회논문집
    • /
    • pp.13-19
    • /
    • 2003
  • Discriminant method using seismic signal was studied for discrimination of surface explosion. By means of the seismic spectral characteristics, multi-variate discriminant analysis was performed. Four single discriminant techniques - Pg/Lg, Lg1/Lg2, Pg1/Pg2, and Rg/Lg - based on seismic source theory were applied to explosion and earthquake training data sets. The Pg/Lg discriminant technique was most effective among the four techniques. Nevertheless, it could not perfectly discriminate the samples of the training data sets. In this study, a compound linear discriminant analysis was defined by using common characteristics of the training data sets for the single discriminants. The compound linear discriminant analysis was used for the single discriminant as an independent variable. From this analysis, all the samples of the training data sets were correctly discriminated, and the probability of misclassification was lowered to 0.7%.

  • PDF