• Title/Summary/Keyword: 제2종 오류

Search Result 30, Processing Time 0.029 seconds

Partial AUC and optimal thresholds (부분 AUC와 최적분류점들)

  • Hong, Chong Sun;Cho, Hyun Su
    • The Korean Journal of Applied Statistics
    • /
    • v.32 no.2
    • /
    • pp.187-198
    • /
    • 2019
  • Extensive literature exists on how to estimate optimal thresholds based on various accuracy measures using receiver operating characteristic (ROC) and cumulative accuracy profile (CAP) curves. This paper now proposes an alternative measure to represented the specific partial area under the ROC and CAP curves. The relationship between ROC and CAP functions is examined using differential equations of the new defined partial area under curves. In addition, the relationship with the optimal thresholds under conditions of various accuracy measures for the ROC and CAP functions is also derived. We assume there are two kinds of distribution functions composing the mixed distribution as various normal distributions before finding the optimal thresholds. Corresponding type 1 and 2 errors are also explored and discussed under various conditions for accuracy measures.

Analysis of Mistakes in Photosynthesis Unit in Biology II Textbooks and Survey of Biology Teachers' Recognition on them (생물 II 교과서 광합성 단원의 오류 분석 및 생물 교사의 오류 인지 조사)

  • Park, Hae-Kyung;Yoon, Ki-Soon;Kwon, Duck-Kee
    • Journal of Science Education
    • /
    • v.32 no.1
    • /
    • pp.33-46
    • /
    • 2008
  • The purpose of this study was to know whether or not any wrongful description or simple errors were in photosynthesis unit of Biology II textbook under 7th national curriculum and if so, to know whether or not high school teachers recognized and corrected properly the mistakes. The mistakes in photosynthesis unit of text books were determined by the comparison with several reference books and through examination by three plant physiologists in 8 different Biology II textbooks. After the mistakes were analysed, the survey using contents of textbook containing the mistakes was conducted on high school teachers teaching Biology II. As a result, 48 mistakes were determined in 13 subjects. As many as four mistakes were found even in one subject in a certain textbook and a same mistake was found repeatedly in several textbooks. The survey result showed that the teachers who pointed exactly the mistakes out corrected properly, however, the percentage of these ones out of 35 teachers replied to survey was less than 50%. The ratios of correction out of total number of responses were high in question #6 (43%), #4-3 (40%), and #1-2 (32%) which were containing a simple mistake in graph, a wrong word and a wrong picture, respectively. But, no one pointed out and made correction in question #5-1 and #5-2 which were containing Z scheme of light reaction without the legend of vertical axis that should be explained as electron energy or standard reduction potential. The result indicates the possibility that the mistakes in photosynthesis unit of Biology II textbook can be corrected and teached properly by teachers may be low. In order to reduce the possibility that students may have misconceptions about photosynthesis, the list of print's errors should be provided to the teachers and/or the training program and/or workshop for in-service high school biology teachers was recommended.

  • PDF

한국주식시장에 적합한 사건연구 방법론의 고안

  • Jeong, Hyeong-Chan
    • The Korean Journal of Financial Management
    • /
    • v.14 no.2
    • /
    • pp.273-312
    • /
    • 1997
  • 본 연구는 우리나라의 실제 일별 주식수익률 자료를 이용한 시뮬레이션을 통해 우리나라 주식시장에 가장 적합한 사건연구방법론을 도출하고자 하였다. 이를 위해, 1980년에서부터 1995년까지 우리나라 주식시장에 상장된 675개 주식을 대상으로 무작위 복원추출 방법에 의해 50개의 개별주식으로 구성된 250개 표본을 선정하였다. 이들 250개 표본을 이용하여 시뮬레이션 기법에 의해 다양한 사건연구 모형의 통계적 오류와 검정력에 미치는 영향을 종합적으로 분석하였다. 시뮬레이션 실험 결과에 의하면, 먼저 사건일을 정확히 포착할 수 있는 경우에는 산업별주가지수를 시장지수로 선택한 시장모형 혹은 시장조정모형으로 초과수익률을 측정하고, 횡단면 독립성을 가정한 검정법이 가장 우수한 사건연구방법으로 나타났다. 한편, 사건일을 정확하게 포착할 수 없는 경우에는, 동일가중지수를 시장지수로 선택한 시장모형 혹은 시장조정모형으로 초과수익률을 측정하고, 횡단면 독립성을 가정한 검정법이 가장 적합한 모형으로 나타났다. 그리고, 사건일 집중현상으로 인한 제1종 오류를 감소시키는 데에는 개별주식의 초과수익률 간의 횡단면 독립성을 가정한 검정법보다는 횡단면 중속성을 조정한 검정법을 사용하는 것이 더욱 효과적이다.

  • PDF

Selection of the economically optimal parameters in the EWMA control chart (지수가중이동평균관리도의 경제적 최적모수의 선정)

  • 박창순;원태연
    • The Korean Journal of Applied Statistics
    • /
    • v.9 no.1
    • /
    • pp.91-109
    • /
    • 1996
  • Exponentially weighted moving averae(EWMA) control chart has been used widely for process monitoring and process adjustment recently, but there has not been many studies about the selection of the parameters. Design of the control chart can be classified into the statistical design and the economic design. The purpose of the economic design is to minimize the cost function in which all the possible costs occurring during the process are probability given the Type I error probability. In this paper the optimal parameters of the EWMA chart are selected for the economic design as well as for the statistical design. The optimal parameters for the economic design show significantly different from those of the statistical design, and especially the weight is always larger than that used in the statistical design. In the economic design, we divide the model into the single assignable cause model and the multiple assignable causes model caacording to number of which is used as the average context of the multiple assignable causes, it shows that the selection of the parameters may be misleading when the multiple assignable causes exist in practice.

  • PDF

Comparison of Some Nonparametric Statistical Inference for Logit Model (로짓모형의 비모수적 추론의 비교)

  • 정형철;김대학
    • The Korean Journal of Applied Statistics
    • /
    • v.15 no.2
    • /
    • pp.355-366
    • /
    • 2002
  • Nonparametric statistical inference for the parameter of logit model were examined. Usually nonparametric approach is milder than parametric approach based on normal theory assumption. We compared the two nonparametric methods for legit model, the bootstrap and random permutation in the sense of coverage probability. Monte Carlo simulation is conducted for small sample cases. Empirical power of hypothesis test and coverage probability for confidence interval estimation were presented for simple and multiple legit model respectively. An example were also introduced.

Natural Language-based Immersive English Tutoring System (자연어 대화 기반 몰입환경 영어 교육 시스템)

  • Lee, Kyusong;Lee, Sungjin;Lee, Jonghoon;Noh, Hyeongjong;Lee, Gary Geunbae
    • Annual Conference on Human and Language Technology
    • /
    • 2010.10a
    • /
    • pp.22-27
    • /
    • 2010
  • 최근 국가적 차원에서 영어교육에 대한 많은 투자가 이루어지고 있으나 기존의 주입식, 암기식 영어 교육은 회화 실력 향상에 큰 도움을 주지 못하였다. 컴퓨터를 이용한 영어교육 또한 많은 관심을 얻고 있으나 실제 의사소통을 위한 회화 학습에 대한 고려는 깊지 않으며, 주어진 흐름의 대본을 따라 단순히 읽고 반복하는 수준의 시스템만 존재하고 있다. 이러한 학습형태는 흥미 유발 동기가 약하여 사용자로 하여금 장기간 꾸준히 학습하게 만들지 못한다는 문제가 있다. 이러한 문제점에 대하여 제2언어 습득 이론에 바탕을 둔 자연어 처리 기반 몰입 환경 영어 교육 시스템을 제안한다. 이는 도메인 확장성이 뛰어난 예제 기반 대화 시스템을 3 차원 가상공간과 결합한 시스템으로 자연스러운 대화를 통한 외국어 회화 연습을 하는 과정에서 학습자의 발화 오류를 분석하고 교육적 피드백을 제공한다. 또한 현실과 비슷한 몰입 환경에서 체험형 기술을 통해 자발적인 학습을 유도하고 집중력, 기억력을 획기적으로 높이고자 한다. 본 논문에서는 영어교육 시스템의 이론적 배경, 예제 기반 대화관리, 시스템 구성요소와 동작에 대하여 중점적으로 기술하였다.

  • PDF

A Survey or The Korean Learner's Problems in Mastering English Pronunciation (한국인의 영어 발음 학습상 문제점 개관)

  • Youe Hansa MahnGunn
    • MALSORI
    • /
    • no.42
    • /
    • pp.47-56
    • /
    • 2001
  • 이 글은 제2회 서울 국제 음성학 학술대회(SICOPS 2000) 기조강연 내용을 조금 손질한 것인데, 한국인 영어 학습자가 저지르기 쉬운 발음상 잘못을 모음, 자음별로 관찰하고 그 대책을 논의한다. 모음에서는 주로 i:l, u:$-\sigma$, (equation omitted) 흔동이 문제이며, 또한 90종이 넘는 여러 철자로 나타나는 쭉정모음(schwa) 식별과 정복한 발음도 큰 문제다. 자음에서는 음소 연결방식에서 생기는 자음접변 둥 한 국어 특유 현상을 영어에까지 연장하는 바람에 많은 오류가 생긴다는 것과 영어 sp-, st-, sk-에서 /p t k/는 연한소리(lenis)로 [(equation omitted)]인데, 된소리로 잘못알고 있는 수가 많다는 것도 지적된다. 무룻 영어학습자는 철자만 보고 발음을 속단하지 말고 단어마다 반드시 발음을 사전에서 확인할 것과 아울러 거기에 음성학적 훈련이 수반되어야 함을 역설하며, 정확한 발음을 아는 것은 실제 영어 청취i구사에 뿐 아니라 또한 언어연구 기초확립에 필수적이라는 말로 글을 맺는다.

  • PDF

Note on the Equality of Variances in Two Sample t-Test (두 집단 평균 차이 검정에서 분산의 동질성에 관한 소고)

  • Kim, Sang-Cheol;Lim, Jo-Han
    • Communications for Statistical Applications and Methods
    • /
    • v.17 no.1
    • /
    • pp.79-88
    • /
    • 2010
  • Introductory statistic class proposes two tests for the equality of two population means according to the homogeneity of their variances. However, in practice, the variances are also unknown and practitioners often test their homogeneity before they do two sample t-test. This is also true in many popular statistical packages such as SAS and SPSS. In this paper, we study the type I error of this two stage procedure and propose a procedure to control it at a given significance level.

Gamma Mixed Model to Improve Sib-Pair Linkage Analysis (감마 혼합 모형을 통한 반복 측정된 형제 쌍 연관 분석 사례연구)

  • Kim, Jeonghwan;Suh, Young Ju;Won, Sungho;Nah, Jeung Weon;Lee, Woojoo
    • The Korean Journal of Applied Statistics
    • /
    • v.28 no.2
    • /
    • pp.221-230
    • /
    • 2015
  • Traditionally, sib-pair linkage analysis with repeated measures has employed linear mixed models, but it suffers from the lack of power to find genetic marker loci associated with a phenotype of interest. In this paper, we use a gamma mixed model to improve sib-pair linkage analysis and compare it with a linear mixed model in terms of power and Type I error. We illustrate that the use of gamma mixed model can achieve higher power than linear mixed model with Genetic Analysis Workshop 13 data.

Mitigiating Data Imbalance via Ensembled Data Augmentation: An Explainable Credit Scoring Models (데이터 증강 기법의 앙상블을 통한 레이블 불균형 해 소: 설명 가능한 신용평가 모델을 중심으로)

  • Ji-Young Chung;So-Yeon Lee;Ye-Lin Yong;Min-Jun Kim
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.11a
    • /
    • pp.483-486
    • /
    • 2023
  • 최근 금융 분야는 예측 모델의 복잡성으로 인한 블랙박스 문제와 금융 규제에 대한 관심이 높아지고 있다. 이에 따라 금융 업계는 신뢰성과 투명성을 강조하며, 특히 신용평가 분야에서 설명 가능한 모델 연구가 활발히 진행되고 있다. 또한, 해당 분야에서 소수 클래스에 대해 충분히 학습하지 못하고 다수 클래스에 과적합 될 수 있는 데이터 불균형 문제 역시 강조되고 있다. 이는 제 2종 오류(Type 2 Error)를 최소화해야 하는 상황에서 더욱 부각되며, 대출 상환 능력이 낮은 고객을 최대한 식별해야 하는 개인 신용평가 문제에서 매우 중요한 화두로 떠오르고 있다. 본 논문에서는 어텐션 메커니즘을 활용하여 모델의 설명 가능성을 개선하고, 분석 결과를 해석하는 데 도움이 되고자 한다. 더 나아가, SMOTE, GAN, ADASYN 등 총 다섯 가지 데이터 증강 기법을 실험하여, 이를 앙상블 하였을 때 소수 클래스 레이블에 대한 분류 정확도를 크게 개선할 수 있음을 확인하였다.