• Title/Summary/Keyword: 통계 오류

Search Result 384, Processing Time 0.032 seconds

Criterion of Test Statistics for Validation in Credit Rating Model (신용평가모형에서 타당성검증 통계량들의 판단기준)

  • Park, Yong-Seok;Hong, Chong-Sun;Lim, Han-Seung
    • Communications for Statistical Applications and Methods
    • /
    • v.16 no.2
    • /
    • pp.239-347
    • /
    • 2009
  • This paper presents Kolmogorov-Smirnov, mean difference, AUROC and AR, four well known statistics that have been widely used for evaluating the discriminatory power of credit rating models. Criteria for these statistics are determined by the value of mean difference under the assumption of normality and equal standard deviation. Alternative criteria are proposed through the simulations according to various sample sizes, type II error rates, and the ratio of bads, also we suggest the meaning of statistic on the basis of discriminatory power. Finally we make a comparative study of the currently used guidelines and simulated results.

A Hybrid N-best Part-of-Speech Tagger for English-Korean Machine Translation (영한 기계 번역을 위한 혼합형 N-best 품사 태거)

  • Lim, Heui-Seok;Kwon, Cheol-Joong;Lee, Jae-Won;Oh, Ki-Eun
    • Annual Conference on Human and Language Technology
    • /
    • 1998.10c
    • /
    • pp.15-19
    • /
    • 1998
  • 기계 번역 시스템에서 품사 태거의 오류는 전체번역 정확률에 결정적인 영향을 미친다. 따라서 어휘 단계의 정보만으로는 중의성 해소가 불가능한 단어에 대해서는 중의성 해소에 충분한 정보를 얻을 수 있는 구문 분석이나 의미 분석 단계까지 완전한 중의성 해소를 유보하는 N-best 품사 태거가 요구된다. 또한 N-best 품사 태거는 단어에 할당되는 평균 품사 개수를 최소화함으로써 상위 단계의 부하를 줄이는 본연의 역할을 수행하여야 한다. 본 논문은 통계 기반 품사 태깅 방법을 이용하여 N-best 후보를 선정하고, 선정된 N-best 후보에 언어 규칙을 적용하여 중의성을 감소시키거나 오류를 보정하는 혼합형 N-best 품사 태깅 방법을 제안한다 제안된 N-best 품사 태거는 6만여 단어의 영어 코퍼스에서 실험한 결과, 단어 당 평균 1.09개의 품사를 할당할 때 0.43%의 오류율을 보인다.

  • PDF

The Average SER of MPSK Signals for a Generalized Selection Diversity Combining over Nakagami Fading Channels (나카가미 페이딩 체널에서 일반화된 선택성 다이버시티를 사용한 MPSK 신호의 평균 심벌 오류 확률)

  • Choi, Se-Yeong;Yoon, Dong-Weon;Han, Young-Yearl
    • Journal of the Korean Institute of Telematics and Electronics S
    • /
    • v.35S no.6
    • /
    • pp.19-24
    • /
    • 1998
  • In this paper, a new closed form expression for the average symbol error rate(SER) of generalized selection combining(SC), whereby the two(three) signals with the two(three) largest amplitudes are combined from the original diversity branches in the channel, for MPSK signals in a frequency-nonselective slowly m-distributed Nakagami fading channel is derived. In order to analyze the error performance for a generalized SC, the Order-Statistics is applied. To derive the SER of MPSK signals with SC, the new expression of pdf is introduced and many other mathematical methods are used. Comparing the derived SER with that of MRC, we find adequate diversity branch number from total Lth-order diversity branches.

  • PDF

한일양언어의 음운조직과 일본어청취의 상관분석

  • 정혜경
    • Proceedings of the KSPS conference
    • /
    • 1996.10a
    • /
    • pp.534-534
    • /
    • 1996
  • 본 연구는 한국인 일본어학습자의 일본어 청취상의 난점을 한일 양언어의 음운 조직의 차이를 비교.분석함으로써, 문제의 소지와 그 해결점을 제시하는 것을 목적으로 한다. 연구방법으로서는, 초급일본어 학습자인 일어일문학 전공학생 1학년 30명을 대상으로 두재의 다른 종류의 청취태스트를 2회에 걸쳐 실시, 그 자료를 통계적으로 분석.고찰하는 방법을 취하였다. 분석내용은, 첫째 청취테스트의 결과로부터 한국인 일본어학습자의 일본어 청취에 있어서 나타나는 전형적인 오류의 패턴을 분석하고, 둘째 그 오류의 패턴의 원인을 한일 양언어의 음운조직의 상이함을 대조.분석하므로써 구조적 원인을 이론적인 측면에서 보다 명백히 밝혀냈다. 끝으로, 한국인 일본어학습자의 일본어 청취상의 난점과 문제점을 미리 예측하고 제시할 수 있는 항목들을 구체적으로 제시하여, 효과적인 일본어 교육은 물론 동시에 한국어교육에 있어서도 이 연구의 결과가 적용.응용될 수 있도록 하였다.

  • PDF

Measurement of the Effective Internet Diameter Based on Hop Counts of Effective Connections (실효 접속의 Hop Count에 기반한 인터넷 실효 지름의 측정)

  • 이지웅;김재균
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10c
    • /
    • pp.745-747
    • /
    • 1999
  • 인터넷이 급성장함에 따라 사용자의 더 나은 서비스에 대한 요구 역시 급증하였다. 네트웍 연구가들은 제한된 네트웍 자원 하에서 오류제어, 흐름 제어, 그리고 폭주 제어를 적절히 수행함으로써 전송 품질을 향상시키는 방법들에 대해 연구해 오고 있다. 그러나 인터넷 연구의 가장 큰 난점 중 하나가 인터넷에는 네트웍의 상태를 모니터링할 수 있는 근간이 되는 방법이 기본적으로 지원되고 있지 않다는 점이고 따라서 네트웍의 구조와 상태, 플로우의 흐름 및 통계 등에 대한 기본 자료가 부족한 실정이다. 오류 제어나 흐름 제어, 그리고 폭주제어 기술을 연구할 때 가장 필요한 자료중의 하나가 네트웍 토폴로지이다. 그 중에서도 송신자와 수신자 사이의 거리 정보인 Network Diameter가 있다. 기존 연구에서는 연구자 임의로 이 값을 할당하거나 혹은 특정 실험실에서만 유효한 Network Diameter가 있다. 기존 연구에서는 연구자 임의로 이 값을 할당하거나 혹은 특정 실험에서만 유효한 Network Diameter 값을 제시해오고 있었다. 이 논문에서는 이처럼 비객관적이거나 특수값으로만 사용되어 오던 Internet Diameter를 실효 접속에 근거하여 측정하는 알고리즘을 제안하고, KAIST에서 전세계로 나가는 실측 접속 자료로부터 접속 Hop Count의 분포를 측정하며 이를 통해 타 인터넷 연구에 적절한 자료를 제시한다.

  • PDF

Text Corpus Construction for Language Model (대어휘 음성인식 언어모델링을 위한 텍스트 코퍼스 구축)

  • Kim Jeong-se;Yoon Aesun;Kwon Hyuk-Chul
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.155-158
    • /
    • 2002
  • 본 논문은 음성정보연구센터에서 추진하고 있는 대용량 텍스트 코퍼스 구축에 관하여 기술한다. 총 3 년 동안 약 3 억$\~$5 억 어절 수집을 목표로 하고 있으며, 주 목적은 대어휘 음성인식용 언어모델링을 위한 통계정보 추출용으로 활용할 예정이다. 1 차년도인 2002 년에 수집할 텍스트의 양은 약 6 천만 어절로 주요 일간지와 방송뉴스를 대상으로 하고 있다. 이 중 2 천만 어절은 띄어쓰기, 철자오류 수정 등을 수동으로 수행하고, 나머지 어절은 자동 검증 툴을 사용하여 오류를 수정하고자 한다. 본 논문에서는 공동 이용 가능한 텍스트 코퍼스의 구축 방안과 구축 시의 고려해야 할 사항들을 제시하고자 한다.

  • PDF

Error analysis on factorization and the effect of online individualization classes (인수분해에 대한 오류 분석과 온라인 개별화 수업의 효과)

  • Choi, Dong-won;Heo, Haeja
    • Journal of the Korean School Mathematics Society
    • /
    • v.24 no.1
    • /
    • pp.83-105
    • /
    • 2021
  • In this paper, we analyzed the misconceptions and errors incurred during factorization learning. We also examined whether online individualization classes had a positive effect on students' mathematical achievement. The experiment was conducted for 4 weeks (16 times in total) on middle school juniors in rural areas of Gyeonggi Province, where the influence of private extra education was small. In the class, the 'Google Classroom' was used as a LMS, the video lecture was uploaded to YouTube, and the teacher interacted with the students through "Zoom" and "Facetalk". In the online class situation, students' assignments and test answers were checked in real time through 'Google Classroom', and immediate feedback was provided to the experimental class group's students. However, for the control group students, feedback was provided only to those who desired. A total of 7 achievement evaluations were conducted in the order of pre-test, formative evaluation (5 times), and post-test to confirm the change in students' ability improvement and achievement. Through the formative evaluation analysis, it was possible to grasp the types of errors and misconceptions that occured during the factorization process. Students' errors were divided into four types: theorem or definition distortion error, functional errors such as calculation, operation, and manipulation, errors that do not verify the solution, and no response. As a result of ANCOVA, the two groups did not show any difference from the 1st to 4th formative assessment. However, the 5th formative assessment and post-test showed statistically significant differences, confirming that online individualization classes contributed to improvemed achievement.

Differences in attributional bias and irrational gambling beliefs between gamblers and non-gamblers (귀인양식과 귀인편향, 비합리적 도박신념에서의 차이: 도박자와 비도박자의 비교)

  • Eun-A Park;Jonghan Yi
    • Korean Journal of Culture and Social Issue
    • /
    • v.21 no.2
    • /
    • pp.177-203
    • /
    • 2015
  • The aims of this study were 1) to compare irrational gambling beliefs of gamblers and non-gamblers, 2) to investigate the role of cognitive error on winning probability thinking error, and 3) to examine the relationship between attributional bias and gambling behavior. A total of 248 subjects were recruited for this study. All subjects were classified into non-gamblers, social gamblers and pathological gamblers, and administered self-report questionnaires to measure irrational gambling beliefs, the probability inference error, the attriburional style, and the attributional bias. A pathological gambler group scored highest on irrational gambling beliefs, especially the overestimation of self-ability factor, and a social gambler group and a non-gambler group follow. All three groups scored higher on the magnification of gambling skills than the mean (4.0) of the scale. Pathological gamblers and social gamblers scored higher on the probability thinking error than non-gamblers. Pathological gamblers displayed higher external attribution, lower internal attribution in their daily life events and higher internal attribution in failure situation than social gamblers and non-gamblers. The results indicate that cognitive errors would be a factor that differentiates pathological gamblers from social gamblers and non-gamblers. In predicting gambling behaviors, overestimation of self-ability of irrational gambling beliefs, internal attribution in failure situation, external attribution in daily live event, and probability thinking error were identified as significant factors. It is concluded that a public education about common cognitive bias featured in gamblers might be important in prevention of pathological gambling behaviors.

  • PDF

Comparison of Principal Component Regression and Nonparametric Multivariate Trend Test for Multivariate Linkage (다변량 형질의 유전연관성에 대한 주성분을 이용한 회귀방법와 다변량 비모수 추세검정법의 비교)

  • Kim, Su-Young;Song, Hae-Hiang
    • The Korean Journal of Applied Statistics
    • /
    • v.21 no.1
    • /
    • pp.19-33
    • /
    • 2008
  • Linear regression method, proposed by Haseman and Elston(1972), for detecting linkage to a quantitative trait of sib pairs is a linkage testing method for a single locus and a single trait. However, multivariate methods for detecting linkage are needed, when information from each of several traits that are affected by the same major gene are available on each individual. Amos et al. (1990) extended the regression method of Haseman and Elston(1972) to incorporate observations of two or more traits by estimating the principal component linear function that results in the strongest correlation between the squared pair differences in the trait measurements and identity by descent at a marker locus. But, it is impossible to control the probability of type I errors with this method at present, since the exact distribution of the statistic that they use is yet unknown. In this paper, we propose a multivariate nonparametric trend test for detecting linkage to multiple traits. We compared with a simulation study the efficiencies of multivariate nonparametric trend test with those of the method developed by Amos et al. (1990) for quantitative traits data. For multivariate nonparametric trend test, the results of the simulation study reveal that the Type I error rates are close to the predetermined significance levels, and have in general high powers.

A concordance test for bivariate interval censored data using a leverage bootstrap (지렛대 붓스트랩을 이용한 이변량 구간 중도 절단 자료의 일치성 검정)

  • Kim, Yang-Jin
    • The Korean Journal of Applied Statistics
    • /
    • v.32 no.5
    • /
    • pp.753-761
    • /
    • 2019
  • A test procedure based on a Kendall's τ statistic is proposed for the association of bivariate interval censored data. In particular, a leverage bootstrap technique is applied to replace unknown failure times and a classical adjustment method is applied for treating tied observations. The suggested method shows desirable results in simulation studies. An AIDS dataset is analyzed with the suggested method.