• Title/Summary/Keyword: 통계 오류

Search Result 388, Processing Time 0.025 seconds

Study on the size of experiments in mixed models (혼합모형에서 실험의 크기에 관한 연구)

  • 이연수;임용빈;김재주
    • The Korean Journal of Applied Statistics
    • /
    • v.12 no.2
    • /
    • pp.593-603
    • /
    • 1999
  • 표본의 크기의 제1종오류의 확률 $\alpha$, 실용적으로 차이가 있다고 판독되어서 검출하고자하는 요인효과의 오차에 대한 상대적인 크기, 그 값에서의 제2종오류의 확률 $\beta$에 따라서 결정된다. 이 논문에서, 우리는 고정요인과 랜덤요인이 포함된 실험계획에서 표본의 크기를 결정하는 방법을 간단한 MATLAB 프로그램을 사용하여 고려한다. 분할법과 지분요인배치법의 예제를 들어 유의수준 $\alpha$와 최소 표준과 검출효과 $\Delta^*$에서 검정력이 적어도 $1-\beta$를 갖도록 표본의 크기를 결정한다

  • PDF

Rank Transformation Technique in a Two-stage Two-level Balanced Nested Design (이단계 이수준 균형지분모형의 순위변환 기법연구)

  • Choi Young-Hun
    • The Korean Journal of Applied Statistics
    • /
    • v.19 no.1
    • /
    • pp.111-120
    • /
    • 2006
  • In a two-stage two-level balanced nested design, type I error rates for the parametric tests and the rank transformed tests for the main effects and the nested effects are in overall similar to each other. Furthermore, powers for the rank transformed statistic for the main effects and the nested effects in a two-stage two-level balanced nested design are generally superior to powers for the parametric statistic When the effect size and the sample size are increased, we can find that powers increase for the parametric statistic and the rank transformed statistic are dramatically improved. Especially for the case of the fixed effects in the asymmetric distributions such as an exponential distribution, powers for the rank transformed tests are quite high rather than powers for the parametric tests.

Artificial statistician/tool selection (AS/TS: Insight 2를 이용한 통계기법선정자문시스템)

  • 김용진
    • Korean Management Science Review
    • /
    • v.5 no.1
    • /
    • pp.45-55
    • /
    • 1988
  • 다양한 통계기법을 이용하는 연구자들은 부적합한 통계기법을 선정하여 수집된 자료를 분석함에 따라 많은 오류를 범하고 있는 실정이며, 자신의 연구목적에 부합되는 통계기법을 선정함에 있어 어느 기법을 선택할 것인가 하는 문제에 직면하게 된다. 본 연구에서 구축한 통계기법 선정을 위한 전문가 시스템(AS/TS)은 수집된 자료의 특성과 연구목적에 적합한 기법을 연구자에게 선정해주는 전문가 시스템이다. 현존하는 대부분의 통계 패키지들은 이용자 자신의 연구목적에 가장 적합한 통계기법을 선택할 수 있는 지식을 지니고 있는 것으로 전제하고 있기 때문에, AS/TS는 이들 통계 패키지를 이용하기 전에 통계기법만 선택해 주도록 설계되었다. AS/TS는 MS-DOS를 탑재한 16bit 퍼스널 컴퓨터로 INSIGHT 2(shell)를 이용하여 구축하였다.

  • PDF

Group Sequential Tests Using both Type I and Type II Error Spending Rate Functions on Binomial Response (이산형 반응변수에서 오류 분배율 함수를 적용한 집단축차 검정)

  • Kim, Dong-Uk;Nam, Jin-Hyun
    • Communications for Statistical Applications and Methods
    • /
    • v.17 no.1
    • /
    • pp.127-140
    • /
    • 2010
  • In interim analysis, group sequential tests are widely used for the ethical, scientific, and economic reasons. In this paper, we propose the group sequential tests using both type I and type II error spending rate functions when the response variable is discrete, especially binomial distribution, in the interim analysis. In addition, we propose new error spending rate function which covers the formerly proposed. Our method has good property that is flexible, fast and easily applicable. A numerical simulations are carried out to evaluate our method and it shows good performance.

Context-sensitive Spelling Error Correction using Eojeol N-gram (어절 N-gram을 이용한 문맥의존 철자오류 교정)

  • Kim, Minho;Kwon, Hyuk-Chul;Choi, Sungki
    • Journal of KIISE
    • /
    • v.41 no.12
    • /
    • pp.1081-1089
    • /
    • 2014
  • Context-sensitive spelling-error correction methods are largely classified into rule-based methods and statistical data-based methods, the latter of which is often preferred in research. Statistical error correction methods consider context-sensitive spelling error problems as word-sense disambiguation problems. The method divides a vocabulary pair, for correction, which consists of a correction target vocabulary and a replacement candidate vocabulary, according to the context. The present paper proposes a method that integrates a word-phrase n-gram model into a conventional model in order to improve the performance of the probability model by using a correction vocabulary pair, which was a result of a previous study performed by this research team. The integrated model suggested in this paper includes a method used to interpolate the probability of a sentence calculated through each model and a method used to apply the models, when both methods are sequentially applied. Both aforementioned types of integrated models exhibit relatively high accuracy and reproducibility when compared to conventional models or to a model that uses only an n-gram.

Detection of Syntactic and Semantic Anomaly in Korean Sentences: an ERP study (언어이해과정에서의 구문/의미요소 분리에 대한 ERP특성연구)

  • 김충명;이경민
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2000.05a
    • /
    • pp.61-67
    • /
    • 2000
  • 본고는 텍스트로 제시된 한국어 문장의 형태통사론적 오류와 의미적 논항결합시 하위범주화요건을 위배하는 논항선택 오류의 인식 및 판단에 따른 ERP(Event-Related Potential)를 검출하여, 이에 대한 문장이해과정의 시간추이적 양상을 연구의 대상으로 하였다. 참여한 피험자로부터 각각의 유형에 대한 통계분석 결과, 통사적 오류 추출에서 의미적 오류 추출에 이르기까지 기존의 연구에서 제시된 오류패턴 요소들(ELAN, N400, P600)을 확인하였으며, 아울러 한국어 문장이해과정의 특이성을 관찰할 수 있었다. 이를 통해 문장묵독시 일어나는 여러 종류의 문법오류에 대한 개별적 성격규명과 함께, 이들의 문법틀 내에서의 상호관계에 대한 일련의 가설설정이 이루어질 수 있으며, 또한 문장이해 메커니즘의 신경적 기전의 특성 규명으로 부수될 인간지능 모사가능성에 생리학적 토대가 더해 질 것으로 추정되는 바, 언어이해와 대뇌기전지형을 결정짓는 또 다른 규준이 될 것이다.

  • PDF

Hybrid POS Tagging with generalized unknown word handling and post error-correction rules (일반화된 미등록어 처리와 오류 수정규칙을 이용한 혼합형 품사태깅)

  • Cha, Jeong-Won;Lee, Won-Il;Lee, Geun-Bae;Lee, Jong-Hyeok
    • Annual Conference on Human and Language Technology
    • /
    • 1997.10a
    • /
    • pp.88-93
    • /
    • 1997
  • 본 논문에서는 품사 태깅을 위해 여러 통계 모델을 실험을 통하여 비교하였으며 이를 토대로 통계적 모델을 구성하였다. 형태소 패턴 사전을 이용하여 미등록어의 위치와 개수에 관계없는 일반적인 방법의 미등록어 처리 방법을 개발하고 통계모델이 가지는 단점을 보완할 수 있는 오류 수정 규칙을 함께 이용하여 혼합형 품사 태깅 시스템인 $POSTAG^{i}$를 개발하였다. 미등록어를 추정하는 형태소 패턴 사전은 한국어 음절 정보와 용언의 불규칙 정보를 이용하여 구성하고 다어절어 사전을 이용하여 여러 어절에 걸쳐 나타나는 연어를 효과적으로 처리하면서 전체적인 태깅 정확도를 개선할 수 있다. 또 오류 수정 규칙은 Brill이 제안한 학습을 통하여 자동으로 얻어진다. 오류 수정 규칙의 자동 추출시에 몇 가지의 휴리스틱을 사용하여 보다 우수하고 일반적인 규clr을 추출할 수 있게 하였다. 10만의 형태소 품사 말뭉치로 학습하고 학습에 참여하지 않은 2만 5천여 형태소로 실험하여 97.28%의 정확도를 보였다.

  • PDF

온톨로지의 구축과 학습: 상하위 관계

  • Choe, Gi-Seon;Ryu, Beop-Mo
    • Communications of the Korean Institute of Information Scientists and Engineers
    • /
    • v.24 no.4 s.203
    • /
    • pp.24-30
    • /
    • 2006
  • 온톨로지의 기본개념, 응용 분야 및 학습 단계에 대하여 간단하게 설명하였고, 온톨로지 학습단계에서 전문 분야의 개념간 계층 관계 학습 방법에 대하여 자세하게 알아보았다. 전문분야 개념을 표현하는 전문 용어 사이의 계층 관계를 학습하는 방법은 크게 규칙 기반 방법, 통계 기반 방법 그리고 용어의 전문성과 유사도를 이용하는 방법으로 나눌 수 있다. 규칙 기반 방법은 비교적 정확한 결과를 얻을 수 있는 장점이 있지만 재현율이 낮은 단점이 있다. 기존은 통계 기반 방법에서는 재현율이 높은 장점이 있지만 정확률이 낮은 단점이 있다. 또한 이 방법에서는 순수하게 통계 정보만 이용하기 때문에 오류에 대한 분석이 어려운 단점이 있다. 용어의 전문성과 용어간 유사도를 이용한 방법에서는 용어의 전문성을 이용하여 기존의 계층 구조에서 상위에 후보를 선택하고, 용어간 유사도를 이용하여 선택한 후보를 정렬하여 최적의 후보를 찾는다. 이 방법은 상위어 선정 과정을 두 단계로 분리하여 수행하기 때문에 오류 분석이 용이한 장점이 있다. 향후 온톨로지 학습 과정에서 계층 관계뿐 아니라 인과 관계 및 다양한 관계의 학습과 관련된 연구가 진행되어야 한다.