• Title/Summary/Keyword: 분류의 오류

Search Result 655, Processing Time 0.024 seconds

Optimal Thresholds from Non-Normal Mixture (비정규 혼합분포에서의 최적분류점)

  • Hong, Chong-Sun;Joo, Jae-Seon
    • The Korean Journal of Applied Statistics
    • /
    • v.23 no.5
    • /
    • pp.943-953
    • /
    • 2010
  • From a mixture distribution of the score random variable for credit evaluation, there are many methods of estimating optimal thresholds. Most the research news is based on the assumption of normal distributions. In this paper, we extend non-normal distributions such as Weibull, Logistic and Gamma distributions to estimate an optimal threshold by using a hypotheses test method and other methods maximizing the total accuracy and the true rate. The type I and II errors are obtained and compared with their sums. Finally we discuss their e ciency and derive conclusions for non-normal distributions.

Improvement of MODIS land cover classification over the Asia-Oceania region (아시아-오세아니아 지역의 MODIS 지면피복분류 개선)

  • Park, Ji-Yeol;Suh, Myoung-Seok
    • Korean Journal of Remote Sensing
    • /
    • v.31 no.2
    • /
    • pp.51-64
    • /
    • 2015
  • We improved the MODerate resolution Imaging Spectroradiometer (MODIS) land cover map over the Asia-Oceania region through the reclassification of the misclassified pixels. The misclassified pixels are defined where the number of land cover types are greater than 3 from the 12 years of MODIS land cover map. The ratio of misclassified pixels in this region amounts to 17.53%. The MODIS Normalized Difference Vegetation Index (NDVI) time series over the correctly classified pixels showed that continuous variation with time without noises. However, there are so many unreasonable fluctuations in the NDVI time series for the misclassified pixels. To improve the quality of input data for the reclassification, we corrected the MODIS NDVI using Correction based on Spatial and Temporal Continuity (CSaTC) developed by Cho and Suh (2013). Iterative Self-Organizing Data Analysis (ISODATA) was used for the clustering of NDVI data over the misclassified pixels and land cover types was determined based on the seasonal variation pattern of NDVI. The final land cover map was generated through the merging of correctly classified MODIS land cover map and reclassified land cover map. The validation results using the 138 ground truth data showed that the overall accuracy of classification is improved from 68% of original MODIS land cover map to 74% of reclassified land cover map.

Improvement of Korean Grammar Checker Using Partial Parsing based on Dependency Grammar and Disambiguation Rules (어휘적 중의성 제거 규칙과 부분 문장 분석을 이용한 한국어 문법 검사기 성능 향상)

  • So, Kil-Ja;Nam, Hyeon-Sook;Kim, Su-Nam;Won, Sang-Yeon;Kwon, Hyuck-Chul;Park, Dong-In
    • Annual Conference on Human and Language Technology
    • /
    • 1998.10c
    • /
    • pp.253-260
    • /
    • 1998
  • 한국어 문서에는 여러 어절을 검증해야만 처리할 수 있는 의미 오류와 문체 오류가 있다. 다수 어절 사이에 있는 오류는 부분 문장 분석을 한다. 논문에서는 의미 오류와 문체 오류를 처리할 때 어휘적 중의성 때문에 생기는 문제점을 제시하고 해결방법을 제안한다. 어휘적 중의성이란 한 단어가 두 가지 이상의 형태소 정보를 가짐을 뜻한다. 철자검사기와는 달리 문법 검사기에서는 어휘적 중의성을 제거하지 않으면 여러 가지 검사 오류가 발생한다. 이 논문에서는 의미, 문체 시스템에서 어휘적 중의성 때문에 검사 오류가 발생할 수 있는 과정을 크게 세 단계로 분류하였다. 연어 오류가 발생할 수 있는 검사단어가 어휘적 중의성을 가지면 표제어가 다른 규칙이 여러 개 존재한다. 이 때 규칙 선택 문제가 생긴다. 중의성 문제는 부분 문장분석 과정에서도 지배소와 의존소 사이의 의존관계를 정확하게 설정하기 어렵게 한다. 본 논문에서는 각 단계에서 발생한 문제를 최소화하여 문법 검사기의 성능을 향상시킨다.

  • PDF

A Korean Revision System Using the governal and collocational relation between words (단어 간 지배 관계 및 연관 관계를 이용한 한국어 교열 시스템)

  • Sim, Chul-Min;Kim, Min-Jung;Lee, Young-Sik;Kwon, Hyuk-Chul
    • Annual Conference on Human and Language Technology
    • /
    • 1993.10a
    • /
    • pp.303-316
    • /
    • 1993
  • 스펠러와 같은 오류 처리 기법은 한 어절 사이의 처리에 국한되거나, 또는 수사 처리와 같이 일부 제한된 품사 영역에서만 어절을 넘어선 처리가 행해지고 있다. 한편 교열과 같은 어절 단위를 넘어선 오류 처리는 완벽한 통사 분석과 의미 해석을 반드시 필요로 한다고 생각되어져 왔다. 그리고 현재 한국어 처리에서는 완벽한 통사적, 의미적 처리가 불가능하기 때문에 교열 시스템 또는 어절 단위를 넘어선 오류 처리에 대한 연구가 거의 전무한 실정이다. 본 논문은 어절을 넘어선 오류의 유형을 분류하고, 문장 단위로 관련된 단어 사용오류를 검사하는 기법과 관련 단어 처리를 위한 규칙 데이타 베이스의 구조를 제안한다. 단어 사이에 존재하는 통사적, 의미적 지배 관계와 연관 관계를 어휘선택 제약으로 이용함으로써 완벽한 통사 분석과 의미 분석이 없이도 교열이 가능하게 하였다.

  • PDF

A Korean Grammar Checker using Lexical Disambiguation Rule and Partial Parsing (어휘적 중의성 제거 규칙과 부분 문장 분석을 이용한 한국어 문법 검사기)

  • So, Gil-Ja;Gwon, Hyeok-Cheol
    • Journal of KIISE:Software and Applications
    • /
    • v.28 no.3
    • /
    • pp.305-315
    • /
    • 2001
  • 본 논문에서는 우리말 문서에 있는 오류를 어절 단위로 검증하는 철자 오류와 여러 어절을 분석해야 처리할 수 있는 문법 오류로 분류하였다. 문법 오류를 처리할 때 전체 문장 분석은 시간이 많이 소요되고 구현하기 어려우므로 대부분 부분 문장 분석 방법을 이용한다. 기존 연구에서 사용한 부분 문장 분석은 분석 어절에 어휘 중의성이 있을 때 문장 분석 종결 또는 과분석 등의 오류가 발생한다. 본 논문에서는 문법 검사기에서 어휘 중의성 때문에 발생하는 문제점을 해결하는 방법으로 어휘 중의성 제거 규칙을 사용한다. 본 논문에서 구현한 어휘 중의성 제거 모듈은 코퍼스 데이타에서 얻은 경험적 규칙을 기반으로 한다. 이 경험적 규칙은 언어적 지식을 기반으로 한다.

  • PDF

A Study on Performance Shaping Factors of Human Error in Toxic Gas Facilities (독성가스시설의 인적오류 수행영향인자에 관한 연구)

  • Kim, Youngran;Jang, Seo-Il;Shin, Dongil;Kim, Tae-Ok;Park, Kyoshik
    • Journal of the Korean Institute of Gas
    • /
    • v.18 no.4
    • /
    • pp.68-75
    • /
    • 2014
  • It is necessary to control and evaluate human factors to reduce economic loss by major accident in toxic gas facilities. Conventional works to evaluate hazards have been focused on mechanical and systematic failure, while only a little works have been studied on managing human errors. In this work, a classification system of performance shaping factor (PSF) was suggested to consist human error in managing accident in the toxic gas facilities. Four types of PSFs (human, system, task characteristics, and task environment) were collected, reviewed, and analyzed to be categorized selected according their characteristics of situational, task, and environmental parameters. The PSFs were further modified to set up PSF systems adequate to evaluate human error, and the proposed system to consist PSFs to evaluate human error was further studied through accident analysis in toxic gas facilities.

Analysis of the error types made by Korean language learners in the use of dual numerals (이중 수사(數詞) 사용에서 나타나는 한국어학습자의 오류 유형 분석)

  • Do, Joowon
    • Communications of Mathematical Education
    • /
    • v.38 no.2
    • /
    • pp.145-165
    • /
    • 2024
  • The purpose of this study is to analyze the types of errors made by Korean language learners in the use of dual numerals and provides basic data for developing an effective teaching numeration using dual numerals. To this end, a case study was conducted to analyze the types of errors that appear in numeration using dual numerals targeting Korean language learners with diverse linguistic and cultural backgrounds and different academic achievements in Korean and mathematics. Error types that categorized errors made by Korean language learners were used as an analysis framework. The conclusions obtained from the research results are as follows. First, it is necessary to provide students with opportunities to use them frequently so that they can become familiar with the use of native language numerals, which often causes errors. Second, when teaching Korean language learners with low-level Korean language academic achievement how to use Chinese numerals, it is necessary to pay attention to the multiplicative numeral system of Chinese numerals. Third, it is necessary to teach children to accurately read foreign word classifiers used with Chinese numerals accurately in Korean and distinguish between the classifiers 'o'clock' and 'hours'. There is a need to provide guidance so that native language/Chinese numerals can be used appropriately in succession along with Chinese classifiers. The results of this study may contribute to the development of an effective teaching numeration using dual numerals for Korean language learners with diverse linguistic and cultural backgrounds.

Classification of Web Application Model ing Elements and Constraints Based Web Application Modeling (웹 응용 모델링의 요소 분류와 그에 따른 제약조건 기반 모델링)

  • 박영주;이기열;이병정;김희천;우치수
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.358-360
    • /
    • 2004
  • 웹 어플리케이션은 생명 주기가 짧고, 마르고 정확한 개발이 요구되므로 모델링 단계에서의 요소 분류 및 요소간의 제약조건을 정의할 필요가 있다. 이에 본 연구에서는 각 프레임과 페이지를 그 성격에 따라 집합 프레임과 구조 프레임, 내용 페이지와 구조 정보 페이지로 분류, 이를 바탕으로 요소간의 관계를 정의하였다. 웹 응용 모델링의 요소 분류를 통해 그에 따른 제약 조건을 서술할 수 있는데, 이를 통해 사소한 예측할 수 있는 오류를 피할 수 있고, 웹 응용의 기본적인 테스트 케이스로도 사용할 수 있다.

  • PDF

The analysis of mathematics error type that appears from the process of solving problem related to real life (실생활 문장제의 해결과정에 나타나는 오류유형 분석)

  • Park, Jang Hee;Ryu, Shi Kyu;Lee, Joong Kwoen
    • Journal of the Korean School Mathematics Society
    • /
    • v.15 no.4
    • /
    • pp.699-718
    • /
    • 2012
  • The purpose of mathematics eduction is to develop the ability of thinking mathematically. It informs method to solve problem through mathematical thinking that teach mathematical ability. Errors in the problem solving can be thought as those in the mathematical thinking. Therefore analysis and classification of mathematics errors is important to teach mathematics. This study researches the preceding studies on mathematics errors and presents the characteristic of them with analyzed models. The results achieved by analysis of the process of problem solving are as follows : ▸ Students feel much harder to solve words problems rather than multiple-choice problems. ▸ The length of sentence make some differences of understanding of the words problems. Students easy to understand short sentence problems than long sentence problems. ▸ If students feel difficulties on the pre-learned mathematical content, they feel the same difficulties on the words problems based on the pre-learned mathematics content.

  • PDF

Using Dynamic Programming for Word Segmentation in OCR (동적 프로그래밍을 이용한 OCR에서의 띄어쓰기 교정)

  • Park, Ho-Min;Kim, Chang-Hyun;Noh, Kyung-Mok;Cheon, Min-Ah;Kim, Jae-Hoon
    • 한국어정보학회:학술대회논문집
    • /
    • 2016.10a
    • /
    • pp.243-245
    • /
    • 2016
  • 광학 문자 인식(OCR)을 통해 문서의 글자를 인식할 때 띄어쓰기 오류가 발생한다. 본 논문에서는 이를 해결하기 위해 OCR의 후처리 과정으로 동적 프로그래밍을 이용한 분절(Segmentation) 방식의 띄어쓰기 오류 교정 시스템을 제안한다. 제안하는 시스템의 띄어쓰기 오류 교정 과정은 다음과 같다. 첫째, 띄어쓰기 오류가 있다고 분류된 어절 내의 공백을 모두 제거한다. 둘째, 공백이 제거된 문자열을 동적 프로그래밍을 이용한 분절로 입력 문자열에 대하여 가능한 모든 띄어쓰기 후보들을 찾는다. 셋째, 뉴스 기사 말뭉치와 그 말뭉치에 기반을 둔 띄어쓰기 확률 모델을 참조하여 각 후보의 띄어쓰기 확률을 계산한다. 마지막으로 띄어쓰기 후보들 중 확률이 가장 높은 후보를 교정 결과로 제시한다. 본 논문에서 제안하는 시스템을 이용하여 OCR의 띄어쓰기 오류를 해결할 수 있었다. 향후 띄어쓰기 오류 교정에 필요한 언어 규칙 등을 시스템에 추가한 띄어쓰기 교정시스템을 통하여 OCR의 최종적인 인식률을 향상에 대해 연구할 예정이다.

  • PDF