• Title/Summary/Keyword: 통계적 학습

Search Result 506, Processing Time 0.025 seconds

Performance Comparison Between Neural Network Model and Statistical Models (통계적 모델과 신경회로망 모델의 성능 비교에 관한 연구)

  • Han, Seung-Soo;Kim, In-Taek
    • Proceedings of the KIEE Conference
    • /
    • 2000.07d
    • /
    • pp.2401-2403
    • /
    • 2000
  • 시스템의 특성을 이해하고 신뢰성 있는 제어를 위해서는 시스템에 대한 정확한 모델을 필요로 한다. 이러한 목적을 위해서 많은 연구자들에 의한 다양한 방법의 모델링 방법이 계속되어 연구되어지고 있다. 현재 많이 사용하는 모델링 방법 중에는 통계적 기법을 이용하는 것, first principle 방법을 이용하는 것, 지능형 기법을 이용하는 방법 등이 있다. 본 연구에서는 통계적 방법인 fractional factorial 방법을 이용한 모델, Taguchi 방법을 이용한 모델, 그리고 지능형 방법인 신경회로망을 이용한 모델의 3가지 모델을 사용해서 각 모델의 학습오차와 예측오차 등의 특성을 비교하였다. 모델에 사용된 데이터는 비선형 시스템인 플라즈마 화학 증착 장비(Plasma-Enhnaced Chemical Vapor Deposition : PECVD)에 의해 증착된 산화막 실험 데이터이다. 각 모델에 대해서 PECVD 데이터를 사용하여 모델을 만들었을 때 각 모델의 학습오차와 학습오차 변위, 그리고 예측오차와 예측오차변위를 조사하였다. 세가지 모델 모두 학습오차가 예측오차보다 작았으며 변위 또한 학습오차변위가 예측오차변위보다 작았다. 본 연구 결과는 일반적으로 신경회로망에 의한 오차가 다른 통계적인 방법에 의한 오차보다 작음을 보여준다.

  • PDF

Korean Part-of-Speech Tagging Error Correction Method Based on Statistical Decision Graph Learning (통계적 결정 그래프 학습 방법을 이용한 한국어 품사 부착 오류 수정)

  • Ryu, Won-Ho;Lee, Sang-Zoo;Rim, Hae-Chang
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.123-129
    • /
    • 2001
  • 지금까지 한국어 품사 부착을 위해 다양한 모델이 제안되었고 95% 이상의 높은 정확도를 보여주고 있다. 그러나 4-5%의 오류는 실제 응용 분야에서 많은 문제를 야기시킬 수 있다. 이러한 오류를 최소화하기 위해서는 오류를 분석하고 이를 수정할 수 있는 규칙들을 학습하여 재사용하는 방범이 효과적이다. 오류 수정 규칙을 학습하기 위한 기존의 방법들은 수동학습 방법과 자동 학습 방법으로 나눌 수 있다 수동 학습 방법은 많은 비용이 요구되는 단점이 있다. 자동 학습 방법의 경우 모두 변형규칙 기반 접근 방법을 사용하였는데 어휘 정보를 고려할 경우 탐색 공간과 규칙 적용 시간이 매우 크다는 단점이 있다. 따라서 본 논문에서는 초기 모델에 대한 오류 수정 규칙을 효율적으로 학습하기 위한 새로운 방법으로 결정 트리 학습 방법을 확장한 통계적 결정 그래프 학습 방법을 제안한다. 제안된 방법으로 두 가지 실험을 수행하였다. 초기 모델의 정확도가 높고 말뭉치의 크기가 작은 첫 번째 실험의 경우 초기 모델의 정확도 95.48%를 97.37%까지 향상시킬 수 있었다. 초기 모델의 정확도가 낮고 말뭉치 크기가 큰 두 번째 실험의 경우 초기 모델의 정확도 87.22%를 95.59%로 향상시켰다. 또한 실험을 통해 결정 트리 학습 방법에 비해 통계적 결정 그래프 학습 방법이 더욱 효과적임을 알 수 있었다.

  • PDF

통계적 교수 ${\cdot}$ 학습 과정을 통한 그래프 이해력 증진에 관한 탐구

  • Park, Gyeong-Yeon;Choe, Chang-U
    • Communications of Mathematical Education
    • /
    • v.11
    • /
    • pp.107-126
    • /
    • 2001
  • 우리는 흔히 21C를 정보화 시대라고 하며 우리에게 주어지는 정보들 또한 일기예보와 같은 일상적인 분야에서 여론 조사와 같은 전문적인 분야에 이르기까지 아주 다양하다. 이런 정보들은 통계영역과 아주 밀접하며 이런 정보들을 통계적으로 바르게 해석하고 추론하여 일반화하는 등 일련의 과정들을 요구한다. 이런 상황아래 본 연구에서는 6차 초등학교 수학 교과서에서 여러 통계학 영역 중 그래프 형태로 가장 먼저 도입되는 막대그래프에 중점을 두어 현행 교과서에서 학습 내용과 학습 과정의 문제점에는 어떤 것이 있으며 아울러 그래프 이해력에 필요한 요소나 인지적 사고 능력, 그래프 이해력의 수준을 알아보고, 이를 바탕으로 여러 문헌을 통해 본 연구자가 나름대로 구안한 통계적 기법을 사용한 교수 ${\cdot}$ 학습 과정을 실험반에 적용한 후 그래프 이해력 사전 ${\cdot}$ 사후 검사를 비교함으로써 통계적 기법을 사용한 교수 ${\cdot}$ 학습 과정이 그래프 이해력에 어떠한 영향을 미치는지 알아보고자 한다.

  • PDF

Statistical Literacy of Fifth and Sixth Graders in Elementary School about the Beginning Inference from a Pictograph Task ('그림그래프에서 추론하기' 과제에서 나타나는 초등학교 5, 6학년 학생들의 통계적 소양)

  • Moon, Eunhye;Lee, Kwangho
    • Education of Primary School Mathematics
    • /
    • v.22 no.3
    • /
    • pp.149-166
    • /
    • 2019
  • The purpose of this study is to analyze the statistical literacy in elementary school students when they beginning inference. Picto-graphs provide statistical information and often data-related arguments they certainly qualify as objects for interpretation, for critical evaluation, and for discussion or communication of the conclusions presented. For research, the inference from pictograph task was designed and statistical literacy standards for evaluating the student's level was presented based on prior studies. Evaluating student's statistical literacy is meaningful in that it can check their current level. To know the student's current level can help them achieve a higher level of performance. The outcomes of this research indicate that pictograph can provide a basis for rich tasks displaying not only student's counting skills but also their appreciation of variation and uncertainty in prediction. Raising statistical thinking by students is an important goal in statistical education, and the experience of informal statistical reasoning can help with formal statistical reasoning that will be learned later. Therefore, the task about the inference from a pictograph, discussions on statistical learning of elementary school children are expected to present meaningful implications for statistical education.

Learning Bayesian Network Parameters using Dialogue based User Feedbacks (대화기반 사용자 피드백을 이용한 베이지안 네트워크 파라메터 학습)

  • Lim, Sung-Soo;Lee, Seung-Hyun;Cho, Sung-Bae
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2010.06c
    • /
    • pp.419-422
    • /
    • 2010
  • 사용자와 환경의 변화에 적응하기 위해서 베이지안 네트워크의 다양한 학습 방법들이 연구되고 있다. 기존의 많은 학습방법에서는 학습 데이터로부터 통계적 방법을 통해서 베이지안 네트워크 모델을 학습하는데, 이러한 접근 방법은 학습 데이터를 수집하기 어려운 문제에 적용하기 힘들며, 사용자의 의도를 데이터의 패턴들로만 학습하므로 직접적으로 사용자의 의도를 반영할 수 없다. 본 논문에서는 대화에 기반하여 사용자의 의도를 직접적으로 수집하고, 이로부터 베이지안 네트워크의 파라메터를 학습하는 방법을 연구한다. 제안하는 방법에서는 사용자와의 대화를 통해서 현재의 모델의 잘못된 점 혹은 개선점을 직접적으로 입력 받고, 이를 바탕으로 베이지안 네트워크 모델을 수정하여 데이터의 수집 없이 빠른 시간에 사용자가 원하는 모델을 학습 할 수 있다. 기존의 통계적 기법을 이용한 대표적인 베이지안 네트워크 파라메터 학습 방법인 최대우도 추정(Maximum Likelihood Estimation; MLE) 방법과 제안하는 방법을 비교하여 제안하는 방법의 유용성을 확인한다.

  • PDF

A New Statistical Sampling Method for Reducing Computing time of Machine Learning Algorithms (기계학습 알고리즘의 컴퓨팅시간 단축을 위한 새로운 통계적 샘플링 기법)

  • Jun, Sung-Hae
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.21 no.2
    • /
    • pp.171-177
    • /
    • 2011
  • Accuracy and computing time are considerable issues in machine learning. In general, the computing time for data analysis is increased in proportion to the size of given data. So, we need a sampling approach to reduce the size of training data. But, the accuracy of constructed model is decreased by going down the data size simultaneously. To solve this problem, we propose a new statistical sampling method having similar performance to the total data. We suggest a rule to select optimal sampling techniques according to given data structure. This paper shows a sampling method for reducing computing time with keeping the most of accuracy using cluster sampling, stratified sampling, and systematic sampling. We verify improved performance of proposed method by accuracy and computing time between sample data and total data using objective machine learning data sets.

Optimization of Generalized Regression Neural Network Using Statistical Processing (통계적 처리를 이용한 일반화된 회귀 신경망의 분류성능의 최적화)

  • Kim, Geun-Ho;Kim, Byun-Whan
    • Proceedings of the KIEE Conference
    • /
    • 2002.07d
    • /
    • pp.2749-2751
    • /
    • 2002
  • 일반화된 회귀 신경망 (GRNN)을 이용하여 플라즈마을 분류하는 새로운 알고리즘을 보고한다. 데이터분포를 통계적인 평균치와 표준편차를 이용하여 특징지었으며, 바이어스 인자을 이용하여 9 종류의 데이터을 발생하였다. 각 데이터에 대하여 GRNN의 학습인자를 최적화하였으며, 모델성능은 예측과 분류 정확도로 나누어 바이어스와 학습인자의 함수로 분석하였다. 바이어스는 모델성능에 상당한 영향을 주었으며, 학습인자와의 상호작용을 통하여 완전 분류를 이루었다.

  • PDF

Design and implementation of Web Course_ware based on Simulation for statistical Inference Study (통계적 추론 학습을 위한 시뮬레이션 중심 웹 코스웨어의 설계와 구현)

  • Choi, Eun-Seon;Choi, Jin-Seek
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10a
    • /
    • pp.113-118
    • /
    • 2006
  • 고등학교 수학과 교육과정에서의 ‘확률과 통계'단원은 실제로 자료의 수집과 요약을 통하여 자료 분석방법을 배우고 사회와 자연현상을 인식하고 추론하는 능력을 기르는데 목표를 두고 있다. 추상적인 수학내용을 직접 시도하거나 학생들이 실제적인 자료를 수집하고 직접 자료를 해석하고 추론해 보는 경험과정은 수학실험과 시뮬레이션이라는 컴퓨터 학습을 통해 가능하고 개념학습의 전 단계에서 보다 구성적이고 탐구적인 활동을 강화할 수 있다. 본 논문에서는 ‘확률과 통계'의 교수-학습과정에서 수학적 시뮬레이션을 활용한 웹 기반 학습모형을 제시하여 학습자들에게 수학적 내용과 관련된 구체적 매체를 조작하는 컴퓨터 실험 활동을 통하여 수학에서의 원리발견과 통계적 추론을 경험하고 유도할 수 있는 탐구적 학습 환경을 조성해 보고자 한다.

  • PDF

Analyzing seventh graders' statistical thinking through statistical processes by phases and instructional settings (통계적 과정의 학습에서 나타난 중학교 1학년 학생들의 단계별·수업 형태별 통계적 사고 분석)

  • Kim, Ga Young;Kim, Rae Young
    • The Mathematical Education
    • /
    • v.58 no.3
    • /
    • pp.459-481
    • /
    • 2019
  • This study aims to investigate students' statistical thinking through statistical processes in different instructional settings: Teacher-centered instruction vs. student-centered learning. We first developed instructional materials that allowed students to experience all the processes of statistics, including data collection, data analysis, data representation, and interpretation of the results. Using the instructional materials for four classes, we collected and analyzed the data from 57 seventh graders' discourse and artifacts from two different instructional settings using the analytic framework generated on the basis of literature review. The results showed that students felt difficulty particularly in the process of data collection and graph representations. In addition, even though data description has been heavily emphasized for data analysis in statistics education, it is surprisingly discovered that students had a hard time to understand the relationship between data and representations. Also, there were relationships between students' statistical thinking and instructional settings. Even though both groups of students showed difficulty in data collection and graph representations of the data, there were significant differences between the groups in terms of their performance. Whereas students from student-centered learning class outperformed in making decisions considering verification and justification, students from teacher-centered lecture class did better in problems requiring accuracy than the counterpart. The results from the study provide meaningful implications on developing curriculum and instructional methods for statistics education.

TAKTAG: Two phase learning method for hybrid statistical/rule-based part-of-speech disambiguation (TAKTAG: 통계와 규칙에 기반한 2단계 학습을 통한 품사 중의성 해결)

  • Shin, Sang-Hyun;Lee, Geun-Bae;Lee, Jong-Hyeok
    • Annual Conference on Human and Language Technology
    • /
    • 1995.10a
    • /
    • pp.169-174
    • /
    • 1995
  • 품사 태깅은 형태소 분석 이후 발생한 모호성을 제거하는 것으로, 통계적 방법과 규칙에 기 반한 방법이 널리 사용되고 있다. 하지만, 이들 방법론에는 각기 한계점을 지니고 있다. 통계적인 방법인 은닉 마코프 모델(Hidden Markov Model)은 유연성(flexibility)을 지니지만, 교착어(agglutinative language)인 한국어에 있어서 제한된 윈도우로 인하여, 중의성 해결의 실마리가 되는 어휘나 품사별 제대로 참조하지 못하는 경우가 있다. 반면, 규칙에 기반한 방법은 차체가 품사에 영향을 받으므로 인하여, 새로운 태그집합(tagset)이나 언어에 대하여 유연성이나 정확성을 제공해 주지 못한다. 이러한 각기 서로 다른 방법론의 한계를 극복하기 위하여, 본 논문에서는 통계와 규칙을 통합한 한국어 태깅 모델을 제안한다. 즉 통계적 학습을 통한 통계 모델이후에 2차적으로 규칙을 자동학습 하게 하여, 통계모델이 다루지 못하는 범위의 규칙을 생성하게 된다. 이처럼 2단계의 통계와 규칙의 자동 학습단계를 거치게 됨으로써, 두개 모델의 단점을 보강한 높은 정확도를 가지는 한국어 태거를 개발할 수 있게 하였다.

  • PDF