• 제목/요약/키워드: Statistical Data

검색결과 14,797건 처리시간 0.033초

초등학생의 통계적 소양 신장을 위한 데이터와 인공지능 예측모델 기반의 통계프로그램 개발 및 적용 (Development and Application of Statistical Programs Based on Data and Artificial Intelligence Prediction Model to Improve Statistical Literacy of Elementary School Students)

  • 김윤하;장혜원
    • 한국수학교육학회지시리즈E:수학교육논문집
    • /
    • 제37권4호
    • /
    • pp.717-736
    • /
    • 2023
  • 본 연구는 데이터와 인공지능 예측모델을 활용한 통계프로그램을 개발하여 초등학교 6학년 한 학급에 적용함으로써 학생들의 통계적 소양 신장에 효과가 있는지 확인하는 것을 목적으로 한다. 오늘날 초등학교 통계교육의 문제점을 분석하고, 4차 산업혁명 시대에서 중시되는 데이터와 인공지능 교육을 융합하여 통계적 문제해결의 전 과정을 경험하고 미래에 대한 올바른 예측을 경험해 볼 수 있는 총 15차시의 통계프로그램을 개발하였다. 본 프로그램의 가장 큰 특징은 인공지능 교육의 중점 요소인 데이터의 중요성 인식, 공공데이터플랫폼에서 제공하는 실생활 데이터를 사용하여 맥락을 고려한 자료 수집 및 분석 활동을 포함한다는 것이다. 또한 공학 도구인 엔트리와 이지통계를 활용하고, 인공지능 예측모델을 제작하여 데이터를 기반으로 미래를 예측해 보는 활동으로 구성된다는 점에서 의사소통역량, 정보처리역량, 비판적 사고 역량을 기를 수 있는 역량 중심의 프로그램으로 구성하였다. 본 프로그램의 적용 결과, 프로그램 적용은 초등학생의 통계적 소양에 긍정적 영향을 미쳤을 뿐만 아니라 학생들의 흥미, 주체적이고 비판적 탐구, 통계적 문제해결 전 과정에서의 수학적 의사소통을 관찰할 수 있었다.

수질자료의 추세분석을 위한 비모수적 통계검정에 관한 연구 (A Study of Non-parametric Statistical Tests to Analyze Trend in Water Quality Data)

  • 이상훈
    • 환경영향평가
    • /
    • 제4권2호
    • /
    • pp.93-103
    • /
    • 1995
  • This study was carried out to suggest the best statistical test to analyze the trend in monthly water quality data. Traditional parametric tests such as t-test and regression analysis are based on the assumption that the underlying population has a normal distribution and regression analysis additionally assumes that residual errors are independent. Analyzing 9-years monthly COD data collected at Paldang in Han River, the underlying population was found to be neither normal nor independent. Therefore parametric tests are invalid for trend detection. Four Kinds of nonparametric statistical tests, such as Run Test, Daniel test, Mann-Kendall test, and Time Series Residual Analysis were applied to analyze the trend in the COD data, Daniel test and Mann-Kendall test indicated upward trend in COD data. The best nonparametric test was suggested to be Daniel test, which is simple in computation and easy to understand the intuitive meaning.

  • PDF

데이터 바이닝을 이용한 로버스트 설계 모형의 최적화 (Optimization of Robust Design Model using Data Mining)

  • 정혜진;구본철
    • 산업경영시스템학회지
    • /
    • 제30권2호
    • /
    • pp.99-105
    • /
    • 2007
  • According to the automated manufacturing processes followed by the development of computer manufacturing technologies, products or quality characteristics produced on the processes have measured and recorded automatically. Much amount of data daily produced on the processes may not be efficiently analyzed by current statistical methodologies (i.e., statistical quality control and statistical process control methodologies) because of the dimensionality associated with many input and response variables. Although a number of statistical methods to handle this situation, there is room for improvement. In order to overcome this limitation, we integrated data mining and robust design approach in this research. We find efficiently the significant input variables that connected with the interesting response variables by using the data mining technique. And we find the optimum operating condition of process by using RSM and robust design approach.

지반조사 데이터의 통계처리기법 (Statistical Representation Methods of Ground Data)

  • 이규환;윤길림
    • 한국지반공학회:학술대회논문집
    • /
    • 한국지반공학회 2008년도 추계 학술발표회
    • /
    • pp.85-110
    • /
    • 2008
  • Ground investigation data to be used as a basis for geotechnical analysis and foundation design are usually troubled with large uncertainty, due to natural variability and limited number of data. Statistical methods can be a rational tool for handling such uncertain ground data, in particular with a view to the selection of characteristic values for estimating ground design parameters used in design. The characteristic values of soil properties for use in geotechnical design have oftenly based on not only a subjective judgment but also engineer's past acumulated experience. This paper discussed some statistical methods which can handle such intrinsic ground uncertainty data with a case design in a rational manner.

  • PDF

INVITED PAPER MULTIVARIATE ANALYSIS FOR THE CASE WHEN THE DIMENSION IS LARGE COMPARED TO THE SAMPLE SIZE

  • Fujikoshi, Yasunori
    • Journal of the Korean Statistical Society
    • /
    • 제33권1호
    • /
    • pp.1-24
    • /
    • 2004
  • This paper is concerned with statistical methods for multivariate data when the number p of variables is large compared to the sample size n. Such data appear typically in analysis of DNA microarrays, curve data, financial data, etc. However, there is little statistical theory for high dimensional data. On the other hand, there are some asymptotic results under the assumption that both and p tend to $\infty$, in some ratio p/n ${\rightarrow}$c. The results suggest that the new asymptotic results are more useful and insightful than the classical large sample asymptotics. The main purpose of this paper is to review some asymptotic results for high dimensional statistics as well as classical statistics under a high dimensional asymptotic framework.

Bioequivalence trial with two generic drugs in 2 × 3 crossover design with missing data

  • Park, Sang-Gue;Kim, Seunghyo;Choi, Ikjoon
    • Communications for Statistical Applications and Methods
    • /
    • 제27권6호
    • /
    • pp.641-647
    • /
    • 2020
  • The 2 × 3 crossover design, a modified version of the 3 × 3 crossover design, is considered to compare the bioavailability of two generic candidates with a reference drug. The 2 × 3 crossover design is more economically favorable due to decrease in the number of sequences, rather than conducting a 3×3 crossover trial or two separate 2 × 2 crossover trials. However, when using a higher-order crossover trial, the risk of drop-outs and withdrawals of subjects increases, so the suitable statistical inferences for missing data is needed. The bioequivalence model of a of 2×3 crossover trial with missing data is defined and the statistical procedures of assessing bioequivalence is proposed. An illustrated example of the 2 × 3 trial with missing data is also presented with discussion.

초등수학영재들의 통계적 사고 특성 사례 분석: 변이성에 대한 인식을 중심으로 (A Case Study of the Characteristics of Mathematically Gifted Elementary Students' Statistical Reasoning : Focus on the Recognition of Variability)

  • 이형숙;이경화;김지원
    • 대한수학교육학회지:수학교육학연구
    • /
    • 제20권3호
    • /
    • pp.339-356
    • /
    • 2010
  • 통계교육에서는 자료에 대한 경험을 바탕으로 한 사고의 발달이 중요하다, 특히, 자료 생성 시 발생하는 변이성에 대한 이해는 통계적 사고의 핵심이므로 변이를 고려한 학습기회를 제공할 필요가 있다. 국내외 관련 연구자들은 수학적으로 우수한 능력을 지닌 학생들이라 할지라도 통계적 사고 수준은 매우 낮으므로 적극적인 교육을 통해 이를 극복해야 한다고 주장하고 있다. 본 논문은 15명의 우리나라 수학 영재아들이 자료를 통한 통계의 주요 개념들을 이해하는 다양한 방식들을 살펴보면서 그 중 모둠 활동에 참여한 세 명의 학생들이 자료와 그래프를 생성하는 과정에서 보여주는 서로 다른 통계적 사고 과정을 좀 더 세밀히 비교분석하는 것을 목표로 한다. 연구 결과, 수학적으로 매우 우수한 성취를 보이는 학생들임에도 불구하고, 선행연구에서 제시한 일반 초등학생들의 변이성에 대한 이해 양상과 별다른 차이를 보이지 않았다. 이로부터 우리나라의 초등학교 통계교육이 변이성 인식에 도움을 주지 못하고 있다는 시사점을 얻었다.

  • PDF

모수적·비모수적 입력모델링 기법을 이용한 신뢰성 해석 (Reliability Analysis Using Parametric and Nonparametric Input Modeling Methods)

  • 강영진;홍지민;임오강;노유정
    • 한국전산구조공학회논문집
    • /
    • 제30권1호
    • /
    • pp.87-94
    • /
    • 2017
  • 신뢰성 해석 및 신뢰성기반 최적설계는 불확실성을 고려한 확률변수를 입력 값으로 요구하며, 확률변수는 모수적 비모수적 통계모델링 방법을 사용하여 확률분포함수의 형태로 정량화 된다. 신뢰성 해석과 같은 통계적 해석은 입력되는 확률분포함수의 특성이 결과값에 영향을 미치게 되며, 확률분포함수는 통계모델링 방법에 따라 다른 형태를 가지게 된다. 본 연구에서는 모수적 통계모델링 방법인 순차적 통계모델링 방법과 비모수적 방법인 커널밀도추정을 사용하여 데이터의 개수에 따른 통계모델링의 결과를 분석하였다. 또한 수치예제를 통해 두 가지 기법에 따른 신뢰성 해석의 결과를 분석하였고, 데이터의 개수에 따른 적절한 기법을 제안하였다.

TRAPR: R Package for Statistical Analysis and Visualization of RNA-Seq Data

  • Lim, Jae Hyun;Lee, Soo Youn;Kim, Ju Han
    • Genomics & Informatics
    • /
    • 제15권1호
    • /
    • pp.51-53
    • /
    • 2017
  • High-throughput transcriptome sequencing, also known as RNA sequencing (RNA-Seq), is a standard technology for measuring gene expression with unprecedented accuracy. Numerous bioconductor packages have been developed for the statistical analysis of RNA-Seq data. However, these tools focus on specific aspects of the data analysis pipeline, and are difficult to appropriately integrate with one another due to their disparate data structures and processing methods. They also lack visualization methods to confirm the integrity of the data and the process. In this paper, we propose an R-based RNA-Seq analysis pipeline called TRAPR, an integrated tool that facilitates the statistical analysis and visualization of RNA-Seq expression data. TRAPR provides various functions for data management, the filtering of low-quality data, normalization, transformation, statistical analysis, data visualization, and result visualization that allow researchers to build customized analysis pipelines.

Inappropriate Survey Design Analysis of the Korean National Health and Nutrition Examination Survey May Produce Biased Results

  • Kim, Yangho;Park, Sunmin;Kim, Nam-Soo;Lee, Byung-Kook
    • Journal of Preventive Medicine and Public Health
    • /
    • 제46권2호
    • /
    • pp.96-104
    • /
    • 2013
  • Objectives: The inherent nature of the Korean National Health and Nutrition Examination Survey (KNHANES) design requires special analysis by incorporating sample weights, stratification, and clustering not used in ordinary statistical procedures. Methods: This study investigated the proportion of research papers that have used an appropriate statistical methodology out of the research papers analyzing the KNHANES cited in the PubMed online system from 2007 to 2012. We also compared differences in mean and regression estimates between the ordinary statistical data analyses without sampling weight and design-based data analyses using the KNHANES 2008 to 2010. Results: Of the 247 research articles cited in PubMed, only 19.8% of all articles used survey design analysis, compared with 80.2% of articles that used ordinary statistical analysis, treating KNHANES data as if it were collected using a simple random sampling method. Means and standard errors differed between the ordinary statistical data analyses and design-based analyses, and the standard errors in the design-based analyses tended to be larger than those in the ordinary statistical data analyses. Conclusions: Ignoring complex survey design can result in biased estimates and overstated significance levels. Sample weights, stratification, and clustering of the design must be incorporated into analyses to ensure the development of appropriate estimates and standard errors of these estimates.