• 제목/요약/키워드: box plot analysis

검색결과 56건 처리시간 0.029초

6 Sigma 현장적용 적용 시 초기 데이터 분석에 대한 고찰 (Study on analysis of initial Data on 6 Sigma application in real fields)

  • 이상복;최은향
    • 한국품질경영학회:학술대회논문집
    • /
    • 한국품질경영학회 2009년도 추계학술대회
    • /
    • pp.33-39
    • /
    • 2009
  • 본 연구에서는 현장에서 6 시그마를 활용 시 통계분석의 기초가 되는 초기 데이터 분석에 대한 고찰이다. 통계의 가장 기본이 되는 데이터가 잘못되었으면 나머지 모두 문제가 된다. 이에 데이터 초기에 발생할 수 있는 여러 오류의 가능성을 살펴보고 각각에 대해 해결책을 제시하였다. 여기서 활용하는 방법들은 계측기 선정, Gage R&R, Histogram, Box-plot, PDF, Box-Cox 변화 등이다.

  • PDF

Big Data Smoothing and Outlier Removal for Patent Big Data Analysis

  • Choi, JunHyeog;Jun, Sunghae
    • 한국컴퓨터정보학회논문지
    • /
    • 제21권8호
    • /
    • pp.77-84
    • /
    • 2016
  • In general statistical analysis, we need to make a normal assumption. If this assumption is not satisfied, we cannot expect a good result of statistical data analysis. Most of statistical methods processing the outlier and noise also need to the assumption. But the assumption is not satisfied in big data because of its large volume and heterogeneity. So we propose a methodology based on box-plot and data smoothing for controling outlier and noise in big data analysis. The proposed methodology is not dependent upon the normal assumption. In addition, we select patent documents as target domain of big data because patent big data analysis is a important issue in management of technology. We analyze patent documents using big data learning methods for technology analysis. The collected patent data from patent databases on the world are preprocessed and analyzed by text mining and statistics. But the most researches about patent big data analysis did not consider the outlier and noise problem. This problem decreases the accuracy of prediction and increases the variance of parameter estimation. In this paper, we check the existence of the outlier and noise in patent big data. To know whether the outlier is or not in the patent big data, we use box-plot and smoothing visualization. We use the patent documents related to three dimensional printing technology to illustrate how the proposed methodology can be used for finding the existence of noise in the searched patent big data.

Box-Cox Power Transformation Using R

  • Baek, Hoh Yoo
    • 통합자연과학논문집
    • /
    • 제13권2호
    • /
    • pp.76-82
    • /
    • 2020
  • If normality of an observed data is not a viable assumption, we can carry out normal-theory analyses by suitable transforming data. Power transformation by Box and Cox, one of the transformation methods, is derived the power which maximized the likelihood function. But it doesn't induces the closed form in mathematical analysis. In this paper, we compose some R the syntax of which is easier than other statistical packages for deriving the power with using numerical methods. Also, by using R, we show the transformed data approximately distributed the normal through Q-Q plot in univariate and bivariate cases with some examples. Finally, we present the value of a goodness-of-fit statistic(AD) and its p-value for normal distribution. In the similar procedure, this method can be extended to more than bivariate case.

탐색적 자료분석시 그래프의 활용에 대한 연구 (A Study for the Application of Graphs in Exploratory Data Analysis)

  • 장대흥
    • 응용통계연구
    • /
    • 제15권2호
    • /
    • pp.433-448
    • /
    • 2002
  • 탐색적 자료분석에서는 자료를 통계적 모형에 바로 적합시키기 보다 자료를 있는 그대로 보려는 데 중점을 두므로 현시성을 강조한다. 따라서, 다양한 그래프가 사용되는데. 본 논문에서는 이러한 그래프들을 이용하여 탐색적 자료분석의 몇 가지 유용한 사례들을 보이고자 한다.

상수도용 Pipeline의 누수고장 자료 분석 (Data Analysis of First Leak Time of Water Pipeline)

  • 나명환;함상민
    • 한국신뢰성학회지:신뢰성응용연구
    • /
    • 제11권3호
    • /
    • pp.213-224
    • /
    • 2011
  • In this paper, we analyze statistically the data set of first leak time of water pipeline. We classify first the leak time data by pipe type, location, diameter of pipe and, length of pipe. We perform the analysis of variance to indicate that there are significant difference of mean of the time between levels of the factor and also compare the distribution of levels using the multiple box-plot. When there are the difference of the mean, we perform the least significant test to find out what levels of the facor has a different mean.

탐색적 자료분석과 학교수학에서의 통계지도 (Exploratory Data Analysis and Teaching of Statistics in School Mathematics)

  • 김응환
    • 한국학교수학회논문집
    • /
    • 제1권1호
    • /
    • pp.35-45
    • /
    • 1998
  • This paper will present some basic and simple graphical methods of exploratory data analysis for the instrument of data analysis at school mathematics. Human beings perceive visual patterns more readily than patterns in collections of numbers. This is especially important in exploratory data analysis because pictures dramatically reveal things that we did not expect to find in the data set. Here are graphical methods as the stem and leaf plot, the box plot, the star plot and the face plot. These methods impulse the motivation of students in real life. And the subject can be taught in secondary school with several applications. Also It is important for students to get a feel for working with and manipulating data before studying the more theoretical aspects of statistics.

  • PDF

R 소프트웨어를 이용한 대기오염 데이터의 시각화 (Data visualization of airquality data using R software)

  • 오영창;박은식
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권2호
    • /
    • pp.399-408
    • /
    • 2015
  • 본 논문은 대기오염 자료를 여러 가지 방법의 데이터 시각화를 통해 나타내었고, 데이터 시각화 방법별로 통계적인 방법을 활용한 분석과 연계하여 어떤 특징을 알아 볼 수 있는지를 나타냈다. 데이터 시각화 도구로는 통계 패키지인 R을 사용하였다. 분석에 사용된 데이터는 뉴욕시에서 1973년 5월부터 9월까지 공기의 질을 측정한 자료이다. 먼저 단변량 분석과 단순회귀분석을 실시하여 데이터 시각화를 통해 자료의 기본적인 특성을 파악하고 시각화 방법으로 산점도행렬 등을 통해 특성을 한눈에 볼 수 있게 나타내었다. 다중 회귀 분석을 실시하여 로그변환 등을 이용하여 최적의 모형을 찾고 설명변수들을 범주화하여 상자그림이나 3차원 투시도, 3차원 산점도 등 여러 데이터 시각화 방법을 이용해 대기오염 데이터의 전체적인 특성들을 알아보았다.

영화 흥행 예측변수로서 온라인 구전 변수의 효과 (Effect of online word-of-mouth variables as predictors of box office)

  • 전성현;손영숙
    • 응용통계연구
    • /
    • 제29권4호
    • /
    • pp.657-678
    • /
    • 2016
  • 본 연구는 영화 흥행에 미치는 온라인 구전 변수들의 영향을 다루었다. 2012년 부터 2015년까지 4년 동안 국내에서 개봉한 총 관객 수 50만 이상인 276편의 영화에 대한 통계분석 결과 개봉 후 포털의 평가자 수, 개봉 후 블로그 수, 개봉 후 뉴스 수와 같은 온라인 구전의 크기를 나타내는 변수들이 온라인 구전의 방향을 나타내는 개봉 후 포털의 평점이나 혹은 영화의 내재적 속성을 나타내는 변수들로서 감독, 배우, 배급사, 등급, 국적, 개봉 월, 개봉 계절 등 보다 영화 흥행과 더욱 연관성이 있었다.

프리믹스 및 포스트믹스 시멘트를 혼입시간이 콘크리트의 압축강도에 미치는 영향 (Effect of Mixing Time of Pre-Mixed Cement and Post-Mixed Cement on the Strength Development of the Concrete)

  • 백성진;이혁;한준희;김종;한민철
    • 한국건축시공학회:학술대회논문집
    • /
    • 한국건축시공학회 2023년도 봄 학술논문 발표대회
    • /
    • pp.137-138
    • /
    • 2023
  • This study proposed the optimal mixing time for pre-mixed cement and post mixed cement using the statistical analysis method of box plots. Pre-mixed cement can prevent material seegregation, strength loss, and quality variation if mixed for at least 60 seconds, and the data median is shown to be within the box range. Post-mixed cement should be mixed for at least 180 seconds to prevent material segregation, strength loss, and quality variation, and compressive strength tends to increase with longer vibrating times. Therefore, it is suggested that using pre-mixed cement can shorten the vibrating time and increase the productivity of the concrete.

  • PDF

대파 뿌리 분비물내의 국화 생장 억제 활성물질 분석 (Analysis of Activative Inhibitors of Chrysanthemum from Root Exudate of Allium fistulosum)

  • 최상태;안형근;박인환
    • 아시안잔디학회지
    • /
    • 제13권3호
    • /
    • pp.171-176
    • /
    • 1999
  • Chrysanthemum showed worse grow of wilt to death during summer at the field which is Allium fistulosum (welsh onion) plants had been cultivated. This study was carried out to analysis of activative inhibitors of chrysanthemum from root exudate of Allium fistulosum. Bioassay experiments with welsh onion root exudate were conducted and the biologically active compounds were determined. The results were obtained as follows. The root exudate of welsh onion inhibited root and hypocotyl growth of chrysanthemum and lettuce at low concentration(10ppm). The inhibitory effects was higher in closed bottom box but with drain hole than in open bottom box plot. The inhibitory substance contained in root exudate was analysed as vanillic acid. This phenolic acid was also detected in stem-leaf and root of welsh onion.

  • PDF