• Title/Summary/Keyword: Box-Plot 방법

Search Result 23, Processing Time 0.026 seconds

Study on analysis of initial Data on 6 Sigma application in real fields (6 Sigma 현장적용 적용 시 초기 데이터 분석에 대한 고찰)

  • Lee, Sang-Bok;Choe, Eun-Hyang
    • Proceedings of the Korean Society for Quality Management Conference
    • /
    • 2009.10a
    • /
    • pp.33-39
    • /
    • 2009
  • 본 연구에서는 현장에서 6 시그마를 활용 시 통계분석의 기초가 되는 초기 데이터 분석에 대한 고찰이다. 통계의 가장 기본이 되는 데이터가 잘못되었으면 나머지 모두 문제가 된다. 이에 데이터 초기에 발생할 수 있는 여러 오류의 가능성을 살펴보고 각각에 대해 해결책을 제시하였다. 여기서 활용하는 방법들은 계측기 선정, Gage R&R, Histogram, Box-plot, PDF, Box-Cox 변화 등이다.

  • PDF

A Comparative Study on Methods for Outlier Test of Rainfall in Korea (국내 강우의 이상치검정 방법의 비교 연구)

  • Lee, Jung Sik;Shin, Chang Dong
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2018.05a
    • /
    • pp.359-359
    • /
    • 2018
  • 이상치는 표본자료에서 크게 어긋나 다른 자료들로부터 떨어져 표시되는 자료로써, 실제로 발생할 확률이 매우 낮은 자료로 정의되고 있다. 설계홍수량을 산정하기 위하여 적용하고 있는 극치계열의 연최대치 강우자료에는 기계오작동 및 엔지니어의 표독오류가 발생하고 있으며, 기후변화에 따른 거대태풍 및 국지적인 집중호우 발생 등으로 인한 극치값 등에서 이상치가 관측되고 있다. 통상 이상치들은 통계분석시 자료 본연의 특성을 왜곡시켜 편향된 결과를 산정할 수 있으므로 빈도해석시 이상치해석 절차를 수행하여 자료의 적정성을 확인하여야 한다. 현재 실무에서는 설계홍수량 산정요령과 하천설계기준 해설 등에서 관련 내용을 기술하고 있지만, 국내 강우자료의 기록연수의 부족으로 인하여 빈도해석시 이상치 해석이 미수행되고 있어 이상치에 따른 자료편의가 발생하면 결과물인 확률강우량이 왜곡되게 산정될 수 있다. 따라서, 본 연구에서는 국내 주요 도시의 강우자료를 이용하여 이상치검정을 수행하였다. 대상지점으로는 서울, 부산, 대전, 대구, 인천, 광주, 울산 등의 비교적 긴 관측년수를 보유하고 있는 광역시를 선정하였으며, 지속기간은 10분, 1~24시간의 25개 강우자료를 적용하였다. 이상치검정 방법으로는 타 방법에 비하여 이상치 검정력이 뛰어난 것으로 알려진 2가지 방법을 채택하였으며, 표본자료의 평균과 표준편차로 표준화된 z값을 이용하여 상 하 한계선를 초과하는 값을 확인하는 z-Score 방법중 향상된 중위수 절대편차(MAD)에 의한 수정 z-Score 방법(Hoaglin, 1993)과 Box-Plot 방법(Tukey, 1969)을 적용하였다. Box-Plot 방법(Tukey, 1969)은 전체 자료를 25%씩 사분위로 구분하는 방법으로 정렬된 자료계열을 중앙값, 박스, 수염(whiskers), 이상치로 구분한다. 정렬된 25~75% 값들을 박스로 포함하여 외곽의 수염값들을 이상치로 분류하며, 특히 사분위수의 도식화로 데이터의 분포를 파악하기 좋으며, 이상치들의 위치와 자료의 비대칭 여부를 쉽게 파악할 수 있다. 본 연구의 수행으로 수정 z-Score 방법의 경우에는 서울과 대구지점에는 이상치가 없으며, 부산지점에는 13개, 대전지점 7개, 인천지점 5개, 광주지점 32개, 울산지점 26개가 나타났다. Box-Plot 방법으로는 서울지점 35개, 부산지점 39개, 대전지점 32개, 대구지점 38개, 인천지점 51개, 광주지점 61개, 울산지점 65개의 이상치가 분석되었다. 연구를 수행한 결과, 수정 z-Score 방법에 비하여 Box-Plot 방법에 의한 이상치가 더 많이 발생하였으며, 각각의 방법으로 지속기간 및 연도별 이상치 발생자료를 확인하였다. 방법별 이상치 발생현황 등을 분석하여 지점별 발생횟수를 분석하였으며, 추후 지점 및 자료의 보완이 수행되면 활용성을 증대시킬 수 있을 것으로 판단된다.

  • PDF

Graphical Methods for Evaluating the Effect of Outliers in Univariate and Bivariate Data (일변량 및 이변량 자료에 대하여 특이값의 영향을 평가하기 위한 그래픽 방법)

  • Jang, Dae-Heung
    • Proceedings of the Korean Society for Quality Management Conference
    • /
    • 2006.11a
    • /
    • pp.221-226
    • /
    • 2006
  • We usually use two techniques(influence function and local influence) for detecting outliers. But, we cannot use these difficult techniques in elementary industrial statistics course for college students. We can use some simple graphical methods(box plot, dandelion seed plot, influence graph and cumulative deletion plot) for univariate and bivariate outlier detection and outlier effect in elementary industrial statistics course for college students.

  • PDF

Data visualization of airquality data using R software (R 소프트웨어를 이용한 대기오염 데이터의 시각화)

  • Oh, Youngchang;Park, Eunsik
    • Journal of the Korean Data and Information Science Society
    • /
    • v.26 no.2
    • /
    • pp.399-408
    • /
    • 2015
  • This paper presented airquality data through data visualization in several ways and described its characteristics related to statistical methods for analysis. Software R was used for visualization tools. The airquality data was measured in New York city from May to September of year 1973. First, simple, exploratory data analysis was done in terms of both data visualization and analysis to find out univariate characteristics. Then through data transformation and multiple regression analysis, model for describing the airquality level was found. Also, after some data categorization, overall feature of the data was explored using box plot and three-dimensional perspective drawing and scatter plot.

A study on estimating background concentration of groundwater for water quality assessment in non-water supply district (상수도 미보급 지역의 지하수 수질상태 평가를 위한 배경농도 산정방법에 관한 연구)

  • Yea, Young-Do;Seo, Yong-Gyo;Kim, Rak-Hyeon;Cho, Dong-Jun;Kim, Kwang-Shik;Cho, Wook-Sang
    • Journal of Korean Society of Water and Wastewater
    • /
    • v.28 no.3
    • /
    • pp.345-358
    • /
    • 2014
  • For introducing the groundwater quality assessment using background concentration of groundwater, several methods had been studied to estimate the background concentration of groundwater and to suggest the background concentration of study area. Some methods such as Box whisker plot, Percentile and Cumulative probability distribution had been adopted to estimate background concentration, and it was evaluated that the Cumulative probability distribution method presents more reasonable background concentration because it can consider the data distribution. So we estimated the background concentration of study area using cumulative probability distribution method. We suggested the background concentration for each hydrogeology respectively in case hydrogeological water quality similarity is very low.

Bivariate skewness, kurtosis and surface plot (이변량 왜도, 첨도 그리고 표면그림)

  • Hong, Chong Sun;Sung, Jae Hyun
    • Journal of the Korean Data and Information Science Society
    • /
    • v.28 no.5
    • /
    • pp.959-970
    • /
    • 2017
  • In this study, we propose bivariate skewness and kurtosis statistics and suggest a surface plot that can visually implement bivariate data containing the correlation coefficient. The skewness statistic is expressed in the form of a paired real values because this represents the skewed directions and degrees of the bivariate random sample. The kurtosis has a positive value which can determine how thick the tail part of the data is compared to the bivariate normal distribution. Moreover, the surface plot implements bivariate data based on the quantile vectors. Skewness and kurtosis are obtained and surface plots are explored for various types of bivariate data. With these results, it has been found that the values of the skewness and kurtosis reflect the characteristics of the bivariate data implemented by the surface plots. Therefore, the skewness, kurtosis and surface plot proposed in this paper could be used as one of valuable descriptive statistical methods for analyzing bivariate distributions.

The Study on Didactic Transposition for Teaching Statistical Graphs - The comparison between the Korean and MiC's textbooks (그래프의 교수학적 변환 방식 비교 -우리나라 교과서와 MiC 교과서의 초등 통계 내용을 중심으로-)

  • Lee, Kyung-Hwa;Ji, Eun-Jeung
    • Journal of Educational Research in Mathematics
    • /
    • v.18 no.3
    • /
    • pp.353-372
    • /
    • 2008
  • This study looks around the goals of teaching statistical graphs that are introduced in the seventh Korean Curriculum for Elementary School and in the Principles and Standards for School Mathematics(NCTM, 2000), and these are compared. We compare how to transpose statistical graphs didactically between the Korean and MiC textbooks. For it, it examines the types of statistical graphs, the methods defining them, and the making connections and comparing among them, which are content components in the chapters on statistical graphs. The results show that in contrast to the Korean textbooks, NCTM(2000) has allowed students to develop their own expression for data, to compare results analysed within different graphs, and to consider a graph as a whole in the goals of teaching statistical graphs. MiC textbooks have introduced the number-line plot and the box plot more than Korean. Although both of Korean and MiC textbooks usually use extensive methods for defining individual graphs, the former use extensive methods together with synonymic methods and the latter use extensive methods with the characteristics of graphs. Also, the number-line plot is defined using operative method in the MiC textbooks. MiC textbooks contain various activities for connecting and comparing graphs, but there are comparatively few comparing activities in the Korean textbooks.

  • PDF

Verifying Applicability of Multi-Timescale Rainfall Data from CHIRPS Satellite (다중시간 규모의 CHIRPS 위성 강우자료에 대한 활용성 검증)

  • Minseok Kim;Kyunghun Kim;Seong Cheol Shin;Soojun Kim;Hung Soo Kim
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2023.05a
    • /
    • pp.192-192
    • /
    • 2023
  • 우량계는 강우 자료를 수집하는 전통적인 방법 중 하나로, 연속적이고 직접적인 설치가 가능하다. 하지만 지형적 특성에 영향을 받아 강우량을 과소 측정하는 문제점이 있다. 이러한 문제를 해결하기 위해 국지적인 호우, 강우 이동 및 강우 상황 등을 파악할 수 있는 레이더를 이용한 강우 측정이 활용된다. 하지만 레이더 기반 측정 또한 우량계와 마찬가지로 과소 측정하는 문제점이 있다. 측정 한계를 극복하기 위해 최근에는 위성 기반 강우 자료를 사용하고 있다. 위성 기반의 강우 자료는 측정이 어려운 장소에서도 강우량의 수집이 가능하며, 지표 변화를 관측하여 강우 측정의 정확도를 높일 수 있다. 고화질 위성 자료인 CHIRPS (Climate Hazards Group InfraRed Precipitation with Stations) 자료는 미국 국제개발처, 항공우주국, 해양 대기청의 지원으로 1980년부터 현재까지 전 지구적 (50°S-50°N, 180°E-180°W) 0.05° × 0.05°의 해상도를 가진 강우량 데이터를 개발하였다. 본 연구에서는 전국 54개 ASOS (Automated Synpotic Observing System)에서 관측한 월 단위 및 일 단위 강우 자료를 기준으로 CHIRPS 강우 자료를 비교하였다. 또한, 다른 위성 강우 자료들 (APHRODITE (Asian Precipitation Highly Resolved Observation Data Integration Towards Evaluation), CMORPH (Climate Prediction Cneter morphing method))과도 비교하여 국내 적용성을 확인하였다. 강우 자료의 정확도를 비교하기 위해서 Box-plot, RMSE (Root Mean Squared Error) 등을 산정하였으며, 강우 발생 일을 비교하고자 오차 행렬을 활용하였다. 비교 결과를 통해서 CHIRPS 강우 자료가 다른 위성 강우 자료들에 비해서 국내 적용성이 높은 것을 확인할 수 있었으며, 추후 국내 수문학 연구에서 기초자료로서 활용될 수 있을 것으로 판단된다.

  • PDF

A Study on Model Based Optimum Design of Oxidation Ditch in Sewage Treatment (산화구 하수처리공정의 최적설계에 관한 기초연구)

  • Dho, Hyonseung
    • Journal of Korean Society of Disaster and Security
    • /
    • v.12 no.2
    • /
    • pp.25-34
    • /
    • 2019
  • The efficiency of sewage treatment was analyzed by statistical method based on the water quality and operation data of the sewage treatment plant applying the oxidation method. The obtained water quality data were pH, temperature, BOD, SS, T-N, ${NH_4}^+-N$, and T-P of influent and discharge water. Data analysis was performed by correlation analysis, ANOVA analysis, and cluster analysis. As a result of the statistical analysis, the influent flow rate in the sewage treatment plant was the highest in summer. The average inflow flow rate was $3.000m^3/s$. According to Box plot results, COD, and T-P concentrations of effluents were not significantly different from season to season. The Pearson correlation analysis showed strong positive correlation between BOD, COD, T-N, and T-P in influent flow. Seasonal BOD and T-N concentrations were highest in winter and COD and T-P in seasonal influences. BOD showed a strong negative correlation with the water temperature, but showed a positive correlation with other operating factors such as HRT, SRT and C/N. The higher the influent temperature, the lower the BOD concentration. Therefore, retention time was shortened and BOD treatment efficiency was lowered. It was found that T-N had a higher retention time and a higher concentration than DO concentration. On the other hand, T-P did not show a significant correlation with operating factors.

Effect of rice seed dressing with imidacloprid WS on early occurring rice insect pests (본답 초기해충의 생력방제를 위한 imidacloprid의 종자분의 효과)

  • Choi, Byung-Ryul;Yoo, Jae-Ki;Lee, Sang-Guei;Lee, Jeong-Oon
    • The Korean Journal of Pesticide Science
    • /
    • v.2 no.1
    • /
    • pp.85-90
    • /
    • 1998
  • A series of experiments were carried out to determine the effect of seed dressing application of chemicals on the early occurring rice insect pests. The number of small brown planthopper adults per 3hills in seed-dressing plot of Imidacloprid WS (Im WS) was 1.6 and its control efficacy was over 90%, compared with that of untreated plot. Rice water weevil was observed in the density of 8.8 larvae per 5 hills seed-dressed Im WS plots(showing 95.5% of control efficacy). Control efficacy of Im WS and Im GR against adult weevils lasted for 26 days after treatment and was higher than that of Carbofuran GR. Rates of injured stems by rice stem maggot and injured leaves by rice leaf miner were 3% and 3.7% in Im WS treatment plot respectively. Seed germination rate after seed dressing with recommended dosage (3 g/seed kg) of Im WS was 71 % on the 1st day and increased on 5th day up to that of untreated seed. The residual amount of Im in seed dressing plot was 0.11 ppm in rice roots and 0.05 ppm in leaves on the 40th day after treatment. Residual effect of Im WSI sustained for 50 days with over 95% insecticidal effect for the rice water weevil and over 90% for the brown planthopper. Quantity of the chemical applied in the field was calculated as 0.084 kg a.i./ha in seed dressing and 0.3 kg a.i./ha in seed box treatment, respectively It took 1 hour to treat insecticide by seed dressing, 2.5 hours by seed box applying, and 3.6 hours by water surface releasing per 990 $m^2$.

  • PDF