• 제목/요약/키워드: Box-Plot 방법

검색결과 23건 처리시간 0.024초

6 Sigma 현장적용 적용 시 초기 데이터 분석에 대한 고찰 (Study on analysis of initial Data on 6 Sigma application in real fields)

  • 이상복;최은향
    • 한국품질경영학회:학술대회논문집
    • /
    • 한국품질경영학회 2009년도 추계학술대회
    • /
    • pp.33-39
    • /
    • 2009
  • 본 연구에서는 현장에서 6 시그마를 활용 시 통계분석의 기초가 되는 초기 데이터 분석에 대한 고찰이다. 통계의 가장 기본이 되는 데이터가 잘못되었으면 나머지 모두 문제가 된다. 이에 데이터 초기에 발생할 수 있는 여러 오류의 가능성을 살펴보고 각각에 대해 해결책을 제시하였다. 여기서 활용하는 방법들은 계측기 선정, Gage R&R, Histogram, Box-plot, PDF, Box-Cox 변화 등이다.

  • PDF

국내 강우의 이상치검정 방법의 비교 연구 (A Comparative Study on Methods for Outlier Test of Rainfall in Korea)

  • 이정식;신창동
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2018년도 학술발표회
    • /
    • pp.359-359
    • /
    • 2018
  • 이상치는 표본자료에서 크게 어긋나 다른 자료들로부터 떨어져 표시되는 자료로써, 실제로 발생할 확률이 매우 낮은 자료로 정의되고 있다. 설계홍수량을 산정하기 위하여 적용하고 있는 극치계열의 연최대치 강우자료에는 기계오작동 및 엔지니어의 표독오류가 발생하고 있으며, 기후변화에 따른 거대태풍 및 국지적인 집중호우 발생 등으로 인한 극치값 등에서 이상치가 관측되고 있다. 통상 이상치들은 통계분석시 자료 본연의 특성을 왜곡시켜 편향된 결과를 산정할 수 있으므로 빈도해석시 이상치해석 절차를 수행하여 자료의 적정성을 확인하여야 한다. 현재 실무에서는 설계홍수량 산정요령과 하천설계기준 해설 등에서 관련 내용을 기술하고 있지만, 국내 강우자료의 기록연수의 부족으로 인하여 빈도해석시 이상치 해석이 미수행되고 있어 이상치에 따른 자료편의가 발생하면 결과물인 확률강우량이 왜곡되게 산정될 수 있다. 따라서, 본 연구에서는 국내 주요 도시의 강우자료를 이용하여 이상치검정을 수행하였다. 대상지점으로는 서울, 부산, 대전, 대구, 인천, 광주, 울산 등의 비교적 긴 관측년수를 보유하고 있는 광역시를 선정하였으며, 지속기간은 10분, 1~24시간의 25개 강우자료를 적용하였다. 이상치검정 방법으로는 타 방법에 비하여 이상치 검정력이 뛰어난 것으로 알려진 2가지 방법을 채택하였으며, 표본자료의 평균과 표준편차로 표준화된 z값을 이용하여 상 하 한계선를 초과하는 값을 확인하는 z-Score 방법중 향상된 중위수 절대편차(MAD)에 의한 수정 z-Score 방법(Hoaglin, 1993)과 Box-Plot 방법(Tukey, 1969)을 적용하였다. Box-Plot 방법(Tukey, 1969)은 전체 자료를 25%씩 사분위로 구분하는 방법으로 정렬된 자료계열을 중앙값, 박스, 수염(whiskers), 이상치로 구분한다. 정렬된 25~75% 값들을 박스로 포함하여 외곽의 수염값들을 이상치로 분류하며, 특히 사분위수의 도식화로 데이터의 분포를 파악하기 좋으며, 이상치들의 위치와 자료의 비대칭 여부를 쉽게 파악할 수 있다. 본 연구의 수행으로 수정 z-Score 방법의 경우에는 서울과 대구지점에는 이상치가 없으며, 부산지점에는 13개, 대전지점 7개, 인천지점 5개, 광주지점 32개, 울산지점 26개가 나타났다. Box-Plot 방법으로는 서울지점 35개, 부산지점 39개, 대전지점 32개, 대구지점 38개, 인천지점 51개, 광주지점 61개, 울산지점 65개의 이상치가 분석되었다. 연구를 수행한 결과, 수정 z-Score 방법에 비하여 Box-Plot 방법에 의한 이상치가 더 많이 발생하였으며, 각각의 방법으로 지속기간 및 연도별 이상치 발생자료를 확인하였다. 방법별 이상치 발생현황 등을 분석하여 지점별 발생횟수를 분석하였으며, 추후 지점 및 자료의 보완이 수행되면 활용성을 증대시킬 수 있을 것으로 판단된다.

  • PDF

일변량 및 이변량 자료에 대하여 특이값의 영향을 평가하기 위한 그래픽 방법 (Graphical Methods for Evaluating the Effect of Outliers in Univariate and Bivariate Data)

  • 장대흥
    • 한국품질경영학회:학술대회논문집
    • /
    • 한국품질경영학회 2006년도 추계 학술대회
    • /
    • pp.221-226
    • /
    • 2006
  • We usually use two techniques(influence function and local influence) for detecting outliers. But, we cannot use these difficult techniques in elementary industrial statistics course for college students. We can use some simple graphical methods(box plot, dandelion seed plot, influence graph and cumulative deletion plot) for univariate and bivariate outlier detection and outlier effect in elementary industrial statistics course for college students.

  • PDF

R 소프트웨어를 이용한 대기오염 데이터의 시각화 (Data visualization of airquality data using R software)

  • 오영창;박은식
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권2호
    • /
    • pp.399-408
    • /
    • 2015
  • 본 논문은 대기오염 자료를 여러 가지 방법의 데이터 시각화를 통해 나타내었고, 데이터 시각화 방법별로 통계적인 방법을 활용한 분석과 연계하여 어떤 특징을 알아 볼 수 있는지를 나타냈다. 데이터 시각화 도구로는 통계 패키지인 R을 사용하였다. 분석에 사용된 데이터는 뉴욕시에서 1973년 5월부터 9월까지 공기의 질을 측정한 자료이다. 먼저 단변량 분석과 단순회귀분석을 실시하여 데이터 시각화를 통해 자료의 기본적인 특성을 파악하고 시각화 방법으로 산점도행렬 등을 통해 특성을 한눈에 볼 수 있게 나타내었다. 다중 회귀 분석을 실시하여 로그변환 등을 이용하여 최적의 모형을 찾고 설명변수들을 범주화하여 상자그림이나 3차원 투시도, 3차원 산점도 등 여러 데이터 시각화 방법을 이용해 대기오염 데이터의 전체적인 특성들을 알아보았다.

상수도 미보급 지역의 지하수 수질상태 평가를 위한 배경농도 산정방법에 관한 연구 (A study on estimating background concentration of groundwater for water quality assessment in non-water supply district)

  • 여영도;서용교;김락현;조동준;김광식;조욱상
    • 상하수도학회지
    • /
    • 제28권3호
    • /
    • pp.345-358
    • /
    • 2014
  • For introducing the groundwater quality assessment using background concentration of groundwater, several methods had been studied to estimate the background concentration of groundwater and to suggest the background concentration of study area. Some methods such as Box whisker plot, Percentile and Cumulative probability distribution had been adopted to estimate background concentration, and it was evaluated that the Cumulative probability distribution method presents more reasonable background concentration because it can consider the data distribution. So we estimated the background concentration of study area using cumulative probability distribution method. We suggested the background concentration for each hydrogeology respectively in case hydrogeological water quality similarity is very low.

이변량 왜도, 첨도 그리고 표면그림 (Bivariate skewness, kurtosis and surface plot)

  • 홍종선;성재현
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권5호
    • /
    • pp.959-970
    • /
    • 2017
  • 본 연구에서는 두 변수의 상관계수를 반영한 이변량 자료의 왜도와 첨도 통계량을 제안하고, 시각적으로 표현할 수 있는 표면그림을 개발한다. 이변량 왜도 통계량은 이변량 확률표본 자료의 치우침 방향과 정도를 표현하는 실수 한 쌍으로 정의한다. 첨도는 양의 값을 가지며 이변량 정규분포를 기준으로 꼬리 부분의 두터운 정도를 파악할 수 있다. 그리고 표면그림은 분위벡터를 바탕으로 평면에 구현한다. 다양한 형태의 이변량 자료를 생성하여 표면그림을 작성하고 왜도와 첨도를 계산하여 탐색해 본 결과, 왜도와 첨도 값들은 표면그림으로 구현한 이변량 자료의 특징을 잘 반영하는 것을 발견할였다. 그러므로 본 논문에서 제안한 왜도, 첨도 그리고 표면그림은 이변량 분포를 분석하는 기술통계학적 방법으로 활용할 수 있다.

그래프의 교수학적 변환 방식 비교 -우리나라 교과서와 MiC 교과서의 초등 통계 내용을 중심으로- (The Study on Didactic Transposition for Teaching Statistical Graphs - The comparison between the Korean and MiC's textbooks)

  • 이경화;지은정
    • 대한수학교육학회지:수학교육학연구
    • /
    • 제18권3호
    • /
    • pp.353-372
    • /
    • 2008
  • 본 연구는 우리나라 제7차 초등학교 교육과정과 NCTM(2000)의 "학교수학을 위한 원리와 규준" 에서 제시하고 있는 그래프 지도의 목표를 살펴보고, 우리나라 교과서와 MiC 교과서에서 그래프를 어떻게 교수학적으로 변환하여 다루고 있는지 비교한다. 이를 위해 그래프 단원의 내용 요소로서 그래프의 종류와 정의 방식, 그래프 비교 활동에 대한 교수학적 변환 방식을 비교하여 살펴보았다. 연구 결과, 그래프 지도 목표에서 우리나라에 비해 NCTM(2000)에서는 학생 스스로 자료를 표현하는 방법의 개발을 허용하며, 그래픽 표현 방법에 따른 분석 결과를 비교하도록 한다. 또, 그래프를 통해 자료 전체에 주목하여 설명하도록 한다는 차이점을 확인하였다. 두 교과서에서 다루는 그래프의 종류는 우리나라에 비해 MiC 교과서에서 number-line plot과 상자 그림을 더 다루고 있었다. 그래프를 정의하는 방법은 두 나라가 외연적 정의 방법을 주로 사용하고 있으나, 우리나라 교과서는 외연적 방법과 동의적 방법을 혼합하여 사용하고, MiC 교과서는 외연적 정의 방법을 그래프의 특징과 함께 사용하는 경우가 있었다. 그래프간의 비교 활동은 우리나라 교과서가 매우 빈약한 반면에, MiC 교과서는 여러 가지 형태의 비교 활동이 이루어지고 있음을 확인하였다.

  • PDF

다중시간 규모의 CHIRPS 위성 강우자료에 대한 활용성 검증 (Verifying Applicability of Multi-Timescale Rainfall Data from CHIRPS Satellite)

  • 김민석;김경훈;신성철;김수전;김형수
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.192-192
    • /
    • 2023
  • 우량계는 강우 자료를 수집하는 전통적인 방법 중 하나로, 연속적이고 직접적인 설치가 가능하다. 하지만 지형적 특성에 영향을 받아 강우량을 과소 측정하는 문제점이 있다. 이러한 문제를 해결하기 위해 국지적인 호우, 강우 이동 및 강우 상황 등을 파악할 수 있는 레이더를 이용한 강우 측정이 활용된다. 하지만 레이더 기반 측정 또한 우량계와 마찬가지로 과소 측정하는 문제점이 있다. 측정 한계를 극복하기 위해 최근에는 위성 기반 강우 자료를 사용하고 있다. 위성 기반의 강우 자료는 측정이 어려운 장소에서도 강우량의 수집이 가능하며, 지표 변화를 관측하여 강우 측정의 정확도를 높일 수 있다. 고화질 위성 자료인 CHIRPS (Climate Hazards Group InfraRed Precipitation with Stations) 자료는 미국 국제개발처, 항공우주국, 해양 대기청의 지원으로 1980년부터 현재까지 전 지구적 (50°S-50°N, 180°E-180°W) 0.05° × 0.05°의 해상도를 가진 강우량 데이터를 개발하였다. 본 연구에서는 전국 54개 ASOS (Automated Synpotic Observing System)에서 관측한 월 단위 및 일 단위 강우 자료를 기준으로 CHIRPS 강우 자료를 비교하였다. 또한, 다른 위성 강우 자료들 (APHRODITE (Asian Precipitation Highly Resolved Observation Data Integration Towards Evaluation), CMORPH (Climate Prediction Cneter morphing method))과도 비교하여 국내 적용성을 확인하였다. 강우 자료의 정확도를 비교하기 위해서 Box-plot, RMSE (Root Mean Squared Error) 등을 산정하였으며, 강우 발생 일을 비교하고자 오차 행렬을 활용하였다. 비교 결과를 통해서 CHIRPS 강우 자료가 다른 위성 강우 자료들에 비해서 국내 적용성이 높은 것을 확인할 수 있었으며, 추후 국내 수문학 연구에서 기초자료로서 활용될 수 있을 것으로 판단된다.

  • PDF

산화구 하수처리공정의 최적설계에 관한 기초연구 (A Study on Model Based Optimum Design of Oxidation Ditch in Sewage Treatment)

  • 도현승
    • 한국방재안전학회논문집
    • /
    • 제12권2호
    • /
    • pp.25-34
    • /
    • 2019
  • 본 연구에서는 산화구 방법으로 하수처리를 하는 공공 하수처리장을 선정하여 통계적인 방법으로 처리장의 수질 및 운영의 효율을 분석하였다. 얻어진 수질 데이터는 유입수 및 배출수의 pH, 온도, BOD, SS, T-N, ${NH_4}^+-N$ 및 T-P였다. 데이터 분석은 군집분석, 상관분석, ANOVA 분석, 클러스터 분석으로 수행되었다. 통계분석 결과, 하수 처리장의 유입 유량은 여름에 가장 높았으며 평균 유속은 $3.000m^3/s$이었다. Box plot 결과에 따르면, 하수의 COD, 총인 농도는 계절에 변화에 따라 크게 차이가 없었다. Pearson 상관관계 분석결과는 유입수에서 BOD, COD, T-N 및 T-P 간에 강한 양의 상관관계를 보였다. 계절변화에 따른 BOD와 T-N 농도는 겨울철에 가장 높았고, 계절에 따른 온도의 영향은 COD와 T-P가 가장 높았다. BOD는 수온과 음의 상관관계를 보였으나 HRT, SRT, C/N과 같은 공정인자는 양의 상관관계를 나타내었다. 유입수 온도가 높을수록 BOD 농도가 낮아지는 현상을 보였으며, 체류 시간이 단축될수록 BOD의 처리 효율이 저하되었다. T-N은 효율적인 처리를 위해 긴 체류 시간이 필요했으나 T-P는 공정인자의 변화에 따른 상관관계도에서 다소 적게 나타났다.

본답 초기해충의 생력방제를 위한 imidacloprid의 종자분의 효과 (Effect of rice seed dressing with imidacloprid WS on early occurring rice insect pests)

  • 최병렬;유재기;이상계;이정운
    • 농약과학회지
    • /
    • 제2권1호
    • /
    • pp.85-90
    • /
    • 1998
  • 벼 본논초기에 발생하여 피해를 주는 해충을 효과적으로 방제하고자 몇가지 약제를 종자분의 및 육묘상처리를 하여 다음과 같은 결과를 얻었다. Imidacloprid의 종자분의처리구에서 애멸구 성충수는 3주당 1.6마리로 방제효과가 94% 이상이었으며, 벼물바구미 유충은 5주당 8.8마리로 95.5%의 방제효과를 보였다. 또한, imidacloprid 종자분의처리와 육묘상처리구에서 벼물바구미 성충의 밀도와 피해정도는 약제처리후 26일 까지도 무처리구의 1/10에 불과 하였다. 또한 imidacloprid WS의 종자분의 처리구에서는 벼줄기굴파리의 피해경율은 3%, 벼애잎굴파리의 피해엽율은 3.7%로 90%이상의 방제효과를 보였다. Imidacloprid WS을 추천약량으로 종자분의하였을 때 볍씨의 발아율은 처리 1일후에는 71%로 낮았지만 처리후 5일경에는 무처리의 발아율과 비슷한 수준을 보였다. Imidacloprid WS의 도체내 잔류량은 처리후 40일경에 뿌리와 잎에서 각각 0.11 ppm, 0.05 ppm이었으며, 벼물바구미와 벼멸구에 대하여 약효지속기간은 각각 약제처리 50일과 55일후까지 90%이상의 방제효과을 보였다. 논에서 약제처리방법별 살포되는 농약의 유효성 분량을 조사한 결과 imidacloprid 70% WS는 ha당 0.084 kg이 사용되었으며 2% GR은 0.3 kg이 투여되었다. 약제처리방법별로 종자분의처리는 약제살포시간이 ha당 1시간이 소요되었으나, 육묘상처리는 2.5시간, 수면처리는 3.6시간이 소요되어 종자분의처리가 다른 방제방법보다 $2.5{\sim}3.6$배의 방제소요시간이 절감되었다.

  • PDF