• 제목/요약/키워드: 통계 오류

검색결과 384건 처리시간 0.025초

Indicator 크리깅을 이용한 부산지하수 수질의 오염도 연구

  • 강동환;정상용;김병우;심병완;성익환;조병욱
    • 한국지하수토양환경학회:학술대회논문집
    • /
    • 한국지하수토양환경학회 2003년도 추계학술발표회
    • /
    • pp.249-253
    • /
    • 2003
  • 강서구를 제외한 부산 전지역에서 1998년도에 조사된 지하수 수질 중 6개 성분(pH, TS, KMnO$_4$, Cl, SO$_4$, NO$_3$-N)에 대한 일반통계분석 결과 pH 성분을 제외하고는 5개 성분의 중앙값이 평균보다 적은 값을 보이는 양성왜도를 보임으로써, 수질오염정도를 분석하기 위해 지시크리깅이라는 비모수적인 지구통계분석기법을 적용하였다. 6개 수질성분에 대해 음용수 기준치를 적용하여 음용가능은 “1”의 값이, 음용불가능은 “0”의 값이 주어졌다. 이렇게 변환된 자료를 이용하여 각 성분별로 실험적인 베리오그램 분석을 실시한 결과 pH, TS, SO$_4$ 성분은 선형모델이 선정되었으며, KMnO$_4$, Cl, NO$_3$-N 성분은 구상형모델이 선정되었다. 본 연구에서는 지시크리깅을 이용하여 6개 성분의 분포도를 작성하고 부산지역의 오염정도를 분석하였다. 지시크리깅기법은 연구지역 전체의 정량적인 분포를 나타내지는 못하지만, 오염의 유.무와 오염의 크기를 정확하게 파악할 수 있으며 또한, 이상치(outlier)가 크게 영향을 미칠 수 있는 통계학적인 오류를 보완할 수 있다.

  • PDF

규칙과 어절 확률을 이용한 혼합 품사 태깅 모델 (POS-Tagging Model Combining Rules and Word Probability)

  • 황명진;강미영;권혁철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (B)
    • /
    • pp.11-15
    • /
    • 2006
  • 본 논문은, 긍정적 가중치와 부정적 가중치를 통해 표현되는 규칙에 기반을 둔 품사 태깅 모델과, 형태 소 unigram 정보와 어절 내의 카테고리 패턴에 기반하여 어절 확률을 추정하는 품사 태깅 모델의 장점을 취하고 단점을 보완할 수 있는 혼합 품사 태깅 모델을 제안한다. 이 혼합 모델은 먼저, 규칙에 기반한 품사 태깅을 적용한 후, 규칙이 해결하지 못한 결과에 대해서 통계적인 기법을 사용하여 품사 태깅을 한다. 본 연구는 어절 내 카테고리 패턴정보에 따른 파라미터 set과 형태소 unigram만을 이용해 어절 확률을 계산해 내므로 다른 통계기반 접근방법에서와는 달리 작은 크기의 통계사전만을 필요로 하며, 카테고리 패턴 정보를 사용함으로써 통계기반 접근 방법의 가장 큰 문제점인 data sparseness 문제 또한 줄일 수 있다는 이점이 있다. 특히, 본 논문에서 사용할 통계 모델은 어절 확률에 기반을 두고 있기 때문에 한국어의 특성을 잘 반영할 수 있다. 본 논문에서 제안한 혼합 모델은 규칙이 적용된 후에도 후보열이 둘 이상 남아 오류로 반환되었던 어절 중 24%를 개선한다.

  • PDF

빅데이터 통계그래픽스의 유형 및 특정 - 인지적 방해요소를 중심으로 - (The types and characteristics of statistical big-data graphics with emphasis on the cognitive discouragements)

  • 심미희;류시천
    • 스마트미디어저널
    • /
    • 제3권3호
    • /
    • pp.26-35
    • /
    • 2014
  • 통계그래픽스는 정량적인 데이터를 이용하여 정보 분석, 추출, 시각화의 과정을 거쳐 정확한 정보전달과 효과적인 이해를 위해 사용자 인지측면에 초점을 둔 디자인 분야이다. 이러한 통제그래픽스에 빅데이터의 구성요소들 내포하게 될 경우 빅데이터 통제그래픽스라고 할 수 있다. 통계그래픽스에서 시각적 요소는 인지부분에 대한 오류를 줄이고 성공적으로 정보를 전달하기 위해 사용되어야 하지만, 빅데이터 통계그래픽스에서는 방대한 데이터로 인해 시각적 요소가 오히려 인지적 방해를 일으키고 있다. 본 연구는 빅데이터 통계 그래픽스에서 나타날 수 있는 인지적 방해요소를 도출하여 제시하는 것을 목적으로 한다. 빅데이터의 통계그래픽스의 유형을 구조적 형태를 바탕으로 '네트워크 유형', '세그먼트 유형', '혼합유형' 세 가지로 분류하였고, 그에 따른 특징들을 탐색하였다. 특히, 빅데이터 통계그래픽스에서 시각적 주요요소를 기반으로 시각화의 고도화 시 나타날 수 있는 인지적 방해요소를 '다차원 범례', '다양한 색채', '정보의 중첩', '서체의 가독성' 네 가지로 도출하여 제시하였다.

작은도서관 통계지표 개선에 관한 연구 (A Study to Improve the Statistical Indicators of Small Libraries)

  • 안인자;윤소영;차성종
    • 한국도서관정보학회지
    • /
    • 제42권4호
    • /
    • pp.375-393
    • /
    • 2011
  • 작은도서관이 공공도서관의 영역에 포함되면서 작은도서관의 제도적 보완, 지원 정책틀 마련, 운영활성화를 위한 정책적 결정을 하여야 하는 시기에 이르렀다. 이러한 정책결정 도구로서 도서관통계가 충실하게 이루어지도록 작은도서관 통계지표를 개선할 필요가 있다. 현재의 작은도서관통계(문고)는 2008년 마련된 공공도서관 통계의 틀에 일부항목을 수정하여 국가도서관통계에서 활용하고 있다. 하지만 항목의 불합리성으로 91.3%의 무응답율과 수집된 데이터의 오류가 상당히 많다. 본 연구에서 개선을 위하여 작은도서관 현황조사 4종, 평가기준 7종을 분석하고, 이를 기초로 하여 2차에 걸친 자문회의, 경기도 지역의 3개 지자체 작은도서관 108개관의 현장조사 결과를 반영하여 개선된 통계지표를 제시하였다. 제시된 통계는 7개 영역 37개 항목이다.

학년 상승에 따른 초등학생들의 자연수 사칙계산 오답유형 및 오답률 추이와 그에 따른 교수학적 시사점 (The Transition of Error Patterns and Error Rates in Elementary Students' Arithmetic Performance by Going Up Grades and Its Instructional Implication)

  • 김수미
    • 한국초등수학교육학회지
    • /
    • 제16권1호
    • /
    • pp.125-143
    • /
    • 2012
  • 이 연구는 학년이 상승하면서 초등학생들의 자연수 계산 오류가 어떤 양상을 띠며 변해 가는지를 알아보고, 이를 통해 효율적인 계산 지도를 위한 시사점을 도출하고자 시도되었다. 이를 위해 수도권의 한 초등학교 3, 4, 5, 6학년 580명을 대상으로, 동일한 뺄셈, 곱셈, 나눗셈 검사지를 풀게 하였으며, 미리 설정한 오류유형틀에 입각하여 학생의 오답 반응을 분석하였다. 학생들의 반응을 분석한 결과, 세 계산 영역에서 학년 상승에 따른 계산 수행능력의 향상이 통계적으로 유의미한 수치로 나타났으며, 계산 절차를 처음 배우는 시점에서 차년도까지의 향상 폭이 가장 큰 것으로 나타났다. 그러나 초등학생들의 계산 오류는 일회 혹은 이회 정도 반복되지만 삼회이상은 잘 반복되지 않는, 체계성이나 고착성이 비교적 낮은 것으로 드러났다. 마지막으로, 이러한 내용을 바탕으로 계산 지도의 효율성을 높이기 위한 지도 전략을 제안하였다.

  • PDF

다중 표상을 활용한 화학 개념 학습에서 학생들의 장독립성-장의존성에 따른 연계 오류 분석 (Analysis of Connection Errors by Students' Field Independence-Dependence in Learning Chemistry Concepts with Multiple External Representations)

  • 강훈식;이종현;노태희
    • 한국과학교육학회지
    • /
    • 제28권5호
    • /
    • pp.471-481
    • /
    • 2008
  • 이 연구에서는 학생들이 현재의 과학 교과서에서 화학 개념 학습을 위해 제시된 외적 표상들을 연계하는 과정에서 범하는 오류 유형을 학생들의 장독립성-장의존성에 따라 조사했다. 1개 중학교 1학년 학생 196명을 '보일의 법칙'을 학습하는 BL 집단과 '샤를의 법칙'을 학습하는 CL 집단으로 배치한 후, 장독립성-장의존성 검사를 실시했다. 각 집단 학생들에게 물질의 입자성이 강조된 글과 그림으로 해당 개념을 학습하게 한 후, 연계 과정 검사를 실시했다. 연구 결과, '불충한 연결', '부적절한 연결', '무분별한 연결', '불가능한 연결', '연결 불이행'의 5가지 연계 오류 유형이 나타났다. 이 중에서도 목표 개념과 관계없이 '연결 불이행', '부적절한 연결', '무분별한 연결'이 많이 나타났다. 장독립적 학생들과 장의존적 학생들이 범한 연계 오류의 빈도 사이에는 통계적으로 유의미한 차이가 없었다. 이에 대한 교육적 함의를 논의했다.

비유를 사용한 물질의 세 가지 생태 개념 학습에서 대응 오류 분석 활동의 효과 (The Effects of Analyzing Mapping Errors in Concept Learning on the Three States of Matter with Analogy)

  • 김경순;변지선;신은주;노태희
    • 한국과학교육학회지
    • /
    • 제27권9호
    • /
    • pp.778-786
    • /
    • 2007
  • 이 연구에서는 비유를 사용한 화학 개념 학습에서 대응 오류 분석 활동의 효과를 개념 이해도,대응 관계 이해도,수업에 대한 인식 측면에서 조사하였다. 2개 중학교의 1학년 121명을 비교 집단과 처치 집단으로 배치한 후,'물질의 상태와 분자 배열'에 대하여 수업을 실시하였다. 비교 집단에서는 TWA 모형에 기초한 비유 수업을 하였고,처치 집단에서는 TWA 모형의 '유사성 대응' 및 '차이점 지적'을 '대응 오류 분석 활동'으로 대체한 수업을 하였다. 연구 결과,학생들의 장의존성 장독립성에 관계없이 개념 이해도 검사와 대응 관계 이해도 검사에서 처치 집단의 점수가 비교 집단보다 높았으며,그 차이가 통계적으로 유의미하였다. 수업에 대한 인식 검사 결과에서는 대부분의 학생들이 비유를 사용하는 수업에 대해 긍정적으로 인식하였으나,처치 집단의 학생들은 대응 오류 분석 활동을 어려워하는 것으로 나타났다. 이에 대한 교육적 함의를 논의하였다.

환자-대조군 연구에서 인구집단 층화가 일배체형 경향성 검정에 미치는 영향 (Study on Effects of Population Stratification on Haplotype Trend Test in Case-Control Studies)

  • 김진흠;강대룡;임현선;남정모
    • 응용통계연구
    • /
    • 제22권5호
    • /
    • pp.1085-1096
    • /
    • 2009
  • 환자-대조군 연관성 연구에서 후보 유전자와 질병이 연관되어 있지 않더라도 인구집단 층화로 인해 가짜 연관성이 발생할 수도 있다. 본 연구에서는 일배체형에 기초한 환자-대조군 연관성 연구에서 인구집단 층화로 인한 가짜 연관성을 해결하기 위한 방법으로, Zaykin 등 (2002)이 제안한 일배체형 경향성 모형에 인구집단 층화에 대한 정보를 추가하고자 한다. Zaykin 등 (2002)의 모형과 제안한 모형에 기초한 일배체형의 유의성 검정에서 인구집단 층화와 인구집단에 대한 관측 오차가 제1종 오류율에 미치는 영향을 모의실험을 통해 살펴보았다. 인구집단이 층화되어 있지만 각 개체가 속한 인구집단을 정확히 알 수 있을 때, Zaykin 등 (2002)의 모형에 기초한 검정은 제1종 오류율을 잘 조절하지 못했지만 본 연구에서 제안한 모형에 기초한 검정은 제1종 오류율을 잘 조절하는 것으로 나타났다. 그러나 인구집단이 층화되어 있고 관측 오차가 존재하면 제안한 모형에 기초한 검정도 제1종 오류율을 조절하지 못하고 명목 유의수준보다 큰 값을 갖는 것으로 나타났다. 따라서 단일염기다형성에 기초한 환자-대조군 연관성 연구와 마찬가지로 일배체형에 기초한 환자-대조군 연관성 연구에서도 인구집단 층화에 대한 정보를 갖고 있다할지라도 그 속에 관측 오차가 존재하면 위양성을 피하기 어렵다는 것을 알 수 있었다.

간호사가 인식한 조직의 특성과 투약오류보고장애요인간의 정준상관관계 (Canonical correlation between organizational characteristics and barrier to medication error reporting of nurses)

  • 김민정;김명수
    • 한국산학기술학회논문지
    • /
    • 제15권2호
    • /
    • pp.979-988
    • /
    • 2014
  • 본 연구는 간호사들이 인식한 안전 분위기와 업무환경을 포함한 조직의 특성과 투약오류보고장애요인간의 관련성을 검증하기 위한 연구이다. 수정된 안전 분위기, 업무환경, 투약오류보고장애 문항을 활용하여 7개 병원의 334명의 간호사들을 대상으로 하여 조사하였다. 자료수집기간은 2012년 9월 한달 간이었고, 서술적 통계, Pearson correlation coefficient, canonical correlation을 적용하였다. 조직의 특성은 투약오류보고장애와 세 가지 유의한 상관이 있었다. 첫 번째 정준상관계수는 .50(Wilks' ${\lambda}$=0.61, df=32, p<.001)이었고, 두 번째는 .35(Wilks' ${\lambda}$=0.81, df=21, p<.001), 세 번째는 .22(Wilks' ${\lambda}$=0.93, df=12, p=.018)이었다. 첫 번째 정준상관은 높은 안전 분위기와 업무환경이 오류보고에의 두려움을 제외한 투약오류보고와 관련이 있었다. 두 번째 식은 '의료인간의 안전 분위기'의 높은 지각과 높은 '병원에의 간호사 참여'와 '인적 자원의 적절성'은 낮은 '불안감'과 '행정자들의 반응'과 관련이 있었다. 투약오류보고장애를 위한 전략과 안전 분위기와 업무환경과 같은 조직의 특성의 진보가 적용되어야 한다.

극치강수량의 시공간적 특성을 이용한 지역빈도분석 (Regionalization of Extreme Rainfall with Spatio-Temporal Pattern)

  • 이정주;권현한;김병식;윤석영
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2010년도 학술발표회
    • /
    • pp.1429-1433
    • /
    • 2010
  • 수공구조물의 설계, 수자원 관리계획의 수립, 재해영향 검토 등을 수행할 때, 재현기간에 따른 확률개념의 강우량, 홍수량, 저수량 등을 산정하여 사용하게 되며, 보통 대상지역의 장기 수문관측 자료를 이용하여 수문사상의 확률분포를 산정한 후 재현기간을 연장하여 원하는 설계빈도에 해당하는 양을 추정하게 된다. 미계측지역 또는 관측자료의 보유기간이 짧은 지역의 경우는 지역빈도 분석 결과를 이용하게 된다. 지역빈도해석을 위해서는 강우자료들의 동질성을 파악하는 것이 가장 기본적인 과정이 되며 이를 위해 통계학적인 범주화분석이 선행되어야 한다. 지점 빈도분석의 수문학적 동질성 판별을 위해 L-moment 방법, K-means 방법에 의한 군집분석 등이 주로 사용되며 관측소 위치좌표를 이용한 공간보간법을 적용하여 시각화하고 있다. 강수량은 시공간적으로 변하는 수문변량으로서 강수량의 시간적인 특성 또한 강수량의 특성을 정의하는데 매우 중요한 요소이다. 이러한 점에서 본 연구를 통해 강수지점의 공간적인 좌표 및 강수량의 양적인 범주화에 초점을 맞춘 기존 지역빈도분석의 범주화 과정에 덧붙여 시간적인 영향을 고려할 수 있는 요소들을 결정하고 이를 활용할 수 있는 범주화 과정을 제시하고자 한다. 즉, 극치강수량의 발생 시기에 대한 정량적인 분석이 가능한 순환통계기법을 이용하여 관측 지점별 시간 통계량을 산정하고, 이를 극치강수량과 결합하여 시 공간적인 특성자료를 생성한 후 이를 이용한 군집화 해석 모형을 개발하는데 연구의 목적이 있다. 분석 과정에 있어서 시간속성의 정량화 및 일반화는 순환통계기법을 사용하였으며, 극치강수량과 발생시점의 속성자료는 각각의 평균과 표준편차를 이용하였다. K-means 알고리즘을 이용해 결합자료를 군집화 하고, L-moment 방법으로 지역화 결과에 대한 검증을 수행하였다. 속성 결합 자료의 군집화 효과는 모의데이터 실험을 통해 확인하였으며, 우리 나라의 58개 기상관측소 자료를 이용하여 분석을 수행하였다. 예비해석 단계에서 100회의 군집분석을 통해 평균적인 centroid를 산정하고, 해당 값을 본 해석의 초기 centroid로 지정하여, 변동적인 클러스터링 경향을 안정화시켜 해석이 반복됨에 따라 군집화 결과가 달라지는 오류를 방지하였다. 또한 K-means 방법으로 계산된 군집별 공간거리 합의 크기에 따라 군집번호를 부여함으로써 군집의 번호순서대로 물리적인 연관성이 인접하도록 설정하였으며, 군집간의 경계선을 추출할 때 발생할 수 있는 오류를 방지하였다. 지역빈도분석 결과는 3차원 Spline 기법으로 도시하였다.

  • PDF