• 제목/요약/키워드: 샘플 통계

검색결과 207건 처리시간 0.024초

다중 자료 변환을 이용한 구성 자료의 지구통계학적 시뮬레이션 (Geostatistical Simulation of Compositional Data Using Multiple Data Transformations)

  • 박노욱
    • 한국지구과학회지
    • /
    • 제35권1호
    • /
    • pp.69-87
    • /
    • 2014
  • 이 논문에서는 구성 자료의 지구통계학적 시뮬레이션을 위해 다중 자료 변환 기반 조건부 시뮬레이션 틀을 제안하였다. 우선 일반적인 통계 기법의 적용이 가능하도록 구성 자료에 로그비 변환을 적용하였다. 다음 변환들로는 최소/최대 자기상관 인자 변환과 지시자 변환을 순차적으로 적용하였다. 독립적인 새로운 변수의 생성을 위해 최소/최대 자기상관 인자 변환을 적용하였으며, 적용 결과 개별 변수들의 독립적인 시뮬레이션이 가능해진다. 그리고 다중 가우시안 확률 모델을 따르지 않는 변수들의 비모수적 조건부 누적 확률 분포 모델링을 위해 지시자 변환을 적용하였다. 최종적으로는 적용한 변환 방법들의 역순으로 역 변환을 적용하였다. 간석지 표층 퇴적물 성분 자료를 대상으로 제안 시뮬레이션 기법의 적용 가능성을 예시하였다. 모든 시뮬레이션 결과들은 구성 자료의 제한 조건을 만족하면서 샘플 자료의 통계 특성을 잘 반영하였다. 구성 자료의 다수의 시뮬레이션 결과들을 이용한 표층 퇴적물 분류를 통해 기존 크리깅에서는 얻을 수 없는 분류 결과의 확률론적 평가가 가능하였다. 따라서 제안 시뮬레이션 틀은 다양한 구성 자료의 지구통계학적 시뮬레이션에 효과적으로 이용될 수 있을 것으로 기대된다.

무선 센서 네트워크 모니터링 시스템을 위한 데이터 통계 분석 기반 데이터 필터링 기법 (Data Statical Analysis based Data Filtering Scheme for Monitoring System on Wireless Sensor Network)

  • 이현조;최영호;장재우
    • 한국콘텐츠학회논문지
    • /
    • 제10권3호
    • /
    • pp.53-63
    • /
    • 2010
  • 최근 무선 센서 네트워크를 활용한 다양한 모니터링 시스템 구축이 활발히 이루어지고 있다. 무선 센서네트워크 기반 모니터링 시스템 구축을 위해서, 세 가지 사항을 고려해야 한다. 첫째, 지속적인 모니터링을 위해서, 노드 실패 감지 기법이 요구된다. 둘째, 센서노드는 제한된 배터리 용량을 지니기 때문에, 에너지 소모량 감소를 위한 효율적인 데이터 필터링 기법이 요구된다. 마지막으로 데이터 필터링 수행 시, 계산오버헤드를 감소시키는 기법이 필요하다. 기존 칼만 데이터 필터링 기법은 우수한 필터링 성능을 나타내는 반면, 데이터 예측값 계산과정이 복잡하여 센서 노드에서의 계산 오버헤드가 증가하는 단점이 존재한다. 이러한 문제점들을 해결하기 위하여 본 논문에서는 데이터 통계 분석 기반 데이터 필터링 기법을 제안한다. 제안하는 기법은 첫째, 노드 실패 감지를 지원하기 위해, 주기적으로 노드 생존 메시지를 수집한다. 둘째, 불필요한 전송 메시지 수 감소를 위하여 샘플 데이터를 노드 생존 메시지에 포함하여 전송하고, 수집된 샘플 데이터 집합을 바탕으로 데이터 필터링을 수행한다. 마지막으로, 서버에서 데이터 통계 분석을 이용한 데이터 필터링 범위를 계산하기 때문에, 센서에서는 단순 비교연산만을 수행함으로써 센서 노드에서의 계산 오버헤드를 감소시킨다. 아울러 성능 분석을 통해 제안하는 기법이 기존 칼만 필터링 기법보다 전송 메시지 수 측면에서 성능이 우수함을 보인다.

딥러닝모델을 이용한 국가수준 LULUCF 분야 토지이용 범주별 자동화 분류 (Automatic Classification by Land Use Category of National Level LULUCF Sector using Deep Learning Model)

  • 박정묵;심우담;이정수
    • 대한원격탐사학회지
    • /
    • 제35권6_2호
    • /
    • pp.1053-1065
    • /
    • 2019
  • 신기후체제에 대응하여 정확한 탄소흡수 및 배출량을 산정하기 위해 토지이용 범주별 통계량 산출은 활동자료로서 매우 중요한 자료이다. 본 연구는 효과적인 토지이용 범주별 판독을 위하여 산림항공사진(이하 FAP)에 딥러닝모델을 적용하여 토지이용 범주별 자동화 판독 분류를 한 후 샘플링기법을 통해 국가단위 통계량을 산출하였다. 딥러닝모델에 적용한 데이터세트(이하, DS)는 국가산림자원조사 고정표본점 위치 기반 FAP의 이미지를 추출하여 훈련데이터세트(이하, 훈련DS)와 시험데이터세트(이하, 시험 DS)로 구분하였다. 훈련 DS는 토지이용 범주별 정의에 따라 이미지별 레이블을 부여하였으며, 딥러닝모델을 학습하고 검증하였다. 검증 시 모델의 학습정확도는 학습 횟수 1500회에서 정확도가 약 89%로 가장 높았다. 학습된 딥러닝모델을 시험DS에 적용한 결과, 이미지 레이블의 판독 분류정확도는 약 90%로 높았다. 샘플링기법을 통해 범주별 분류 결과에 대해 면적을 추정하여 국가통계와 비교한 결과 정합성 또한 높아 향후 LULUCF(Land Use, Land Use Change, Forestry)분야 국가 온실가스 인벤토리 보고서의 활동자료로 활용하기에 충분하다고 판단된다.

지구통계 기법을 이용한 토양오염 분포 예측 오차 최적화 및 머신러닝 알고리즘 기반의 영향인자 해석 (Optimization of Soil Contamination Distribution Prediction Error using Geostatistical Technique and Interpretation of Contributory Factor Based on Machine Learning Algorithm)

  • 한호상;서장원;최요순
    • 자원환경지질
    • /
    • 제56권3호
    • /
    • pp.331-341
    • /
    • 2023
  • 지구통계 기법을 기반으로 토양오염지도를 작성하는 경우 예측 오차가 발생하며 이에 영향을 미치는 다양한 원인이 존재한다. 본 연구에서는 정규 크리깅을 활용하여 폐광산지역의 토양 내 중금속 농도 샘플링 데이터로부터 격자형 기반의 토양오염지도를 작성하였다. 해당 지도의 예측 오차에 영향을 미친다고 판단된 5개 인자를 선정하고, Leave-one-out 기법을 기반으로 인자의 옵션과 설정값의 변화에 따른 예측값과 실측값 간의 평균제곱근오차(root mean square error, RMSE) 변화를 분석하였다. 이후 머신러닝 알고리즘을 이용하여 RMSE에 영향을 미치는 상위 3개 인자를 도출하였다. 그 결과, Standard interpolation에서는 Variogram Model, Minimum Neighbors, Anisotropy 인자가 RMSE에 가장 큰 영향을 미치는 것으로 분석되었다. 베리오그램 모델에서는 Spherical 모델이 가장 낮은 RMSE를 보였으며, Minimum Neighbors는 3에서 최젓값을 보인 후 값이 증가함에 따라 증가하였다. Anisotropy의 경우 이방성을 고려하지 않는 것이 더 적합한 것으로 나타났다. 본 연구에서는 지구통계와 머신러닝의 복합 활용을 통해 지역 규모에서 높은 신뢰성을 갖는 토양오염지도를 작성할 수 있었고, 적은 수의 토양 샘플링 데이터의 보간 작업 시 어떠한 요인들이 큰 영향을 미치는지 파악할 수 있었다.

신뢰성 해석을 위한 결합분포함수의 통계모델링 (Statistical Modeling of Joint Distribution Functions for Reliability Analysis)

  • 노유정;이상진
    • 한국산학기술학회논문지
    • /
    • 제15권5호
    • /
    • pp.2603-2609
    • /
    • 2014
  • 기계시스템의 신뢰성 해석을 위해서는 기계시스템에 성능을 미치는 변수의 확률 분포와 파라미터를 결정하는 통계적 모델링은 반드시 필요하다. 하지만, 신뢰성 해석에서 상당수의 변수는 상관관계가 있음에도 불구하고 독립변수로 취급되거나 실험데이터 수가 부족하다는 이유로 통계 모델에 대한 잘못된 가정을 하는 경우가 많다. 본 연구에서는 베이지안 방법을 이용하여 상관관계를 갖는 데이터의 결합분포함수를 copula를 이용하여 모델링함으로써 적은 수의 데이터로부터 정확한 입력모델을 산정하는 방법을 제안하였으며, 방법의 검증을 위해 다양한 상관계수와 데이터 수에 대해 통계 시뮬레이션을 수행하였다. 그 결과 Bayesian방법은 상관계수가 낮아 후보함수가 유사하거나 샘플수가 적어 정확한 모델을 산정하기 어려운 경우에도 후보 copula 중 실제 copula와 가장 근사한 후보 copula를 선정하였다. 이러한 근사 후보 copula는 신뢰성 해석결과 역시 실제 copula 함수를 이용한 신뢰성 해석 결과와 유사한 결과를 가짐을 확인할 수 있으므로 베이지안 방법은 신뢰성 해석을 위해 정확한 통계모델링을 제공함을 알 수 있다.

도로변에서 발생되는 미세먼지로써 타이어와 도로 마모입자 채집과 분석 연구 (A Study on the Collection and Analysis of Tire and Road Wear Particles(TRWPs) as Fine Dust Generated on the Roadside)

  • 강태우;김혁중
    • 한국건설순환자원학회논문집
    • /
    • 제10권3호
    • /
    • pp.293-299
    • /
    • 2022
  • 본 연구에서는 도로변 미세먼지 내 타이어와 도로 마모입자의 정량화 분석과 타이어와 도로 마모입자 내 타이어 및 도로 성분 비율을 확인하기 위한 연구를 수행하였다. 이에 시간당 1,300여대 교통량을 갖는 충청남도 지자체중에서 C도시의 종합버스터미널 부근 정류장의 경계석 6곳에서 먼지 샘플을 채집하였다. 채집된 먼지 샘플 1,000 g에 대해 크기와 밀도 분리 수행한 결과 미세먼지 샘플 24 g과 타이어와 도로 마모입자 약 0.05 g이 분리되었다. 즉, 도로변 미세먼지에는 타이어와 도로 마모입자가 약 0.21 % 존재하는 것으로 분석되었다. 분리된 타이어와 도로 마모입자에 대해 주사전자현미경(SEM)을 이용하여 형상을 분석한 결과 지우개가루 형상이 관찰되었다. 또한, 도로변 미세먼지 내 존재하는 타이어와 도로 마모입자는 자동차 주행 중 타이어와 도로간 마찰에 의해 생성되어 도로변으로 분산되었기 때문에 열중량분석기(TGA)와 가스크로마토 질량분석기(GC/MS)를 이용하여 성분 분석을 수행하였다. 정량화 계산식을 통해 성분에 대한 타이어 및 도로 성분 비율을 도출한 결과 약 3:7로 분석되었다. 본 연구는 도로변 미세먼지 발생원의 구성원과 함량 분석을 위해 객관적이고 신뢰도 높은 분석 기법을 제시하였다. 추후, 도로건설과 타이어 소재의 미세먼지 저감 기술 확보와 개선 방안 확보를 위한 선행적 기초 연구로써 활용되기를 기대하고 지속적으로 더 많은 지역과 샘플 분석에 대한 통계 데이터를 확보하여 신뢰도 높은 연구를 수행하고자 한다.

대졸자 직업이동 경로조사에서 패널탈락분석 (An Analysis of Panel Attrition in GOMS(Graduates Occupational Survey))

  • 천영민;윤정혜;오민홍
    • 응용통계연구
    • /
    • 제22권5호
    • /
    • pp.981-993
    • /
    • 2009
  • 패널조사에서 패널탈락이 특정계층에 집중되어 있다면, 초기에 구축된 샘플의 변화에 따라 패널자료의 대표성에 문제를 야기할 수 있다. 본 연구는 대졸자 직업이동 경로조사(GOMS)를 이용하여 신뢰성과 대표성을 저해하는 표본 탈락편의(non-random attrition bias)가 있는지를 파악하고, 패널탈락의 결정요인을 분석하여 패널탈락을 최소할 수 있는 방안을 모색하고자 한다. 분석결과 패널탈락은 응답자의 문제보다 조사시스템의 문제가 더 큰 것으로 나타났다. 따라서 추가연구를 통해 체계적인 조사시스템의 구축 및 응답자관리방법 개발뿐만 아니라 패널탈락의 편의를 보완하기 위한 가중치 부여 등 다양한 개선책의 도입이 시급한 것으로 판단된다.

정규확률변수 관측치열에 대한 베이지안 변화점 분석 : 서울지역 겨울철 평균기온 자료에의 적용 (Bayesian Change Point Analysis for a Sequence of Normal Observations: Application to the Winter Average Temperature in Seoul)

  • 김경숙;손영숙
    • 응용통계연구
    • /
    • 제17권2호
    • /
    • pp.281-301
    • /
    • 2004
  • 본 논문에서는 일변량 정규분포를 따르는 확률변수의 관측치열에 대한 변화점 문제(change point problem)를 고찰한다. 변화점의 존재유무, 그리고 만일 변화점이 존재한다면 어떠한 유형으로 발생했는지 즉, 변화점 발생 이후로 평균만 변화, 분산만 변화, 또는 평균과 분산 모두가 변화했는지를 밝힌다. 가능한 여러 유형의 변화모형들 가운데 최적의 모형을 선택하기 위해 베이지안 모형선택 기법을 이용하고, 선택된 모형에 내재된 모수를 추정 하기 위해 메트로폴리스-혜스팅스 알고리 즘을 포함한 깁스샘플링 을 이용한다. 이러한 방법론은 모의실험을 통해 검토되고, 또한 서울지역의 겨울철 평균기온 자료에 적용된다.

평행좌표 플롯을 활용한 유전자발현 자료의 시각화 (Applications of Parallel Coordinate Plots for Visualizing Gene Expression Data)

  • 박미라;곽일엽;허명회
    • 응용통계연구
    • /
    • 제21권6호
    • /
    • pp.911-921
    • /
    • 2008
  • 유전자발현 자료로터 유용한 생물학적 정보를 얻기 위해 여러 시각화 방법이 개발되어 왔다. 본 논문에서는 평행좌표 플롯(parallel coordinate plot: PCP)을 이용하여 유전자발현 패턴을 찾아내어 표현하고자 하였다. 평행좌표 플롯의 두 변형인 ePCP(enhanced parallel coordinate plot)와 APCP(Andrews' type parallel coordinate plot)를 림포마(lymphoma) 자료에 적용하여 62개 샘플을 의미있게 배열하고 300개 유전자를 평활 곡선으로 표현하였다.

샘플링오차에 의한 품질통계 모형의 해석 (Interpretation of Quality Statistics Using Sampling Error)

  • 최성운
    • 대한안전경영과학회지
    • /
    • 제10권2호
    • /
    • pp.205-210
    • /
    • 2008
  • The research interprets the principles of sampling error design for quality statistics models such as hypothesis test, interval estimation, control charts and acceptance sampling. Introducing the proper discussions of the design of significance level according to the use of hypothesis test, then it presents two methods to interpret significance by Neyman-Pearson and Fisher. Second point of the study proposes the design of confidence level for interval estimation by Bayesian confidence set, frequentist confidential set and fiducial interval. Third, the content also indicates the design of type I error and type II error considering both productivity and customer claim for control chart. Finally, the study reflects the design of producer's risk with operating charistictics curve, screening and switch rules for the purpose of purchasing and subcontraction.