• Title/Summary/Keyword: 자료결측

Search Result 302, Processing Time 0.034 seconds

Spatial Gap-filling of GK-2A/AMI Hourly AOD Products Using Meteorological Data and Machine Learning (기상모델자료와 기계학습을 이용한 GK-2A/AMI Hourly AOD 산출물의 결측화소 복원)

  • Youn, Youjeong;Kang, Jonggu;Kim, Geunah;Park, Ganghyun;Choi, Soyeon;Lee, Yangwon
    • Korean Journal of Remote Sensing
    • /
    • v.38 no.5_3
    • /
    • pp.953-966
    • /
    • 2022
  • Since aerosols adversely affect human health, such as deteriorating air quality, quantitative observation of the distribution and characteristics of aerosols is essential. Recently, satellite-based Aerosol Optical Depth (AOD) data is used in various studies as periodic and quantitative information acquisition means on the global scale, but optical sensor-based satellite AOD images are missing in some areas with cloud conditions. In this study, we produced gap-free GeoKompsat 2A (GK-2A) Advanced Meteorological Imager (AMI) AOD hourly images after generating a Random Forest based gap-filling model using grid meteorological and geographic elements as input variables. The accuracy of the model is Mean Bias Error (MBE) of -0.002 and Root Mean Square Error (RMSE) of 0.145, which is higher than the target accuracy of the original data and considering that the target object is an atmospheric variable with Correlation Coefficient (CC) of 0.714, it is a model with sufficient explanatory power. The high temporal resolution of geostationary satellites is suitable for diurnal variation observation and is an important model for other research such as input for atmospheric correction, estimation of ground PM, analysis of small fires or pollutants.

Analysis of Temporal and Spatial Variability of Generated 2D Soil Moisture Data (우리나라 2차원 토양수분 자료의 생산과 시.공간 변화도 분석)

  • Kim, Gwang-Seob;Kim, Jong-Pil
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2006.05a
    • /
    • pp.674-677
    • /
    • 2006
  • 토양수분은 토양입자나 공극에 포함되어 있는 물을 의미하는 것으로서 여러 수문현상을 연계하는 주요변수이며, 올바른 물순환 체계를 이해하기 위해서는 토양수분에 대한 활발한 관측과 연구가 수반되어야 한다. 하지만, 우리나라의 토양수분 자료는 지상관측 자료로서 관측기간이 짧고 결측치가 많아 장기 추세나 공간변화도를 분석하기엔 미흡할 뿐만 아니라 2차원 토양수분 자료는 보유하고 있지 않은 실정이다. 따라서, 본 연구에서는 이를 보완하기 위해 우리나라와 위도가 비슷한 지역인 미국 Illinois 지역의 토양수분자료와 정규식생지수의 상관관계를 이용하여 우리나라의 2차원 토양수분을 산출하였으며, 산출된 장기 토양수분 자료를 이용한 시 공간 변화도 분석을 수행하였다.

  • PDF

Nonparametric Approaches of Analyzing Randomly Incomplete Ranking Data (임의의 불완전 순위자료 분석을 위한 비모수적 방법)

  • 임동훈
    • The Korean Journal of Applied Statistics
    • /
    • v.13 no.1
    • /
    • pp.45-53
    • /
    • 2000
  • 본 논문에서는 모든 판정자(judge)들이 모든 객체(object)들에 대해 순위를 부여할 수 없는 경우에 얻어지는 불완전 순위자료에서 판정자들의 처리 효과에 대한 유의성을 검정하는데 관심이 있다. 이를 위해 불완전 순위자료를 완전자료로 바꾸는 알고리즘을 제안하고 알고리즘에 의해 얻어진 완전 순위자료에 Friedman 검정법을 적용하고자 한다. 제안된 검정법은 결측 객체에 순위를 부여하는데 있어서 완전순위를 갖는 판정자들의 정보를 이용함으로서 효율적이며 검정을 시행하는데 기존의 Friedman 통계량에 대한 분포표를 사용할 수 있어 간편하다. 그리고 몬테칼로 모의실험을 통하여 제안된 검정법과 기존의 평균 순위법, 최대/최소 Friedman 검정법과 검정력을 비교하였다.

  • PDF

A joint modeling of longitudinal zero-inflated count data and time to event data (경시적 영과잉 가산자료와 생존자료의 결합모형)

  • Kim, Donguk;Chun, Jihun
    • The Korean Journal of Applied Statistics
    • /
    • v.29 no.7
    • /
    • pp.1459-1473
    • /
    • 2016
  • Both longitudinal data and survival data are collected simultaneously in longitudinal data which are observed throughout the passage of time. In this case, the effect of the independent variable becomes biased (provided that sole use of longitudinal data analysis does not consider the relation between both data used) if the missing that occurred in the longitudinal data is non-ignorable because it is caused by a correlation with the survival data. A joint model of longitudinal data and survival data was studied as a solution for such problem in order to obtain an unbiased result by considering the survival model for the cause of missing. In this paper, a joint model of the longitudinal zero-inflated count data and survival data is studied by replacing the longitudinal part with zero-inflated count data. A hurdle model and proportional hazards model were used for each longitudinal zero inflated count data and survival data; in addition, both sub-models were linked based on the assumption that the random effect of sub-models follow the multivariate normal distribution. We used the EM algorithm for the maximum likelihood estimator of parameters and estimated standard errors of parameters were calculated using the profile likelihood method. In simulation, we observed a better performance of the joint model in bias and coverage probability compared to the separate model.

Efficient Outlier Detection of the Water Temperature Monitoring Data (수온 관측 자료의 효율적인 이상 자료 탐지)

  • Cho, Hongyeon;Jeong, Shin Taek;Ko, Dong Hui;Son, Kyeong-Pyo
    • Journal of Korean Society of Coastal and Ocean Engineers
    • /
    • v.26 no.5
    • /
    • pp.285-291
    • /
    • 2014
  • The statistical information of the coastal water temperature monitoring data can be biased because of outliers and missing intervals. Though a number of outlier detection methods have been developed, their applications are very limited to the in-situ monitoring data because of the assumptions of the a prior information of the outliers and no-missing condition, and the excessive computational time for some methods. In this study, the practical robust method is developed that can be efficiently and effectively detect the outliers in case of the big-data. This model is composed of these two parts, one part is the construction part of the approximate components of the monitoring data using the robust smoothing and data re-sampling method, and the other part is the main iterative outlier detection part using the detailed components of the data estimated by the approximate components. This model is tested using the two-years 5-minute interval water temperature data in Lake Saemangeum. It can be estimated that the outlier proportion of the data is about 1.6-3.7%. It shows that most of the outliers in the data are detected and removed with satisfaction by the model. In order to effectively detect and remove the outliers, the outlier detection using the long-span smoothing should be applied earlier than that using the short-span smoothing.

Development of Quality Control Method for Visibility Data Based on the Characteristics of Visibility Data (시정계 자료 특성을 고려한 시정계 자료 품질검사 기법 개발)

  • Oh, Yu-Joo;Suh, Myoung-Seok
    • Korean Journal of Remote Sensing
    • /
    • v.36 no.5_1
    • /
    • pp.707-723
    • /
    • 2020
  • In this study, a decision tree type of quality control (QC) method was developed to improve the temporal-spatial representation and accuracy of the visibility data being operated by the Korea Meteorological Administration (KMA). The quality of the developed QC method was evaluated through the application to the 3 years (2016.03-2019.02) of 290 stations visibility data. For qualitative and quantitative verification of the developed QC method, visibility and naked-eye data provided by the KMA and QC method of the Norwegian Meteorological Institute (NMI) were used. Firstly, if the sum of missing and abnormal data exceeds 10% of the total data, the corresponding point was removed. In the 2nd step, a temporal continuity test was performed under the assumption that the visibility changes continuously in time. In this process, the threshold was dynamically set considering the different temporal variability depending on the visibility. In the 3rd step, the spatial continuity test was performed under the assumption of spatial continuity for visibility. Finally, the 10-minute visibility data was calculated using weighted average method, considering that the accuracy of the visibility meter was inversely proportional to the visibility. As results, about 10% of the data were removed in the first step due to the large temporal-spatial variability of visibility. In addition, because the spatial variability was significant, especially around the fog area, the 3rd step was not applied. Through the quantitative verification results, it suggested that the QC method developed in this study can be used as a QC tool for visibility data.

Methods for Handling Incomplete Repeated Measures Data (불완전한 반복측정 자료의 보정방법)

  • Woo, Hae-Bong;Yoon, In-Jin
    • Survey Research
    • /
    • v.9 no.2
    • /
    • pp.1-27
    • /
    • 2008
  • Problems of incomplete data are pervasive in statistical analysis. In particular, incomplete data have been an important challenge in repeated measures studies. The objective of this study is to give a brief introduction to missing data mechanisms and conventional/recent missing data methods and to assess the performance of various missing data methods under ignorable and non-ignorable missingness mechanisms. Given the inadequate attention to longitudinal studies with missing data, this study applied recent advances in missing data methods to repeated measures models and investigated the performance of various missing data methods, such as FIML (Full Information Maximum Likelihood Estimation) and MICE(Multivariate Imputation by Chained Equations), under MCAR, MAR, and MNAR mechanisms. Overall, the results showed that listwise deletion and mean imputation performed poorly compared to other recommended missing data procedures. The better performance of EM, FIML, and MICE was more noticeable under MAR compared to MCAR. With the non-ignorable missing data, this study showed that missing data methods did not perform well. In particular, this problem was noticeable in slope-related estimates. Therefore, this study suggests that if missing data are suspected to be non-ignorable, developmental research may underestimate true rates of change over the life course. This study also suggests that bias from non-ignorable missing data can be substantially reduced by considering rich information from variables related to missingness.

  • PDF

Undecided inference using logistic regression for credit evaluation (신용평가에서 로지스틱 회귀를 이용한 미결정자 추론)

  • Hong, Chong-Sun;Jung, Min-Sub
    • Journal of the Korean Data and Information Science Society
    • /
    • v.22 no.2
    • /
    • pp.149-157
    • /
    • 2011
  • Undecided inference could be regarded as a missing data problem such as MARand MNAR. Under the assumption of MAR, undecided inference make use of logistic regression model. The probability of default for the undecided group is obtained with regression coefficient vectors for the decided group and compare with the probability of default for the decided group. And under the assumption of MNAR, undecide dinference make use of logistic regression model with additional feature random vector. Simulation results based on two kinds of real data are obtained and compared. It is found that the misclassification rates are not much different from the rate of rawdata under the assumption of MAR. However the misclassification rates under the assumption of MNAR are less than those under the assumption of MAR, and as the ratio of the undecided group is increasing, the misclassification rates is decreasing.

Long Terms Baseflow Separation Using Moving Average Method (이동평균법을 이용한 장기간 기저유출분석)

  • Lee, Sang-Sin;Lee, Sang-Il;Kim, Joon-Soo
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2010.05a
    • /
    • pp.1233-1237
    • /
    • 2010
  • 강변여과는 지표수와 지하수가 각기 갖는 장점과 제약점을 상호 보완하여 수질이 양호한 상수원수를 대량 확보하기 위한 실제적 대안이다. 자연적인 여과작용에 의해 수질이 개선되는 효과가 있어 경제적이고 안정적으로 확보할 수 있지만, 장기간 취수는 지하수위의 저하를 가져 올 수 있으므로 유역의 수문분석을 통한 기저유출량 산정에 관한 연구가 필요하다. 대상지역으로는 현재 강변여과를 개발중인 창원시 대산정수장 취수장 지역이며, 대상지역의 기저유출량을 산정하기 위해 대상지역 상류에 위치한 낙동강 본포교의 낙동강 유량을 기초로 기저유출량을 산정하여 지하수 함양율을 평가하였다. 수문곡선 분리는 여러 방법 중 다른 방법보다 상대적으로 간편하고 실무에서 많이 사용되는 방법인 수평직선분리법을 사용하여 적정 취수 가능량을 산정하기 위한 최소 기저유출량을 산정하고자 한다. 이에 따라, 보유 자료 중 연 평균 최저 유출량을 보인 2008년 가을 갈수기의 시작(2008년 10월)부터 2009년 가을 갈수기의 시작(2009년 10월)까지의 자료를 분석했다. 본포교 유량 자료는 8일부터 10일 간격으로 측정되고 있기 때문에 결측치는 최인접 두 지점 사이의 선형보간법으로 보완했다. 다소 많은 양의 결측치에 대한 보정과 해당 유역의 연간 유출 특성을 파악하기 위해서 이동평균(moving average)을 적용했으며, 적용 결과 관측 주기에 해당하는 10일 이동평균 유출수문곡선이 가장 적합한 것으로 나타났다. 10일 이동평균에 의한 유출수문곡선에 의하면 상승부의 기점은 2009년 6월 12일로 나타났으며 유출량은 47.87cms로 나타났다. 따라서 총 기저유출량은 상승부 기점의 유출량으로 111일 동안 발생하는 것을 알 수 있었으며 그 총량은 약 45,900만$m^3$으로 나타났다. 본 연구에서의 결과 본포교를 유역출구로 하는 이 유역에는 임의 유출이 생기는 호우사상 시, 기저유출량은 총 유출량의 6.38%를 최소한 기대할 수 있음을 알 수 있다.

  • PDF

Efficient Integrated Real-time Discharge Measurement System Operating Strategy applying Non-face-to-face technology (비대면 기술을 적용한 효율적인 자동유량측정시스템 운영 방안)

  • Oh, Dong Heon;Baek, Jong Seok;Cho, Sang Uk;Cha, Jun Ho;Seo, Hae Yeop
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2021.06a
    • /
    • pp.482-482
    • /
    • 2021
  • 자동유량측정시스템은 하천 유량을 실시간으로 측정하기 위한 수문조사시설로 전국 하천 64개 주요 지점에 설치·운영 중이며 실시간으로 운영되는 시스템의 특성상 내·외부 요인으로 인해 자료의 결측이 발생할 수 있다. 주요 결측 요인으로는 계측장비의 고장 및 오작동, 낙뢰로 인한 전원부문제, 시스템 컨트롤러 단순 오류 등이며, 현재 이로 인해 결측이 발생한 경우 현장 방문을 통한 조치 외에는 복구가 불가한 실정이다. 본 연구에서는 현장 유지관리 개선을 통해 자료 결측 최소화 방안을 마련하고자 최근 5년간(2015년~2019년) 수행된 유지관리 점검내역을 검토하였다. 현장 유지관리는 정기적으로 수행되는 정기점검, 수중점검과 장애 발생 시 수행되는 현장점검으로 구분되며 최근 5년간 수행된 점검(1,735회) 중 정기적인 점검을 제외한 현장점검의 경우 총 764회(46%) 수행된 것으로 나타났으며 현장점검 중 유지관리 방법 및 장비 개선 적용 사례를 통해 최소 1일~3일 소요되던 점검 시간이 즉시 조치가 가능한 것으로 나타났다. 시스템 확대 및 기존 장비의 노후로 현장점검은 지속적으로 증가하고 있으며 최근 사회적 상황을 고려하였을 때 사물인터넷(IoT)을 활용한 시설물 개선 등으로 비대면 점검 수행이 가능해짐에 따라 점검 소요시간을 단축하여 보다 효율적인 시설물 운영, 예산 절감, 자료의 연속성 확보 등이 가능할 것으로 판단된다.

  • PDF