• 제목/요약/키워드: 결측자료

검색결과 302건 처리시간 0.032초

국도의 동질구간 선정과 이상치 제거 방법에 관한 연구 (Development of Homogeneous Road Section Determination and Outlier Filter Algorithm)

  • 도명식;김성현;배현숙;김종식
    • 대한교통학회지
    • /
    • 제22권7호
    • /
    • pp.7-16
    • /
    • 2004
  • 국도의 단속교통류의 특성을 고려한 교통량 동질구간이란 도로의 공급측면에서 주요 신호교차로의 분기, g/C 비율, 신호교차로간 거리등으로 분할할 수 있으며, 교통수요측면에서는 교통량 변화 패턴곡 서로 유사하면서 정량적인 교통특성(예를 들어, 교통량의 크기나 속도의 범위 등)이 거의 같은 인근 검지기들로 이루어진 구간을 말한다. 본 연구에서는 국도 3호선의 곤지암 IC에서 장지 IC간의 10.72km를 대상으로 수집한 구간통행시간 자료와 검지기에서 수집한 지점 교통량과 속도 자료를 이용하여 기존의 이상치 제거방법에서의 문제점을 제시하고 참조자료를 활용한 새로운 유효 데이터 확보방안을 제시한다. 나아가, 향후 통행시간 추정모형 제작 및 검지기 자료의 이상치 및 결측 자료의 보정을 위한 동질구간의 선정방법을 KHCM 방식에 의한 공급자 측면과 교통류의 특성을 고려한 수요자 측면을 동시에 고려하여 제시하였다. 이러한 구간자료와 지점자료를 공유한 국도 구간의 교통류 특성에 관한 연구는 향후 소요시간 추정과 결측 및 데이터 보정에 필요한 기초 자료로 활용될 것으로 기대된다.

MODIS 및 Landsat 위성영상의 다중 해상도 자료 융합 기반 토지 피복 분류의 사례 연구 (A Case Study of Land-cover Classification Based on Multi-resolution Data Fusion of MODIS and Landsat Satellite Images)

  • 김예슬
    • 대한원격탐사학회지
    • /
    • 제38권6_1호
    • /
    • pp.1035-1046
    • /
    • 2022
  • 이 연구에서는 토지 피복 분류를 위한 다중 해상도 자료 융합의 적용성을 평가하였다. 여기서 다중 해상도 자료 융합 모델로는 spatial time-series geostatistical deconvolution/fusion model (STGDFM)을 적용하였다. 연구 지역은 미국 Iowa 주의 일부 농경 지역으로 선정하였으며, 대상 지역의 규모를 고려해 다중 해상도 자료 융합의 입력 자료로 Moderate Resolution Imaging Spectroradiometer (MODIS) 및 Landsat 영상을 사용하였다. 이를 바탕으로 STGDFM 적용해 Landsat 영상이 결측된 시기에서 가상의 Landsat 영상을 생성하였다. 그리고 획득한 Landsat 영상과 함께 STGDFM의 융합 결과를 입력 자료로 사용해 토지 피복 분류를 수행하였다. 특히 다중 해상도 자료 융합의 적용성 평가를 위해 획득한 Landsat 영상만을 이용한 분류 결과와 Landsat 영상 및 융합 결과를 모두 이용한 분류 결과를 비교 평가하였다. 그 결과, Landsat 영상만을 이용한 분류 결과에서는 대상 지역의 주요 토지 피복인 옥수수와 콩 재배지에서 혼재 양상이 두드러지게 나타났다. 또한 건초 및 곡물 지역과 초지 지역 등 식생 피복 간의 혼재 양상도 큰 것으로 나타났다. 반면 Landsat 영상 및 융합 결과를 이용한 분류 결과에서는 옥수수와 콩 재배지의 혼재 양상과 식생 피복 간의 혼재 양상이 크게 완화되었다. 이러한 영향으로 Landsat 영상 및 융합 결과를 이용한 분류 결과에서 분류 정확도가 약 20%p 향상되었다. 이는 STGDFM을 통해 MODIS 영상이 갖는 시계열 분광 정보를 융합 결과에 반영하면서 Landsat 영상의 결측을 보완할 수 있었고, 이러한 시계열 분광 정보가 분류 과정에 결합되면서 오분류를 크게 줄일 수 있었던 것으로 판단된다. 본 연구 결과를 통해 토지 피복 분류에 다중 해상도 자료 융합이 효과적으로 적용될 수 있음을 확인하였다.

인공 위성과 기상 모형을 이용한 증발산 추정 (Estimation of Evapotranspiration using Satellite data and Meteorological Model)

  • 장근창;강신규;김재철;김준
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2009년도 춘계학술대회 논문집
    • /
    • pp.213-218
    • /
    • 2009
  • 에너지 전달 과정과 밀접한 관계가 있는 증발산(Evapotranspiration)은 기후 변화나 육상 생태계 생산성에서 매우 중요한 요소이며, 수문학적 순환과 지역적 물 관리 측면에서 매우 중요하다. 최근 인공위성을 이용하여 증발산을 추정하기 위한 노력이 많이 진행되고 있으며, 특히 MODIS (Moderate Resolution Imaging Spectroradiometer)는 증발산을 추정하기 위한 좋은 정보를 제공하고 있다 하지만, 구름 등에 의한 증발산 입력 자료 결측은 전체 자료의 획득률을 낮추고, 연속적인 증발산 모니터 링을 제한한다. 따라서 본 연구에서는 MODIS 기반의 증발산 입력 자료의 개선하여 서로 다른 식생과 지형 구조를 갖는 플럭스 연구지에 대한 증발산의 추정 및 평가하고, 남한에 대한 MODIS 기반의 증발산 지도 작성하였다. 또한 구름에 의해 결측된 날에 대해서는 MODIS-MM5 4차원 자료동화 기법을 이용한 증발산의 연속적인 모니터링 기법을 개발하였다. MODIS 기반의 증발산을 추정하기 위해 Revised RS-PM 알고리즘을 사용하였다. 증발산을 평가하기 위해 4 곳의 플럭스 연구지(광릉, 해남 이상 대한민국, 타카야마, 토마코아미 이상 일본) 자료와 비교하였고, 매우 신뢰성 있는 결과를 얻을 수 있었다. MODIS 입력 자료의 개선으로 획득률은 2배 가량 증가하였다. 남한에 대한 연간 증발산은 평균적으로 약 35%의 획득률 (365일 중 약 120일)과 함께 산출되었고, 시 공간적인 분포를 잘 나타내었다. 구름 낀 날에 대한 MODIS-MM5 자료 동화 기법의 적용은 증발산의 연속적인 모니터링을 가능하게 하였다.

  • PDF

통계적 경향 분석을 통한 남한강 상류 수계 수질 변동 해석 (Analysis of Water Quality Fluctuations in Upstream Namhan (or South Han) River Watershed using Long-term Statistical Analysis)

  • 변상돈;노연정;임경재;김종건;홍은미
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2020년도 학술발표회
    • /
    • pp.141-141
    • /
    • 2020
  • 강원도는 산림 비중이 크고 급경사지가 많은 지형적 특성과 여름철 비교적 선선하고 강우량이 많은 기후적 특성 때문에 고랭지 농업이 활발히 이루어지고 있다. 하지만, 많은 부분을 차지하는 고랭지밭 면적 탓에 강우시에 토양침식과 비점오염물이 하천으로 유입되고 있다. 강원도 송천 상류에 위치한 도암호는 장기간 탁수를 저류하고 방류로 인한 해체 논란까지 일으키기도 했다. 이에 정부는 흙탕물 저감과 비점오염원 관리를 위한 국고보조사업과 다양한 환경 정책들을 시행중이다. 효율적이고 효과적인 수질 정책을 시행하고 분석하기 위해서는 장기간의 모니터링 자료를 이용한 통계적 분석을 활용하는 것이 중요하다. 수질 자료는 변동이 심하고, 비정규분포를 이루며 결측치와 검출한계 이하의 값들이 많아 비모수 통계 방법을 널리 사용되어 왔다. 그중에서도 계절적 특성을 갖는 수질자료의 장기경향분석에 적합한 Seasonal Mann-Kendall Test을 사용하여 남한강상류 유역의 수질 경향성을 분석하였으며, Sen's Slope를 구하여 수질 자료의 경향 크기를 구하였다. 하지만, Seasonal Mann-Kendall Test는 연구 기간동안의 경향성을 반영할 수 없다는 단점이 있기 때문에 LOWESS Test를 통해 장기간 수질 자료 사이의 경향성을 분석하였다. 이러한 수질자료의 경향 분석 결과는 유역 내 취약 지점을 확인할 수 있으며, 환경 정책의 효과를 평가하고 보완할 수 있는 자료로 이용될 수 있을 것이다.

  • PDF

한반도의 과거 기후 데이터 구축을 위한 누락된 기록 추정 (Estimation of Missing Records in Daily Climate Data over the Korean Peninsula)

  • 노규호;안국현
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2020년도 학술발표회
    • /
    • pp.135-135
    • /
    • 2020
  • 우리나라의 기후 자료는 일반적으로 기상청에서 발표하는 종관기상관측(ASOS)과 방재기상관측(AWS), 그리고 북한이 세계기상기구(WMO, World Meteorogical Organization)의 기상통신망(GTS)을 통해 보낸 북한기상관측(NKO)을 사용 할 수 있다. 그러나 이 중 40년 이상의 완전한 관측 자료를 얻을 수 있는 건 ASOS가 유일하지만 공간적인 표현에 한계를 갖고 있다. AWS는 관측소가 많다는 장점이 있지만 관측 기간이 길지 않고 이용 가능한 기간에도 관측이 연속적이지 못한 경우가 많다. NKO는 비록 27개의 관측소가 있지만 많은 데이터가 누락되어 일별 기후자료의 사용에 한계를 갖고 있다. 이러한 미관측 기간이나 관측 자료의 누락은 연속적인 시계열 자료분석을 기반으로 하는 수자원 모델링에 있어서 문제를 야기한다. 본 연구는 1973년부터 2019년까지 47년의 신뢰도 높은 한반도 일일 기후 자료를 구축하기 위해 다양한 방법론을 비교하였다. 추정에 사용한 방법은 총 7개로 EM algorithm for probabilistic principal components (PPCA-EM), Inverse distance weight method (IDWM), Nearest neighbor method (NNM), Multivariate normal copulas (Copula), Elastic net model (Elastic), Ordinary kriging (OK), Regularized principal components with EM algorithm (RPCA-EM)를 살펴보았다. 다양한 형태의 결측치를 가정하여 그 결과값을 비교하였고 이는 Root mean squared error(RMSE), Kling-Gupta efficiency(KGE), Nash-Sutcliffe efficiency(NSE)를 통해 평가하였다. 최종 선택된 방법론을 통하여 한반도 전역을 그리드 기반의 강수 및 최저온도/최고온도의 일별자료로 생성하였다.

  • PDF

8일 간격으로 부분 계측된 유량을 연속 일유량으로 확장하는 방법 (Extension Techniques of 8 Day Interval Recorded Stream-flow Data to Daily One)

  • 백경오;임동희
    • 한국수자원학회논문집
    • /
    • 제45권1호
    • /
    • pp.91-99
    • /
    • 2012
  • 본 연구에서는 수질오염총량관리단위유역의 말단부에서 8일 간격으로 계측된 유량자료가 있을 때 이를 연속적인 일유량으로 확대할 수 있는 방법론을 제시하였다. 이 방법은 부분계측이 이루어지는 지점의 결측치를 인근 혹은 수문학적으로 유사한 지점에서 연속계측된 유량자료를 이용하여 보완하는 방식이다. 이를 위해 먼저 부분계측이 수행된 날짜와 같은 날의 유량을 연속계측자료로부터 추출한다. 그 다음 두 자료간에 상관도가 높다면 이를 잘 표현하는 확장식을 개발하고 이 식을 통해 결측치를 내삽 또는 외삽한다. 본 연구에서는 두 자료간 상관성을 잘 묘사하는 방법으로 분산유지법을 제안하였고, 이를 부분계측과 연속계측이 동시에 수행된 지점의 유량자료를 통해 그 정확성을 검증하였다. 검증된 분산유지법을 이용하여 한강수계 총량관리단위유역 중 15개 유역을 선택하여 각 유역의 말단부에 8일 간격으로 계측된 유량을 연속 일유량으로 확장시켰다. 확장된 자료를 기반으로 유황분석을 통해 저수량을 산정하였다.

BMS 데이터를 활용한 링크단위 여행시간 산출방안에 관한 연구 (An Estimation of Link Travel Time by Using BMS Data)

  • 전옥희;안계형;현철승;홍경식;김현주;이철기
    • 한국ITS학회 논문지
    • /
    • 제13권3호
    • /
    • pp.78-88
    • /
    • 2014
  • 현재 UTIS는 수도권 22개 지자체에 노변기지국 1,150개소, 차량내장치 51,000여대를 구축하여 교통정보를 수집, 제공하고 있으나, UTIS 사업의 안정화 및 결측구간을 최소화 하기위해서는 교통정보 수집원의 확대 및 이를 통한 UTIS 교통정보의 질 제고가 필수적이다. 본 연구에서는 이러한 문제점을 극복하기 위한 방편으로 수도권에 구축되어 운영중인 BIS(Bus Information System)를 기반으로 하여 실시간으로 수집되는 BMS 데이터를 이용한 일반차량의 링크 통행시간 추정모형 개발을 통해 UTIS 결측 구간의 정보제공에 활용하고자 한다. 이를 위해 수원시(경수대로, 중부대로구간), 안양시(흥안대로 구간)의 전용차로 여부에 따른 일부 구간을 선정하여 각각의 Case별 BMS 자료와 UTIS 교통정보와의 모형 추정 및 검증을 실시하였다. 그 결과 Case2, 4, 6, 8의 경우 UTIS 소통정보와 추정값 간의 신뢰도가 높게 나타났으며, Case 3, 5의 경우 큰 오차로 인해 UTIS 결측구간의 소통정보를 대체하기에는 다소 무리가 있을 것으로 판단된다. 따라서 대상구간의 도로운영 조건 및 상황에 맞추어 신뢰도가 높은 모형식을 적용 할 필요가 있다.

데이터 마이닝에서 배깅, 부스팅, SVM 분류 알고리즘 비교 분석 (An Empirical Comparison of Bagging, Boosting and Support Vector Machine Classifiers in Data Mining)

  • 이영섭;오현정;김미경
    • 응용통계연구
    • /
    • 제18권2호
    • /
    • pp.343-354
    • /
    • 2005
  • 데이터 마이닝에서 데이터를 효율적으로 분류하고자 할 때 많이 사용하고 있는 알고리즘을 실제 자료에 적용시켜 분류성능을 비교하였다. 분류자 생성기법으로는 의사결정나무기법 중의 하나인 CART, 배깅과 부스팅 알고리즘을 CART 모형에 결합한 분류자, 그리고 SVM 분류자를 비교하였다. CART는 결과 해석이 쉬운 장점을 가지고 있지만 데이터에 따라 생성된 분류자가 다양하여 불안정하다는 단점을 가지고 있다. 따라서 이러한 CART의 단점을 보완한 배깅 또는 부스팅 알고리즘과의 결합을 통해 분류자를 생성하고 그 성능에 대해 평가하였다. 또한 최근 들어 분류성능을 인정받고 있는 SVM의 분류성능과도 비교?평가하였다. 각 기법에 의한 분류 결과를 가지고 의사결정나무를 형성하여 자료가 가지는 데이터의 특성에 따른 분류 성능을 알아보았다. 그 결과 데이터의 결측치가 없고 관측값의 수가 적은 경우는 SVM의 분류성능이 뛰어남을 알 수 있었고, 관측값의 수가 많을 때에는 부스팅 알고리즘의 분류성능이 뛰어났으며, 데이터의 결측치가 존재하는 경우는 배깅의 분류성능이 뛰어남을 알 수 있었다.

SWAT 모형을 이용한 안동댐 장기 일 유입량 산정 (Estimation of Andong Reservoir Long-Term Daily Inflow Using SWAT Model)

  • 강민석;유명수;이재응
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2012년도 학술발표회
    • /
    • pp.868-872
    • /
    • 2012
  • 유역의 유입 및 유출은 강수에 의해 발생하며 여러 가지 기후 조건과 토지 상태의 영향을 받는다. SWAT(Soil and Water Assessment Tool) 모형은 이러한 여러 가지 복잡한 기후 조건과 토지 상태를 반영하며, 장기간 입력 자료에 따른 유출량을 산출할 수 있다. 본 연구에서는 시험유역을 안동댐 유역으로 선정하였으며, SWAT 모형을 이용하여 10년(2000년 ~ 2010년) 동안의 유출량을 산정하였고 이를 안동댐의 실측 유입량과 비교 분석하였다. ArcSWAT을 이용하여 분석하였고 입력 자료는 SWAT의 분석단위인 HRU(Hydrologic Response Unit)를 산정하기 위한 정밀 토양도 및 토지피복도와 기상입력 자료인 강우 및 최고기온, 최저기온, 습도, 풍속, 일사량 등을 사용하였다. 강우관측소는 안동댐 유역의 고선, 남회룡, 도천, 미질, 석동, 석포, 석현, 의촌, 재산, 황지를 선정하였고, 일사량관측소는 안동, 대관령, 포항을 선정하였으며, 기온, 습도, 풍속관측소는 안동, 봉화, 태백, 영주를 선정하였다. 또한 기상입력자료 중 결측값은 역거리 자승법을 이용하여 보완하였다. SWAT 모형은 유출량 계산 시 여러 가지 다양한 매개변수가 사용되며, 이러한 매개변수들의 검 보정을 통하여 실제 유역의 특성과 하천 흐름특성을 반영할 수 있다. 본 연구의 시험유역인 안동댐유역은 산림과 초지가 많은 지역이기 때문에 식물에 의해 차단되는 강우에 관한 매개변수와 지하로 침투되는 강우량에 관한 매개변수 등을 보정하여 실제 유역특성을 반영하였다. 본 연구에서는 이러한 과정을 통해 안동댐 유역의 10년 동안의 일 유출량을 산정한 결과, 홍수기의 첨두유량 및 첨두시간에는 실측자료와 약간의 차이가 있었지만 전체적으로 실측자료와 매우 유사한 유출량을 산정하였다.

  • PDF

생존 분석 자료에서 적용되는 시간 가변 ROC 분석에 대한 리뷰 (Review for time-dependent ROC analysis under diverse survival models)

  • 김양진
    • 응용통계연구
    • /
    • 제35권1호
    • /
    • pp.35-47
    • /
    • 2022
  • Receiver operating characteristic (ROC) 곡선은 이항 반응 자료에 대한 마커의 분류 예측력을 측정하기 위해 널리 적용되어왔으며 최근에는 생존 분석에서도 매우 중요한 역할을 하고 있다. 여러 가지 유형의 중도 절단과 원인 불명 등 다양한 종류의 결측 자료를 포함한 생존 자료 분석에서 마커의 사건 발생 여부에 대한 예측력을 판단하기 위해 기존의 통계량을 확장하였다. 생존 분석 자료는 각 시점에서의 사건 발생 여부로 이해할 수 있으며, 따라서 시점마다 ROC 곡선과 AUC를 구할 수 있다. 본 논문에서는 우중도 절단과 경쟁 위험 모형하에서 사용되는 다양한 방법론과 관련 R 패키지를 소개하고 각 방법의 특성을 설명하고 비교하였으며 이를 검토하기 위해 간단한 모의실험을 시행하였다. 또한, 프랑스에서 수집된 치매 자료의 마커 분석을 시행하였다.