• Title/Summary/Keyword: 확률적 자료연계

Search Result 56, Processing Time 0.029 seconds

A study on the probabilistic record linkage and its application (확률적 자료연계의 이론과 적용에 관한 연구)

  • Choi, Yeonok;Lee, Sangin
    • The Korean Journal of Applied Statistics
    • /
    • v.34 no.5
    • /
    • pp.849-861
    • /
    • 2021
  • This paper aims to introduce the basic concept of probabilistic record linkage and its statistical framework, and describe the specific process and principle of performing it using a real example from Statistics Korea. First, we briefly describe the deterministic record linkage and compare it with probabilistic record linkage. We introduce the Fellegi-Sunter model framework for record linkage and the related paprameters: m-probability, u-probability, matched weight and decision rule. Finally, we show the detailed process of record linkage under Fellegi-Sunter model framework and evaluate the record linkage results, using sample data from the registered-based census and Population and Housing Census survey in Statistics Korea.

Traffic Accidents Analysis on Expressway using Spatial Autoregressive Model (공간자기회귀모형을 이용한 고속도로 교통사고 분석)

  • 강경우
    • Journal of Korean Society of Transportation
    • /
    • v.15 no.1
    • /
    • pp.5-15
    • /
    • 1997
  • 공간통계분석은 공간적으로 연계된 변수들간의 관계를 분석하는 통계분야이다. 일 반적으로 공간적으로 연계된 변수들간의 관계는 각 변수간의 공간적 분포정도에 따라서 영 향을 받는다. 전통적인 통계 분석의 방법은 동질의 자료발생과정에 의하여 확률적으로 축출 된 표본자료를 가정하고 있으나, 공간적인 자료는 이와 같은 동질의 자료발생과정의 가정을 부정한다. 교통류 및 교통사고 등과 같은 교통분야의 자료는 대부분 공간적인 상관관계에 의하여 축출된 이질적인 표본자료이며 따라서 공간상관관계를 동질적으로 가정한 전통적인 통계적 분석 방법은 오류를 범할 수 있다. 본 논문은 공간적인 관계를 고려한 공간자기상관 분석기법을 이용하여 고속도로상의 교통사고에 관하여 분석하였다. 분석의 결과에 의하면 4 개 고속도로 중 경인고속도로를 제외한 3개의 고속도로상의 교통사고건수는 통계적으로 현 저한 양의 공간적 상관관계가 있음을 알 수 있었다. 이에 따라 공간적 상관관계를 고려한 교통사고분석을 위하여 종속변수로 단위구간별 교통사고건수를 그리고 설명변수로서는 단위 구간별 교통량, I.C. 유무 및 화물차량비율을 이용하여 공간 자기회귀분석을 시도하였다. 분 석의 분석에서는 구간별 교통량과 화물차량의 비율이 호남/남해 고속도로의 경우에는 구간 별 교통량과 I.C. 유무가 통계적으로 유의한 것으로 분석되었다.

  • PDF

A Sampling Stochastic Linear Programming Model for Coordinated Multi-Reservoir Operation (저수지군 연계운영을 위한 표본 추계학적 선형 계획 모형)

  • Lee, Yong-Dae;Kim, Sheung-Kown;Kim, Jae-Hee
    • Proceedings of the Korean Operations and Management Science Society Conference
    • /
    • 2004.05a
    • /
    • pp.685-688
    • /
    • 2004
  • 본 연구에서는 저수지군 연계운영을 위한 표본 추계학적 선형 계획(SSLP, Sampling Stochastic Linear Programming) 모형을 제안한다. 일반적 추계학적 모형은 과거 자료로부터 확률변수의 확률분포를 추정하고 이를 몇 개 구간으로 나누어 이산 확률 값을 산정하여 기댓값이 최대가 되는 운영방안을 도출하지만 저수지 유입량 예측시 고려되어야할 지속성 효과(Persistemcy Effect)와 유역간 또는 시점별 공분산 효과(The joint spatial and temporal correlations)를 반영하는데 많은 한계가 있다. 이를 극복하기 위하여 과거자료 자체를 유입량 시나리오로 적용하여 시${\cdot}$공간적 상관관계를 유지하는 표본 추계학적(Sampling Stochastic)기법을 바탕으로 Simple Recourse Model로 구성한 추계학적 선형 계획 모형을 제시한다. 이 모형은 미국 기상청(NWS)에서 발생 가능한 유입량의 시나리오를 예측하는 방법인 앙상블 유량 예측(ESP, Ensemble Streamflow Prediction)을 통한 시나리오를 적용함으로써 좀더 신뢰성 있는 저수지군 연계운영 계획을 도출 할 수 있을 것으로 기대된다.

  • PDF

Probabilistic Reservoir Inflow Forecast Using Nonparametric Methods (비모수적 기법에 의한 확률론적 저수지 유입량 예측)

  • Lee, Han-Goo;Kim, Sun-Gi;Cho, Yong-Hyon;Chong, Koo-Yol
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2008.05a
    • /
    • pp.184-188
    • /
    • 2008
  • 추계학적 시계열 분석은 크게 수문자료의 장기간 합성과 실시간 예측으로 구분해 볼 수 있다. 장기간 합성은 주로 수문자료의 추계적 특성을 반영한 수자원 시스템의 운영율 개발에 이용되어 왔다. 반면에 실시간 예측은 수자원 시스템의 순응적(adaptive) 관리에 적용되고 있다. 두 개념의 차이로 전자는 시계열 자료를 합성하여 발생 가능한 모든 수문조합을 얻고자 하는 것이라면 후자는 전 시간의 수문량을 조건으로 하는 다음 시간의 값을 순응적으로 예측하는 것이라 할 수 있다. 수문자료의 합성과 예측에는 크게 결정론적, 확률론적 방법의 두 가지 대별될 수 있다. 결정론적 모델링 방법에는 인공신경망이나 Fuzzy 기법 등을 이용할 수 있으며, 확률론적 방법에는 ARMAX 등의 모수적 기법과 k-NN(k-nearest neighbor bootstrap resampling), KDE(kernel density estimates), 추계학적 인공신경망 등의 비모수적 기법으로 분류할 수 있다. 본 연구에서는 대표적 비모수적 기법인 k-NN를 이용하여 충주댐을 대상으로 월 및 일 유입량 자료의 예측 정도를 살펴보았다. 전 시간 관측치를 조건으로 하는 다음 시간의 조건부 확률분포를 구하여 평균값을 계산한 후 관측치와 비교함으로써 모형의 정도를 살펴보았다. 그리고 실시간 저수지 운영에 이 기법의 활용성과 장단점도 살펴보았다. 모형개발 절차로 모형의 보정을 거쳐 검증을 실시하였다. 결론적으로 월 및 일 유입량 예측에 k-NN 기법이 실무적으로 적용될 수 있었으며, 장점으로는 k-NN 기법이 다른 기법보다 모델링 절차가 비교적 쉬워 저수지 운영 최적화 등 타 시스템과의 연계에 수월함이 인식되었다.

  • PDF

Regional Frequency Analysis using Nonparametric Kernel Function (비매개변수적 Kernel Function을 이용한 지역빈도해석)

  • Moon, Young-Il;Oh, Tae-Suk;Kim, Jong-Suk;Jeong, Min-Su
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2006.05a
    • /
    • pp.1492-1496
    • /
    • 2006
  • 수공구조물의 설계에 있어 가중 중요한 변수 중에 하나가 확률 강우량이다. 우리나라의 경우 매개변수적인 지점빈도해석을 통해 확률 강우량을 산정하고 있으나, 최근 들어 지점별 관측자료의 부족으로 인한 지역빈도해석을 수행하여 확률강우량을 산정하고 있는 실정이다. Index Flood 기법이나 L-moment 기법과 같은 기존의 지역빈도해석은 여러 관측 지점에서 관측된 강우자료를 이용하여 매년최대 시간강우량 자료를 추출하여 동질성 분석을 통해 이질성이 없는 것으로 분석된 연최대 강우량을 빈도해석 하여 확률 강우량을 결정한다. 그러나 이와 같은 지역빈도해석은 매개변수적 지점빈도해석과 마찬가지로 적합도 검정에 통과한 다수의 분포형이 선정되는 경우에 어떤 분포형을 사용하느냐 하는 문제점이 발생할 수 있다. 그리고 선정된 여러 강우 관측 지점의 연최대 강우량 자료에 모두 동일한 확률 분포형을 이용하므로 선정된 확률 분포형이 모든 지점의 강우 자료와 적합하지 못할 가능성을 내포하고 있으며, 또한 수문자료가 여러가지 요인으로 인하여 복합분포(mixed distribution)형태를 가질 때, 매개변수적 해석방법으로는 다중 첨두를 갖는 확률밀도함수를 해석하는데는 여러 가지 어려움이 따른다. 따라서 이러한 매개변수적 확률분포형을 이용한 빈도해석의 문제점을 해결할 수 있는 비매개변수적 빈도해석이 하나의 대안으로 제시될 수 있다. 본 연구에서는 강우자료의 선별을 통해 신뢰성 있는 자료를 구축하고, 기존의 매개변수를 갖는 확률 분포형을 이용한 지역빈도해석을 적용하여 확률 강우량을 산정하였다. 그리고 동질성분석을 통해 선정된 강우자료에 대해 비매개변수적 지역빈도해석을 적용하여 확률 강우량을 산정하고 각각의 방법에 대한 빈도해석 결과를 비교하여 확률강우량 해석에 있어 하나의 대안을 제시하고자 한다.X>${\mu}_{max,A}$는 최대암모니아 섭취률을 이용하여 구한 결과 $0.65d^{-1}$로 나타났다.EX>$60%{\sim}87%$가 수심 10m 이내에 분포하였고, 녹조강과 남조강이 우점하는 하절기에는 5m 이내에 주로 분포하였다. 취수탑 지점의 수심이 연중 $25{\sim}35m$를 유지하는 H호의 경우 간헐식 폭기장치를 가동하는 기간은 물론 그 외 기간에도 취수구의 심도를 표층 10m 이하로 유지 할 경우 전체 조류 유입량을 60% 이상 저감할 수 있을 것으로 조사되었다.심볼 및 색채 디자인 등의 작업이 수반되어야 하며, 이들을 고려한 인터넷용 GIS기본도를 신규 제작한다. 상습침수지구와 관련된 각종 GIS데이타와 각 기관이 보유하고 있는 공공정보 가운데 공간정보와 연계되어야 하는 자료를 인터넷 GIS를 이용하여 효율적으로 관리하기 위해서는 단계별 구축전략이 필요하다. 따라서 본 논문에서는 인터넷 GIS를 이용하여 상습침수구역관련 정보를 검색, 처리 및 분석할 수 있는 상습침수 구역 종합정보화 시스템을 구축토록 하였다.N, 항목에서 보 상류가 높게 나타났으나, 철거되지 않은 검전보나 안양대교보에 비해 그 차이가 크지 않은 것으로 나타났다.의 기상변화가 자발성 기흉 발생에 영향을 미친다고 추론할 수 있었다. 향후 본 연구에서 추론된 기상변화와 기흉 발생과의 인과관계를 확인하고 좀 더 구체화하기 위한 연구가 필요할 것이다.게 이루어질 수 있을 것으로 기대된다.는 초과수익률이 상승하지만, 이후로는 감소하므로, 반전거래전략을 활용하는 경우 주식투자기간은 24개월이하의 중단기가 적합함을 발견하였다. 이상의 행태적 측면과 투자성과측면의 실증결과를 통하여 한국주식시장에 있어서 시장수익률을 평균적으로 초과할 수 있는 거래전

  • PDF

Concept of Seasonality Analysis of Hydrologic Extreme Variables and Effective Design Rainfall Estimation Using Nonstationary Frequency Analysis (극치수문자료의 계절성 분석 개념 및 비정상성 빈도해석을 이용한 유효확률강수량 해석)

  • Kwon, Hyun-Han;Lee, Jeong-Ju;Lee, Dong-Ryul
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2010.05a
    • /
    • pp.1434-1438
    • /
    • 2010
  • 수문자료의 계절성은 수자원관리의 관점에서 매우 중요한 요소로서 계절성의 변동은 댐의 운영, 홍수조절, 관계용수 관리 등 다양한 분야와 밀접한 관계를 가지고 있다. 그러나 지금까지의 수문 자료의 계절성 평가는 주로 이수과점에서 이루어지고 있으며 치수관점에서 극치수문량의 계절성을 평가하는 연구는 미진한 실정이다. 이는 극치수문량을 해석하는 방법론으로서 연최대치계열(annual maxima) 즉, Block Maxima가 이용됨에 따라 나타나는 문제점이다. 그러나 부분기간치계열(partial duration series)을 활용하게 되면 자료의 확충뿐만 아니라 자연적으로 극치수문량의 계절성에 대한 평가 또한 가능하다. 이러한 분석과정을 POT(peak over threshold)분석이라 하며 일정 기준값(threshold) 이상의 자료를 모두 취하여 빈도해석에 이용하는 방법으로서 기존 방법의 경우 연최대값이 일반적으로 7월과 8월에만 존재하게 되지만 POT 분석의 경우 여러 달에 걸쳐 빈도해석을 위한 자료가 구성되게 된다. 이를 빈도해석으로 연계시키기 위해서는 계절성을 비정상성으로 고려하여 모형화 할 수 있는 방법론의 개발이 필요하다. 본 연구에서는 이러한 목적을 위해서 계절성을 고려할 수 있는 비정상성빈도해석 기법의 개념을 제시하고 모형으로 개발하고자 한다. GEV 또는 Gumbel 분포의 매개변수와 계절성을 연계시키기 위해서 Fourier 급수가 활용되며 매개변수는 Bayesian 기법을 통해 최적화 된다. 이를 통하여 설계강수량의 계절적 분포를 정량적으로 해석할 수 있으며 미래의 극치강수량에 대한 분포특성 또한 확률적으로 해석이 가능하다. 본 연구에서 제안된 방법은 국내외 시간강수량자료에 적용되어 적합성과 적용성이 평가된다.

  • PDF

Concept of Trend Analysis of Hydrologic Extreme Variables and Nonstationary Frequency Analysis (극치수문자료의 경향성 분석 개념 및 비정상성 빈도해석)

  • Lee, Jeong-Ju;Kwon, Hyun-Han;Kim, Tae-Woong
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2010.05a
    • /
    • pp.1448-1452
    • /
    • 2010
  • 최근 기상변동성 증가 및 기후변화 영향으로 수문순환과정이 과거와는 다른 양상으로 전개되고 있으며 전반적으로 극치사상의 빈도 및 강도의 증가현상이 지배적이다. 이러한 영향을 정량적으로 검토하기 위해서 경향성분석 방법 등이 도입되어 극치수문사상의 변동경향을 평가하는데 이용되고 있다. 대표적인 방법으로 선형회귀분석, Mann-Kendall 경향성 분석 등이 있으나 기본적인 가정(assumption)의 제약으로 극치수문자료 계열의 특성을 효과적으로 분석하는데 무리가 있다. 대표적이고 일반적으로 적용되는 선형회귀분석의 경우 자료가 정규분포(normal distribution)의 특성을 가질 때 유효한 방법으로서 극치수문자료와 같이 Heavy Tail를 가지는 분포특성을 표현하는 데는 무리가 따른다. 이밖에도 기존 선형회귀분석을 극치수문자료에 적용할 경우 추정된 결과를 수자원설계의 관심사항인 빈도해석 등에 직접적으로 연계시켜 해석할 수 없는 단점이 있다. 이는 자료계열의 분포특성을 정규분포로 가정하기 때문에 발생하는 문제로서 극치수문자료계열의 분포 특성을 반영할 수 있는 방법론의 개발이 필요하다. 본 연구에서는 이러한 점을 개선하기 위해서 극치분포(extreme distribution)를 선형회귀분석에 적용하는 비정상성빈도해석(nonstationary frequency analysis) 방법론의 개념을 제시하고자 한다. 비정상성빈도해석을 위해서 Bayesian 기법이 도입되며 Bayesian 기법의 특성상 관련변수들이 사후분포(posterior distribution)로 귀결되기 때문에 경향성에 대한 정량적이고 확률적인 분석이 가능한 장점이 있다. 본 연구를 통해 개발된 방법론은 국내외 주요 강수지점에 대해서 적용되며 경향성, 분포특성, 빈도별 강수량에 대한 체계적인 분석이 이루어진다.

  • PDF

Uncertainty Analysis of Neyman-Scott Rectangular Pulse Model(NSRPM) Based on Bayesian Modelling (Bayesian 기법을 활용한 Neyman-Scott Rectangular Pulse 모형의 불확실성 분석)

  • Kim, Jang-Gyeong;Ban, Woo-Sik;Kwon, Hyun-Han
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.79-79
    • /
    • 2017
  • 강우 자료는 수공구조물 설계목적에 따라 다양한 시공간적 범주가 필요하다. 그러나 시간단위 이하 시계열 강우자료는 미계측 유역 및 관측연한 등의 제약으로 연속적인 시계열을 확보하는데 어려움이 있다. 이러한 점에서 포아송분포 기반 강우발생모형은 강우시계열의 통계적 특성을 나타내는 5개 매개변수로 다양한 시간 범주의 연속강우시계열을 생성할 수 있다는 장점이 있다. 강우발생모의 핵심은 과거자료의 통계특성을 효과적으로 복원할 수 있어야 하며, 다양한 기상학적 특성들 또한 적절하게 모의될 수 있어야 한다는 점이다. 즉, 다음과 같은 기준으로 모의적합성을 평가할 수 있다. 첫째, 지속기간별 관측시계열과 모의시계열의 통계적 유사성을 평가하고, 둘째, 확률분포를 따르는 각 매개변수의 사후분포를 제시하여 불확실성을 정량화하고, 셋째, 추정된 매개변수의 물리적 범위의 적정성 검토가 필요하다. 본 연구에서는 강우발생모형으로 널리 알려진 Neyman-Scott Rectangular Pulse(NSRP) 모형과 Bayesian 모형을 연계한 Bayesian NSRP 모형 개발을 통해 강우관측소 전지점에 대한 매개변수 지도를 제시하고자 한다. 본 연구결과는 임의 유역에 대한 강우발생 시나리오를 제공하여, 다양한 형태의 유출결과를 도출할 수 있으며, 무엇보다 유출결과를 확률적으로 평가할 수 있다는 장점이 있다.

  • PDF

Analysis on CWGEN Simulation Method Considering Climate Change Impacts (기후변화 시나리오를 고려한 CWGEN 모의기법에 관한 연구)

  • Kwon, Hyun-Han;Kim, Byung-Sik;Yoon, Seok-Young;Bae, Young-Hae
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2008.05a
    • /
    • pp.1023-1026
    • /
    • 2008
  • 과거에 수문자료 시계열 모의기법은 수자원시스템 설계에 사용되는 일강수량 모의에 주로 이용되어 왔지만 최근에 기후변화에 따른 수문사상의 변동성을 평가하기 위한 기본 자료 모의를 위한 방법론으로 많이 이용되고 있다. 수문시스템에서 강수는 현상의 발생여부에 따라 건조일과 습윤일이 교대로 반복되는 과정으로 구성되어 있으며 건조일, 습윤일 등으로 구분하고 습윤일의 강수량을 상태별로 분류하여 각 상태별 천이확률을 계산함으로써 장래에 발생 가능한 강수사상의 모의 발생이 가능하다. 기후변화 영향 평가 연구에서 가장 중요한 문제 중의 하나는 기후변화로 기인하는 수문사상의 전체적인 거동의 변동사상을 추정하는 것이며 이를 기존 모형들과 연계시키는 방법이라 할 수 있다. 이러한 관점에서 본 연구에서는 천이확률 및 강수 모의에 이용되는 Gamma 확률분포와 같은 분포형의 매개변수들이 우리가 목적으로 하는 월강수량 또는 계절강수량의 총량을 유사하게 모의할 수 있도록 CWGEN(Cross-validated Canonical Correlation Analysis-Weather Generator)를 도입하였다. 이를 국내 강수 지점을 대상으로 검토 평가하였다.

  • PDF

Developing the Probability of Human Casualties by Flooding (홍수로 인한 인명피해 발생확률 개발)

  • Hong, Seung Jin;Kim, Gil Ho;Choi, Cheon Kyu;Kim, Kyung Tak
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2018.05a
    • /
    • pp.464-464
    • /
    • 2018
  • 최근 풍수해 현황 분석(국민안전처, 2016)에서는 2003년 이후 태풍 루사와 매미와 같은 대형태풍이 최근에 발생하지 않아 대부분 하천급류로 인한 인명피해가 대부분이라고 언급하였다. 최근 풍수해로 인한 피해가 발생하지는 않았지만 호우/태풍이 발생할 경우 인명보호와 불편해소를 최우선에 두고 각종 정책들을 선제적으로 추진하고 있어 홍수범람발생 예상지역에 대한 인명피해 분석은 반드시 필요하다고 판단된다. 최근들어 인명피해를 평가하는 기술은 피해자료로부터 비교적 간단히 분석되는 경험적 방법에서 2차원 동적 수리모형과 연계, 그리고 정밀한 인구, 건물 등의 자료를 활용하여 대피율, 사전경보 등 인명피해에 영향을 미치는 다양한 요소를 복합적으로 고려하고 개념적이고 기계적 방법으로 발전하는 추세이다. 우리나라의 경우 인명피해 평가와 관련한 연구사례가 거의 전무한 상태이고, 치수경제성분석에서 제시하는 침수면적에 기반한 간략한 방법만이 실무에서 활용되고 있다. 최근 국외에서 제시한 접근방법은 본 연구에서의 개발하고자 하는 목적과 방향에 부합하지 않다고 판단되며, 국내 실정을 고려할 때 주요 영향인자를 추가하고, 특히 노출인구, 인명 인벤토리의 해상도를 높이는 데 주안점을 두고자 한다. 홍수로 인한 인명피해 발생확률은 사후분석의 일환으로 침수흔적도를 통해 총 2개의 침수구간을 설정한 후 Census data를 활용한 위험인구(Population at Risk, PAR)를 산정한후, NDMS 인명피해 자료를 활용하여 침수구간별 인명피해 발생확률을 제시하였다. 여기서 제시한 침수구간의 경우 데이터의 축적정도에 따라 구간을 세밀화 할 수 있는데, 본 연구에서는 총 2개구간(0-1m, 1m 이상)으로 계략화 하여 제시하였다. 본 연구에서는 4개의 지자체의 인명피해 자료를 통해 인명피해 발생확률을 산정하였으며, 해당내용을 시범유역의 빈도별 침수구역도에 적용하여 인명피해 발생을 분석하였다. 해당 연구결과의 경우 인명피해에 대한 명확한 결과를 유추하는데에는 한계가 있지만, 인명피해에 기반한 해당지역의 장래피해규모를 예측하는 데에는 기초가 될 수 있을 것으로 판단된다.

  • PDF