• 제목/요약/키워드: LIKELIHOOD CROSS-VALIDATION

검색결과 31건 처리시간 0.026초

지하수위 분포 모델링을 위한 UNIVERSAL KRIGING의 응용 2. 제한적 최대 우도법 (Application of universal kriging for modeling a groundwater level distribution 2. Restricted maximum likelihood method)

  • 정상용
    • 지질공학
    • /
    • 제3권1호
    • /
    • pp.51-61
    • /
    • 1993
  • 비정상 현상을 나타내는 지하수위 자료의 추정을 위해서 제한적 최대 우도치를 이용하는 universal kriging을 사용하였다. 제한적 최대우도법의 우수성을 판정하기 위해 가중 최소자승법을 이용하는 IRD-k와 비교 검토하였다. 교차 타당성에 있어서 RML과 k계 고유 확율함수는 거의 비슷한 결과를 갖고, 참값 대 추정치의 이산분포도와 지하수위 등고선도에 있어서도 2가지 방법이 거의 같은 결과를 만들었다. RNL을 이요한 universal kriging과 가중 최소자승법을 이용한 IRF-k가 비정상 함수자료의 추정에 있어서 거의 비슷한 결과를 만든 원인은 이용된 실험자료의 비정규분포와 적은 자료수에 기인하는 것으로 사료된다.

  • PDF

공간적 상관구조를 포함하는 선형회귀모형을 이용한 강수량 자료 분석 (Precipitation Analysis Based on Spatial Linear Regression Model)

  • 정지용;진서훈;박만식
    • 응용통계연구
    • /
    • 제21권6호
    • /
    • pp.1093-1107
    • /
    • 2008
  • 매년 전 세계는 여러 자연재해로 인하여 많은 피해를 받고 있다 그 중에서도 강수와 관련한 집중호우와 가뭄, 홍수, 상수원 부족 등으로 많은 손실을 입고 있다. 이러한 재해에 의한 피해를 줄이기 위해서는 기상에 대한 정확한 예측이 필요하다. 따라서 강수량에 대한 정확한 예측을 실시하여 수자원을 적절하게 이용하고 재해에 의한 피해를 줄이기 위하여 많은 연구가 진행되고 있다. 본 연구에서는 강수량을 측정하는 지상기상관측지점자료에 대해 공간적 상관구조를 포함하는 선형회귀모형(크리깅)을 고려하여 세미베리오그램을 기반으로한 최소제곱법과 코베리오그램을 기반으로한 최대우도추정방법으로 남한지역의 공간적 특성을 적절하게 파악할 수 있는 모형들을 찾고 이 모형들을 비교하였다. 공간적 선형회귀모형들에 대한 신뢰성을 검증하기 위하여 자동기상관측지점과 항공기상관측지점에서 측정된 실제값과 예측값을 비교하고 이를 바탕으로 강수량 예측에 관한 발전 및 개선방향에 대해 알아보았다.

비대칭 라플라스 분포를 이용한 분위수 회귀 (Quantile regression using asymmetric Laplace distribution)

  • 박혜정
    • Journal of the Korean Data and Information Science Society
    • /
    • 제20권6호
    • /
    • pp.1093-1101
    • /
    • 2009
  • 분위수 회귀모형은 확률변수들 사이에 확률적인 관계구조를 포함한 함수 모형을 좀 더 완벽하게 추정하도록 제공한다. 본 논문에서는 함수 추정에 로버스트하다고 알려져 있는 서포트벡터기계 기법과 이중벌칙커널기계를 이용하여 분위수 회귀모형을 추정하고자 한다. 이중벌칙커널기계는 고차원의 입력변수에 대한 분위수 회귀가 요구될 때 분위수 회귀모형을 잘 추정한다고 알려져 있다. 또한 본 논문에서는 광범위한 형태의 분위수 회귀모형 추정을 위해서 정규분포보다 비대칭 라플라스 분포를 이용한다. 본 논문에서 제안한 모형은 분위수 회귀모형 추정을 위해서 서포트벡터기계 기법에 이중벌칙커널기계를 이용하여 각각의 평균과 분산을 동시에 추정한다. 평균과 분산함수 추정을 위해 사용된 커널함수의 모수들은 최적의 값을 찾기 위해 일반화근사 교차타당성을 이용한다.

  • PDF

커널기계 기법을 이용한 일반화 이분산자기회귀모형 추정 (Estimating GARCH models using kernel machine learning)

  • 황창하;신사임
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권3호
    • /
    • pp.419-425
    • /
    • 2010
  • 커널기계 기법은 최근 대용량 또는 고차원 비선형 자료를 분석하는 방법으로 인기를 많이 얻고 있다. 본 논문에서는 주식시장 수익률의 조건부 변동성을 예측하기 위한 일반화 이분산자기회귀모형을 추정하기 위해 커널기계 기법을 사용한다. 일반화 이분산자기회귀모형은 자료가 정규분포를 따른다고 가정한 후 주로 최대우도법을 사용하여 추정된다. 본 논문에서는 꼬리가 두꺼운 분포를 갖는 금융시계열자료의 변동성을 추정할 때 커널기계 기법이 최대우도법과 서포트벡터기계 보다 더 정확한 예측능력을 가진다는 것을 보이고자 한다.

지구물리 자료의 고속 베이지안 역산 (Fast Bayesian Inversion of Geophysical Data)

  • 오석훈;권병두;남재철;이덕기
    • 지구물리
    • /
    • 제3권3호
    • /
    • pp.161-174
    • /
    • 2000
  • 베이지안 역산(Bayesian inversion)은 불충분한 자료를 가지고 지하구조를 추정해야 하는 지구물리자료의 해석에 있어서 안정적이고 신뢰를 줄 수 있는 방법 중의 하나이다. 관측 자료가 측정 과정부터 불확실성을 함유하고 있으며, 역산에 이용되는 이론 자료 또한 모델의 매개변수화에 따른 각종 불확실성을 포함하고 있다. 따라서 지구물리 자료의 역산은 확률적으로 접근하는 것이 가장 바람직하며 베이지안 역산은 이에 대한 처리뿐만 아니라, 추정에 대한 신뢰도와 불확실성에 대한 이론적 근거를 제공한다. 그러나 대부분의 베이지안 역산이 고차원의 적분을 필요로 하므로 몬테 카를로 방법과 같은 대규모의 계산이 요구되는 방법에 의해 사후 확률분포가 구해지는 경우가 많다. 이는 특히 지구물리 자료와 같이 고도의 비선형 자료에 대하여 매우 적합한 접근 방법이기는 하지만, 점차 현장화, 고속화되어가는 자료의 해석 경향에 맞추어 간략하게 사후 확률분포를 근사한 수 있는 기법의 연구 또한 필요하다. 따라서 이 연구에서는 관측자료와 사전 확률분포가 정규분포에 의해 근사 될 수 있는 지구물리자료에 대한 베이지안 역산에 대해 논의 하고자 한다. 사전 확률분포의 작성을 위해 지구통계학적 기법이 이용되었으며, 관측자료의 통계적 불화실성을 추정하기 위해 교차 검사(cross-validation) 방법을 이용하여 공분산(covariance)을 유도하고 그것에 의한 우도 함수(likelihood function)를 작성하였다. 베이지안 해석을 위해 두 확률분포를 곱하여 근사적인 사후 확률분포를 얻을 수 있었으며, 이에 대해 최적화(optimization) 기법을 이용하여 최대 사후 확률(Maximum a Posterior)을 따르는 지하 구조를 얻을 수 있었다. 또한 사후 확률 분포의 공분산 항을 이용하여 지하 비저항 구조를 시뮬레이션 하여 불확실성분석을 수행하였다.

  • PDF

단일 시기의 Landsat 7 ETM+ 영상을 이용한 산불피해지도 작성 (Fire Severity Mapping Using a Single Post-Fire Landsat 7 ETM+ Imagery)

  • 원강영;임정호
    • 대한원격탐사학회지
    • /
    • 제17권1호
    • /
    • pp.85-97
    • /
    • 2001
  • 인공위성영상(ETM+)을 이용하여 산불피해지역을 분석하기 위해 KT(Kauth-Thomas)변환기법과 IHS(Intensity-Hue-Saturation)변환기법을 적용하여 비교해 보고 산불피해등급지도를 작성하였다. 이 연구는 두 부분으로 나누어 수행되었는데, 그 첫 번째는 기하보정만 수행한 영상의 7, 4, 1밴드를 이용하여 IHS변환을 적용하여 단순 슬라이싱 기법으로 산불피해지역을 피해 정도별로 등급화 하는 것이 가능한가를 분석하였다. 그 결과 각 컴포넌트에서 클래스의 분광 특성이 서로 겹쳐서 단순 슬라이싱 기법으로는 적절한 분류가 이루어지지 않았다. 두 번째는 방사 및 지형보정을 한 영상을 각각 IHS와 KT변환기법으로 변환시킨 후 최대우도법을 이용해 분류하였다. 현장데이타가 부족하여 cross-validation을 수행하였으며, 일관되게 KT변환기법에 의한 분류가 IHS기법에 의한 분류보다 더 좋은 결과를 보여주었다. 또한 KT feature space와 IHS 컴포넌트의 분광분포를 그래프 상에서 분석해 보았다. 이 연구에서는 KT변환기법이 IHS변환기법보다 산불피해지역을 추출함에 있어 더 높은 정확도를 나타내고, 산불과 관련된 지표의 물리적 특성을 더 잘 반영함을 볼 수 있었다.

Ordinary kriging approach to predicting long-term particulate matter concentrations in seven major Korean cities

  • Kim, Sun-Young;Yi, Seon-Ju;Eum, Young Seob;Choi, Hae-Jin;Shin, Hyesop;Ryou, Hyoung Gon;Kim, Ho
    • Environmental Analysis Health and Toxicology
    • /
    • 제29권
    • /
    • pp.12.1-12.8
    • /
    • 2014
  • Objectives Cohort studies of associations between air pollution and health have used exposure prediction approaches to estimate individual-level concentrations. A common prediction method used in Korean cohort studies is ordinary kriging. In this study, performance of ordinary kriging models for long-term particulate matter less than or equal to $10{\mu}m$ in diameter ($PM_{10}$) concentrations in seven major Korean cities was investigated with a focus on spatial prediction ability. Methods We obtained hourly $PM_{10}$ data for 2010 at 226 urban-ambient monitoring sites in South Korea and computed annual average $PM_{10}$ concentrations at each site. Given the annual averages, we developed ordinary kriging prediction models for each of the seven major cities and for the entire country by using an exponential covariance reference model and a maximum likelihood estimation method. For model evaluation, cross-validation was performed and mean square error and R-squared ($R^2$) statistics were computed. Results Mean annual average $PM_{10}$ concentrations in the seven major cities ranged between 45.5 and $66.0{\mu}g/m^3$ (standard deviation=2.40 and $9.51{\mu}g/m^3$, respectively). Cross-validated $R^2$ values in Seoul and Busan were 0.31 and 0.23, respectively, whereas the other five cities had $R^2$ values of zero. The national model produced a higher cross-validated $R^2$ (0.36) than those for the city-specific models. Conclusions In general, the ordinary kriging models performed poorly for the seven major cities and the entire country of South Korea, but the model performance was better in the national model. To improve model performance, future studies should examine different prediction approaches that incorporate $PM_{10}$ source characteristics.

정규 확률과정을 사용한 공조 시스템의 전력 소모량 예측에 관한 연구 (A Study on the Prediction of Power Consumption in the Air-Conditioning System by Using the Gaussian Process)

  • 이창용;송근수;김진호
    • 산업경영시스템학회지
    • /
    • 제39권1호
    • /
    • pp.64-72
    • /
    • 2016
  • In this paper, we utilize a Gaussian process to predict the power consumption in the air-conditioning system. As the power consumption in the air-conditioning system takes a form of a time-series and the prediction of the power consumption becomes very important from the perspective of the efficient energy management, it is worth to investigate the time-series model for the prediction of the power consumption. To this end, we apply the Gaussian process to predict the power consumption, in which the Gaussian process provides a prior probability to every possible function and higher probabilities are given to functions that are more likely consistent with the empirical data. We also discuss how to estimate the hyper-parameters, which are parameters in the covariance function of the Gaussian process model. We estimated the hyper-parameters with two different methods (marginal likelihood and leave-one-out cross validation) and obtained a model that pertinently describes the data and the results are more or less independent of the estimation method of hyper-parameters. We validated the prediction results by the error analysis of the mean relative error and the mean absolute error. The mean relative error analysis showed that about 3.4% of the predicted value came from the error, and the mean absolute error analysis confirmed that the error in within the standard deviation of the predicted value. We also adopt the non-parametric Wilcoxon's sign-rank test to assess the fitness of the proposed model and found that the null hypothesis of uniformity was accepted under the significance level of 5%. These results can be applied to a more elaborate control of the power consumption in the air-conditioning system.

기술금융을 위한 부실 가능성 예측 최적 판별모형에 대한 연구 (A Study on the Optimal Discriminant Model Predicting the likelihood of Insolvency for Technology Financing)

  • 성웅현
    • 기술혁신학회지
    • /
    • 제10권2호
    • /
    • pp.183-205
    • /
    • 2007
  • 본 연구는 기술력평가에 근거해서 중소기업 부실예측 가능성을 사전에 예측할 수 있는 최적 판별 모형을 개발 제안하였다. 판별모형에 포함될 설명변수는 요인분석과 판별모형의 단계별 선택방법에 의하여 선정되었다. 분석결과 선형판별모형이 로지스틱판별모형보다 임계확률 관점에서 적절한 것으로 나타났다. 최적 선형판별모형의 분류 정분류율은 70.4%, 분류 예측력은 67.5%로 나타났다. 최적 선형판별모형의 활용도를 높이기 위해서 확실 범주와 유보범주를 구분할 수 있는 경계값을 설정하였다. 분석결과를 활용하면 기술금융 취급기관은 부실위험 평가와 더불어 기술금융 신청기업의 순위를 부여할 때 유용하게 사용할 수 있을 것으로 기대된다.

  • PDF

철원지역 두루미 취식지의 핵심지역 설정을 위한 MCP, 커널밀도측정법(KDE)과 국지근린지점외곽연결(LoCoH) 분석 (MCP, Kernel Density Estimation and LoCoH Analysis for the Core Area Zoning of the Red-crowned Crane's Feeding Habitat in Cheorwon, Korea)

  • 유승화;이기섭;박종화
    • 한국환경생태학회지
    • /
    • 제27권1호
    • /
    • pp.11-21
    • /
    • 2013
  • 본 연구는 두루미(Grus japonensis)의 이용분포 내에서 행동권 분석의 기법인 MCP(최소볼록다각형법), KDE(커널밀도측정법), LoCoH(국지근린지점외곽연결)를 이용하여 이용면적과 핵심서식지를 선정하였다. 또한, 각 기법의 차이와 의미를 고찰하도록 하였다. 두루미의 분포자료는 철원지역 2012년 2월 17일 조사자료를 사용하였다. MCP에 의한 두루미류 서식영역은 $140km^2$이었다. KDE 분석에서 띠폭에 해당하는 h값을 1000m, CVh, LSCVh로 달리하여 KDE 등치선을 생성하였을 때, 핵심지역에 해당하는(Kernel 50% 이상) 면적은 $33.3km^2$($KDE_{1000m}$), $25.7km^2$($KDE_{CVh}$), $19.7km^2$($KDE_{LSCVh}$)이었다. 결과적으로 띠폭에 대한 기본값(1000m)-CVh(554.6m)-LSCVh(329.9m) 순으로 변수를 작게 입력할 경우 핵심면적 개수는 늘어나고, 면적은 감소하였으며, 형태의 복잡성은 증가하였다. 두루미류의 KDE 분석에 의한 핵심지역의 선정에서 적합한 띠폭변수는 CVh 값인 것으로 판단되었다. LoCoH분석에서는 서식범위와 핵심지역(50% 등치선 이상의 지역)의 면적이 k값의 증가에 따라 증가하는 모습을 보였으며, 점차 큰 핵심지역으로 합쳐지는 모습을 나타내었다. 핵심지역을 도출하기에 적합한 k 값은 24로 나타났으며, 전체 개체군의 핵심지역은 $18.2km^2$로 전체 서식면적의 16.5%를 차지하였다. 최종적으로, LoCoH 분석은 두 개의 큰 핵심서식지를 제시하였으며, 이것은 KDE에 의한 핵심지역에 비하여 작은 수의 핵심지역을 제시한 것이었다. 국내의 게재논문 및 발표자료를 포함한 연구에서 KDE는 대부분 기본설정으로 분석되었으며, 띠폭에 의한 변수를 고려한 것은 매우 드물었다. 따라서 띠폭변수를 명확히 제시하는 것이 요구되었다.