• 제목/요약/키워드: Kernel Density Estimate

검색결과 35건 처리시간 0.025초

주행거리를 이용한 연료소비량 산정방법: 몬테카를로 기법 중심으로 (Estimation methods of fuel consumption using distance traveled: Focused on Monte Carlo method)

  • 박천건;소진영;이영섭
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권2호
    • /
    • pp.247-256
    • /
    • 2012
  • 최근 온실가스 배출량에 대한 국제적 이슈가 지속적으로 대두되어 왔다. 본 연구는 이동 배출원중에서 도로교통부분에 대한 배출량을 산출하는데 필요한 연료소비량 산정에 관한 통계적인 기법들을 비교한 것이다. 지금까지 연료소비량을 산정하는데 단순히 연료공급량 또는 주행거리에 의한 방법으로 초점을 두어왔다. 그러나 연료공급량을 토대로 산출된 배출량은 다양한 차량 및 연식을 반영하지 못한다. 본 연구는 통계적 관점에서 주행거리와 연비를 조합한 각 차량의 연료소비량 및 모든 차량의 소비한 총연료소비량의 추정에 적용되는 방법들을 나열하고 비교한다. 또한 향후 연구로 제시된 일부 방법들에 대해서 차량 및 연식을 고려한 연료소비량의 추정에 관한 현실적인 적용방법을 제시한다.

환경 DNA 메타바코딩을 활용한 멧돼지 및 육상 포유류 출현 모니터링 - 경기도 양평군 일대를 중심으로 - (Monitoring the presence of wild boar and land mammals using environmental DNA metabarcoding - Case study in Yangpyeong-gun, Gyeonggi-do -)

  • 김용환;한윤하;박지윤;김호걸;조수현;송영근
    • 한국환경복원기술학회지
    • /
    • 제24권6호
    • /
    • pp.133-144
    • /
    • 2021
  • This study aims to estimate location of land mammals habitat by analyzing spatial data and investigate how to apply environmental DNA monitoring methodology to lotic system in Yangpyeong-gun, Gyeonggi-do. Environmental DNA sampling points are selected through spatial analysis with QGIS open source program by overlaying Kernel density of wild boar(Sus scrofa), elevation, slope and land-cover map, and 81 samples are collected. After 240 mL of water was filtered in each sample, metabarcoding technique using MiMammal universal primer was applied in order to get a whole list of mammal species whose DNA particles contained in filtered water. 8 and 22 samples showed DNA of wild boar and water deer, respectively. DNA of raccoon dog, Eurasian otter, and Siberian weasel are also detected through metabarcoding analysis. This study is valuable that conducted in outdoor lotic system. The study suggests a new wildlife monitoring methodology integrating overlayed geographic data and environmental DNA.

독립성분분석을 이용한 다변량 시계열 모의 (Multivariate Time Series Simulation With Component Analysis)

  • 이태삼;호세살라스;주하카바넨;노재경
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2008년도 학술발표회 논문집
    • /
    • pp.694-698
    • /
    • 2008
  • In hydrology, it is a difficult task to deal with multivariate time series such as modeling streamflows of an entire complex river system. Normal distribution based model such as MARMA (Multivariate Autorgressive Moving average) has been a major approach for modeling the multivariate time series. There are some limitations for the normal based models. One of them might be the unfavorable data-transformation forcing that the data follow the normal distribution. Furthermore, the high dimension multivariate model requires the very large parameter matrix. As an alternative, one might be decomposing the multivariate data into independent components and modeling it individually. In 1985, Lins used Principal Component Analysis (PCA). The five scores, the decomposed data from the original data, were taken and were formulated individually. The one of the five scores were modeled with AR-2 while the others are modeled with AR-1 model. From the time series analysis using the scores of the five components, he noted "principal component time series might provide a relatively simple and meaningful alternative to conventional large MARMA models". This study is inspired from the researcher's quote to develop a multivariate simulation model. The multivariate simulation model is suggested here using Principal Component Analysis (PCA) and Independent Component Analysis (ICA). Three modeling step is applied for simulation. (1) PCA is used to decompose the correlated multivariate data into the uncorrelated data while ICA decomposes the data into independent components. Here, the autocorrelation structure of the decomposed data is still dominant, which is inherited from the data of the original domain. (2) Each component is resampled by block bootstrapping or K-nearest neighbor. (3) The resampled components bring back to original domain. From using the suggested approach one might expect that a) the simulated data are different with the historical data, b) no data transformation is required (in case of ICA), c) a complex system can be decomposed into independent component and modeled individually. The model with PCA and ICA are compared with the various statistics such as the basic statistics (mean, standard deviation, skewness, autocorrelation), and reservoir-related statistics, kernel density estimate.

  • PDF

백두산 분화 Worst-case로 인한 우리나라 초미세먼지(PM2.5) 영향분석 및 노출평가 (Analysis of PM2.5 Impact and Human Exposure from Worst-Case of Mt. Baekdu Volcanic Eruption)

  • 박재은;김혜림;선우영
    • 대한원격탐사학회지
    • /
    • 제36권5_4호
    • /
    • pp.1267-1276
    • /
    • 2020
  • 백두산 화산의 대규모 분화로 인한 우리나라 PM2.5 영향 및 피해범위를 정량적으로 예측하기 위하여 우리나라에 직접 피해를 주는 worst-case 기상 시나리오를 적용하여 3차원 대기화학모델링 시스템 WRF-SMOKE-CMAQ(Weather Research & Forecasting - Sparse Matrix Operation Kernel Emission - Comunity Multi-scale Air Quality)을 구동하였다. 과거 10년(2005~2014년)간 백두산 분화 worst-case 우선순위 중 우리나라에 가장 큰 직접 피해를 주는 대표 worst-case 시나리오를 적용하여 대상 사례일(2012.5.16)에 VEI 4의 대규모 화산 분화를 가정하여 화산 분화로 인한 초미세먼지(PM2.5)의 영향을 분석하였다. 우리나라 지역별(시군구) PM2.5의 영향을 예측하고 취약계층 등을 반영한 노출평가를 실시하여 취약지역을 도출하였다. 또한, 시군구의 영향을 보다 상세규모(9 km × 9 km)로 분석하여 시군구 지역 내 취약지역을 도출하였다. 백두산 분화 대표 worst-case(2012.5.16.) 분석결과, 국내 PM2.5 피크농도는 24,547 ㎍/㎥로 낙하 화산재(5억 4천만톤) 처리가 가장 큰 문제로 대두되었던 미국 세인트헬렌스 화산 분화(1980년) 사례보다 더 극한 상황이 될 것으로 예상된다. 또한, PM2.5 고농도 지역의 분석결과, 파주, 김포, 고양, 강화, 산청, 하동에서 고농도가 나타났다. 반면, 인구 노출분석 결과 인구 밀집지역인 파주가 특히 취약지역으로 나타났고, 취약계층 노출분석 결과 또한, 취약계층 인구가 많은 파주, 남양주, 화성이 취약지역으로 나타났다. 시군구 지역을 상세규모로 분석함으로써 하동 북부 등 시군구 지역 내에서의 고농도 지역을 도출할 수 있었다. 화산재해 발생 시 대기오염물질의 고농도 지역도 중요하지만 인구 및 민감군, 취약계층 밀집지역 등을 고려한 대응 및 대책 마련이 필요하겠으며 시군구에 대한 일률적인 대책보다 시군구 지역 내 고농도 지역 등의 선별을 통한 취약 지역별 대책 마련이 필요하겠다. 본 연구는 화산재해의 재난선포 기준 개발 및 선제적 대응체계 개발의 초석 마련에 기초자료가 될 것으로 판단된다.

Support Vector Regression을 이용한 GARCH 모형의 추정과 투자전략의 성과분석 (Estimation of GARCH Models and Performance Analysis of Volatility Trading System using Support Vector Regression)

  • 김선웅;최흥식
    • 지능정보연구
    • /
    • 제23권2호
    • /
    • pp.107-122
    • /
    • 2017
  • 주식시장의 주가 수익률에 나타나는 변동성은 투자 위험의 척도로서 재무관리의 이론적 모형에서뿐만 아니라 포트폴리오 최적화, 증권의 가격 평가 및 위험관리 등 투자 실무 영역에서도 매우 중요한 역할을 하고 있다. 변동성은 주가 수익률이 평균을 중심으로 얼마나 큰 폭의 움직임을 보이는가를 판단하는 지표로서 보통 수익률의 표준편차로 측정한다. 관찰 가능한 표준편차는 과거의 주가 움직임에서 측정되는 역사적 변동성(historical volatility)이다. 역사적 변동성이 미래의 주가 수익률의 변동성을 예측하려면 변동성이 시간 불변적(time-invariant)이어야 한다. 그러나 대부분의 변동성 연구들은 변동성이 시간 가변적(time-variant)임을 보여주고 있다. 이에 따라 시간 가변적 변동성을 예측하기 위한 여러 계량 모형들이 제안되었다. Engle(1982)은 변동성의 시간 가변적 특성을 잘 반영하는 변동성 모형인 Autoregressive Conditional Heteroscedasticity(ARCH)를 제안하였으며, Bollerslev(1986) 등은 일반화된 ARCH(GARCH) 모형으로 발전시켰다. GARCH 모형의 실증 분석 연구들은 실제 증권 수익률에 나타나는 두터운 꼬리 분포 특성과 변동성의 군집현상(clustering)을 잘 설명하고 있다. 일반적으로 GARCH 모형의 모수는 가우스분포로부터 추출된 자료에서 최적의 성과를 보이는 로그우도함수에 대한 최우도추정법에 의하여 추정되고 있다. 그러나 1987년 소위 블랙먼데이 이후 주식 시장은 점점 더 복잡해지고 시장 변수들이 많은 잡음(noise)을 띠게 됨에 따라 변수의 분포에 대한 엄격한 가정을 요구하는 최우도추정법의 대안으로 인공지능모형에 대한 관심이 커지고 있다. 본 연구에서는 주식 시장의 주가 수익률에 나타나는 변동성의 예측 모형인 GARCH 모형의 모수추정방법으로 지능형 시스템인 Support Vector Regression 방법을 제안한다. SVR은 Vapnik에 의해 제안된 Support Vector Machines와 같은 원리를 회귀분석으로 확장한 모형으로서 Vapnik의 e-insensitive loss function을 이용하여 비선형 회귀식의 추정이 가능해졌다. SVM을 이용한 회귀식 SVR은 두터운 꼬리 분포를 보이는 주식시장의 변동성과 같은 관찰치에서도 우수한 추정 성능을 보인다. 2차 손실함수를 사용하는 기존의 최소자승법은 부최적해로서 추정 오차가 확대될 수 있다. Vapnik의 손실함수에서는 입실론 범위내의 예측 오차는 무시하고 큰 예측 오차만 손실로 처리하기 때문에 구조적 위험의 최소화를 추구하게 된다. 금융 시계열 자료를 분석한 많은 연구들은 SVR의 우수성을 보여주고 있다. 본 연구에서는 주가 변동성의 분석 대상으로서 KOSPI 200 주가지수를 사용한다. KOSPI 200 주가지수는 한국거래소에 상장된 우량주 중 거래가 활발하고 업종을 대표하는 200 종목으로 구성된 업종 대표주들의 포트폴리오이다. 분석 기간은 2010년부터 2015년까지의 6년 동안이며, 거래일의 일별 주가지수 종가 자료를 사용하였고 수익률 계산은 주가지수의 로그 차분값으로 정의하였다. KOSPI 200 주가지수의 일별 수익률 자료의 실증분석을 통해 기존의 Maximum Likelihood Estimation 방법과 본 논문이 제안하는 지능형 변동성 예측 모형의 예측성과를 비교하였다. 주가지수 수익률의 일별 자료 중 학습구간에서 대칭 GARCH 모형과 E-GARCH, GJR-GARCH와 같은 비대칭 GARCH 모형에 대하여 모수를 추정하고, 검증 구간 데이터에서 변동성 예측의 성과를 비교하였다. 전체 분석기간 1,487일 중 학습 기간은 1,187일, 검증 기간은 300일 이다. MLE 추정 방법의 실증분석 결과는 기존의 많은 연구들과 비슷한 결과를 보여주고 있다. 잔차의 분포는 정규분포보다는 Student t분포의 경우 더 우수한 모형 추정 성과를 보여주고 있어, 주가 수익률의 비정규성이 잘 반영되고 있다고 할 수 있다. MSE 기준으로, SVR 추정의 변동성 예측에서는 polynomial 커널함수를 제외하고 linear, radial 커널함수에서 MLE 보다 우수한 예측 성과를 보여주었다. DA 지표에서는 radial 커널함수를 사용한 SVR 기반의 지능형 GARCH 모형이 가장 우수한 변동성의 변화 방향에 대한 방향성 예측력을 보여주었다. 추정된 지능형 변동성 모형을 이용하여 예측된 주식 시장의 변동성 정보가 경제적 의미를 갖는지를 검토하기 위하여 지능형 변동성 거래 전략을 도출하였다. 지능형 변동성 거래 전략 IVTS의 진입규칙은 내일의 변동성이 증가할 것으로 예측되면 변동성을 매수하고 반대로 변동성의 감소가 예상되면 변동성을 매도하는 전략이다. 만약 변동성의 변화 방향이 전일과 동일하다면 기존의 변동성 매수/매도 포지션을 유지한다. 전체적으로 SVR 기반의 GARCH 모형의 투자 성과가 MLE 기반의 GARCH 모형의 투자 성과보다 높게 나타나고 있다. E-GARCH, GJR-GARCH 모형의 경우는 MLE 기반의 GARCH 모형을 이용한 IVTS 전략은 손실이 나지만 SVR 기반의 GARCH 모형을 이용한 IVTS 전략은 수익으로 나타나고 있다. SVR 커널함수에서는 선형 커널함수가 더 좋은 투자 성과를 보여주고 있다. 선형 커널함수의 경우 투자 수익률이 +526.4%를 기록하고 있다. SVR 기반의 GARCH 모형을 이용하는 IVTS 전략의 경우 승률도 51.88%부터 59.7% 사이로 높게 나타나고 있다. 옵션을 이용하는 변동성 매도전략은 방향성 거래전략과 달리 하락할 것으로 예측된 변동성의 예측 방향이 틀려 변동성이 소폭 상승하거나 변동성이 하락하지 않고 제자리에 있더라도 옵션의 시간가치 요인 때문에 전체적으로 수익이 실현될 수도 있다. 정확한 변동성의 예측은 자산의 가격 결정뿐만 아니라 실제 투자에서도 높은 수익률을 얻을 수 있기 때문에 다양한 형태의 인공신경망을 활용하여 더 나은 예측성과를 보이는 변동성 예측 모형을 개발한다면 주식시장의 투자자들에게 좋은 투자 정보를 제공하게 될 것이다.