• 제목/요약/키워드: Generalized additive model (GAM)

검색결과 28건 처리시간 0.024초

트렌드와 계절성을 가진 시계열에 대한 순수 모형과 하이브리드 모형의 비교 연구 (Comparison Studies of Hybrid and Non-hybrid Forecasting Models for Seasonal and Trend Time Series Data)

  • 정철우;김명석
    • 지능정보연구
    • /
    • 제19권1호
    • /
    • pp.1-17
    • /
    • 2013
  • 본 연구에서는 시계열 예측을 위해 선형 모형과 비선형 모형의 하이브리드 모형 및 순수 모형의 성과를 비교 평가하였다. 이를 위해 5가지 서로 다른 패턴을 가지는 데이터를 생성하여 시뮬레이션을 진행하였다. 본 연구에서 고려한 선형 모형은 AR(autoregressive model)과 SARIMA(seasonal autoregressive integrated moving average model)이고 비선형 모형은 인공신경망(artificial neural networks model)과 GAM(generalized additive model)이다. 특히, GAM은 여러 장점에도 불구하고 시계열 예측을 위한 비선형 모형으로 기존 연구들에서는 거의 쓰이지 않았던 모형이다. 시뮬레이션 결과, seasonality를 가지는 시계열에 대해서는 AR 및 AR-AR 모형이, trend를 가지는 시계열에 대해서는 SARIMA 및 SARIMA와 다른 모형의 하이브리드 모형이 다른 모형에 비해 높은 성과를 보였다. 한편, 인공신경망과 GAM을 비교하면, 트렌드와 계절성이 더해진 시계열에 대해 SARIMA와 GAM의 하이브리드 모형이 거의 모든 노이즈(noise) 수준에 대해 높은 성과를 보인 반면, 노이즈 수준이 미미한 경우에 한해 SARIMA와 인공신경망의 하이브리드 모형이 높은 성과를 보였다.

일반화가법모형에서 축소방법의 적용연구 (A Study on Applying Shrinkage Method in Generalized Additive Model)

  • 기승도;강기훈
    • 응용통계연구
    • /
    • 제23권1호
    • /
    • pp.207-218
    • /
    • 2010
  • 일반화가법모형은 기존 선형회귀모형의 문제점을 대부분 해결한 통계모형이지만 의미있는 독립변수의 수를 줄이는 방법이 적용되지 않을 경우 과대적합 문제가 발생할 수 있다. 그러므로 일반화가법모형에서 변수 축소방법을 적용하는 연구가 필요하다. 회귀분석에서 변수 축소방법으로 최근에는 Lasso 계열의 접근법이 연구되고 있다. 본 연구에서는 활용성이 높은 통계모형인 일반화가법모형에 Lasso 계열의 모형 중에서 Group Lasso와 Elastic net 모형을 적용하는 방법을 제시하고 이들의 해를 구하는 절차를 제안하였다. 그리고 제안된 방법을 모의실험과 실제자료인 회계년도 2005년 자동차보혐 자료에 적용을 통해 비교하여 보았다. 그 결과 본 논문에서 제안한 Group Lasso와 Elastic net을 이용하여 변수 축소를 통한 일반화가법모형이 기존의 방법보다 더 나은 결과를 제공하는 것으로 분석 되었다.

위치자료의 종류에 따른 생물종 분포모형 비교 연구 (Comparison of Species Distribution Models According to Location Data)

  • 서창완;박유리;최윤수
    • 대한공간정보학회지
    • /
    • 제16권4호
    • /
    • pp.59-64
    • /
    • 2008
  • 우리나라의 야생동식물 조사가 시간적, 경제적 이유로 주로 출현지역만을 대상으로 하고 있어 종분포모형을 개발할 때 각 모형의 장점을 최대한 이용하는 것이 필요하다. 본 연구는 위치자료의 종류(출현/비출현자료)에 따라 가장 대표적인 출현/비출현모형(presence-absence model)인 GAM(Generalized Additive Model)과 출현모형(presence-only model)인 Maxent(Maximum Entropy Model)를 이용하여 비교 검토하였다. 본 연구의 대상종으로는 캘리포니아의 보호종인 피셔(Martes pennanti)를 선정하고 대상지를 지역에 따라 나누었으며, 서식지환경을 설명하는 지형, 기후, 식생변수들을 이용하여 모형을 적용하였다. 그 결과 첫째, 실제 출현/비출현자료를 사용한 GAM이 임의 비출현자료를 사용한 GAM과 출현자료만을 사용한 Maxent보다 전체적으로 나은 것을 볼 수 있었다. 둘째, 실제 출현자료만을 이용한 모형을 개발할 경우 임의 비출현자료를 이용한 GAM보다 출현자료만을 이용한 Maxent가 더 나은 것을 알 수 있었다. 마지막으로 세부지역에서 개발된 모형(Klamath/Shasta, Sourthern Sierra)은 서로 서식환경이 다를 경우 다른 지역의 서식지를 잘 예측하지 못함을 알 수 있었고, 대상지 외부지역에 대해 과추정하는 경향을 보였다. 위 결과를 바탕으로 위치자료의 종류, 공간적 분포 등을 감안하여 대상지의 환경에 알맞은 모형을 선택하는 것이 바람직할 것으로 판단된다.

  • PDF

Oceanographic indicators for the occurrence of anchovy eggs inferred from generalized additive models

  • Kim, Jin Yeong;Lee, Jae Bong;Suh, Young-Sang
    • Fisheries and Aquatic Sciences
    • /
    • 제23권7호
    • /
    • pp.19.1-19.14
    • /
    • 2020
  • Three generalized additive models were applied to the distribution of anchovy eggs and oceanographic factors to determine the occurrence of anchovy spawning grounds in Korean waters and to identify the indicators of their occurrence using survey data from the spring and summer of 1985, 1995, and 2002. Binomial and Gaussian types of generalized additive models (GAM) and quantile generalized additive models (QGAM) revealed that egg density was influenced mostly by ocean temperature and salinity in spring, and the vertical structure of temperature, salinity, dissolved oxygen, and zooplankton biomass during summer in the upper quantiles of egg density. The GAM and QGAM model deviance explained 18.5-63.2% of the egg distribution in summer in the East and West Sea. For the principle component analysis-based GAMs, the variance explained by the final regression model was 27.3-67.0%, higher than the regular models and QGAMs for egg density in the East and West Sea. By analyzing the distribution of anchovy eggs off the Korean coast, our results revealed the optimal temperature and salinity conditions, in addition to high production and high vertical mixing, as the key indicators of the major spawning grounds of anchovies.

Tuning the Architecture of Support Vector Machine: The Case of Bankruptcy Prediction

  • Min, Jae-H.;Jeong, Chul-Woo;Kim, Myung-Suk
    • Management Science and Financial Engineering
    • /
    • 제17권1호
    • /
    • pp.19-43
    • /
    • 2011
  • Tuning the architecture of SVM (support vector machine) is to build an SVM model of better performance. Two different tuning methods of the grid search and the GA (genetic algorithm) have been addressed in the literature, each of which has its own methodological pros and cons. This paper suggests a combined method for tuning the architecture of SVM models, which employs the GAM (generalized additive models), the grid search, and the GA in sequence. The GAM is used for selecting input variables, and the grid search and the GA are employed for finding optimal parameter values of the SVM models. Applying the method to a bankruptcy prediction problem, we show that SVM model tuned by the proposed method outperforms other SVM models.

일반화 가법모형을 이용한 태양광 발전량 예측 알고리즘 (Solar Power Generation Prediction Algorithm Using the Generalized Additive Model)

  • 윤상희;홍석훈;전재성;임수창;김종찬;박철영
    • 한국멀티미디어학회논문지
    • /
    • 제25권11호
    • /
    • pp.1572-1581
    • /
    • 2022
  • Energy conversion to renewable energy is being promoted to solve the recently serious environmental pollution problem. Solar energy is one of the promising natural renewable energy sources. Compared to other energy sources, it is receiving great attention because it has less ecological impact and is sustainable. It is important to predict power generation at a future time in order to maximize the output of solar energy and ensure the stability and variability of power. In this paper, solar power generation data and sensor data were used. Using the PCC(Pearson Correlation Coefficient) analysis method, factors with a large correlation with power generation were derived and applied to the GAM(Generalized Additive Model). And the prediction accuracy of the power generation prediction model was judged. It aims to derive efficient solar power generation in the future and improve power generation performance.

지리산 지역의 생물종 분포모형 구축 및 종풍부도 평가 (Development of Species Distribution Models and Evaluation of Species Richness in Jirisan region)

  • 권혁수;서창완;박종화
    • 대한공간정보학회지
    • /
    • 제20권3호
    • /
    • pp.11-18
    • /
    • 2012
  • 생물다양성에 대한 사회적 관심이 늘어남에 따라 생물다양성 평가, 보호지역 지정, 서식지 관리 및 복원 등 생물자원에 대한 공간적 평가의 필요성이 대두되고 있다. 본 연구는 이러한 야생동물의 서식지에 대한 평가를 위하여 자료의 수집 및 모형화의 기법 연구와 생물종풍부도를 작성하는데 목적이 있다. 종분포모형을 위해 사용된 GAM (Generalized Additive Model)으로 기존의 중첩 분석이나 GLM (Generalized Linear Model)에 비해 환경변수와 반응변수의 관계가 명확하고 이에 따른 해석이 용이하다. 본 연구대상지로는 국립공원, 경관생태보호구역, 수달보호구역으로 지정된 지리산, 백운산, 섬진강을 포함하고 있는 유역을 선정하였다. 대상유역의 토지피복에 따라 층화추출을 통하여 야생동물(포유류와 조류)의 출현/비출현 형태의 현장자료를 수집하였으며, 야생동물의 서식에 영향을 미치는 자연, 사회 경제적 자료를 구축하였다. 각 종에 대한 서식지이용분석과 주요서식인자를 확인한 후, 출현/비출현 모형을 통해 서식지적합성모형을 개발하고, 개별 종에 대한 서식지적합성지도 작성하였다. 서식지 적합성지도를 산술 합산하여 분류군별(포유류, 조류) 종풍부도, 통합종풍부도를 작성하였다. 개별 종 서식지의 주요인자는 서식지선택에 따라 다르게 나타났다. 고라니나 박새와 같은 몇몇 종들은 저지대에 분포하나, 대부분의 포유류나 조류의 잠재서식지는 국립공원 경계구역이나 중산간지역에 많이 분포하였다. 본 연구의 결과는 환경부에서 수행하는 생물다양성의 평가, 보호지역의 지정 등의 기초자료로서 활용될 수 있을 것이다.

성남시 유비쿼터스 고혈압 관리에 대한 평가 (Evaluation of Ubiquitous High Blood-Pressure Demonstration in Sungnam)

  • 이원재;김혜정;이재은
    • 보건교육건강증진학회지
    • /
    • 제25권1호
    • /
    • pp.13-23
    • /
    • 2008
  • Objective: The current study was to test if the developed sphygmomanometer was working well and blood pressure information could be collected and monitored systematically through the internet. We tested if the sphygmomanometer and services for blood pressure controlled high blood pressure significantly and the ubiquitous monitoring could be used further. Methods: Kyungwon University, KT Co., Gil Medical Center, LIG Nex1 Co., and Sujeong Health Center conducted an ubiquitous high blood control project in Sujeong-gu, Sungnam, Korea from Mar. 5 to May 16. We developed and applied sphygmomanometer. We distributed the devices to 27 high blood pressure patients. The blood pressures of the residents were monitored through the internet when they measured blood pressures in their homes. A nurse monitored and consulted their blood pressures in the monitoring center in Kyungwon University during the demonstration period. The consultant called them and consulted on their blood pressures in few seconds they used the sphygmomanometers. For the significance of change in blood pressure, we tested statistically with Generalized Additive Model(GAM) and Multi-level Analysis. Results: Both GAM and Multi-level Analysis showed that the blood pressures of persons with ubiquitous blood pressure management decreased significantly as time passed. Conclusions: The internet monitoring and services are considered to be promising because most of the participants were satisfied especially because somebody was caring their health. The decrease of blood pressures was significant by GAM and Multi-level Analysis. Thus, we can apply ubiquitous blood pressure management to health promotion projects.

기후변화에 따른 한반도 난대성 상록활엽수 잠재서식지 분포 변화 (Potential Impact of Climate Change on Distribution of Warm Temperate Evergreen Broad-leaved Trees in the Korean Peninsula)

  • 박선욱;구경아;공우석
    • 대한지리학회지
    • /
    • 제51권2호
    • /
    • pp.201-217
    • /
    • 2016
  • 본 연구는 난대성 상록활엽수에 대한 기후변화의 영향을 평가하고자 하였다. 이를 위해 분포 북방한계지가 중부해안인 난대성 상록활엽수 9종을 선정하고, 각 종의 분포 자료와 최한월최저기온, 겨울철강수량에 Generalized Additive Model(GAM) 알고리즘을 적용하여 종분포모형을 구축하였다. 종분포모형에 현재와 미래기후자료, 토지이용도를 적용하여 난대성 상록활엽수의 현재와 미래 잠재서식지를 예측하였다. 기후요소 분석 결과에서 최한월최저기온은 모든 종의 분포에 유의한 영향을 주지만, 겨울철강수량은 종에 따라 영향이 다르게 나타났다. 9종은 잠재서식지의 분포 패턴에 따라 3개의 유형(중부해안형, 남서해안형, 중부경상내륙형)으로 분류되며 기후변화와 토지이용의 영향이 다르게 나타났다. 토지이용을 고려했을 때 9종에서 60% 이상의 잠재서식지가 감소하며, 특히 중부경상내륙형에 속하는 종들은 다른 유형에 비해 높은 서식지 감소를 보였다. 9종 모두 기후변화에 따라 2050년과 2070년에 분포지가 북쪽으로 확대될 것으로 예측되었지만, 분포 유형에 따라 각기 다르게 나타났다. 이러한 분포 유형별 기후변화 영향이 다른 것은 겨울철강수량의 시공간적 변화와 종별로 미치는 영향의 정도가 다르기 때문으로 판단된다.

  • PDF

강제환기식 돈사의 환기량 추정을 위한 회귀모델의 비교 (Comparison of Regression Models for Estimating Ventilation Rate of Mechanically Ventilated Swine Farm)

  • 조광곤;하태환;윤상후;장유나;정민웅
    • 한국농공학회논문집
    • /
    • 제62권1호
    • /
    • pp.61-70
    • /
    • 2020
  • To estimate the ventilation volume of mechanically ventilated swine farms, various regression models were applied, and errors were compared to select the regression model that can best simulate actual data. Linear regression, linear spline, polynomial regression (degrees 2 and 3), logistic curve, generalized additive model (GAM), and gompertz curve were compared. Overfitting models were excluded even when the error rate was small. The evaluation criteria were root mean square error (RMSE) and mean absolute percentage error (MAPE). The evaluation results indicated that degree 3 exhibited the lowest error rate; however, an overestimation contradiction was observed in a certain section. The logistic curve was the most stable and superior to all the models. In the estimation of ventilation volume by all of the models, the estimated ventilation volume of the logistic curve was the smallest except for the model with a large error rate and the overestimated model.