• Title/Summary/Keyword: 회귀분석기법

Search Result 1,080, Processing Time 0.032 seconds

Analysis of Statistical Characteristics of Annual Precipitation in Korea Using Data Screeening Technique (데이터 스크린 기법을 이용한 연강수량의 통계적 특성 분석)

  • Jeung, Se-Jin;Lim, Ga-Kyun;Kim, Byung-Sik
    • Journal of Korean Society of Disaster and Security
    • /
    • v.13 no.3
    • /
    • pp.15-28
    • /
    • 2020
  • Hydrological data is very important in understanding the hydrological process and identifying its characteristics to protect human life and property from natural disasters. In particular, hydrological analysis are often performed assuming that hydrological data are stationary. However, recently climate change has raised the issue of climate stationary, and it is necessary to analyze the nonstationary of the climate. In this study, a method to analyze the stationarity of hydrological data was examined using the annual precipitation of 37 meteorological stations with long - term record data. Therefore, in this study, the stationary was determined by analyzing the persistence, trend, and stability using annual precipitation. Overall results showed that a trend was observed in 4 out of 37 stations, stable was investigated at 15 stations, and persistence was shown at 4 stations. In the stationary analysis using the annual precipitation data, 25 stations (67% of 37 stations) were nonstationary.

Proposing a Technique for Regional Flood Frequency Analysis: Bayesian-GLS Regression (국내 지역 홍수빈도해석을 위한 기법 제안: Bayesian-GLS 회귀)

  • Jeong, Dae-Il;Stedinger, Jery R.;Kim, Young-Oh;Sung, Jang-Hyun
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2007.05a
    • /
    • pp.241-245
    • /
    • 2007
  • 국내 홍수빈도 분포의 매개변수 추정에서 지점추정(at-site estimate) 방법은 유량 자료의 부족으로 발생하는 표본오차(sampling error)가 크기 때문에 충분한 유량 자료를 보유한 지점에 한하여 제한적으로 사용되고 있다. 대안으로 동질성을 가진 유역의 유량 자료를 모아 지역 매개변수를 추정하는 지수홍수법(Index Flood Method)이 제안되기도 하였으나, 이질성이 큰 우리나라의 유역특성 때문에 적용이 쉽지 않다. Stedinger와 Tasker가 1986년 제안한 GLS(Generalized Least Square) 기법은 유역을 동질지역으로 구분할 필요가 없으며 지점들간의 상관관계와 이분산성을 고려할 수 있어, 국내 홍수빈도 해석을 위해서 꼭 도입해야할 기법으로 생각된다. 본 연구에서는 기존의 GLS 기법의 단점을 보완한 Bayesian-GLS 기법을 이용하여, 국내 대유역에 골고루 위치하며 댐의 영향을 받지 않는 31개 지점의 연최대 일유량 시계열의 L-변동계수(L-moment coefficient variation)와 L-왜도계수(L-moment coefficient skewness)를 추정할 수 있는 회귀모형을 제안하였다. 위 회귀모형을 구성하기 위한 유역특성으로는 유역면적, 유역경사, 유역평균강우 등을 사용하였다. Bayesian-GLS (B-GLS) 적용 결과를 OLS(Ordinary Least Square) 및 Bayesian-GLS 기법에서 지점간의 상관관계를 고려하지 않는 Bayesian-WLS(Weighted Least Square)와 비교 평가하여 그 우수성을 입증하였다. 따라서 본 연구에서 제안된 B-GLS에 의한 지역회귀모형은 국내의 미계측유역이나 또는 관측 길이가 짧은 계측유역의 홍수빈도분석을 위해 매우 유용할 것으로 기대된다.년 홍수 피해가 발생하고 있지만, 다른 한편 인구밀도가 높고 1인당 가용 수자원이 상대적으로 적기 때문에 국지적 물 부족 문제를 경험하고 있다. 최근 국제적으로도 농업용수의 물 낭비 최소화와 절약 노력 및 타 분야 물 수요 증대에 대한 대응 능력 제고가 매우 중요한 과제로 부각되고 있다. 2006년 3월 멕시코에서 개최된 제4차 세계 물 포럼에서 국제 강 네트워크는 "세계 물 위기의 주범은 농경지", "농민들은 모든 물 위기 논의에서 핵심"이라고 주장하고, 전 프랑스 총리 미셀 로카르는 "...관개시설에 큰 문제점이 있고 덜 조방적 농업을 하도록 농민들을 설득해야 한다. 이는 전체 농경법을 바꾸는 문제..."(segye.com, 2006. 3. 19)라고 주장하는 등 세계 물 문제 해결을 위해서는 농업용수의 효율적 이용 관리가 중요함을 강조하였다. 본 연구는 이러한 국내외 여건 및 정책 환경 변화에 적극적으로 대처하고 물 분쟁에 따른 갈등해소 전략 수립과 효율적인 물 배분 및 이용을 위한 기초연구로서 농업용수 수리권과 관련된 법 및 제도를 분석하였다.. 삼요소의 시용 시험결과 그 적량은 10a당 질소 10kg, 인산 5kg, 및 가리 6kg 정도였으며 질소는 8kg 이상의 경우에는 분시할수록 비효가 높았으며 특히 벼의 후기 중점시비에 의하여 1수영화수와 결실율의 증대가 크게 이루어졌다. 3. 파종기와 파종량에 관한 시험결과는 공시품종선단의 파종적기는 4월 25일부터 5월 10일경까지 인데 이 기간중 일찍 파종하는 경우에 파종적량은 10a당 약 8${\ell}$이고 늦은 경우에는 12${\ell}$ 정도였다. 여기서 늦게 파종한 경우 감수의 가장 큰 원인은 1수영화수가 적어지기 때문이었다. 4. 건답직파에 대한 담수상태로 관수를 시작하는 적기는 파종후

  • PDF

Analysis of Processes in Reading about 'Science Stories' in 6th Grade Science Textbook Using Eye-tracking (안구운동 추적 기법을 활용한 6학년 과학 교과서의 과학 이야기 읽기 과정 분석)

  • Park, Hyojeong;Shin, Donghoon
    • Journal of The Korean Association For Science Education
    • /
    • v.35 no.3
    • /
    • pp.383-393
    • /
    • 2015
  • This study analyzed the 6th grade elementary science textbook 'Science stories' reading process of students by utilizing eye movement tracking techniques. Participants read 3 articles in the new experimental science textbooks and solved 9 problems about each article. By understanding and academic achievement results, participants were divided into high-groups, middle-groups, and low-groups. The results of eye movement characteristics of the high-groups and low-groups had the following differences. Number of fixations and number of regressions were higher in high-groups. Average fixation duration and average regressive fixation duration were longer in low-groups. Fixation time for the key sentence of the article was longer in high-groups. Analysis of a scan path and post-interview, high-groups had frequent regression between sentences and they knew where the core of the article is and paid much attention there. In contrast low-groups are sequentially read most articles and some of them had a leap of abnormal range. Problem-solving approach is also different between groups. In conclusion reading style is associated with the science stories comprehension and students who had more regressions, much core search process, effective attention distribution, high concentration showed better understanding results. Also words or sentences used in textbooks are associated with science stories comprehension.

Inconsistent Pattern Model for Improving the Performance of Supervised Learning in Data Mining (데이터 마이닝의 지도학습 기법 성능향상을 위한 불일치 패턴 모델)

  • Heo, Jun;Kim, Jong-U
    • Proceedings of the Korean Operations and Management Science Society Conference
    • /
    • 2007.11a
    • /
    • pp.288-305
    • /
    • 2007
  • 본 논문은 데이터 마이닝의 기법 중 가장 잘 알려진 지도학습 기법의 성능 향상을 위한 새로운 Hybrid 및 Combined 기법인 불일치 패턴 모델(오차 패턴 모델)에 대한 연구 논문이다. 불일치 패턴 모델이란 2개 이상의 기법 중 향후 더 레코드별로 더 잘 맞출 수 있는 기법을 메타 분류하는 불일치 패턴 모델을 개발하여, 최종적으로는 기존의 기법보다 더 좋은 분류 정확도 및 예측 향상율을 기대하기 위한 기법을 의미한다. 본 논문에서는 의사 결정나무 추론 기법인 C5.0과 C&RT 그리고 신경망 분석, 그리고 로지스틱 회귀분석과 같은 대표적인 데이터 마이닝의 지도학습 기법을 이용하여 불일치 패턴 모델을 생성하여 보고, 이들이 기존 단일 기법과 기존의 Combined 모델인 Bagging, Boosting 그리고 Stacking 기법보다 성능이 우수함을 23개의 실제 데이터 및 공신력 있는 공개 데이터를 이용하여 증명하여 보였다. 또한 데이터의 특성에 따라서 불일치 패턴 모델의 성능의 변화 및 더 우수해 지는지를 알아보기 위한 연구포 같이 수행을 하여 본 모델의 활용성을 높이고자 하였다.

  • PDF

Characterization of low frequency between Droughts and Meteorological factor in Korea (우리나라 가뭄특성과 기상인자간의 저빈도 특성 분석)

  • So, Byung-Jin;Kwon, Hyun-Han
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2012.05a
    • /
    • pp.418-418
    • /
    • 2012
  • 현재 전 세계적으로 온실가스 농도 증가로 호우나 가뭄, 대설 등 지역에 따라 서로 상반되는 변화를 가져올 수 있다고 경고되고 있으며, 우리나라에서도 남해안지역과 경기북부지역에서 호우빈도가 증가하는 반면, 충정도 내륙지역과 경상북도에서는 호우빈도가 감소하고 5일 누적 강수량 또한 감소하여, 해당지역에서 가뭄이 발생할 경우 심화될 가능성이 높아진다고 보고된 바 있다. 기후변화 시나리오에 분석결과에서도 우리나라의 경우 평균적으로 강우일수는 작아지며, 강우강도는 커지는 결과들이 도출되었다. 이러한 결과들은 가뭄의 발생가능성이 높아지고 있음을 보여주고 있다. 본 연구에서는 우리나라에서 발생된 가뭄의 특성을 분석하고 가뭄의 특성과 기상인자간의 관계를 Quantile regression 분석을 통해 살펴보고자 한다. 가뭄의 특성과 기상인자(엘니뇨, 강수량 등)의 관계에 있어서 기상인자들의 평균을 이용하는 일반적인 회귀분석은 전체 데이터의 영향에 따른 가뭄특성인자와의 관계를 보여준다. 하지만 강수량과 가뭄과의 관계에서와 같이 강수량의 극값보다는 적은 강수량 혹은 무강우일수가 가뭄과 밀접한 관련을 보여준다. 이러한 점에서 이상치들에 영향을 배재할 수 있는 Quantile regression을 사용하여 Quantile에 따른 기상인자와 가뭄특성과의 관계를 규명하고 평가해 보고자 한다. 본 연구에서 적용한 Quantile Regression 기법은 회귀계수의 추정에 있어서 회귀인자의 신뢰성을 아래와 같은 Quantile-회귀계수 그래프를 통해 분석할 수 있으며, 로버스트 통계량의 특징인 분산이 적은 안정적인 추정량을 확보할 수 있는 장점을 갖는다. 아래식은 Quantile regression의 회귀계수 추정식을 나타낸다. $$arg\;in\;{n\\\;p(y_i-f(x_i,\;z_i,\;{\cdots}))\\ =1}$$ 여기서, $y_i$는 가뭄특성값을 $x_i$, $z_i$, $\cdots$는 기상인자를 나타낸다. $$p(y-q)={{\beta}(y-q)\;y{\geq_-}q \\ (1-{\beta})(q-y)\;y<q}$$ ${\beta}$는 quantile을 나타내며 0< ${\beta}$ <1범위를 갖는다.

  • PDF

Evaluation of a Thermal Conductivity Prediction Model for Compacted Clay Based on a Machine Learning Method (기계학습법을 통한 압축 벤토나이트의 열전도도 추정 모델 평가)

  • Yoon, Seok;Bang, Hyun-Tae;Kim, Geon-Young;Jeon, Haemin
    • KSCE Journal of Civil and Environmental Engineering Research
    • /
    • v.41 no.2
    • /
    • pp.123-131
    • /
    • 2021
  • The buffer is a key component of an engineered barrier system that safeguards the disposal of high-level radioactive waste. Buffers are located between disposal canisters and host rock, and they can restrain the release of radionuclides and protect canisters from the inflow of ground water. Since considerable heat is released from a disposal canister to the surrounding buffer, the thermal conductivity of the buffer is a very important parameter in the entire disposal safety. For this reason, a lot of research has been conducted on thermal conductivity prediction models that consider various factors. In this study, the thermal conductivity of a buffer is estimated using the machine learning methods of: linear regression, decision tree, support vector machine (SVM), ensemble, Gaussian process regression (GPR), neural network, deep belief network, and genetic programming. In the results, the machine learning methods such as ensemble, genetic programming, SVM with cubic parameter, and GPR showed better performance compared with the regression model, with the ensemble with XGBoost and Gaussian process regression models showing best performance.

주택가격(住宅價格)에 내재(內在)된 대기질(大氣質)의 가격측정(價格測定) - 공간계량경제모형(空間計量經濟模型)을 이용한 접근(接近) -

  • Kim, Jong-Won
    • Environmental and Resource Economics Review
    • /
    • v.7 no.1
    • /
    • pp.61-84
    • /
    • 1997
  • 본 연구는 기존의 특성가격기법(特性價格技法)(hedonic price technique)에 공간(空間)개념을 도입한 계량경제모형을 이용하여 분석하였다. 이 공간시차모형은 기존의 모형과 달리 특성변수의 변화에 따른 직(直) 간접효과(間接效果)를 동시에 포착할 수 있는 장점을 가지고 있다. 또한 공간시차모형의 회귀진단 및 가설검정 결과는 공간시차모형이 적합한 것으로 나타났다. 이 경우 공간시차를 고려하지 않은 OLS 회귀분석 결과의 계수들은 편기추정(biased)된 동시에 효율적(efficiency)이지 못하다는 것이다. 회귀분석 결과는 주택에 자본화된 대기오염에 대한 잠재가격(潛在價格)(marginal implicit price)은 주택평균가격의 약 1.5% 정도인 것으로 추정된다.

  • PDF

The Comparison Among Prediction Methods of Water Demand And Analysis of Data on Water Services Using Data Mining Techniques (데이터마이닝 기법을 활용한 상수 이용현황 분석 및 단기 물 수요예측 방법 비교)

  • Ahn, Jihoon;Kim, Jinhwa
    • The Journal of Bigdata
    • /
    • v.1 no.1
    • /
    • pp.9-17
    • /
    • 2016
  • This study identifies major features in water supply and introduces important factors in water services based on the information from data mining analysis of water quantity and water pressure measured from sensors. It also suggests more accurate methods using multiple regression analysis and neural network in predicting short term prediction of water demand in water service. A small block of a county is selected for the data collection and tests. There isa water demand on business such as public offices and hospitalstoo in this area. Real stream data from sensors in this area is collected. Among 2,728 data sets collected, 2,632 sets are used for modelling and 96 sets are used for testing. The shows that neural network is better than multiple regression analysis in their prediction performance.

  • PDF

A Comparative Study on the Accuracy of Important Statistical Prediction Techniques for Marketing Data (마케팅 데이터를 대상으로 중요 통계 예측 기법의 정확성에 대한 비교 연구)

  • Cho, Min-Ho
    • The Journal of the Korea institute of electronic communication sciences
    • /
    • v.14 no.4
    • /
    • pp.775-780
    • /
    • 2019
  • Techniques for predicting the future can be categorized into statistics-based and deep-run-based techniques. Among them, statistic-based techniques are widely used because simple and highly accurate. However, working-level officials have difficulty using many analytical techniques correctly. In this study, we compared the accuracy of prediction by applying multinomial logistic regression, decision tree, random forest, support vector machine, and Bayesian inference to marketing related data. The same marketing data was used, and analysis was conducted by using R. The prediction results of various techniques reflecting the data characteristics of the marketing field will be a good reference for practitioners.

Multiple Regression-Based Music Emotion Classification Technique (다중 회귀 기반의 음악 감성 분류 기법)

  • Lee, Dong-Hyun;Park, Jung-Wook;Seo, Yeong-Seok
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.7 no.6
    • /
    • pp.239-248
    • /
    • 2018
  • Many new technologies are studied with the arrival of the 4th industrial revolution. In particular, emotional intelligence is one of the popular issues. Researchers are focused on emotional analysis studies for music services, based on artificial intelligence and pattern recognition. However, they do not consider how we recommend proper music according to the specific emotion of the user. This is the practical issue for music-related IoT applications. Thus, in this paper, we propose an probability-based music emotion classification technique that makes it possible to classify music with high precision based on the range of emotion, when developing music related services. For user emotion recognition, one of the popular emotional model, Russell model, is referenced. For the features of music, the average amplitude, peak-average, the number of wavelength, average wavelength, and beats per minute were extracted. Multiple regressions were derived using regression analysis based on the collected data, and probability-based emotion classification was carried out. In our 2 different experiments, the emotion matching rate shows 70.94% and 86.21% by the proposed technique, and 66.83% and 76.85% by the survey participants. From the experiment, the proposed technique generates improved results for music classification.