• Title/Summary/Keyword: 회귀 모델

Search Result 1,933, Processing Time 0.03 seconds

Analyzing the Impact of Pandemics on Air Passenger and Cargo Demands in South Korea

  • Jungtae Song;Irena Yosephine;Sungchan Jun;Chulung Lee
    • Journal of the Korean Society for Aviation and Aeronautics
    • /
    • v.31 no.1
    • /
    • pp.99-106
    • /
    • 2023
  • 글로벌 팬데믹 사태는 항공 수요에 부정적인 영향을 끼치는 요소 중 하나다. 글로벌 팬데믹으로 인해 한국은 2020년과 2021년의 항공 승객 수가 2019년 대비 각각 68.1%와 47% 감소했다. 본 연구는 지난 20여년 동안 발생한 4대 팬데믹 특성을 분석, 전염병의 영향을 연구하는 것을 목표로 한다. SARS, H1N1, MERS 및 COVID-19의 발생기간 동안 한국의 항공 여객 및 화물 수요에 대한 실증 데이터를 활용하여 영향력을 분석한다. 또한 머신러닝 회귀 모델을 구축하여 향후 발생할 다른 전염병 대한 항공 수요를 예측하고자 한다. 연구 결과, 전염병이 항공 운항편수와 승객에 부정적인 영향을 미친다는 사실을 발견하였다. 반면화물 수송에는 긍정적인 영향을 미친다는 분석 결과를 도출하였다. 본 분석에 활용되는 회귀 모델은 팬데믹 기간 동안 항공수요를 예측하는 데 평균 86.8%의 기능을 보였다. 또한 본 연구는 특정 국가의 팬데믹 상황보다 전 세계적인 팬데믹 상황이 항공 운송 수요에 더 많은 영향을 미친다는 것을 보여준다.

Prediction of Rice Prices and Search for a Period of Weather Affecting the Prices Based on a Linear Regression Model (선형회귀모델을 사용한 쌀 가격 예측 및 쌀 가격에 영향을 미치는 날씨의 시기 탐색)

  • Choi, Da-jeong;Seo, Jin-kyeong;Ko, Kwang-Ho;Paik, Juryon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.07a
    • /
    • pp.37-38
    • /
    • 2022
  • 농산물의 산지 가격이나 도매가격이 등락하면, 즉시 또는 일정한 시차 이후에 소비자가격도 등락한다. 본 논문에서는 선형회귀모델을 통해 쌀 가격을 예측하고 쌀 가격에 영향을 미치는 날씨의 시기를 찾아보고자 한다. 이에 따라 KAMIS, 기상자료개방포털, KOSIS에서 수집한 날씨, 생산량, 그리고 소비자물가 등락률 데이터를 이용하여 쌀 가격 예측을 수행하고, 날씨 데이터와 쌀 가격 데이터의 날짜 간격을 두어 날씨가 쌀 가격에 영향을 미치는 시기를 알아보았다. 모델 평가 결과, 2개월 간격을 두고 예측한 RMSE가 164.135로 가장 큰 영향을 미쳤다. 본 연구를 기반으로 향후 다른 농산물의 가격 예측도 가능할 것이며 농산물에 영향을 미치는 변수의 시기도 예측할 수 있을 것으로 기대한다.

  • PDF

Statistical Space-Time Metamodels Based on Multiple Responses Approach for Time-Variant Dynamic Response of Structures (구조물의 시간-변화 동적응답에 대한 다중응답접근법 기반 통계적 공간-시간 메타모델)

  • Lee, Jin-Min;Lee, Tae-Hee
    • Transactions of the Korean Society of Mechanical Engineers A
    • /
    • v.34 no.8
    • /
    • pp.989-996
    • /
    • 2010
  • Statistical regression and/or interpolation models have been used for data analysis and response prediction using the results of the physical experiments and/or computer simulations in structural engineering fields. These models have been employed during the last decade to develop a variety of design methodologies. However, these models only handled responses with respect to space variables such as size and shape of structures and cannot handle time-variant dynamic responses, i.e. response varying with time. In this research, statistical space-time metamodels based on multiple response approach that can handle responses with respect to both space variables and a time variable are proposed. Regression and interpolation models such as the response surface model (RSM) and kriging model were developed for handling time-variant dynamic responses of structural engineering. We evaluate the accuracies of the responses predicted by the two statistical space-time metamodels by comparing them with the responses obtained by the physical experiments and/or computer simulations.

Response Modeling with Semi-Supervised Support Vector Regression (준지도 지지 벡터 회귀 모델을 이용한 반응 모델링)

  • Kim, Dong-Il
    • Journal of the Korea Society of Computer and Information
    • /
    • v.19 no.9
    • /
    • pp.125-139
    • /
    • 2014
  • In this paper, I propose a response modeling with a Semi-Supervised Support Vector Regression (SS-SVR) algorithm. In order to increase the accuracy and profit of response modeling, unlabeled data in the customer dataset are used with the labeled data during training. The proposed SS-SVR algorithm is designed to be a batch learning to reduce the training complexity. The label distributions of unlabeled data are estimated in order to consider the uncertainty of labeling. Then, multiple training data are generated from the unlabeled data and their estimated label distributions with oversampling to construct the training dataset with the labeled data. Finally, a data selection algorithm, Expected Margin based Pattern Selection (EMPS), is employed to reduce the training complexity. The experimental results conducted on a real-world marketing dataset showed that the proposed response modeling method trained efficiently, and improved the accuracy and the expected profit.

Cost Prediction Model using Qualitative Variables focused on Planning Phase for Public Multi-Housing Projects (정성변수를 고려한 공공아파트 기획단계 공사비 예측모델)

  • Ji, Soung-Min;Hyun, Chang-Taek;Moon, Hyun-Seok
    • Korean Journal of Construction Engineering and Management
    • /
    • v.13 no.2
    • /
    • pp.91-101
    • /
    • 2012
  • In planning phase of Public Multi-Housing Projects, it is required to develop the methodology and criteria for fair cost prediction with influencing power from planning phase to occupancy phase. Many studies still have focused on the prediction of cost by multiple regression. However, there is no logical explanation about the influence of nonmetric variables for the prediction of cost in planning phase. Accordingly, this research pursues a cost prediction model including nonmetric variables for use in planning phase. There are 3 steps of this research : 1) Finding the factors influencing construction cost and assigning variables for a multiple regression. 2) Conducting a dummy regression analysis with nonmetric variables and model validation by comparing actual cost data. 3) Developing the ratio of RC structure cost to wall structure cost by using cost predection model. The results could establish cost prediction process including the influence of nonmetric variables and the ratio of RC structure cost to wall structure cost.

Analyzing Performance and Dynamics of Echo State Networks Given Various Structures of Hidden Neuron Connections (Echo State Network 모델의 은닉 뉴런 간 연결구조에 따른 성능과 동역학적 특성 분석)

  • Yoon, Sangwoong;Zhang, Byoung-Tak
    • KIISE Transactions on Computing Practices
    • /
    • v.21 no.4
    • /
    • pp.338-342
    • /
    • 2015
  • Recurrent Neural Network (RNN), a machine learning model which can handle time-series data, can possess more varied structures than a feed-forward neural network, since a RNN allows hidden-to-hidden connections. This research focuses on the network structure among hidden neurons, and discusses the information processing capability of RNN. Time-series learning potential and dynamics of RNNs are investigated upon several well-established network structure models. Hidden neuron network structure is found to have significant impact on the performance of a model, and the performance variations are generally correlated with the criticality of the network dynamics. Especially Preferential Attachment Network model showed an interesting behavior. These findings provide clues for performance improvement of the RNN.

Statistical Characteristics and Rational Estimation of Rock TBM Utilization (암반굴착용 TBM 가동율의 통계적 특성 및 합리적 추정에 관한 연구)

  • Ko, Tae Young;Kim, Taek Kon;Lee, Dae Hyuck
    • Tunnel and Underground Space
    • /
    • v.29 no.5
    • /
    • pp.356-366
    • /
    • 2019
  • Various TBM performance prediction models have been developed and most of them were considered penetration rate only. Despite the fact that some models have suggested equations and charts for estimating the utilization factor, but there are a few studies to estimate the TBM utilization factor. Utilization factor is affected by the type of TBM machine, operation, maintenance of machine, geological conditions, contractor experience and other factors. In this study, more than 100 case studies are analyzed to determine the relationship between the utilization factor and RMR, geological conditions, TBM types, tunnel length, and TBM diameter. Simple and multiple linear regression analysis are performed to develop predictive models for the utilization factor. The predictive model with explanatory variables of geological conditions, TBM types, tunnel length, and TBM diameter does not give a good correlation. The predictive models with explanatory variable of RMR give higher values of the coefficient of determination.

Box Office Hit Prediction Using Data mining and Text mining (데이터마이닝과 텍스트마이닝을 활용한 영화 흥행 예측)

  • Jo, Hyo-jung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.05a
    • /
    • pp.316-318
    • /
    • 2021
  • 영화 수익에 있어 영화의 흥행 여부는 중요한 영향을 끼친다. 영화 흥행 요인은 영화 산업의 규모가 커지면서 많은 제작사들 및 투자자들이 고려해야 하는 사항이 되었다. 따라서 영화의 흥행을 예측하기 위한 많은 모델이 연구되었다. 본 연구의 목적은 선행연구에서 흥행에 유의미한 영향을 끼친다고 밝혀진 스크린 수, 감독명, 제작사명 등의 내재적인 속성과 더불어 온라인 구전 변수를 사용하여 영화 흥행 예측 모델을 만드는 것이다. 이때 기사 수, 블로그 수와 같이 온라인 구전의 크기를 나타내는 변수들을 사용하는 대신 개봉 후 첫 주간의 관람객 리뷰를 텍스트마이닝을 이용하여 전체 리뷰 중 긍정 리뷰의 비율에 따라 점수를 매긴 후 독립변수로 사용한다. 그 후, 데이터 마이닝 기법을 활용하여 만든 모델에 앞서 언급한 독립변수를 입력 값으로 사용하여 영화의 흥행을 예측한다. 최종적으로 의사결정트리와 로지스틱회귀를 수행한 결과 영화 흥행에 영향을 주는 독립변수를 찾고 모델의 성능을 평가하였다. 로지스틱회귀의 결과 관객 수, 평점이 영화의 흥행에 특히 유의한 영향을 끼치는 변수로 선정되었고 리뷰 역시 유의한 변수로 선정되었다. 이때 만들어진 모델은 약 90%의 높은 수준의 정확도를 보여주었다. 의사결정트리의 결과 관객 수가 가장 중요한 변수로 선정되었다.

Performance Improvement of Regression Neural Networks by Using PCA and Zero-Mean Normalization (영평균 정규화와 PCA를 이용한 회귀 신경망의 성능개선)

  • Park, Yong-Soo;Cho, Yong-Hyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2001.10a
    • /
    • pp.515-518
    • /
    • 2001
  • 본 논문에서는 전처리단계로 영평균 정규화 기법과 주요성분분석 기법을 도입하여 다층신경망을 이용한 고신뢰성의 회귀분석 모델을 제안한다. 영평균 정규화 기법은 데이터의 1차적 통계성을 고려하여 알고리즘을 간략화시키며, 주요성분분석 기법은 입력 데이터의 2차적 통계성을 고려하여 독립인 특징들의 집합으로 변환시켜 학습데이터의 차원을 감소시킬 수 있어 고차원의 학습데이터에 따른 회귀분석 모델의 제약을 해결할 수 있었다. 제안된 기법의 신경망을 3개의 독립변수를 가진 암모니아 제조공정문제와 10개의 독립변수를 가진 자동차 연비문제에 각각 적용하여 시뮬레이션한 결과, 단순정규화나 PCA를 적용하지 않는 경우보다 제안된 기법의 학습속도와 회귀성능이 더욱 더 우수함을 확인할 수 있었다.

  • PDF

A Model for Predicting Horse Racing Ranking by Regression Analysis (회귀 분석을 통한 경마 순위 예측 모형)

  • Hur, Tai-sung;Song, Min Seob;Ko, Dong Su
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.07a
    • /
    • pp.15-16
    • /
    • 2022
  • 본 논문에서는 국내 합법 사행산업의 가장 큰 비중을 차지하는 경마에 대한 데이터 분석 모델을 제공하여 건전한 국민 여가 스포츠로 인식 개선을 제안한다. 고배당을 강조하는 경마 예측론이 성행하며 경마가 스포츠가 아닌 도박에 가깝다는 부정적 이미지를 개선하고자 부모마의 수득 상금을 이용한 순위 분석 모델을 제공한다. 현재 국내 경마 경기는 서울, 부산, 제주에서 개최되며, 이 중 서울 지역 경마 데이터를 분석 데이터로 하였다. 분석에 이용한 데이터는 2019년 3월부터 2022년 3월까지의 경주 성적, 경주마 정보, 부모마 수득상금을 이용하였다. 분석에는 선형 회귀 모형, 랜덤 포레스트 회귀 모형 (Breiman, 2001)을 이용하였다. 분석은 Python 을 이용하였으며, Python에서 제공하는 다양한 라이브러리를 이용하여 크롤링, 전처리, 분석하였다.

  • PDF