• 제목/요약/키워드: 회귀 모델

검색결과 1,933건 처리시간 0.029초

Analyzing the Impact of Pandemics on Air Passenger and Cargo Demands in South Korea

  • Jungtae Song;Irena Yosephine;Sungchan Jun;Chulung Lee
    • 한국항공운항학회지
    • /
    • 제31권1호
    • /
    • pp.99-106
    • /
    • 2023
  • 글로벌 팬데믹 사태는 항공 수요에 부정적인 영향을 끼치는 요소 중 하나다. 글로벌 팬데믹으로 인해 한국은 2020년과 2021년의 항공 승객 수가 2019년 대비 각각 68.1%와 47% 감소했다. 본 연구는 지난 20여년 동안 발생한 4대 팬데믹 특성을 분석, 전염병의 영향을 연구하는 것을 목표로 한다. SARS, H1N1, MERS 및 COVID-19의 발생기간 동안 한국의 항공 여객 및 화물 수요에 대한 실증 데이터를 활용하여 영향력을 분석한다. 또한 머신러닝 회귀 모델을 구축하여 향후 발생할 다른 전염병 대한 항공 수요를 예측하고자 한다. 연구 결과, 전염병이 항공 운항편수와 승객에 부정적인 영향을 미친다는 사실을 발견하였다. 반면화물 수송에는 긍정적인 영향을 미친다는 분석 결과를 도출하였다. 본 분석에 활용되는 회귀 모델은 팬데믹 기간 동안 항공수요를 예측하는 데 평균 86.8%의 기능을 보였다. 또한 본 연구는 특정 국가의 팬데믹 상황보다 전 세계적인 팬데믹 상황이 항공 운송 수요에 더 많은 영향을 미친다는 것을 보여준다.

선형회귀모델을 사용한 쌀 가격 예측 및 쌀 가격에 영향을 미치는 날씨의 시기 탐색 (Prediction of Rice Prices and Search for a Period of Weather Affecting the Prices Based on a Linear Regression Model)

  • 최다정;서진경;고광호;백주련
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.37-38
    • /
    • 2022
  • 농산물의 산지 가격이나 도매가격이 등락하면, 즉시 또는 일정한 시차 이후에 소비자가격도 등락한다. 본 논문에서는 선형회귀모델을 통해 쌀 가격을 예측하고 쌀 가격에 영향을 미치는 날씨의 시기를 찾아보고자 한다. 이에 따라 KAMIS, 기상자료개방포털, KOSIS에서 수집한 날씨, 생산량, 그리고 소비자물가 등락률 데이터를 이용하여 쌀 가격 예측을 수행하고, 날씨 데이터와 쌀 가격 데이터의 날짜 간격을 두어 날씨가 쌀 가격에 영향을 미치는 시기를 알아보았다. 모델 평가 결과, 2개월 간격을 두고 예측한 RMSE가 164.135로 가장 큰 영향을 미쳤다. 본 연구를 기반으로 향후 다른 농산물의 가격 예측도 가능할 것이며 농산물에 영향을 미치는 변수의 시기도 예측할 수 있을 것으로 기대한다.

  • PDF

구조물의 시간-변화 동적응답에 대한 다중응답접근법 기반 통계적 공간-시간 메타모델 (Statistical Space-Time Metamodels Based on Multiple Responses Approach for Time-Variant Dynamic Response of Structures)

  • 이진민;이태희
    • 대한기계학회논문집A
    • /
    • 제34권8호
    • /
    • pp.989-996
    • /
    • 2010
  • 통계적 회귀모델과 보간모델은 구조공학 분야에서 실제실험과 전산실험의 결과로부터 자료를 분석하고 응답을 예측하기 위해 적용되었으며 최근 10 년 동안 다양한 설계방법론들과 함께 발전해왔다. 그러나 그들은 구조물의 크기와 형상과 같은 공간변수에 대해서만 취급해왔고 시간변수에 따라 변하는 시간-변화 동적응답을 고려할 수 없었다. 본 연구에서는 공간변수와 시간변수를 모두 취급하여 시간-변화 동적응답을 고려할 수 있는 다중응답접근법 기반 통계적 공간-시간 메타모델을 제안한다. 대표적 회귀모델인 반응표면모델과 보간모델인 크리깅모델을 구조공학 예제의 시간-변화 동적응답에 적용한다. 또한 제안한 방법의 성능을 검증하기 위해 실제함수와의 비교를 통해 두 통계적 공간-시간 메타모델의 정확성을 비교한다.

준지도 지지 벡터 회귀 모델을 이용한 반응 모델링 (Response Modeling with Semi-Supervised Support Vector Regression)

  • 김동일
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권9호
    • /
    • pp.125-139
    • /
    • 2014
  • 본 논문에서는 준지도 지지 벡터 회귀 모델(semi-supervised support vector regression)을 이용한 반응 모델링(response modeling)을 제안한다. 반응 모델링의 성능 및 수익성을 높이기 위해, 고객 데이터 셋의 대부분을 차지하는 레이블이 존재하지 않는 데이터를 기존 레이블이 존재하는 데이터와 함께 학습에 이용한다. 제안하는 알고리즘은 학습 복잡도를 낮은 수준으로 유지하기 위해 일괄 학습(batch learning) 방식을 사용한다. 레이블 없는 데이터의 레이블 추정에서 불확실성(uncertainty)을 고려하기 위해, 분포추정(distribution estimation)을 하여 레이블이 존재할 수 있는 영역을 정의한다. 그리고 추정된 레이블 영역으로부터 오버샘플링(oversampling)을 통해 각 레이블이 없는 데이터에 대한 레이블을 복수 개 추출하여 학습 데이터 셋을 구성한다. 이 때, 불확실성의 정도에 따라 샘플링 비율을 다르게 함으로써, 불확실한 영역에 대해 더 많은 정보를 발생시킨다. 마지막으로 지능적 학습 데이터 선택 기법을 적용하여 학습 복잡도를 최종적으로 감소시킨다. 제안된 반응 모델링의 성능 평가를 위해, 실제 마케팅 데이터 셋에 대해 다양한 레이블 데이터 비율로 실험을 진행하였다. 실험 결과 제안된 준지도 지지 벡터 회귀 모델을 이용한 반응 모델이 기존 모델에 비해 더 높은 정확도 및 수익을 가질 수 있다는 점을 확인하였다.

정성변수를 고려한 공공아파트 기획단계 공사비 예측모델 (Cost Prediction Model using Qualitative Variables focused on Planning Phase for Public Multi-Housing Projects)

  • 지성민;현창택;문현석
    • 한국건설관리학회논문집
    • /
    • 제13권2호
    • /
    • pp.91-101
    • /
    • 2012
  • 공공아파트 프로젝트의 기획단계에서 수행되는 적정 공사비 예측은 기획부터 유지관리까지 전(全) 단계에 걸쳐서 영향을 미치게 되므로 명확한 예측기준 및 방법이 제시되어야 한다. 그러나 현재까지 다양한 다중회귀모델을 활용한 공사비 예측 방법이 개발되어 왔으나, 정성변수를 포함하여 공사비를 예측하는 방법에 대한 연구는 부족한 상황이다. 따라서 본 연구에서는 기획단계 활용을 위한 정성변수를 포함하는 공사비 예측모델을 개발하고자 하였다. 이를 위하여 공사비 영향요인을 분석 및 추출하고, 회귀분석을 위한 독립변수를 선정하였다. 그리고 정성변수를 포함하는 공사비 예측모델을 개발하며 사례적용을 통한 검증을 실시하였다. 개발된 공사비 예측모델과 "RESAMPLING 기법"을 사용하여 구조형식별 공사비 가산비율을 제시하였다. 본 연구에서 제시한 더미회귀모델과 가산비율을 활용하면, 일반적인 공사비 예측과 함께 동일한 평형, 세대수, 연면적에서 평면형식과 구조형식을 변경시켰을 때의 공사비 예측이 가능할 것으로 기대된다.

Echo State Network 모델의 은닉 뉴런 간 연결구조에 따른 성능과 동역학적 특성 분석 (Analyzing Performance and Dynamics of Echo State Networks Given Various Structures of Hidden Neuron Connections)

  • 윤상웅;장병탁
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권4호
    • /
    • pp.338-342
    • /
    • 2015
  • 시계열 데이터를 다룰 수 있는 기계학습모델인 회귀 신경망은 되먹임 연결을 허용하기 때문에 앞먹임 신경망에 비해 훨씬 다양한 구조를 가질 수 있다. 본 연구에서는 은닉 뉴런 간의 네트워크 구조에 초점을 맞추어 그것이 회귀 신경망의 정보처리 능력에 미치는 영향을 탐구하고자 한다. 이를 위해 회귀신경망 모델 중 하나인 Echo State Network을 기준으로 하여, 여러 가지 잘 알려진 네트워크 모델에 따라 은닉 뉴런 간 연결을 구성하고 각각의 경우에 시계열 학습 능력과 동역학을 분석하였다. 그 결과, 은닉 뉴런의 네트워크 구조에 따라 모델의 성능이 큰 폭으로 변하는 것이 관찰되었으며, 그러한 현상은 신경망 동역학이 가지는 임계도(criticality)의 변화와 잘 일치했다. 본 연구의 결과는 기존 회귀 신경망 연구에서 주된 관심사였던 신경망 연결 가중치뿐만 아니라 신경망의 연결 구조가 모델의 성능에 중요한 영향을 미친다는 사실을 보여주며, 성능 향상을 위한 중요한 단서가 될 수 있다.

암반굴착용 TBM 가동율의 통계적 특성 및 합리적 추정에 관한 연구 (Statistical Characteristics and Rational Estimation of Rock TBM Utilization)

  • 고태영;김택곤;이대혁
    • 터널과지하공간
    • /
    • 제29권5호
    • /
    • pp.356-366
    • /
    • 2019
  • 다양한 TBM 성능 예측 모델이 개발되었기만 대부분 관입율 예측에 한정되어 있다. 일부 모델들이 수식과 그래프를 이용하여 TBM 가동율을 추정하는 방법을 제시하기도 하지만, TBM 가동율에 대한 연구는 매우 드문 편이다. TBM 가동율은 TBM 장비의 종류, 운영, 유지보수, 지질 조건, 시공자의 경험 등에 영향을 받는다. 본 연구에서는 100여개 이상의 사례 분석을 통해서 TBM 가동율과 RMR, 암종 등의 지반 조건, TBM의 종류, 터널의 연장 및 직경 등과의 관계를 조사하였다. 단순 및 다중 회귀분석을 수행하여 TBM 가동율 예측모델을 개발하였다. 암종 등의 지반조건, TBM의 종류, 터널의 연장 및 직경 등을 설명 변수로 갖는 회귀모델은 낮은 상관계수를 나타내었다. RMR을 설명변수로 갖는 회귀모델이 더 높은 상관계수를 나타내었다.

데이터마이닝과 텍스트마이닝을 활용한 영화 흥행 예측 (Box Office Hit Prediction Using Data mining and Text mining)

  • 조효정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 춘계학술발표대회
    • /
    • pp.316-318
    • /
    • 2021
  • 영화 수익에 있어 영화의 흥행 여부는 중요한 영향을 끼친다. 영화 흥행 요인은 영화 산업의 규모가 커지면서 많은 제작사들 및 투자자들이 고려해야 하는 사항이 되었다. 따라서 영화의 흥행을 예측하기 위한 많은 모델이 연구되었다. 본 연구의 목적은 선행연구에서 흥행에 유의미한 영향을 끼친다고 밝혀진 스크린 수, 감독명, 제작사명 등의 내재적인 속성과 더불어 온라인 구전 변수를 사용하여 영화 흥행 예측 모델을 만드는 것이다. 이때 기사 수, 블로그 수와 같이 온라인 구전의 크기를 나타내는 변수들을 사용하는 대신 개봉 후 첫 주간의 관람객 리뷰를 텍스트마이닝을 이용하여 전체 리뷰 중 긍정 리뷰의 비율에 따라 점수를 매긴 후 독립변수로 사용한다. 그 후, 데이터 마이닝 기법을 활용하여 만든 모델에 앞서 언급한 독립변수를 입력 값으로 사용하여 영화의 흥행을 예측한다. 최종적으로 의사결정트리와 로지스틱회귀를 수행한 결과 영화 흥행에 영향을 주는 독립변수를 찾고 모델의 성능을 평가하였다. 로지스틱회귀의 결과 관객 수, 평점이 영화의 흥행에 특히 유의한 영향을 끼치는 변수로 선정되었고 리뷰 역시 유의한 변수로 선정되었다. 이때 만들어진 모델은 약 90%의 높은 수준의 정확도를 보여주었다. 의사결정트리의 결과 관객 수가 가장 중요한 변수로 선정되었다.

영평균 정규화와 PCA를 이용한 회귀 신경망의 성능개선 (Performance Improvement of Regression Neural Networks by Using PCA and Zero-Mean Normalization)

  • 박용수;조용현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.515-518
    • /
    • 2001
  • 본 논문에서는 전처리단계로 영평균 정규화 기법과 주요성분분석 기법을 도입하여 다층신경망을 이용한 고신뢰성의 회귀분석 모델을 제안한다. 영평균 정규화 기법은 데이터의 1차적 통계성을 고려하여 알고리즘을 간략화시키며, 주요성분분석 기법은 입력 데이터의 2차적 통계성을 고려하여 독립인 특징들의 집합으로 변환시켜 학습데이터의 차원을 감소시킬 수 있어 고차원의 학습데이터에 따른 회귀분석 모델의 제약을 해결할 수 있었다. 제안된 기법의 신경망을 3개의 독립변수를 가진 암모니아 제조공정문제와 10개의 독립변수를 가진 자동차 연비문제에 각각 적용하여 시뮬레이션한 결과, 단순정규화나 PCA를 적용하지 않는 경우보다 제안된 기법의 학습속도와 회귀성능이 더욱 더 우수함을 확인할 수 있었다.

  • PDF

회귀 분석을 통한 경마 순위 예측 모형 (A Model for Predicting Horse Racing Ranking by Regression Analysis)

  • 허태성;송민섭;고동수
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.15-16
    • /
    • 2022
  • 본 논문에서는 국내 합법 사행산업의 가장 큰 비중을 차지하는 경마에 대한 데이터 분석 모델을 제공하여 건전한 국민 여가 스포츠로 인식 개선을 제안한다. 고배당을 강조하는 경마 예측론이 성행하며 경마가 스포츠가 아닌 도박에 가깝다는 부정적 이미지를 개선하고자 부모마의 수득 상금을 이용한 순위 분석 모델을 제공한다. 현재 국내 경마 경기는 서울, 부산, 제주에서 개최되며, 이 중 서울 지역 경마 데이터를 분석 데이터로 하였다. 분석에 이용한 데이터는 2019년 3월부터 2022년 3월까지의 경주 성적, 경주마 정보, 부모마 수득상금을 이용하였다. 분석에는 선형 회귀 모형, 랜덤 포레스트 회귀 모형 (Breiman, 2001)을 이용하였다. 분석은 Python 을 이용하였으며, Python에서 제공하는 다양한 라이브러리를 이용하여 크롤링, 전처리, 분석하였다.

  • PDF