• 제목/요약/키워드: 회귀 모델

검색결과 1,952건 처리시간 0.036초

회귀 분석을 통한 경마 순위 예측 모형 (A Model for Predicting Horse Racing Ranking by Regression Analysis)

  • 허태성;송민섭;고동수
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.15-16
    • /
    • 2022
  • 본 논문에서는 국내 합법 사행산업의 가장 큰 비중을 차지하는 경마에 대한 데이터 분석 모델을 제공하여 건전한 국민 여가 스포츠로 인식 개선을 제안한다. 고배당을 강조하는 경마 예측론이 성행하며 경마가 스포츠가 아닌 도박에 가깝다는 부정적 이미지를 개선하고자 부모마의 수득 상금을 이용한 순위 분석 모델을 제공한다. 현재 국내 경마 경기는 서울, 부산, 제주에서 개최되며, 이 중 서울 지역 경마 데이터를 분석 데이터로 하였다. 분석에 이용한 데이터는 2019년 3월부터 2022년 3월까지의 경주 성적, 경주마 정보, 부모마 수득상금을 이용하였다. 분석에는 선형 회귀 모형, 랜덤 포레스트 회귀 모형 (Breiman, 2001)을 이용하였다. 분석은 Python 을 이용하였으며, Python에서 제공하는 다양한 라이브러리를 이용하여 크롤링, 전처리, 분석하였다.

  • PDF

국가지준점 망조정 성과를 활용한 최적 국가 좌표계 변환 모델 결정 (Optimal National Coordinate System Transform Model using National Control Point Network Adjustment Results)

  • 송동섭;장은석;김태우;윤홍식
    • 한국측량학회지
    • /
    • 제25권6_2호
    • /
    • pp.613-623
    • /
    • 2007
  • 본 연구의 주요 목적은 서로 다른 측지기준계인 동경측지계와 세계측지계간의 좌표 변환을 위한 연구이다. 이를 위하여 Bursa-Wolf 모델, Molodensky-Badekas 모델 및 Veis 모델을 이용하여 7변환 계수를 결정하였다. 또한 동경데이텀으로부터 세계측지계로 변환하기 위한 다중회귀식 방법도 적용하였다. 공통점 중에서 비상사성인 과대 오차인 점을 분석하고 제거하여 935점의 국가기준점 성과를 변환 계수 결정을 위한 공통점으로 이용하였다. 각 모델별로 결정한 변환 계수를 적용하여 상사 변환에 의한 3, 4등 삼각점 9,917점에 대한 좌표변환을 수행하였으며 변환 정확도를 평가하였다. 그 결과, Bursa-Wolf 모델과 Molodensky-Badekas 모델을 이용하여 결정한 변환 계수가 Veis 모델에 비하여 더 적합하다는 것을 알 수 있었다. 다중회귀식에 의한 변환 정확도는 상사 변환 모델보다는 다소 저하되는 경향을 보였다. 변환 계수의 추정 정밀도와 변환 정확도 및 변환 잔차의 패턴을 분석한 결과, 최적의 국가 좌표변환 모델은 Molodensky-Badekas 모델이라고 판단된다.

EPA-SWMM 모델을 활용한 관개회귀수량 추정 (Estimation of irrigation return flow in agricultural reservoirs using EPA-SWMM)

  • 신지현;남원호;윤동현;정인균;이광야
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.50-50
    • /
    • 2023
  • 농업용수는 우리나라 수자원 사용량 중 약 61%를 차지하고 있으며, 효율적인 수자원 관리를 위한 핵심적인 관리목표 중 하나이다. 논으로 공급되는 관개용수는 필지에서의 증발산량 및 침투량과 용배수로를 통한 자연적 및 인위적인 배수량으로 소비된다. 관개회귀수량 (irrigation return flow)은 관개를 통해 농경지에 공급된 수량 중 증발산에 의해 소비되지 않고 침투 또는 배수 등을 통해 하천으로 회귀되는 수량이다. 관개회귀수량 및 회귀율은 농업용수 물순환 관리에 중요한 역할을 하며, 관개용수 사용량 결정, 합리적인 용수의 공급과 수요 관리계획 및 수질 관리계획 등에 중요한 요소로 작용한다. 하지만, 기상, 작물, 토양 등의 물리적 요소와 농업용수 공급량, 물꼬 조절, 담수심 관리 방식 등 인위적 요소의 영향을 동시에 받기 때문에 그 기작이 복잡한 특징을 갖는다. 따라서, 합리적인 수자원 개발 계획 및 관리를 위해 정확한 관개회귀수량 추정 연구가 필수적이다. 본 연구에서는 전국 4대강 (한강, 금강, 낙동강, 영산강·섬진강) 권역 중심의 9개 대상지구를 선정하였으며, EPA-SWMM (Environmental Protection Agency-Storm Water Management Model) 모델 기반 수로 네트워크 모의를 활용한 수원공 단위 관개회귀수량을 산정하고자 한다. EPA-SWMM 모의 시 공급량은 농업기반시설관리시스템 (Rural Infrastructure Management System, RIMS) 저수율 자료와 수원공 단위용수량을 활용하였으며, 모의결과 시점부 공급량 및 배수량과 강수량, 증발산량 및 침투량을 활용하여 신속회귀수량과 지연회귀수량을 추정하였다. 본 연구 결과는 최적 농업용수 공급방안에 대한 기초자료 구축에 활용 가능할 것으로 사료된다.

  • PDF

다변량 적응 회귀 스플라인을 이용한 증발접시 증발량 모델링 (Pan evaporation modeling using multivariate adaptive regression splines)

  • 서영민;김성원
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2018년도 학술발표회
    • /
    • pp.351-354
    • /
    • 2018
  • 본 연구에서는 일 증발접시 증발량 모델링을 위한 다변량 적응 회귀 스플라인 (multivariate adaptive regression splines, MARS) 모델의 성능을 평가하였다. 모델 입력변수 집합은 부산 관측소 (기상청)로부터 수집된 기상자료를 활용하여 증발접시 증발량과의 상관성이 높은 변수들의 조합으로 구성되었으며, 일사량, 일조시간, 평균지상온도, 최대기온의 조합으로 구성된 세 가지 입력집합이 결정되었다. MARS 모델의 성능은 네 가지의 모델성능평가지표를 활용하여 정량적으로 산출되었으며, 그 결과를 인공신경망 (artificial neural network, ANN) 모델과 비교하였다. 입력변수로서 일사량 및 일조시간을 가지는 Set 1의 경우 MARS1 모델이 ANN1 모델보다 우수한 성능을 나타내었으며, Set 2 (일사량, 일조시간, 평균지상온도)의 경우 ANN2 모델, Set 3 (일사량, 일조시간, 평균지상온도, 최대기온)의 경우 MARS3 모델이 상대적으로 우수한 모델 성능을 나타내었다. 모든 분석 모델들을 비교하였을 때, MARS3, ANN2, ANN3, MARS2, MARS1, ANN1 모델의 순서로 우수한 모델 성능을 나타내었으며, 특히 MARS3 모델은 CE = 0.790, $r^2=0.800$, RMSE = 0.762, MAE = 0.587로서 가장 우수한 일 증발접시 증발량 모델링 성능을 나타내었다. 따라서 본 연구에서 적용한 MARS 모델은 지상관측 기상자료를 활용한 일 증발접시 증발량 모델링에서 효과적인 대안이 될 수 있을 것으로 판단된다.

  • PDF

단계적 회귀법과 자료봉합분석을 이용한 변수선택기법의 개발 (Development of Variable Selection Technique using Stepwise Regression and Data Envelopment Analysis)

  • 정민의;유성진
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제41권8호
    • /
    • pp.598-604
    • /
    • 2014
  • 본 연구는 주요변수를 선정하는 기법을 개발하기 위해서 단계적 회귀와 변수들의 효율성을 평가하기 위해 사용되는 자료봉합분석을 결합한 새로운 방법을 제안하였다. 이를 위해서 먼저 단계적 회귀를 이용하여 중요 변수들을 일차적으로 선정하고, 선정된 각 변수들의 중요도를 이해하기 위해 귀무가설을 세웠고, 중요 변수를 선택하기 위해 Kruskal-Wallis 검정을 사용했다. 또한 해당되는 변수를 Conover-Inman 검정을 사용하여 변동이 발생하는 각 변수들의 우선순위를 결정하였다. 따라서 그 결과, 많은 변수들과 DEA(Data Envelopment Analysis)의 한계를 극복하기 위해 원래 계획된 변수들 중 기준에 의해 원래 유지된 변수와 높은 연관성을 가진 변수들을 남기는 방식으로 변수를 선정하는 기법을 개발한 Jenkins의 기존연구에서는 I2, I4, I5, I6 변수가 누락되었고 I1, I3 변수만이 DEA에 사용되었지만, 본 논문에서 제안된 모델의 효율성 결과로는 I2와 I4 변수를 각각 유지하였다. 본 연구는 다른 문헌에서 단계적 변수의 선택을 보여주기 위해 같은 데이터 집합을 사용하였는데, 여기서 Jenkins의 연구와 같이 변수 I6과 I1, I2를 삭제하였고, I3, I4, I5는 유지하였다. 결론적으로 단계적 회귀 DEA 모델을 사용하여 긴 계산적 절차 없이 변수 선택이 가능함을 발견했으며 기존 연구의 데이터를 적용하여 제안된 모델을 검증하였다. 개발한 DEA모델 결과는 상호 변수에 따라 포함되거나 생략할 수 있기 때문에 실제 현실 상황에서의 지식과 경영적 판단에 매우 유용할 것이다.

선형회귀 및 ARIMA 모델을 이용한 배터리 사용자 패턴 변화 추적 연구 (A study of Battery User Pattern Change tracking method using Linear Regression and ARIMA Model)

  • 박종용;유민혁;노태민;신대견;김성권
    • 한국전자통신학회논문지
    • /
    • 제17권3호
    • /
    • pp.423-432
    • /
    • 2022
  • 전기자동차는 운전자가 바뀌거나 운전자의 주행습관이 바뀜에 따라 SOH가 급격하게 감소할 수 있고, 이러한 운전습관은 배터리에 과부하를 주어 배터리 수명의 단축 및 안전 문제를 일으킬 수 있다. 본 논문에서는 전기자동차의 계기판에 사용자 패턴 변화에 따른 SOH의 변화를, 실시간으로 나타내기 위하여, NASA에서 제공하는 배터리 데이터 세트를 학습하고, 기계학습 모델을 구축 후, 변화된 사용자 패턴을 포함한 배터리에 대해 선형회귀와 ARIMA 모델로 예측하는 실험을 진행하였다. 그 결과, 변화된 사용자 패턴에 따른 변경된 수명을 예측하는 경우, 배터리 데이터가 많이 확보되었다면 선형회귀가 유용하고, 데이터가 많이 확보되지 않은 경우는 ARIMA 모델이 대안이 될 수 있다는 연구결과를 얻을 수 있었다.

자기회귀 모델과 신경망 모델을 이용한 복잡한 지형 내 항만에서의 파고 및 하역중단 예측 (Wave Height and Downtime Event Forecasting in Harbour with Complex Topography Using Auto-Regressive and Artificial Neural Networks Models)

  • 이진학;류경호;백원대;정원무
    • 한국해안·해양공학회논문집
    • /
    • 제29권4호
    • /
    • pp.180-188
    • /
    • 2017
  • 최근에 기후변화로 인해 너울성 고파 등 이상고파의 출현빈도가 높아지고 항만에서의 하역중단이 증가할 가능성이 커지고 있다. 하역중단을 최소화할 수 있도록 방파제(breakwater) 등을 추가적으로 건설하여 정온도(tranquility)를 향상시키는 것도 매우 중요하지만, 하역중단시점을 미리 예보함으로써 항만 운영을 효율적으로 하는 것도 또한 중요하다. 본 연구에서는 효율적인 항만 운영을 위하여 하역중단시점을 사전에 예보할 수 있도록 바람 예보자료를 이용하여 항외 주요 지점에서의 파랑자료를 추산하고, 복잡한 지형을 가진 항내 주요 지점에 대해서는 장기 관측을 실시하여 파랑자료를 수집한 후, 광역 계산지점에서의 파고와 항내 관측지점에서의 파고 사이의 관계를 자기회귀모델(auto-regressive model)과 인공신경망(artificial neural networks) 모델을 이용하여 바람예보자료를 이용한 수치실험 결과만으로 항내 파고를 예측하고, 하역중단시점을 예보할 수 있는 방법을 제안하였다. 제안방법의 적용성을 평가하기 위하여 포켓(pocket) 형상의 비교적 복잡한 지형 조건을 가진 포항신항 내 파랑관측지점에서의 파고 예측 및 하역중단시점을 예측하였으며, 그 결과를 관측자료와 비교하여 제안 방법의 성능을 검증하였다. 인공신경망 모델의 파고 예측결과를 자기회귀모델에 의한 파고 예측결과와 비교할 때, 인공신경망 모델의 예측결과가 관측자료와의 상관계수가 높고 RMS 오차가 작음을 알 수 있었고, 하역중단시점의 예측에 있어서도 인공신경망의 결과가 자기회귀모델의 결과보다 상대적으로 우수함을 알 수 있었다.

선형다변회귀모델과 LP-PSOLA 합성방식을 이용한 음성변환 (Voice Conversion Using Linear Multivariate Regression Model and LP-PSOLA Synthesis Method)

  • 권홍석;배건성
    • 한국음향학회지
    • /
    • 제20권3호
    • /
    • pp.15-23
    • /
    • 2001
  • 본 논문에서는 임의의 사람이 발성한 음성을 마치 다른 사람이 발성한 것처럼 들리도록 하는 음성변환 기술에 대하여 설명하고, 화자간의 성도 특성과 여기신호 특성 파라미터 변환을 독립적으로 수행하기 위한 변환방법을 실험한다. 성도 특성 파라미터 변환은 입력되는 음성신호에서 LPC (Linear Predictive Cofficient)켑스트럼을 추출하여 선형다변회귀모델에 적용하여 수행하고, 여기신호 특성 파라미터 변환은 잔차신호를 추출하여 LP-PSOLA (Linear Predictive-Pitch Synchronous Overlap and Add) 합성방식을 이용한 화자간의 평균 피치주기 변환으로 수행된다. 실험결과는 선형다변회귀모델과 LP-PSOLA 합성방식을 이용하여 변환된 음성이 대상화자의 음성에 유사함을 보여준다

  • PDF

음악신호와 뇌파 특징의 회귀 모델 기반 감정 인식을 통한 음악 분류 시스템 (Music classification system through emotion recognition based on regression model of music signal and electroencephalogram features)

  • 이주환;김진영;정동기;김형국
    • 한국음향학회지
    • /
    • 제41권2호
    • /
    • pp.115-121
    • /
    • 2022
  • 본 논문에서는 음악 청취 시에 나타나는 뇌파 특징을 이용하여 사용자 감정에 따른 음악 분류 시스템을 제안한다. 제안된 시스템에서는 뇌파 신호로부터 추출한 감정별 뇌파 특징과 음악신호에서 추출한 청각적 특징 간의 관계를 회귀 심층신경망을 통해 학습한다. 실제 적용 시에는 이러한 회귀모델을 기반으로 제안된 시스템은 입력되는 음악의 청각 특성에 매핑된 뇌파 신호 특징을 자동으로 생성하고, 이 특징을 주의집중 기반의 심층신경망에 적용함으로써 음악을 자동으로 분류한다. 실험결과는 제안된 자동 음악분류 프레임 워크의 음악 분류 정확도를 제시한다.

경제지표를 활용한 다중선형회귀 모델 기반 국제 휘발유 가격 예측 (A study of Predicting International Gasoline Prices based on Multiple Linear Regression with Economic Indicators)

  • 한명은;김지연;이현희;김세인;박민서
    • 문화기술의 융합
    • /
    • 제10권1호
    • /
    • pp.159-164
    • /
    • 2024
  • 국내 석유 시장은 국제 석유 가격의 변동에 매우 민감하기 때문에 그 변동성에 대한 파악과 대처가 중요하다. 특히, 높은 소비량을 보이는 휘발유의 가격이 어떠한 요인에 인해 변화하는지 명확하게 파악하는 것이 필요하다. 국제 휘발유 가격은 휘발유 수급, 지정학적 사건, 미국 달러화 가치 변동 등 글로벌 요인에 영향을 받는다. 그러나 기존의 연구들은 휘발유의 수급에만 초점에 맞추어 진행하였다는 한계가 존재한다. 본 연구에서는 다양한 머신러닝 기반의 회귀 모델을 활용하여 거시적 경제지표와 국제 휘발유 가격 간의 인과관계를 탐색한다. 첫째, 다양한 세계 경제지표 데이터를 수집한다. 둘째, 데이터 전처리를 진행한다. 셋째, 다중선형회귀, Ridge 회귀, Lasso(Least Absolute Shrinkage and Selection Operator) 회귀 모델을 활용하여 모델링한다. 실험 결과, 테스트 데이터 셋에서 다중선형회귀 모델이 가장 높은 정확도(97.3%)를 보였다. 우리는 국제 휘발유 가격의 예측은 국내 경제 안정성과 에너지 정책 결정에 도움이 될 수 있을 것으로 기대한다.