통합 검색 | Korea Science

앙상블 기법을 통한 잉글리시 프리미어리그 경기결과 예측 (Prediction of English Premier League Game Using an Ensemble Technique)

이재현;이수원
- 정보처리학회논문지:소프트웨어 및 데이터공학
- /
- 제9권5호
- /
- pp.161-168
- /
- 2020
스포츠 경기 결과예측은 전반적인 경기의 흐름과 승패에 영향을 미치는 변인들의 분석을 통해 팀의 전략 수립을 가능하게 해준다. 이와 같은 스포츠 경기결과 예측에 대한 연구는 주로 통계학적 기법과 기계학습 기법을 활용하여 진행되어 왔다. 승부예측 모델은 무엇보다 예측 성능이 가장 중요시된다. 그러나 최적의 성능을 보이는 예측 모델은 학습에 사용되는 데이터에 따라 다르게 나타나는 경향을 보였다. 본 논문에서는 이러한 문제를 해결하기 위해 데이터가 달라지더라도 해당 데이터에 대한 예측 시 가장 좋은 성능을 보이는 모델의 선택이 가능한 기존의 축구경기결과 예측에서 좋은 성능을 보여온 통계학적 모델과 기계학습 모델을 결합한 새로운 앙상블 모델을 제안한다. 본 논문에서 제안하는 앙상블 모델은 각 단일모델들의 경기 예측결과와 실제 경기결과를 병합한 데이터로부터 최종예측모델을 학습하여 경기 승부예측을 수행한다. 제안 모델에 대한 실험 결과, 기존 단일모델들에 비해 높은 성능을 보였다.
https://doi.org/10.3745/KTSDE.2020.9.5.161 인용 PDF KSCI

순환신경망을 활용한 야구승부예측 (A Prediction of Baseball Game Results Using Recurrent Neural Netowrks)

정경석;김진학;한연희
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2017년도 추계학술발표대회
- /
- pp.873-876
- /
- 2017
최근 딥러닝(Deep-learning)을 활용한 기상 예측, 심리 예측, 교통상황 예측 등 다양한 분야에 걸쳐 여러 모델의 인공신경망이 활용되고 있다. 본 논문에서는 여러 분야 중 스포츠라는 분야에 접근했으며, 딥러닝 모델을 통해 승부를 예측하는 실험을 진행하였다. 야구의 승부는 선수의 능력치, 기상의 변화, 험/어웨이 여부, 교체 여부 등 가늠할 수 없이 수많은 데이터들에 의존하고 있다. 그러나 본 논문에서는 이러한 수많은 데이터 중 경기 외적인 데이터를 제외한 데이터를 활용하여 그 다음 경기의 승부를 예측할 수 있을 지를 연구한다. 날짜 별 경기들이 훈련데이터가 되고 목표는 이전 경기들의 영향으로 예측된 다음 경기의 승/패를 예측한다. 즉 순차적인 데이터의 활용에 적합한 모델, Recurrent Neural-Network을 이용하였다. 이를 위하여 KBreport에서 데이터를 수집하였고, 수집된 데이터를 훈련 데이터 세트로 만들어 Recurrent Neural Network를 통해 훈련시켜 다음 경기의 승패를 예측하였다.
https://doi.org/10.3745/PKIPS.y2017m11a.873 인용 PDF

기온효과를 고려한 건설업생산지수 예측모델 개발 (A Development of Construction Industry Production Index(CIPI) with Temperature Effects)

김석종;김현우;진경호;장한익
- 한국건설관리학회논문집
- /
- 제14권5호
- /
- pp.103-112
- /
- 2013
1990년대 이후 국가경제에서 미치는 영향이 감소 추세에 들어선 건설업은 호황과 불황을 넘나들고 있다. 건설업의 경기변동이 심할수록 경기예측은 어려워지며, 불확실한 예측의 피해는 기업과 건설 종사자들이 직접적으로 받게 되므로 건설경기를 예측하는 것은 매우 어려우면서 중요한 일이다. 본 연구에서는 건설경기를 나타내는 지표 중 하나인 건설업생산지수를 GDP와 기온효과를 이용하여 실질소득과 야외활동이 많은 건설업의 특성에 따라 기온효과를 반영한 공급측면에서의 단기 건설 경기예측 모형을 제시하였다. 분석결과, 건설경기는 뚜렷한 기온효과가 있으며 GDP에도 큰 영향을 받는 것으로 나타났다. 이와 같은 과정을 통해 입증된 건설경기 예측모델을 기반으로 GDP예상증가율 3.5%와 2.4%일 때, 두 가지 시나리오로 2013년도 건설업생산지수를 예측하였다. 본 연구결과는 건설업의 경기를 판단하는 지표 중 하나로 활용 가능할 것이며, 향후 기후변화가 건설업에 미치는 영향에 대한 연구의 초석이 될 것이다.
https://doi.org/10.6106/KJCEM.2013.14.5.103 인용 PDF KSCI

인공지능 모델에 따른 한국 프로야구의 승패 예측 분석에 관한 연구 (A Study on the Win-Loss Prediction Analysis of Korean Professional Baseball by Artificial Intelligence Model)

김태훈;임성원;고진광;이재학
- 한국빅데이터학회지
- /
- 제5권2호
- /
- pp.77-84
- /
- 2020
본 연구에서는 인공지능 모델에 따른 한국 프로야구의 승패 예측 분석에 관한 연구를 했다. 승리할 팀과 해당 팀의 최종 리그 순위를 예측했고, 사용자의 편의를 위해 웹사이트도 구축했다. 각 1·3·5이닝 별로 가장 정확도가 높으면서도 오차가 적은 모델을 최적 모델로 선정해 승·패 결과를 예측했고, 이를 토대로 순위표를 작성했다. 결과표는 2020년 개막인 5월 5일부터 8월 30일까지의 예측 결과를 바탕으로 작성했다. 기아타이거즈가 아닌 다른 구단끼리의 경기는 실제 결과를 사용했다. 머신러닝 모델은 KNN과 AdaBoost가 최적 모델로 선정되었으며, 실제 순위와 비교해 본 결과, 경기가 진행될수록, 예측 결과의 순위 오차가 점점 작아지는 것을 확인했다. 딥러닝 모델은 89%의 정확도를 기록했고, 머신러닝 모델과 마찬가지로 경기를 진행할수록 예측 결과 순위 오차가 작아지는 것을 확인했다. 실험 결과는 한국 프로야구 승·패 결과 예측뿐 아니라 다양한 분야에서 사용할 수 있을 것으로 사료된다. 방송국에서 야구 경기를 중계하는 중 이닝별로 인공지능 알고리즘이 예상한 승·패 여부를 중계화면에 띄울 수 있다. 시청자들에게 새로운 흥미를 일으킬 수 있을 것이고, 나아가 구단의 감독들이 이닝마다 데이터를 분석해 경기 중 유동적으로 승리하기 위한 전략을 세울 수 있을 것으로 기대된다.
https://doi.org/10.36498/kbigdt.2020.5.2.77 인용 PDF KSCI

혼합형 기계 학습 모델을 이용한 프로야구 승패 예측 시스템 (Win/Lose Prediction System : Predicting Baseball Game Results using a Hybrid Machine Learning Model)

홍석미;정경숙;정태충
- 한국정보과학회논문지:컴퓨팅의 실제 및 레터
- /
- 제9권6호
- /
- pp.693-698
- /
- 2003
야구는 매 경기마다 다양한 기록을 생성하며, 이러한 기록을 기반으로 다음 경기에 대한 승패예측이 이루어진다. 프로야구 승패 예측에 대한 연구는 많은 사람들에 의해 행해져 왔으나 아직 이렇다할 결과를 얻지 못하고 있는 상태이다. 이처럼 승패 예측이 어려운 이유는 많은 경기 기록들 중 승패 예측에 영향을 주는 요소의 선별이 어렵고, 예측에 사용된 자료들 간의 중복 요인으로 인해 학습 모델의 복잡도만 증가시킬 뿐 좋은 성능을 보이지 못하고 있다. 이에 본 논문에서는 전문가들의 의견을 바탕으로 학습 요소들을 선택하고, 선택된 자료들을 이용하여 휴리스틱 함수를 구성하였다. 요소들 간의 조합을 통해 예측에 영향을 줄 수 있는 새로운 값을 산출함과 동시에 학습 알고리즘에 사용될 입력 값의 차원을 줄일 수 있는 혼합형 모델을 제안하였다. 그 결과, 학습 알고리즘으로 사용된 역전파 알고리즘의 복잡도를 감소시키고, 프로야구 경기 승패 예측에 있어서도 정확성이 향상되었다.
PDF KSCI

한국 프로배구 연맹의 경기 예측 및 영향요인 분석 (Matching prediction on Korean professional volleyball league)

김희숙;이나경;이지윤;송종우
- 응용통계연구
- /
- 제37권3호
- /
- pp.323-338
- /
- 2024
본 연구는 한국 프로배구 리그를 체계적으로 분석하고 대표적인 머신러닝 분류 방법을 활용하여 경기 결과를 예측하고자 한다. 이를 위해 2012/2013 시즌부터 2022/2023 시즌까지의 남자 프로배구와 여자 프로배구 리그 경기 데이터를 수집하였으며, 이 데이터는 경기 세부 내용을 상세하게 포함하고 있다. 데이터는 각 경기를 두 팀으로 분리한 경우와 홈팀을 기준으로 상대팀과의 성과 차이로 데이터를 가공한 경우로 두 가지 다른 데이터 구조를 모델에 적용했다. 이를 통해 남자 프로배구와 여자 프로배구 각각에 대해 총 4개의 예측 모형을 구축했다. 경기 종료 전에는 모형에서 사용하는 세부 변수 값들을 알 수 없기 때문에, 오늘 경기 직전까지의 3~4 경기의 결과를 전처리하여 이를 변수로 사용했다. 본 연구에서는 Decision Tree, Logistic Regression, Bagging, Random Forest, Xgboost, Adaboost, Light GBM 같은 다양한 머신러닝 기법을 분류에 활용하여, Random Forest를 사용한 모델이 가장 우수한 예측 성능을 보였다. 최종 선택한 모형에 대해 변수 중요도 그림과 부분 의존도 그림을 확인한 결과 성별과 데이터 구조에 따라 중요한 변수들이 다른 것으로 나타났지만, 공통적으로 세트 성공 수, 블로킹 득점, 범실 개수가 가장 중요한 변수임을 알 수 있었다. 본 승패 예측 모델은 사후적 예측이 아닌 경기 종료 전 사전 예측이 가능한 모형이라는 점에서 차별성을 가지며, 우리의 분석이 한국 프로배구 팀들에게 전략적 추론이 될 수 있을 것이라 기대한다.
https://doi.org/10.5351/KJAS.2024.37.3.323 인용 PDF

데이터마이닝 기법을 이용한 기업부실화 예측 모델 개발과 예측 성능 향상에 관한 연구 (Development of Prediction Model of Financial Distress and Improvement of Prediction Performance Using Data Mining Techniques)

김량형;유동희;김건우
- 경영정보학연구
- /
- 제18권2호
- /
- pp.173-198
- /
- 2016
본 연구의 목적은 비즈니스 인텔리전스 연구 관점에서 기업부실화 예측 성능을 향상키시는 것이다. 이를 위해 본 연구는 기존 연구들에서 미흡하게 다루어졌던 1) 데이터셋을 구성하는 과정에서 발생하는 바이어스 문제, 2) 거시경제위험 요소의 미반영 문제, 3) 데이터 불균형 문제, 4) 서술적 바이어스 문제를 다루어 경기순환국면을 반영한 기업부실화 예측 프레임워크를 제안하고, 이를 바탕으로 기업부실화 예측 모델을 개발하였다. 본 연구에서는 경기순환국면별로 각각의 데이터셋을 구성하고, 각 데이터셋에서 의사결정나무, 인공신경망 등 단일 분류기부터 앙상블 기법까지 다양한 데이터마이닝 알고리즘을 적용하여 실험하였다. 또한 본 연구는 데이터불균형 문제를 해결하기 위해, 오버샘플링 기법인 SMOTE(synthetic minority over-sampling technique) 기법을 통해 초기 데이터 불균형 상태에서부터 표본비율을 1:1까지 변화시켜 가며, 기업부실화 예측 모델을 개발하는 실험을 하였고, 예측 모델의 변수 선정 시에 선행연구를 바탕으로 재무비율을 추출하고, 여기서 파생된 IT 산출물인 재무상태변동성과 산업수준상태변동성을 예측 모델에 삽입하였다. 마지막으로, 본 연구는 각 순환국면에서 만들어진 기업부실화 예측 모델의 예측 성능 비교와 경기 확장기와 수축기에서의 기업부실화 예측 모델의 유용성에 대해 논의하였다. 본 연구는 비즈니스 인텔리전스 연구 측면에서 기존 연구에서 미흡하게 다루어졌던 4가지 문제점을 검토하고, 이를 해결할 프레임워크를 제안함으로써 기존 연구 대비 기업부실화 예측률을 10% 이상 향상시켰다는 점에서 연구의 의의를 찾을 수 있다.
https://doi.org/10.14329/isr.2016.18.2.173 인용 PDF

GAN을 이용한 하이라이트 영상 예측 모델의 성능 개선 (Improving Highlight Prediction Models Using GAN)

이한솔;이계민
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2019년도 추계학술대회
- /
- pp.225-227
- /
- 2019
최근 다양한 개인방송 플랫폼에 의해 엄청난 양의 콘텐츠가 업로드 되고 있으며 그 중 축구와 야구와 같은 스포츠 영상이 차지하는 비율이 상당하다. 방송사에서는 시청자들이 편의를 위해 경기 영상 중 흥미를 끌거나 또는 중요한 장면을 모아 하이라이트 영상을 만들어 제공하는데, 이는 시간과 비용이 많이 소요되는 문제가 있다. 이에 본 논문에서는 스포츠 영상에서 자동으로 하이라이트를 예측하는 모델을 제안하다. 우리의 모델은 오디오와 이미지 정보를 함께 사용하며, 영상의 단기적 전후관계와 중장기적 흐름을 동시에 파악하는 모델을 제시한다. 또한 좋은 특징벡터를 추출하기 위해 GAN을 결합하는 방법을 설명한다. 제안하는 모델들을 야구 경기 영상을 이용하여 평가한다.
PDF

확률론적 공간 자료 통합 모델을 이용한 산사태 취약성 분석

박노욱;지광훈;권병두
- 한국지구과학회:학술대회논문집
- /
- 한국지구과학회 2005년도 춘계학술발표회 논문집
- /
- pp.254-260
- /
- 2005
이 논문에서는 산사태 취약성 분석을 목적으로 확률론적 공간통합의 틀 안에서 범주형 자료와 연속형 자료를 효율적으로 처리할 수 있는 비모수적 우도비 추정 모델과 모수적 예측적 판별 분석 모델을 적용하였다. 적용 모델의 비교를 위해 1998년 여름철 산사태로 많은 피해를 입은 경기도 장흥 지역과 충청북도 보은 지역을 대상으로 사례연구를 수행하였다. 장흥 지역에서는 두 모델이 유사한 예측 능력을 나타내었으나, 보은 지역에서는 모수적 예측적 판별 분석 모델이 상대적으로 높은 예측 능력을 나타내었다. 결론적으로 제안한 두 모델은 산사태 취약성 분석을 위한 연속형 자료 표현에 효율적으로 적용될 수 있으며, 두 모델이 개별적인 연속형 자료 표현의 특성을 가지고 있기 때문에 다른 사례 연구를 통한 검증 작업이 병행되어야 할 것으로 생각된다.
PDF

불균형 클래스에서 AutoML 기반 분류 모델의 성능 향상을 위한 데이터 처리 (Data Processing of AutoML-based Classification Models for Improving Performance in Unbalanced Classes)

이동준;강지수;정경용
- 융합정보논문지
- /
- 제11권6호
- /
- pp.49-54
- /
- 2021
최근 스마트 헬스케어 기술의 발전에 따라 일상적인 질환에 대한 관심이 증가하고 있다. 이에 따라 헬스케어 데이터를 통해 예측 모델로 질병을 분석하거나 예측하는 연구들이 증가하고 있다. 그러나 헬스케어 데이터에는 양성 데이터와 음성 데이터의 불균형이 존재한다. 이는 특정 질환을 가진 환자에 비하여 상대적으로 환자가 아닌 사람이 많아 데이터 수집에 어려움이 있어 발생하는 현상이다. 데이터 불균형은 질병 예측 및 탐지 시 진행하는 모델의 성능에 영향을 끼치기 때문에 이를 제거할 필요가 있다. 따라서 본 연구에서는 오버샘플링과 결측값 대치를 통해서 데이터 불균형을 해소한다. AutoML을 기반으로 여러 모델의 성능을 파악하고 모델 중 상위 3개의 모델을 앙상블한다.
https://doi.org/10.22156/CS4SMB.2021.11.06.049 인용 PDF KSCI

검색결과 111건 처리시간 0.022초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)