• 제목/요약/키워드: gradient모형

검색결과 220건 처리시간 0.025초

국내 예능 시청률과 회차 예측 및 영향요인 분석 (A study on entertainment TV show ratings and the number of episodes prediction)

  • 김미림;임소연;장초희;송종우
    • 응용통계연구
    • /
    • 제30권6호
    • /
    • pp.809-825
    • /
    • 2017
  • 오디션, 육아, 버라이어티 등 다양한 예능 프로그램들의 수가 점점 증가하고 있다. 특히 종합편성채널이 개국한 이후에 예능 시장 경쟁이 심화되고 있다. 그에 따라 시청률과 회차에 대한 연구의 필요성이 대두되고 있다. 본 연구의 목적은 예능 프로그램 시청률과 회차의 예측모형을 제시하고 주요요인을 살펴보는 데 있다. 모형 적합 시 선형회귀모형, 로지스틱 회귀모형, LASSO 회귀모형, 랜덤 포레스트, 그래디언트 부스팅, 서포트 벡터 머신 등과 같은 다양한 분석 방법을 고려하였다. 예능 시청률 예측 모형에서는 첫 회가 방영되기 전과 방영된 후 두 가지 모형을 적합하였고, 회차 예측 모형에서는 예능 시청률 예측 모형의 예측치를 추가 변수로 생성하여 모형을 적합하였다. 그 결과 첫 회 방영 전 예능 시청률 예측에서는 방송사, 이전 시즌 시청률, 시작 연도, 기사 수가 큰 영향을 주는 것으로 나타났다. 첫 회 방영 후 예능 시청률 예측에서는 첫 회 시청률, 방송사, 예능 유형이 중요한 변수로 나타났으며, 두 모형 모두 랜덤 포레스트 모형에서 가장 좋은 결과를 보였다. 예능 회차 예측에서는 평균 시청률 예측치, 시작 연도, 예능유형, 방송국 등이 중요한 변수로 나타났다.

액터-크리틱 모형기반 포트폴리오 연구 (A Study on the Portfolio Performance Evaluation using Actor-Critic Reinforcement Learning Algorithms)

  • 이우식
    • 한국산업융합학회 논문집
    • /
    • 제25권3호
    • /
    • pp.467-476
    • /
    • 2022
  • The Bank of Korea raised the benchmark interest rate by a quarter percentage point to 1.75 percent per year, and analysts predict that South Korea's policy rate will reach 2.00 percent by the end of calendar year 2022. Furthermore, because market volatility has been significantly increased by a variety of factors, including rising rates, inflation, and market volatility, many investors have struggled to meet their financial objectives or deliver returns. Banks and financial institutions are attempting to provide Robo-Advisors to manage client portfolios without human intervention in this situation. In this regard, determining the best hyper-parameter combination is becoming increasingly important. This study compares some activation functions of the Deep Deterministic Policy Gradient(DDPG) and Twin-delayed Deep Deterministic Policy Gradient (TD3) Algorithms to choose a sequence of actions that maximizes long-term reward. The DDPG and TD3 outperformed its benchmark index, according to the results. One reason for this is that we need to understand the action probabilities in order to choose an action and receive a reward, which we then compare to the state value to determine an advantage. As interest in machine learning has grown and research into deep reinforcement learning has become more active, finding an optimal hyper-parameter combination for DDPG and TD3 has become increasingly important.

지하수위 예측을 위한 경사하강법과 화음탐색법의 결합을 이용한 다층퍼셉트론 성능향상 (Improvement of multi layer perceptron performance using combination of gradient descent and harmony search for prediction of groundwater level)

  • 이원진;이의훈
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.186-186
    • /
    • 2022
  • 강수 및 침투 등으로 발생하는 지하수위의 변동을 예측하는 것은 지하수 자원의 활용 및 관리에 필수적이다. 지하수위의 변동은 지하수 자원의 활용 및 관리뿐만이 아닌 홍수 발생과 지반의 응력상태 등에 직접적인 영향을 미치기 때문에 정확한 예측이 필요하다. 본 연구는 인공신경망 중 다층퍼셉트론(Multi Layer Perceptron, MLP)을 이용한 지하수위 예측성능 향상을 위해 MLP의 구조 중 Optimizer를 개량하였다. MLP는 입력자료와 출력자료간 최적의 상관관계(가중치 및 편향)를 찾는 Optimizer와 출력되는 값을 결정하는 활성화 함수의 연산을 반복하여 학습한다. 특히 Optimizer는 신경망의 출력값과 관측값의 오차가 최소가 되는 상관관계를 찾는 연산자로써 MLP의 학습 및 예측성능에 직접적인 영향을 미친다. 기존의 Optimizer는 경사하강법(Gradient Descent, GD)을 기반으로 하는 Optimizer를 사용했다. 하지만 기존의 Optimizer는 미분을 이용하여 상관관계를 찾기 때문에 지역탐색 위주로 진행되며 기존에 생성된 상관관계를 저장하는 구조가 없어 지역 최적해로 수렴할 가능성이 있다는 단점이 있다. 본 연구에서는 기존 Optimizer의 단점을 개선하기 위해 지역탐색과 전역탐색을 동시에 고려할 수 있으며 기존의 해를 저장하는 구조가 있는 메타휴리스틱 최적화 알고리즘을 이용하였다. 메타휴리스틱 최적화 알고리즘 중 구조가 간단한 화음탐색법(Harmony Search, HS)과 GD의 결합모형(HS-GD)을 MLP의 Optimizer로 사용하여 기존 Optimizer의 단점을 개선하였다. HS-GD를 이용한 MLP의 성능검토를 위해 이천시 지하수위 예측을 실시하였으며 예측 결과를 기존의 Optimizer를 이용한 MLP 및 HS를 이용한 MLP의 예측결과와 비교하였다.

  • PDF

개선된 지형지수 산정 알고리즘의 적용에 관한 연구 (Application of Improved Algorithm for Topographic Index Calculation)

  • 김상현;이지영
    • 한국수자원학회논문집
    • /
    • 제32권4호
    • /
    • pp.489-499
    • /
    • 1999
  • 본 연구는 분포형 수문 모형인 TOPMODEL의 기본 입력자료인 지형지수, 1n(a/tan {{{{{B}_{}}}}}) 산정을 위한 알고리즘과 수로형성면적(CIT)과 구배멱급수(H)를 고려한 개선된 지형지수 산정 알고리즘의 국내 지형에 대한 적용성을 검토하였다. 대상 유역은 청도천 유역의 한제천 소유역 (18.6km2)과 위천 대표 시험유역의 동곡 소유역(33.6km2)으로, 이 두 유역에 대한 10m, 20m, 30m, 50m, 100m의 수치고도자료(Digital elevation model ; DEM)을 구축하였다. 기존 알고리즘에 대해 수로형성면적의 적용 결과, 수로 격자에 대한 지형지수의 적절한 처리를 통해 개선된 계산 결과를 얻을 수 있었고, 구배멱급수(H)의 적용을 통해 기존의 다방향 흐름(MFD) 알고리즘에 비해 유역 내 협곡 지점에 대한 흐름의 수렴 효과를 얻을 수 있었다. 개선된 알고리즘에 의해 계산된 지형지수 분포는 최대값의 감소로 유출 모의시 과도한 초기 유출 계산 문제를 완화시킬 수 있었다. 기존 알고리즘을 사용한 유출 모의와 비교하여 개선된 알고리즘을 활용한 전체적인 모의 효율은 유사하나 수문정보의 공간 분포 산정은 보다 합리적인 결과를 도출하였다,

  • PDF

점토지반 샌드매트의 간극수압 거동 (Behaviour of the Excess Pore Pressure Induced by Sand Mat on the Soft Clay)

  • 김형주;이민선;백필순;전혜선
    • 한국지반공학회논문집
    • /
    • 제22권8호
    • /
    • pp.55-62
    • /
    • 2006
  • 샌드매트의 설계는 연약지반의 압밀침하특성과 매트의 투수성이 상호 결합된 연성압밀해석에 의해 얻어지는 간극 수압거동에 의해 검토되어야 한다. 본 연구에서는 샌드매트의 수두분포에 대하여 Terzaghi 1차원 압밀방정식을 이용한 수치해석을 실시하여 준설모래를 샌드매트 재료로 이용한 성토모형실험의 결과와 비교분석하였다. 실험결과 단계 성토가 증가하면서 간극수압은 성토중심부에서 증가되는 침하량의 영향을 받고 있다. 그리고 잔류된 간극수압 영향으로 간극수압의 상승속도가 수치해석결과보다 지연되고 있다. 따라서 최종적으로 샌드매트 시공은 성토중심부에서 증가되는 동수구배를 저감시키도록 포설되어야 한다.

약물유전체학에서 약물반응 예측모형과 변수선택 방법 (Feature selection and prediction modeling of drug responsiveness in Pharmacogenomics)

  • 김규환;김원국
    • 응용통계연구
    • /
    • 제34권2호
    • /
    • pp.153-166
    • /
    • 2021
  • 약물유전체학 연구의 주요 목표는 고차원의 유전 변수를 기반으로 개인의 약물 반응성을 예측하는 것이다. 변수의 개수가 많기 때문에 변수의 개수를 줄이기 위해서는 변수 선택이 필요하며, 선택된 변수들은 머신러닝 알고리즘을 사용하여 예측 모델을 구축하는데 사용된다. 본 연구에서는 400명의 뇌전증 환자의 차세대 염기서열 분석 데이터에 로지스틱 회귀, ReliefF, TurF, 랜덤 포레스트, LASSO의 조합과 같은 여러 가지 혼합 변수 선택 방법을 적용하였다. 선택된 변수들에 랜덤포레스트, 그래디언트 부스팅, 서포트벡터머신을 포함한 머신러닝 방법들을 적용했고 스태킹을 통해 앙상블 모형을 구축하였다. 본 연구의 결과는 랜덤포레스트와 ReliefF의 혼합 변수 선택 방법을 이용한 스태킹 모형이 다른 모형보다 더 좋은 성능을 보인다는 것을 보여주었다. 5-폴드 교차 검증을 기반으로 하여 적합한 최적 모형의 평균 검증 정확도는 0.727이고 평균 검증 AUC 값은 0.761로 나타났다. 또한, 동일한 변수를 사용할 때 스태킹 모델이 단일 머신러닝 예측 모델보다 성능이 우수한 것으로 나타났다.

조(粗)·세립상(細粒床)의 연속구조를 갖는 개수로 흐름에서 오염물질 수송에 대한 이차흐름 영향 분석 (Impact of Secondary Currents on Solute Transport in Open-Channel Flows over Smooth-Rough Bed Strips)

  • 강형식;최성욱;김규호
    • 대한토목학회논문집
    • /
    • 제29권1B호
    • /
    • pp.73-81
    • /
    • 2009
  • 본 연구에서는 개수로 흐름에서 오염물질 이동 현상에 대한 이차흐름의 영향을 분석하였다. 운동량 방정식과 스칼라 수송 방정식에서의 난류 폐합을 위해 레이놀즈응력 모형 및 GGDH 모형을 사용하였다. 개발된 모형을 이용하여 조 세립상의 횡방향 연속구조를 갖는 개수로 흐름에서의 오염물질 이동에 대한 이차흐름의 영향을 분석하였다. 그 결과, 이차흐름의 영향으로 인해 최대 농도 값의 발생 위치가 이동하는 것으로 나타났으며, 농도 분포 역시 정규 분포에서 거리에 따라 점차 왜곡 되는 것으로 확인되었다. 또한, 이차흐름의 영향으로 자유수면 근처에서는 매끄러운 하상에 비해 거친 하상에서의 오염물질 농도가 더 크게 발생되었으며, 스칼라-흐름률을 계산한 결과, 오염물질의 수직방향 확산은 매끄러운 하상에 비해 거친 하상에서 더 빨리 진행되는 것으로 확인되었다. 한편, 농도 분포 변화에 대한 이차흐름 및 스칼라-흐름률의 영향을 살펴보기 위하여 스칼라 수송률 분석을 수행하였다.

연속류도로 합류영향구간 속도-밀도 상관관계 분석 (Analysis of Speed-Density Correlation on a Merge Influence Section in Uninterrupted Facility)

  • 김현상;도철웅
    • 대한토목학회논문집
    • /
    • 제29권4D호
    • /
    • pp.443-450
    • /
    • 2009
  • A연속류도로는 교통량-속도-밀도 간에 상호 밀접한 관계가 있기 때문에 연결로교통류가 본선에 합류하게 되면 속도나 밀도가 변할 뿐만 아니라 이들 간의 상관관계를 나타내는 모형식도 달라진다. 따라서, 본 연구는 합류영향권역에서 시공간적으로 연속된 교통자료를 이용하여 속도-밀도 변수간의 상관관계 변화구간을 파악하고, 구간별 변화내용을 분석하였다. 분석결과, 상류 및 합류구간에서는 "Underwood"모형의 지수형태를 보이며, 합류구간을 통과한 하류구간에서는 "Greenshields"모형의 직선형태를 나타내었다. 속도-밀도 상관관계가 변화된 하류변화구간은 연결로와 접속한 3차로의 합류 종점부를 기점으로 하류 100m~500m 범위에서 내측차로로 갈수록 점차 하류방향으로 이동하는 현상을 보였다. 또한, 상류구간, 합류구간, 하류변화구간은 속도-밀도 모형에서 자유속도(상수)와 혼잡밀도에 대한 자유속도비(기울기)가 통계적으로 서로 다른 이질적인 교통류로 나타났다.

수위급강하(水位急降下)에 따른 제체(堤體)의 사면안정해석(斜面安定解析) (Embankment Stability under Rapid Drawdown)

  • 신방웅;박재관
    • 대한토목학회논문집
    • /
    • 제5권4호
    • /
    • pp.1-8
    • /
    • 1985
  • 수위변화(水位變化)에 따른 상이(相異)한 자유수면(自由水面)으로 인(因)하여 제체내부(堤體內部)에 응력상태(應力狀態)가 달라지므로 제체(堤體)의 안정해석(安定解析)이 필요(必要)하다. 수위(水位)가 급강하(急降下)할 경우 상류측(上流側) 사면(斜面)에서의 자유수면방향(自由水面方向)이 기초(基礎)쪽으로 바뀌어질 때, 상류측(上流側) Fill의 안전율(安全率)을 찾아 보았다. 여기서 하강(下降)하는 자유수면(自由水面)과 파괴형태(破壞形態)를 찾았으며, 또 안전율(安全率)을 구(求)하였고. 이로 강하속도(降下速度) 및 동수경사(動水傾斜)를 비교(比較)하였다. 실험(實驗)에 의한 결과(結果)는 다음과 같다. 1. 자유수면(自由水面)의 강하(降下)로 인(因)하여 상류측(上流側) Fill에 침투류(浸透流)에 의한 골동파괴(滑動破壞)가 일어나고, 파괴고(破壞高)는 각(各) 각(各)의 모형(模型)에 따라, 5~10, 9~15, 13~21(cm)이다. 2. 침투류(浸透流)에 의한 간극수압(間隙水壓)의 영향(影響)을 고려(考慮)하여 안전율(安全率)을 구하였으며, 이때 강하속도(降下速度)와 안전율(安全率)과의 관계(關係)에서 제체(堤體)의 안전상(安全上) 강하속도(降下速度)는 0.21~0.28(cm/sec)이어야 하고, 동수경사(動水傾斜)와 안전율(安全率)과의 비교(比較)에서 동수경사(動水傾斜)는 각(各) 모형(模型)에서 0.36~0.43 값보다 적어야 함을 실험상(實驗上) 알았다.

  • PDF

앙상블 머신러닝 모형을 이용한 하천 녹조발생 예측모형의 입력변수 특성에 따른 성능 영향 (Effect of input variable characteristics on the performance of an ensemble machine learning model for algal bloom prediction)

  • 강병구;박정수
    • 상하수도학회지
    • /
    • 제35권6호
    • /
    • pp.417-424
    • /
    • 2021
  • Algal bloom is an ongoing issue in the management of freshwater systems for drinking water supply, and the chlorophyll-a concentration is commonly used to represent the status of algal bloom. Thus, the prediction of chlorophyll-a concentration is essential for the proper management of water quality. However, the chlorophyll-a concentration is affected by various water quality and environmental factors, so the prediction of its concentration is not an easy task. In recent years, many advanced machine learning algorithms have increasingly been used for the development of surrogate models to prediction the chlorophyll-a concentration in freshwater systems such as rivers or reservoirs. This study used a light gradient boosting machine(LightGBM), a gradient boosting decision tree algorithm, to develop an ensemble machine learning model to predict chlorophyll-a concentration. The field water quality data observed at Daecheong Lake, obtained from the real-time water information system in Korea, were used for the development of the model. The data include temperature, pH, electric conductivity, dissolved oxygen, total organic carbon, total nitrogen, total phosphorus, and chlorophyll-a. First, a LightGBM model was developed to predict the chlorophyll-a concentration by using the other seven items as independent input variables. Second, the time-lagged values of all the input variables were added as input variables to understand the effect of time lag of input variables on model performance. The time lag (i) ranges from 1 to 50 days. The model performance was evaluated using three indices, root mean squared error-observation standard deviation ration (RSR), Nash-Sutcliffe coefficient of efficiency (NSE) and mean absolute error (MAE). The model showed the best performance by adding a dataset with a one-day time lag (i=1) where RSR, NSE, and MAE were 0.359, 0.871 and 1.510, respectively. The improvement of model performance was observed when a dataset with a time lag up of about 15 days (i=15) was added.