• 제목/요약/키워드: 예측 조합

검색결과 799건 처리시간 0.023초

머신러닝 기법 기반의 예측조합 방법을 활용한 산업 부가가치율 예측 연구 (Prediction on the Ratio of Added Value in Industry Using Forecasting Combination based on Machine Learning Method)

  • 김정우
    • 한국콘텐츠학회논문지
    • /
    • 제20권12호
    • /
    • pp.49-57
    • /
    • 2020
  • 본 연구는 우리나라 수출 분야 산업의 경쟁력을 나타내는 부가가치율을 다양한 머신러닝 기법을 활용하여 예측하였다. 아울러, 예측의 정확성 및 안정성을 높이기 위하여 머신러닝 기법 예측값들에 예측조합 기법을 적용하였다. 특히, 본 연구는 산업별 부가가치율에 영향을 주는 다양한 변수를 고려하기 위하여 재귀적특성제거 방법을 사용하여 주요 변수를 선별한 후 머신러닝 기법에 적용함으로써 예측과정의 효율성을 높였다. 분석결과, 예측조합 방법에 따른 예측값은 머신러닝 기법 예측값들보다 실제의 산업 부가가치율에 근접한 것으로 나타났다. 또한, 머신러닝 기법의 예측값들이 큰 변동성을 보이는 것과 달리 예측조합 기법은 안정적인 예측값을 나타내었다.

제약하의 예측조합 방법을 활용한 산업별 고용비중 예측 (Prediction of the employment ratio by industry using constrainted forecast combination)

  • 김정우
    • 한국융합학회논문지
    • /
    • 제11권11호
    • /
    • pp.257-267
    • /
    • 2020
  • 본 연구는 우리나라 수출 분야의 산업별 고용비중을 다양한 머신러닝 기법을 활용하여 예측하고, 예측성능을 높이기 위하여 머신러닝 기법 예측값들에 예측조합 기법을 적용하였다. 특히, 본 연구에서는 각 머신러닝 기법 예측값들에 부여되는 가중치의 합을 1로 설정하는 제약하의 예측조합 기법을 사용하여 예측의 정확성과 안정성을 확보하고자 하였다. 또한, 본 연구는 산업별 고용비중에 영향을 주는 다양한 변수를 고려하기 위하여 재귀적특성제거 방법을 사용하여 주요 변수를 선별한 후, 머신러닝 기법에 적용함으로써 예측과정 상에서의 효율성을 높였다. 분석결과, 예측조합 방법에 따른 예측값은 머신러닝 기법의 예측값들보다 실제의 산업 고용비중에 근접한 것으로 나타났으며, 머신러닝 기법의 예측값들이 큰 변동성을 보이는 것과 달리 제약하의 예측조합 기법은 안정적인 예측값을 나타내었다.

우리나라 고령층의 경제활동 수준 예측 - 머신러닝 기법과 연계한 예측조합법을 중심으로 - (Prediction on the Economic Activity Level of the Elderly in South Korea - Focusing on Machine Learning Method Combined with Forecast Combination -)

  • 김정우
    • 한국융합학회논문지
    • /
    • 제13권5호
    • /
    • pp.237-247
    • /
    • 2022
  • 본 연구는 급속한 고령화 시대에서 우리나라의 고령층의 경제활동 수준을 다양한 머신러닝 기법으로 정확히 예측하고자 하였다. 고령층의 경제활동 수준과 기존 연구들은 고령층의 삶의 만족도, 사회보장제도 등과 연관된 인과성 검증을 중심으로 이루어진 데 반해, 본 연구는 다양한 머신러닝 기법으로 고령층의 경제활동 수준을 예측하였으며, 특히 예측조합법을 함께 사용함으로써 예측의 안정성을 도모하였다. 60세 이상의 경제활동참가율, 취업률 등을 종속변수로 하고 가구 특성, 소득, 평균임금 등을 설명변수로 설정하여 서로 다른 특성을 지닌 5가지의 머신러닝 기법과 2가지의 예측조합법을 적용하여 예측결과들을 비교하였다. 분석 결과, 종속변수별, 예측구간별로 예측성능이 높은 머신러닝 기법 및 예측조합법은 상이하였으나, 예측의 안정성 측면에서는 예측조합법이 상대적으로 우수한 것으로 나타났다. 이에 따라, 본 연구는 고령층의 경제활동 수준을 정확히 예측하고 예측의 안정성을 도모하여 정책적 관점에서도 실용성을 제고한다고 볼 수 있다.

상호작용 중요도 행렬을 이용한 단백질-단백질 상호작용 예측 (Protein-Protein Interaction Prediction using Interaction Significance Matrix)

  • 장우혁;정석훈;정휘성;현보라;한동수
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권10호
    • /
    • pp.851-860
    • /
    • 2009
  • 최근 계산을 통한 단백질 상호작용 예측 기법 중, 단백질 쌍이 포함하고 있는 도메인들 사이의 관계에 중점을 둔 도메인 정보 기반 예측 기법들이 다양하게 제안되고 있다. 하지만, 다수의 도메인 쌍들이 상호작용에 기여하는 정도를 정밀하게 반영하는 계산 기법은 드문 실정이다. 본 논문에서는 단백질 상호작용에 있어 도메인 조합 쌍의 상호작용 영향력을 수치화하여 반영한 상호작용 중요도 행렬을 고안하고 이를 기반으로 한 단백질 상호작용 예측 시스템을 구현한다. 일반적인 도메인 조합 기법과 달리, 상호작용 중요도 행렬에서는 상호작용을 위한 도메인간의 협업 확률이 고려된 Weighted 도메인 조합과, 다수의 Weighted 도메인 조합 중 실제 상호작용 주체가 될 확률을 도메인 조합 쌍의 힘(Domain Combination Pair Power, DCPPW)으로 수치화한다. DIP과 IntAct에서 얻어온 S. cerevisiae의 단백질 상호작용 데이터와 Pfam-A 도메인 정보를 사용한 정확도 검증 결과, 평균 63%의 민감도와 94%의 특이도를 확인하였으며, 학습집단의 증가에 따른 안정적인 예측 정확도 향상을 보였다. 본 논문에서 구현한 예측 시스템과 학습 데이터는 웹(http://code.google.com/p/prespi)을 통하여 내려 받을 수 있다.

도메인 조합 기반 단백질-단백질 상호작용 확률 예측 틀 (A Domain Combination-based Probabilistic Framework for Protein-Protein Interaction Prediction)

  • 한동수;서정민;김홍숙;장우혁
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제10권4호
    • /
    • pp.299-308
    • /
    • 2004
  • 최근 단백질 및 도메인과 관련된 방대한 양의 데이타들이 인터넷상에 공표되고 축적됨에 따라, 단백질간의 상호작용에 대한 예측 시스템의 필요성이 제기되고 있다. 본 논문에서는 이러한 데이타를 이용하여 계산적으로 도메인 조합 쌍에 기반하여 단백질의 상호작용 확률을 예측하는 새로운 단백질 상호작용 예측 시스템을 제안한다. 제안된 예측 시스템에서는 기존의 도메인 쌍(domain pair)의 제약성을 극복하기 위하여 도메인 조합(domain combination)과 도메인 조합 쌍(domain combination pair)의 개념이 새롭게 도입하였다. 그리고 도메인 조합 쌍(domain combination pair 또는 dc-pair)을 단백질 상호작용의 기본 단위로 간주하고 예측을 시도한다. 예측 시스템은 크게 예측 준비 과정과 서비스 과정으로 구성되어 있다. 예측 준비 과정에서는 상호작용이 있는 것으로 알려진 단백질 쌍 집합과 상호작용이 없는 것으로 추정되는 단백질 도메인 쌍 집합으로부터 각각 도메인 조합 정보와 그 출현 빈도를 추출한다. 추출된 정보들은 출현 확률 배열(Appearance Probability Matrix 또는 AP matrix)로 불리는 배열 구조에 저장된다. 논문에서는 출현 확률 배열에 기반을 두어, 단백질-단백질 상호작용을 예측하는 확률식 PIP(Primary Interaction Probability)를 고안하고, 고안된 확률식을 이용하여, 상호작용이 있는 것으로 알려진 단백질 쌍 집합과 상호작용이 없는 것으로 추정되는 단백질 도메인 쌍 집합의 확률 값 분포를 생성시킨다. 예측서비스 과정에서는 예측 준비 과정에서 얻어진 분포와 확률식을 이용하여 임의의 단백질 쌍의 상호작용 확률을 계산한다. 예측 모델의 유효성은 효모(yeast)에서 상호작용이 있는 것으로 보고된 단백질 쌍 집합과 상호작용이 없는 것으로 추정되는 단백질 쌍 집합을 이용하여 검증하였다. DIP(Database of Inter-acting Proteins)의 상호작용이 있는 것으로 알려진 효모 단백질 쌍 집합의 80%를 학습 집단으로 사용했을 때, 86%의 sensitivity와 56%의 specificity를 나타내어, 도메인을 기반으로 한 기존의 예측 시스템에 비해서 우월한 예측 정확도를 보여주었다. 이와 같은 예측 정확도의 개선은 본 예측 시스템이 상호작용의 기본 단위로 dc-pair를 채택한 점과 분류를 위하여 새롭게 고안하여 사용한 PIP식이 유효했던 것으로 판단된다.

층지진하중분포 예측을 위한 모드조합법 (Modal Combination Method for Prediction of Story Earthquake Load Profiles)

  • 엄태성;이혜린;박홍근
    • 한국지진공학회논문집
    • /
    • 제10권3호
    • /
    • pp.65-75
    • /
    • 2006
  • 건물의 지진응답을 평가하기 위하여 비선형 푸시오버 해석을 수행한다. 구조물의 비탄성 지진응답을 정확히 예측하기 위해서는, 비선형해석에 사용되는 층하중분포가 구조물의 시간이력 지진응답 동안 실제로 발생되는 지진하중분포를 나타낼 수 있어야 한다. 본 연구에서는 건축물의 지진하중분포를 예측하기 위하여 새로운 모드조합법을 개발하였다. 개발된 모드조합법에서는 모드조합계수를 곱한 각 모드의 스펙트럼응답을 조합하여 다수의 지진하중분포를 예측한다. 모멘트 골조와 켄틸레버 벽체에 대한 변수연구를 수행하였다. 변수연구 결과를 토대로, 각 고유모드가 구조물의 지진응답에 미치는 영향을 나타내는 모드조합계수를 정의하였다. 다양한 정형 및 수직 비정형 구조물에 대하여 제안된 계수모드조합법을 적용하였다. 그 결과 제안된 모드조합법은 시간이력 응답 동안 구조물에 실제로 발생되는 지진하중분포를 정확히 예측할 수 있었다.

Takagi-Sugeno 추론기법과 신경망을 연계한 뉴로-퍼지 홍수예측 모형의 구축 및 적용 (I) : 최적 입력자료 조합의 선정 (Establishment and Application of Neuro-Fuzzy Real-Time Flood Forecasting Model by Linking Takagi-Sugeno Inference with Neural Network (I) : Selection of Optimal Input Data Combinations)

  • 최승용;김병현;한건연
    • 한국수자원학회논문집
    • /
    • 제44권7호
    • /
    • pp.523-536
    • /
    • 2011
  • 본 연구의 목적은 중소하천에서의 홍수예측을 위해 사용되는 기존의 수문학적 모형이 가지고 있는 문제점을 개선한 홍수예측 모형을 개발하는데 있다. 이를 위해 기존의 수문학적 강우-유출 모형에서 사용되는 많은 수문학적 자료 및 매개변수들의 사용 없이 오직 수위 및 강우측정 자료만을 이용하여 홍수를 예측할 수 있는 Takagi-Sugeno 퍼지 추론기법과 신경망을 연계한뉴로-퍼지홍수예측 모형을 구축하고자 하였다. 뉴로-퍼지 홍수예측 모형의 예측정확도는 입력자료로 사용되는 강우와 수위 자료의 시간적 분포 및 자료의 수에 의해 결정된다. 따라서 본 연구에서는 홍수예측 모형 구축을 위한 최적 입력 자료 조합 선정을 위해 다양한 강우와 수위의 입력자료 조합을 구성하여 적용하였고, 이를 통해 홍수 예측을 위한 뉴러-퍼지 홍수예측 모형의 최적 입력 자료 조합을 선정하였다.

댐 일유입량 예측을 위한 데이터 전처리와 머신러닝&딥러닝 모델 조합의 비교연구 (Comparative Study of Data Preprocessing and ML&DL Model Combination for Daily Dam Inflow Prediction)

  • 조영식;정관수
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.358-358
    • /
    • 2023
  • 본 연구에서는 그동안 수자원분야 강우유출 해석분야에 활용되었던 대표적인 머신러닝&딥러닝(ML&DL) 모델을 활용하여 모델의 하이퍼파라미터 튜닝뿐만 아니라 모델의 특성을 고려한 기상 및 수문데이터의 조합과 전처리(lag-time, 이동평균 등)를 통하여 데이터 특성과 ML&DL모델의 조합시나리오에 따른 일 유입량 예측성능을 비교 검토하는 연구를 수행하였다. 이를 위해 소양강댐 유역을 대상으로 1974년에서 2021년까지 축적된 기상 및 수문데이터를 활용하여 1) 강우, 2) 유입량, 3) 기상자료를 주요 영향변수(독립변수)로 고려하고, 이에 a) 지체시간(lag-time), b) 이동평균, c) 유입량의 성분분리조건을 적용하여 총 36가지 시나리오 조합을 ML&DL의 입력자료로 활용하였다. ML&DL 모델은 1) Linear Regression(LR), 2) Lasso, 3) Ridge, 4) SVR(Support Vector Regression), 5) Random Forest(RF), 6) LGBM(Light Gradient Boosting Model), 7) XGBoost의 7가지 ML방법과 8) LSTM(Long Short-Term Memory models), 9) TCN(Temporal Convolutional Network), 10) LSTM-TCN의 3가지 DL 방법, 총 10가지 ML&DL모델을 비교 검토하여 일유입량 예측을 위한 가장 적합한 데이터 조합 특성과 ML&DL모델을 성능평가와 함께 제시하였다. 학습된 모형의 유입량 예측 결과를 비교·분석한 결과, 소양강댐 유역에서는 딥러닝 중에서는 TCN모형이 가장 우수한 성능을 보였고(TCN>TCN-LSTM>LSTM), 트리기반 머신러닝중에서는 Random Forest와 LGBM이 우수한 성능을 보였으며(RF, LGBM>XGB), SVR도 LGBM수준의 우수한 성능을 나타내었다. LR, Lasso, Ridge 세가지 Regression모형은 상대적으로 낮은 성능을 보였다. 또한 소양강댐 댐유입량 예측에 대하여 강우, 유입량, 기상계열을 36가지로 조합한 결과, 입력자료에 lag-time이 적용된 강우계열의 조합 분석에서 세가지 Regression모델을 제외한 모든 모형에서 NSE(Nash-Sutcliffe Efficiency) 0.8이상(최대 0.867)의 성능을 보였으며, lag-time이 적용된 강우와 유입량계열을 조합했을 경우 NSE 0.85이상(최대 0.901)의 더 우수한 성능을 보였다.

  • PDF

난류 부분예혼합 제트화염에 대한 난류 및 연소모델의 예측성능 검토 (Investigation of the Prediction Performance of Turbulence and Combustion Models for the Turbulent Partially-premixed Jet Flame)

  • 김유정;오창보
    • 한국화재소방학회논문지
    • /
    • 제28권4호
    • /
    • pp.35-43
    • /
    • 2014
  • 3개의 난류모델과 3개의 연소모델로 구성된 9개의 모델조합을 이용하여 난류 부분예혼합 제트화염 구조에 대한 수치적 예측성능을 검토하였다. 이용된 난류모델은 표준 ${\kappa}-{\varepsilon}$ 모델(SKE), Realizable ${\kappa}-{\varepsilon}$ 모델(RKE) 및 Reynolds 응력모델(RSM)이며 연소모델들은 Eddy Dissipation Concept 모델(EDC), Steady Laminar Flamelet 모델(SLF)와 Unsteady Laminar Flamelet 모델(ULF)이다. 9개 모델조합의 예측성능을 평가하기 위하여 실험결과가 알려진 Sandia D 화염인 난류 부분예혼합 제트화염을 대상으로 수치계산을 수행하였다. 얻어진 결과로서, 화염길이의 예측은 RSM > SKE > RKE순으로 길게 예측하였으며, RKE 난류모델은 화염길이를 너무 과소 예측하는 것을 확인하였다. RSM + SLF과 RSM + ULF의 조합은 화염길이는 비교적 잘 예측하였지만 하류에서의 화염온도를 과대 예측하였다. 반면에 SKE와 연소모델의 조합에서 SLF 또는 ULF 조합은 화염길이 뿐만 아니라 하류에서의 화염온도도 비교적 잘 예측하였는 것을 확인하였다. 반경방향 화염온도 및 화학종 농도분포를 비교해 본 결과 SKE와 연소모델의 조합이 가장 예측성능이 뛰어났으며 SKE + ULF의 조합이 가장 우수한 예측성능을 갖는 것을 확인하였다.

gcd 연산을 이용한 조합 소수 검사 알고리즘의 분석 및 최적화 (Analysis and Optimization of the Combined Primality Test Using gcd Operation)

  • 서동우;조호성;박희진
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (B)
    • /
    • pp.476-481
    • /
    • 2007
  • 큰 소수를 빠르게 생성하기 위한 다양한 소수 검사 방법이 개발되었으며, 가장 많이 쓰이는 소수 검사 방법은 trial division과 Fermat (또는 Miller-Rabin) 검사를 조합한 방법과 gcd 연산과 Fermat (또는 Miller-Rabin) 검사를 조합한 방법이다. 이 중 trial division과 조합한 방법에 대해서는 확률적 분석을 이용하여 수행시간을 예측하고 수행시간을 최적화 하는 방법이 개발되었다. 하지만, gcd 연산과 조합한 방법에 대해서는 아무런 연구결과도 제시되어 있지 않다. 본 논문에서는 gcd 연산을 이용한 조합 소수 검사 방법에 대해 확률적 분석을 이용하여 수행시간을 예측하고 수행시간을 최적화 하는 방법을 제안한다.

  • PDF