• 제목/요약/키워드: 예측정확도 비교

Search Result 1,150, Processing Time 0.041 seconds

Protein Secondary Structure System Design Using Clustering Protein Database and Data Distribution Scheme (클러스터링 단백질 데이터베이스와 데이터 분산 기법을 적용한 단백질 이차구조예측 시스템 설계)

  • 이수진;김재훈;정진원;이원태
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04a
    • /
    • pp.82-84
    • /
    • 2003
  • 생물학 데이터베이스의 크기가 점점 증가함에 따라 데이터베이스를 사용하여 서열을 정렬할 경우 많은 처리시간이 필요하게 되었다. 단백질 이차구조예측 시스템에서 단백질 서열 데이터베이스를 이용해 사용자의 서열들을 정렬하는 부분에서도 많은 처리 시간을 요구한다. 본 논문에서는 단백질 데이터베이스를 비슷한 크기로 나눠 여러 노드에서 서열 정렬을 분산 처리하여 처리율을 높이고자 했다. 또한, ClustalW에서 서열들의 관계에 따라 다양한 BLOSUM을 사용하여 정렬의 정확도를 높이는 휴리스틱 전략을 적용하기 위해 기존의 데이터베이스를 클러스터링 하였다. 클러스터링된 데이터베이스의 대표서열과 사용자 서열의 거리를 비교하여 적합한 BLOSUM을 선택하여 보다 정확한 서열 정렬을 통해 단백질 이차구조예측의 정확도를 높이게 될 것이다. 본 논문에서는 대용량의 단백질 데이터베이스를 여러 노드를 사용하여 병렬 클러스터링하여 이를 이차구조예측 시스템에 적용하여 처리율과 정확도를 높이고자 하였다.

  • PDF

Development and Evaluation of Machine Learning-based Prediction Models for Wastewater Treatment Plant (머신러닝 기반의 하수처리장 예측 모델 평가 및 개발)

  • Kyu Dae Shim;Hyo Sang Kim;Geun Soo Chang;Dong Kyun Kim;Young Mo Kim
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2023.05a
    • /
    • pp.499-499
    • /
    • 2023
  • 최근 컴퓨터 성능 향상과 새로운 머신러닝 알고리즘 개발됨에 따라, 각 분야별 연구자들이 이를 활용한 연구를 다양하게 수행하고 있으며, 하수처리시설의 경우에는 막대한 양의 운영자료가 축척됨에 따라 머신러닝을 활용한 다양한 연구가 가속화 되고 있다. 기존 하수처리장의 물리학적 모델은 적용된 영향 인자에 여러 가지 가정이 고려되어 모델 정확도가 부정확해지는 경향이 있었으며, 이러한 문제점을 보완하기 위해 하수처리장의 수집된 운영자료 및 머신러닝 기반의 예측 모델을 활용하여 예측 모델 정확도를 향상하는 선행 연구들이 진행되고 있다. A 하수처리장의 부지 내에 설치된 센서를 통하여 운영자료가 중앙제어실 서버에 실시간으로 저장되는 자료를 활용하여 NN (Neural Network), SVM (Support Vector Machine), RF (Random Forest) 등과 같은 다양한 머신러닝 모델을 적용하였고, 하수처리장 운영자료를 적용할 경우 어느 모델이 가장 높은 성능이 나타나는지 인사이트를 도출하고자 하였다. 금회 연구는 A 하수처리장을 대상으로 여러 머신러닝 기반 예측 모델을 개발하고, 각 모델의 예측정확도를 서로 평가함으로써, 머신러닝 모델 최적화를 수행할 수 있었다. 이번 연구에서 도출된 결과를 활용하여 하수처리장 예측 모델 최적화를 진행할 경우, 향후 비교적 짧은 시간에 하수처리장 머신러닝 기반 예측 모델 개발이 가능하다는 점에 의의가 있다.

  • PDF

Improvement of flood-stage forecast using the HPG in the lower Nakdong River (HPG를 이용한 낙동강 하류구간 홍수위 예측 정확도 개선)

  • Kim, Ji-Sung;Kim, Won;Choi, Kyu Hyun;Kim, Keuk Soo;Kim, Tae-Hyung
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2016.05a
    • /
    • pp.242-242
    • /
    • 2016
  • 낙동강 하류구간인 남강합류점에서 낙동강하구둑까지는 하상경사가 약 1/10,000보다 작은 매우 완만한 경사를 이루고 있으므로 홍수기 고수위를 장시간 유지하는 등 홍수소통에 불리한 조건을 가지고 있다. 이처럼 하상경사가 매우 완만한 하천에서는 홍수파의 전파 특성이 하상경사, 수심경사, 그리고 이송가속도와 국부가속도 경사 등 운동량 방정식의 각 항 모두에 영향을 크게 받는 것으로 알려져 있다. 따라서, 낙동강 하류구간의 홍수분석 정확도 개선을 위해서는 대상구간에 유입하는 홍수수문량의 크기 및 변화를 정확히 반영하는 것이 무엇보다 중요하다. 하천 본류로 유입하는 지류의 홍수량을 산정하는 보편적인 방법은 지류 하류의 수위관측소에서 구축된 수위-유량관계곡선을 이용하는 것이다. 그러나 본류 수위의 배수영향을 받는 지류 하류 구간에서는 단일 수위-유량관계의 결정이 불가능하므로 지류 유출량 산정을 위한 새로운 방법이 필요하다. 본 연구에서는 낙동강 하류구간(창녕 함안보~낙동강하구둑) 유역면적의 약 45% 이상을 차지하는 밀양강 유역의 홍수기 유출량 산정을 위하여 HPG(Hydraulic Performance Graph)를 이용하였다. HPG는 배수영향을 받아 시시각각 수리특성이 변화하는 구간에서도 유량 및 상하류 수위 등 수리특성 추정에 합리적인 결과를 제공하는 것으로 알려져 있다. 2012년 태풍 산바 사상을 대상으로 HPG를 이용하여 산정한 밀양강 홍수량과 기존 수위-유량관계로 산정한 홍수량을 각각 경계조건으로 사용한 경우로 구분하여, 낙동강 하류구간 주요 지점인 삼랑진과 구포의 홍수위 예측 정확도를 비교하였다. 비교결과, 기존 방법과 HPG를 이용한 방법 모두 예측시점이 첨두발생 시각에 가까워질수록 평균오차가 감소하는 것으로 분석되었다. 그러나 기존 방법은 예측시점에 따라 평균오차의 변화가 단조롭지 않고 진동이 발생한 반면, HPG를 이용한 방법은 기존 방법보다 오차의 감소가 단조롭고 지속적인 것으로 나타났으며 평균오차 또한 작았다. 본 연구결과, 배수영향을 받는 지류 하류구간에서 HPG를 이용한 유입량 산정은 본류 홍수위 예측 정확도 개선을 위한 경제적인 대안이 될 것으로 판단된다.

  • PDF

User Similarity-based Path Prediction Method (사용자 유사도 기반 경로 예측 기법)

  • Nam, Sumin;Lee, Sukhoon
    • The Journal of Korean Institute of Information Technology
    • /
    • v.17 no.12
    • /
    • pp.29-38
    • /
    • 2019
  • A path prediction method using lifelog requires a large amount of training data for accurate path prediction, and the path prediction performance is degraded when the training data is insufficient. The lack of training data can be solved using data of other users having similar user movement patterns. Therefore, this paper proposes a path prediction algorithm based on user similarity. The proposed algorithm learns the path in a triple grid pattern and measures the similarity between users using the cosine similarity technique. Then, it predicts the path with applying measured similarity to the learned model. For the evaluation, we measure and compare the path prediction accuracy of proposed method with the existing algorithms. As a result, the proposed method has 66.6% accuracy, and it is evaluated that its accuracy is 1.8% higher than other methods.

Prediction of module temperature and photovoltaic electricity generation by the data of Korea Meteorological Administration (데이터를 활용한 태양광 발전 시스템 모듈온도 및 발전량 예측)

  • Kim, Yong-min;Moon, Seung-Jae
    • Plant Journal
    • /
    • v.17 no.4
    • /
    • pp.41-52
    • /
    • 2021
  • In this study, the PV output and module temperature values were predicted using the Meteorological Agency data and compared with actual data, weather, solar radiation, ambient temperature, and wind speed. The forecast accuracy by weather was the lowest in the data on a clear day, which had the most data of the day when it was snowing or the sun was hit at dawn. The predicted accuracy of the module temperature and the amount of power generation according to the amount of insolation decreased as the amount of insolation increased, and the predicted accuracy according to the ambient temperature decreased as the module temperature increased as the ambient temperature increased and the amount of power generated lowered the ambient temperature. As for wind speed, the predicted accuracy decreased as the wind speed increased for both module temperature and power generation, but it was difficult to define the correlation because wind speed was insignificant than the influence of other weather conditions.

실시간 수문자료의 특성분리를 통한 예측성능의 향상

  • Hwang, Seok-Hwan;Kim, Chi-Yeong;Cha, Jun-Ho;Jeong, Seong-Won
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2011.05a
    • /
    • pp.128-128
    • /
    • 2011
  • 본 연구에서는 자동유량측정시설에 의하여 실시간으로 생산되는 자동유량측정 자료의 정상성 여부를 판단하는데 중요한 적정 측정 신뢰구간을 실시간으로 예측할 수 있는 기술을 개발하였다. 전세계적으로, 현대적인 유량측정이 시작된 이래 연속유량 산정을 위한 방법은 수위-유량관계곡선을 이용하는 방법 외에 실무적으로 활용 가능한 방법은 거의 전무한 실정이다. 수위-유량관계곡선을 이용하는 방법은 연속수위를 계측하여 이에 해당하는 연속유량을 산정하는 방법으로 수위와 유량간에 일정한 관계를 가지는 정상적인 흐름을 보이는 자연하천의 경우에 정확도가 매우 높다. 그러나 감조나 구조물 등에 의해 유량이 조절되는 경우에 유량산정의 정확도는 현저히 떨어지게 된다. 따라서 수위에서 유량을 환산하는 방법이 아닌 유량을 직접 연속으로 측정하는 방법이 꾸준히 연구되어 왔고, 이 중 가장 대표적인 방법이 자동유량측정 방법이다. 그러나 자동유량측정 방법은 유량을 연속으로 측정할 수 있다는 장점에 반해 측정된 유량의 정확도를 높이기가 매우 어렵다는 단점도 가지고 있다. 계측 자체의 기술적 한계는 주로 계측기기적인 문제로 이는 전자기, 통신 기술 등 첨단 기술의 발전과 함께 다양한 현장 시험을 통해 폭넓은 개선이 이루어지고 있다. 그러나 아직 기술적 완성도가 완전하지 못한 현실에서, 현재 설치되어 있는 자동유량측정 유량자료의 신뢰도를 높이기 위해서는 각각의 계측 시점에서 자료가 정상적으로 산정되고 있는지에 대한 검정이 필요하고, 이는 자동유량측정 자료의 정확도 확보에 매우 중요한 관건으로 작용할 수밖에 없다. 이러한 배경에서 본 연구에서는 조석성분과 유출성분을 분리하여 예측하는 방법을 새롭게 개발 적용하였다. 자료는 자료의 시간해상도 증감에 따른 실제 예측의 정확도 증감을 고려하여 가장 적절하다고 판단되는 시자료를 사용하였으며, 자료간 상관을 분석하여 주 입력 자료로 팔당댐 방류량, 한강대교 지점 수위, 전류 수위를 이용하였다. 모형의 예측 능력을 극대화하기 위하여 조석 영향을 받는 자료의 경우는 웨이블릿 변환(wavelet transform)을 이용하여 순수 유출성분과 조위성분을 분리하여 별도로 적용하였다. 그리고 예측을 위한 모형은 실시간 자료기반 모형으로 그 안정성이 인정된 서포트벡터머신(support vector machine)을 이용하였다. 이러한 과정을 통해 한강대교 지점의 순수 유출성분과 조위성분의 유량을 각각 예측한 후 두 결과를 합성하여 최종 한강 대교 지점의 유량을 산정하였다. 조석성분을 분리하여 한강대교 지점의 유량을 예측한 결과 대부분의 예측치가 95% 예측구간에 포함되었다. 그리고 조석성분을 분리하지 않은 모형과 조석성분을 분리한 모형의 예측 능력을 비교한 결과, 조석성분을 분리한 모형이 예측이 정확도가 높았다. RMSE의 경우 분리하지 않은 모형대비 23%의 예측오차가 감소하였고, NSC의 경우 0.92에서 0.95로 예측의 정확도가 증가하였다.

  • PDF

Development of Highway Traffic Information Prediction Models Using the Stacking Ensemble Technique Based on Cross-validation (스태킹 앙상블 기법을 활용한 고속도로 교통정보 예측모델 개발 및 교차검증에 따른 성능 비교)

  • Yoseph Lee;Seok Jin Oh;Yejin Kim;Sung-ho Park;Ilsoo Yun
    • The Journal of The Korea Institute of Intelligent Transport Systems
    • /
    • v.22 no.6
    • /
    • pp.1-16
    • /
    • 2023
  • Accurate traffic information prediction is considered to be one of the most important aspects of intelligent transport systems(ITS), as it can be used to guide users of transportation facilities to avoid congested routes. Various deep learning models have been developed for accurate traffic prediction. Recently, ensemble techniques have been utilized to combine the strengths and weaknesses of various models in various ways to improve prediction accuracy and stability. Therefore, in this study, we developed and evaluated a traffic information prediction model using various deep learning models, and evaluated the performance of the developed deep learning models as a stacking ensemble. The individual models showed error rates within 10% for traffic volume prediction and 3% for speed prediction. The ensemble model showed higher accuracy compared to other models when no cross-validation was performed, and when cross-validation was performed, it showed a uniform error rate in long-term forecasting.

Development of Artificial Neural Network Model for Prediction of Water Quality Parameters in Large Rivers with Tributary Inflow (지천유입이 있는 대하천에서 수질예측을 위한 인공신경망모델의 개발)

  • Seo, Il Won;Yun, Se Hun
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.141-141
    • /
    • 2017
  • 본 연구에서는 대하천의 8개의 수질인자(수온, 용존산소, 수소이온농도, 전기전도도, 총질소, 총인, 탁도, 클로로필-a)를 예측할 수 있는 인공신경망모델을 개발하였다. 인공신경망모델(ANN)은 수질데이터가 가지는 불확실성 및 비정상성, 복잡한 상호관련성에 효과적으로 대응할 수 있는 데이터기반 모델이다. 데이터기반 모델의 특성상 예측정확도를 높이기 위해서 양질의 입력데이터를 구성하는 것이 가장 중요하다. 때문에 각각의 수질인자뿐만 아니라 기상학적 인자 또한 예측을 위한 입력자료로 사용하였으며, 요인분석 및 층화표층추출법을 적용하여 입력데이터를 구성하였고 앙상블기법을 이용하여 추가적으로 예측의 정확도를 향상시켰다. 개발된 모델을 이용하여 지천유입이 있는 북한강의 수질자료를 예측한 결과 탁도를 제외한 7개의 수질인자 모두 0.85 이상의 설명력을 보였으며, 실측값과 예보값을 비교해본 결과 평균적으로 10% 미만의 에러값을 나타냈다. 요인분석을 통하여 연관성있는 인자를 입력인자로 추가한 경우 향상된 결과값을 보였주었으며, 앙상블기법을 적용한 결과 정확도 면에서 큰 향상을 보여주었다.

  • PDF

Development of Machine Learning Prediction Models for Wastewater Treatment Plant considering Data Pre-processing (데이터 전처리를 고려한 하수처리장 머신러닝 모델 개발)

  • Kyu Dae Shim;;Chan Soo Park;Dong Kyun Kim;Shin Geol Kim
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2023.05a
    • /
    • pp.495-495
    • /
    • 2023
  • 본 연구는 하수처리장 운영시스템 자료를 활용하여, 머신러닝 기반의 예측 모델을 개발하고, 모델 정확도 향상에 대하여 검토하였다. 하수처리장에 설치된 각종 센서를 통해 실시간으로 자료가 모니터링되고 있으며, 수집된 자료는 운영시스템에 저장된다. 하수처리장 시스템은 설정된 값과 센서의 측정값을 비교해 이상치가 발생하면 운영자가 즉각적으로 조치하여 문제를 해결하고 있으나, 비정상적인 상황 발생시 이를 대처할 시간이 부족하여 적절한 조치가 이루어지지 못하는 경우가 발생 되고 있다. 따라서, 이러한 문제점을 해결하기 위해 A 하수처리장 운영자료를 활용하여 결과 예측이 신속하고 신뢰도 높은 머신러닝 기반의 예측 모델을 개발하고자 하였다. 모델의 예측 정확도 및 신뢰성을 향상하기 위하여 결과에 영향을 미치는 주요 영향 인자를 분석하고, 이를 기반으로 모델의 추가 분석 및 개선을 수행하여 모델의 예측력을 평가하였다. 금회 연구는 데이터 전처리를 과정을 통한 인사이트를 도출하고 이를 활용하여 하수처리장 운영자료 예측 정확도를 높일 수 있었으며, 이 결과를 바탕으로 다른 하수처리장의 모델 개발시에도 유용하게 활용이 가능할 것으로 검토되었다.

  • PDF

Variable Input Gshare Predictor based on Interrelationship Analysis of Instructions (명령어 연관성 분석을 통한 가변 입력 gshare 예측기)

  • Kwak, Jong-Wook
    • Journal of the Korea Society of Computer and Information
    • /
    • v.13 no.4
    • /
    • pp.19-30
    • /
    • 2008
  • Branch history is one of major input vectors in branch prediction. Therefore, the Proper use of branch history plays a critical role of improving branch prediction accuracy. To improve branch prediction accuracy, this paper proposes a new branch history management policy, based on interrelationship analysis of instructions. First of all, we propose three different algorithms to analyze the relationship: register-writhing method, branch-reading method, and merged method. Then we additionally propose variable input gshare predictor as an implementation of these algorithms. In simulation part, we provide performance differences among the algorithms and analyze their characteristics. In addition, we compare branch prediction accuracy between our proposals and conventional fixed input predictors. The performance comparison for optimal input branch predictor is also provided.

  • PDF