• 제목/요약/키워드: Model Ensemble

검색결과 650건 처리시간 0.028초

완전지도 시간적 행동 검출에서 역재생 비디오를 이용한 양방향 정보 학습 방법 (A Bi-directional Information Learning Method Using Reverse Playback Video for Fully Supervised Temporal Action Localization)

  • 권희원;조혜정;조선희;정찬호
    • 전기전자학회논문지
    • /
    • 제28권2호
    • /
    • pp.145-149
    • /
    • 2024
  • 최근 시간적 행동 검출 연구가 활발히 진행되고 있다. 시간적 행동 검출 연구의 한 분야인 오프라인 행동 검출은 온라인 행동 검출과 달리 비디오를 한번에 입력으로 받는다. 이를 통해 오프라인 행동 검출은 양방향 정보를 이용할 수 있으며 또한 이를 학습하기 위해 Bi-directional LSTM을 주로 사용한다. 본 논문에서는 기존 방법과 달리 완전지도 시간적 행동 검출에서 역재생 비디오를 생성하고 이를 통해 양뱡향 정보를 학습하는 방법을 제안한다. 구체적으로 역재생 비디오와 순재생 비디오를 함께 학습 데이터로 구성하는 방법과 각각 모델에 학습시킨 후 두 모델을 앙상블 모델로 구성하는 방법을 제안하였다. 제안하는 방법의 성능 평가를 위해 TALLFormer 모델을 이용하여 THUMOS-14 데이터셋에 대한 실험을 진행하였다. 역재생 및 순재생 비디오를 학습 데이터로 구성한 경우 기존 방법에 비해 5.1% 낮은 성능을, 모델 앙상블을 진행했을 경우 1.9% 우수한 성능을 보였다.

수치 예측 알고리즘 기반의 풍속 예보 모델 학습 (Learning Wind Speed Forecast Model based on Numeric Prediction Algorithm)

  • 김세영;김정민;류광렬
    • 한국컴퓨터정보학회논문지
    • /
    • 제20권3호
    • /
    • pp.19-27
    • /
    • 2015
  • 대체 에너지 기술 개발을 위해 지난 20년 동안 풍력 발전에 관련한 기술들이 축적되어왔다. 풍력 발전은 자연적으로 부는 바람을 에너지원으로 사용하므로 환경 친화적이며 경제적이다. 이러한 풍력 발전의 효율적인 운영을 위해서는 시시각각 변하는 자연 바람의 세기를 정확도 높게 예측할 수 있어야 한다. 풍속을 평균적으로 얼마나 정확하게 잘 예측하는지도 중요하지만 실제 값과 예측 값의 절대 오차의 최댓값을 최소화시키는 것 또한 중요하다. 발전 운영 계획 측면에서 예측 풍속을 통한 예측 발전량과 실제 발전량의 차이는 경제적 손실을 가져오는 원인이 되므로 유연한 운영 계획을 세우기 위해 최대 오차가 중요한 역할을 한다. 본 논문에서는 풍속 예측 방법으로 과거 풍속 변화 추세뿐만 아니라 기상청 예보와 시기적인 풍속의 특성을 고려하기 위한 경향 값을 반영하여 수치 예측 알고리즘으로 학습한 풍속 예보 모델을 제안한다. 기상청 예보는 풍력 발전 단지를 포함하는 비교적 넓은 지역의 풍속을 예보하지만 풍속을 예측하고자 하는 국소지점에 대한 풍속 예측의 정확도를 높이는데 상당히 기여한다. 또한 풍속 변화 추세는 긴 시간동안 관측한 풍속을 세세하게 반영할수록 풍속 예측의 정확도를 높인다.

고차원 관측자료에서의 Q-학습 모형에 대한 이중강건성 연구 (Doubly-robust Q-estimation in observational studies with high-dimensional covariates)

  • 이효빈;김예지;조형준;최상범
    • 응용통계연구
    • /
    • 제34권3호
    • /
    • pp.309-327
    • /
    • 2021
  • 동적 치료 요법(dynamic treatment regimes; DTRs)은 다단계 무작위 시험에서 개인에 맞는 치료를 제공하도록 설계된 의사결정 규칙이다. 모든 개인이 동일한 유형의 치료를 처방받는 고전적인 방법과 달리 DTR은 시간이 지남에 따라 변할 수 있는 개별 특성을 고려한 환자 맞춤형 치료를 제공한다. 최적의 치료 규칙을 파악하기 위한 회귀 기반 알고리즘 중 하나인 Q-학습 방법은 쉽게 구현될 수 있기 때문에 더욱 인기를 끌고 있다. 그러나 Q-학습 알고리즘의 성능은 Q-함수를 제대로 설정했는지의 여부에 크게 의존한다. 본 논문에서는 고차원 데이터가 수집되는 DTRs 문제에 대한 다양한 이중강건 Q-학습 알고리즘을 연구하고 가중 최소제곱 추정 방법을 제안한다. 이중강건성(double-robustness)은 반응변수에 대한 모형 혹은 처리변수에 대한 모형 둘 중 하나만 제대로 설정되어도 불편추정량을 얻을 수 있음을 의미한다. 다양한 모의실험 연구를 통해 제안된 방법이 여러 시나리오 하에서도 잘 작동함을 확인하였으며 실제 데이터 예제를 통해 방법론에 대한 예시를 제시하였다.

쉴드 TBM 데이터와 머신러닝 분류 알고리즘을 이용한 암반 분류 예측에 관한 연구 (A Study on the Prediction of Rock Classification Using Shield TBM Data and Machine Learning Classification Algorithms)

  • 강태호;최순욱;이철호;장수호
    • 터널과지하공간
    • /
    • 제31권6호
    • /
    • pp.494-507
    • /
    • 2021
  • TBM의 활용이 증가하면서 최근 국내에서도 머신러닝 기법으로 TBM 데이터를 분석하여 TBM 전방의 지반을 예측하고 디스크커터의 교환주기 예측 및 굴진율을 예측하는 연구가 수행되고 있다. 본 연구에서는 TBM 굴진 시 기계 데이터를 대상으로 전통적 암반에 대한 분류 기법과 최근에 다양한 분야에서 널리 사용되고 있는 머신러닝 기법들을 접목하여 슬러리 쉴드 TBM 현장의 암반 특성에 대한 분류 예측을 하였다. 암반 특성 분류 기준 항목을 RQD, 일축압축강도, 탄성파속도로 설정하고 항목별 암반상태를 클래스 0(양호),1(보통),2(불량)의 3개 클래스로 구분한 다음, 6개의 분류 알고리즘에 대한 기계학습을 수행하였다. 그 결과, 앙상블 계열의 모델이 좋은 성능을 보여주었고 특히 학습성능과 더불어 학습속도에서 우수한 결과를 보인 LigthtGBM 모델이 대상 현장 지반에서 최적인 것으로 나타났다. 본 연구에서 설정한 3가지 암반 특성에 대한 분류 모델을 활용하면 지반정보가 제공되지 않은 구간에 대한 암반 상태를 제공할 수 있어 굴착작업 시 도움을 줄 수 있을 것으로 판단된다.

효율적 수입식품 검사를 위한 머신러닝 기반 부적합 건강기능식품 탐지 방법 (A Method of Machine Learning-based Defective Health Functional Food Detection System for Efficient Inspection of Imported Food)

  • 이경수;박예린;신윤종;손권상;권오병
    • 지능정보연구
    • /
    • 제28권3호
    • /
    • pp.139-159
    • /
    • 2022
  • 코로나19 이후 건강기능식품의 관심이 높아짐에 따라 수입 식품 안전성 검사의 중요성도 더욱 커지고 있다. 그러나 매년 증가하는 건강기능식품 수입량과 반대로 식품 검사에 필요한 예산과 인력은 한계점에 다다르고 있다. 따라서 본 연구의 목적은 수출입 식품 중 건강기능식품을 대상으로 데이터의 특성을 살펴보고, 판별의 정확성과 결과의 설명 가능성을 고려하여 효율적으로 부적합 식품을 탐지할 수 있는 기계학습 모델 기반 자동화 시스템 설계 방안을 제시하는 것이다. 이를 위해 첫째, 부적합 판정에 영향을 미치는 식품 검사 데이터로부터 부적합 판정에 유의한 파생변수를 생성하며, 둘째, 건강기능식품 수출입 검사 데이터에 대한 탐색적 분석을 통해 클래스 불균형과 비선형성 등을 고려하여 영향변수를 선정하며, 셋째, 다양한 머신러닝 기법을 적용하여 모델 별 성능과 해석가능성에 대해 비교를 수행하고자 한다. 성능 분석 결과, 앙상블 모델이 가장 우수하였으며, 본 연구에서 제안하는 파생변수 및 모델이 수출입 식품 검사에서 활용하고 있는 시스템에 도움이 될 수 있음을 확인하였다.

신재생 에너지 최적 활용을 위한 축열조 온도 예측 모델 연구 (A Study on the Thermal Prediction Model cf the Heat Storage Tank for the Optimal Use of Renewable Energy)

  • 오한별;장경민;오지영;이명배;박장우;조용윤;신창선
    • 스마트미디어저널
    • /
    • 제12권10호
    • /
    • pp.63-70
    • /
    • 2023
  • 최근 스마트팜 에너지 비용 중 35% 낸난방비 에너지 소비가 증가되어 에너지 소비 효율화가 요구되며, 전기료 현실화에 대한 우려로 신재생 에너지 중요성이 증가하고 있다. 신재생 에너지는 수력, 풍력, 태양광 등에 속하며, 이중 태양광 에너지는 전기에너지로 변환하는 발전기술로, 이 기술은 에너지원이 환경에 미치는 영향이 적고, 유지 보수가 간편하다는 특징을 갖고 있다. 본 연구에서는 온실 축열조, 히트펌프 데이터 기반으로 축열조 영향을 많이 미치는 요소를 선정하고 축열조 공급 온도예측 모델을 개발하고자 한다. 시계열 데이터 분석 및 예측에 효과적인 LSTM(Long Short-Term Memory)과 다른 앙상블 학습 기법보다 뛰어난 XGBoost 모델을 이용하여 예측한다. 히트펌프 축열조 온도를 예측함으로써 에너지 소비를 최적화하여 시스템 운영을 최적화할 수 있다. 또한, 태양광 활용에 따른 냉난방비 절감 및 농가의 에너지 자립도 개선 등 스마트팜 에너지 통합 운영 시스템에 연계하고자 한다. 플랫폼을 통해 폐열 에너지의 공급을 관리하고 최대 난방부하 및 계절, 시간별 작물생장에 필요한 에너지값을 도출하여 이를 기반으로 최적 에너지 운용방안을 도출하고자 한다.

합성곱 신경망을 이용한 주가방향 예측: 상관관계 속성선택 방법을 중심으로 (Stock Price Direction Prediction Using Convolutional Neural Network: Emphasis on Correlation Feature Selection)

  • 어균선;이건창
    • 경영정보학연구
    • /
    • 제22권4호
    • /
    • pp.21-39
    • /
    • 2020
  • 딥러닝(Deep learning) 기법은 패턴분석, 이미지분류 등 다양한 분야에서 높은 성과를 나타내고 있다. 특히, 주식시장 분석문제는 머신러닝 연구분야에서도 어려운 분야이므로 딥러닝이 많이 활용되는 영역이다. 본 연구에서는 패턴분석과 분류능력이 높은 딥러닝의 일종인 합성곱신경망(Convolutional Neural Network) 모델을 활용하여 주가방향 예측방법을 제안한다. 추가적으로 합성곱신경망 모델을 효율적으로 학습시키기 위한 속성선택(Feature Selection, FS)방법이 적용된다. 합성곱신경망 모델의 성과는 머신러닝 단일 분류기와 앙상블 분류기를 벤치마킹하여 객관적으로 검증된다. 본 연구에서 벤치마킹한 분류기는 로지스틱 회귀분석(Logistic Regression), 의사결정나무(Decision Tree), 인공신경망(Neural Network), 서포트 벡터머신(Support Vector Machine), 아다부스트(Adaboost), 배깅(Bagging), 랜덤포레스트(Random Forest)이다. 실증분석 결과, 속성선택을 적용한 합성곱신경망이 다른 벤치마킹 분류기보다 분류 성능이 상대적으로 높게 나타났다. 이러한 결과는 합성곱신경망 모델과 속성선택방법을 적용한 예측방법이 기업의 재무자료에 내포된 가치를 보다 정교하게 분석할 수 있는 가능성이 있음을 실증적으로 확인할 수 있었다.

텍스트마이닝을 활용한 종분포모형의 국내 연구 동향 파악 (Trends identification of species distribution modeling study in Korea using text-mining technique)

  • 김동주;권용성;한나연;이도훈
    • 환경생물
    • /
    • 제41권4호
    • /
    • pp.413-426
    • /
    • 2023
  • 종분포모형은 생물다양성 보전 및 기후변화 영향평가 등을 위해 활발히 이용되는 방법론이며, 국내에서도 다양한 연구가 진행되고 있으나, 관련 연구 현황과 최근의 동향을 파악하고 시사점을 논의하여 미래 연구에 유용한 정보를 제공하는 연구는 부족한 실정이다. 본 연구에서는 국내의 학술지에서 출판된 학술논문을 대상으로 종분포모형의 활용 동향과 흐름을 파악하여 향후 관련 연구에서 활용될 수 있는 기초적인 정보를 제공하고자 하였다. 우리는 국내의 관련 학술논문을 수집하여 문헌학적 방법과 텍스트마이닝을 통해 분석했고 이를 토대로 종분포모형 관련 연구현황과 최근의 동향을 파악하였다. 국내 종분포모형 관련 학술논문은 1998년부터 2023년까지 총 148편이 출판되었으며, 그중 115편(77.7%)은 2015년 이후 출판된 것으로 나타났다. 다양한 알고리즘 중 MaxEnt 모델이 가장 많이 활용되었으며(44.5%), 식물을 대상으로 한 연구와 생물종 분포 및 평가, 기후변화와 관련된 주제가 주요 주제로 다루어졌다. 텍스트마이닝 분석에서 가장 많이 출현한 핵심어는 "Climate change"로 다양한 연구 주제에서 기후변화로 인한 생물다양성 변화를 고려하였다. 향후 종분포모형의 활용에는 다양한 조건에 따른 최적의 모형 선택, 모형 간 연계, 정량적인 입력 변수의 개발 등을 고려할 필요가 있으며, 현지 조사 자료의 수집 체계 개선 등을 도모하면 생물 다양성 보전과 기후 대응 등 국가 정책 수요에 유용하게 활용될 수 있는 과학적 도구로써 기여가 가능할 것으로 판단된다.

이질성 학습을 통한 문서 분류의 정확성 향상 기법 (Improving the Accuracy of Document Classification by Learning Heterogeneity)

  • 윌리엄;현윤진;김남규
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.21-44
    • /
    • 2018
  • 최근 인터넷 기술의 발전과 함께 스마트 기기가 대중화됨에 따라 방대한 양의 텍스트 데이터가 쏟아져 나오고 있으며, 이러한 텍스트 데이터는 뉴스, 블로그, 소셜미디어 등 다양한 미디어 매체를 통해 생산 및 유통되고 있다. 이처럼 손쉽게 방대한 양의 정보를 획득할 수 있게 됨에 따라 보다 효율적으로 문서를 관리하기 위한 문서 분류의 필요성이 급증하였다. 문서 분류는 텍스트 문서를 둘 이상의 카테고리 혹은 클래스로 정의하여 분류하는 것을 의미하며, K-근접 이웃(K-Nearest Neighbor), 나이브 베이지안 알고리즘(Naïve Bayes Algorithm), SVM(Support Vector Machine), 의사결정나무(Decision Tree), 인공신경망(Artificial Neural Network) 등 다양한 기술들이 문서 분류에 활용되고 있다. 특히, 문서 분류는 문맥에 사용된 단어 및 문서 분류를 위해 추출된 형질에 따라 분류 모델의 성능이 달라질 뿐만 아니라, 문서 분류기 구축에 사용된 학습데이터의 질에 따라 문서 분류의 성능이 크게 좌우된다. 하지만 현실세계에서 사용되는 대부분의 데이터는 많은 노이즈(Noise)를 포함하고 있으며, 이러한 데이터의 학습을 통해 생성된 분류 모형은 노이즈의 정도에 따라 정확도 측면의 성능이 영향을 받게 된다. 이에 본 연구에서는 노이즈를 인위적으로 삽입하여 문서 분류기의 견고성을 강화하고 이를 통해 분류의 정확도를 향상시킬 수 있는 방안을 제안하고자 한다. 즉, 분류의 대상이 되는 원 문서와 전혀 다른 특징을 갖는 이질적인 데이터소스로부터 추출한 형질을 원 문서에 일종의 노이즈의 형태로 삽입하여 이질성 학습을 수행하고, 도출된 분류 규칙 중 문서 분류기의 정확도 향상에 기여하는 분류 규칙만을 추출하여 적용하는 방식의 규칙 선별 기반의 앙상블 준지도학습을 제안함으로써 문서 분류의 성능을 향상시키고자 한다.

부스팅 트리에서 적정 트리사이즈의 선택에 관한 연구 (The guideline for choosing the right-size of tree for boosting algorithm)

  • 김아현;김지현;김현중
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권5호
    • /
    • pp.949-959
    • /
    • 2012
  • 범주형 목표변수를 잘 예측하기 위한 데이터마이닝 방법 중에서 최근에는 여러 단일 분류자를 결합한 앙상블 기법이 많이 활용되고 있다. 앙상블 기법 가운데 부스팅은 재표본 시 분류하기 어려운 관찰치의 가중치를 높여 분류자가 해당 관찰치에 보다 집중할 수 있도록 함으로써 다른 앙상블 기법에 비해 오차를 효과적으로 감소시키는 방법으로 알려져 있다. 부스팅을 구성하는 분류자를 의사결정나무로 둔 부스팅 트리 모형의 경우 각 트리의 사이즈를 결정해야 하는데, 본 연구에서는 자료 별로 부스팅 트리에 가장 적합한 트리사이즈가 서로 다를수 있다고 가정하고, 주어진 자료에 맞는 트리사이즈를 추정하는 문제에 대해 논의하였다. 우선 트리사이즈가 부스팅 트리의 정확도에 중요한 영향을 미치는가를 파악하기 위하여 28개의 자료를 대상으로 실험을 수행하였으며, 그 결과 트리사이즈를 결정하는 문제가 모형 전체의 성능을 결정하는데 상당한 역할을 한다는 것을 확인할 수 있었다. 또한 그 결과를 바탕으로 최적의 트리사이즈에 영향을 미칠 것으로 판단되는 몇 가지 특성 변수를 정의하고, 해당 변수를 이용하여 부스팅 트리에서의 최적 트리사이즈를 설명하는 모형을 구성해 보았다. 자료 별로 고유한 최적의 트리사이즈는 자료의 특성에 의존적일 가능성도 있으므로 본 연구에서 제안하는 추정방법은 최적 트리사이즈를 결정하기 위한 출발점 또는 가이드라인으로 활용하는 것이 적절할 것이다. 기존에는 부스팅 트리의 사이즈에 대한 값으로 목표변수의 범주의 개수를 활용하였는데, 본 모형에서 제안하는 트리사이즈의 추정치로 부스팅 트리를 구축한 경우 기존방법에 비해 분류정확도를 유의미하게 개선하는 것을 확인할 수 있었다.