• 제목/요약/키워드: 간이 예측 모델

검색결과 1,404건 처리시간 0.033초

이미지 비유사도 기반의 개인화된 하이브리드 의류 추천 모델 (Personalized Hybrid Outfit Recommendation Based on Image Dissimilarity)

  • 양정원;백지혜;김현희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.459-460
    • /
    • 2023
  • 기존의 추천시스템은 상품간 혹은 사용자 간의 유사도를 기반으로 작동한다. 하지만 이는 사용자가 유사한 상품 추천 속에 갇히게 되는 필터 버블의 문제와 추천시스템의 고질적인 문제인 데이터 희소성 문제를 피할 수 없게 된다. 따라서 본 연구에서는 사용자의 취향과 체형 정보를 반영하여 사용자의 평점을 예측하는 협업 필터링 기반 딥러닝 추천과 상품간 비유사성을 고려하여 사용자의 평점을 예측하는 내용 기반 추천을 혼합한 하이브리드 추천 모델을 구축하여 기존 추천시스템의 문제점을 해결하였다. 모델의 성능평가를 위해 인터넷 의류 쇼핑몰을 대상으로 유사한 이미지를 활용한 하이브리드 추천 모델과 NDCG 값을 비교하였고 유사도가 낮은 이미지를 활용한 모델이 더 우수한 성능을 보였다. 이는 다른 제품과는 달리 소비자가 의류를 구매할 경우 이미 구매한 상품과 유사한 상품보다는 유사하지 않은 상품을 구매할 가능성이 크다는 것을 보여준다.

호가창(Limit Order Book)과 뉴스 헤드라인을 이용한 딥러닝 기반 주가 변동 예측 (Deep Learning-based Stock Price Prediction Using Limit Order Books and News Headlines)

  • 류의림;김채현;이기용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.541-544
    • /
    • 2021
  • 본 논문은 어떤 기업의 주식 주문 정보를 담고 있는 호가창(limit order book)과 해당 기업과 관련된 뉴스 헤드라인을 사용하여 해당 기업의 주가 등락을 예측하는 딥러닝 기반 모델을 제안한다. 제안 모델은 호가창의 중기 변화와 단기 변화를 모두 고려하는 한편, 동기간 발생한 뉴스 헤드라인까지 예측에 고려함으로써 주가 등락 예측 정확도를 높인다. 제안 모델은 호가창의 변화의 특징을 CNN(convolutional neural network)으로 추출하고 뉴스 헤드라인을 Word2vec으로 생성된 단어 임베딩 벡터를 사용하여 나타낸 뒤, 이들 정보를 결합하여 특정 기업 주식의 다음 날 등락여부를 예측한다. NASDAQ 실데이터를 사용한 실험을 통해 제안 모델로 5개 종목(Amazon, Apple, Facebook, Google, Tesla)의 일일 주가 등락을 예측한 결과, 제안 모델은 기존 방법에 비해 정확도를 최대 17.14%, 평균 10.7% 향상시켰다.

계층적 능동형태 모델을 이용한 비정형 객체의 움직임 예측형 실시간 추적 (Hierarchical Active Shape Model-based Motion Estimation for Real-time Tracking of Non-rigid Object)

  • 강진영;이성원;신정호;백준기
    • 대한전자공학회논문지SP
    • /
    • 제41권5호
    • /
    • pp.1-11
    • /
    • 2004
  • 본 논문에서는 비정형 객체를 능동형태 모델을 사용하여 실시간으로 추적하기 위한 방법을 제시하였다. 객체를 추적 할 때, 가려진 부분의 윤곽을 추정해 낼 수 있는 능동형태 모델을 사용하였으며, 비디오의 각 프레임에서 처리과정의 시간을 줄이기 위해서 영상을 계층적으로 분리하여 실시간 처리를 가능하게 하였다 또한 다음 입력영상의 초기 윤곽을 효율적으로 찾기 위해서 칼만필터(Kalman filter)를 사용하여 특징점을 예측하였고, 블록 정합(block matching) 기법을 추가하여 예측 안정성을 향상시켰다. 비 계층적 방법, 비 예측 방법 등과 비교 실험을 통해서 제안된 계층적, 예측형 방식이 수렴속도 증가와 모델링의 정확도에서 모두 개선된 효과를 얻을 수 있음을 확인하였다.

데이터 전처리를 고려한 하수처리장 머신러닝 모델 개발 (Development of Machine Learning Prediction Models for Wastewater Treatment Plant considering Data Pre-processing)

  • 심규대;김효상;박찬수;김동균;김신걸
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.495-495
    • /
    • 2023
  • 본 연구는 하수처리장 운영시스템 자료를 활용하여, 머신러닝 기반의 예측 모델을 개발하고, 모델 정확도 향상에 대하여 검토하였다. 하수처리장에 설치된 각종 센서를 통해 실시간으로 자료가 모니터링되고 있으며, 수집된 자료는 운영시스템에 저장된다. 하수처리장 시스템은 설정된 값과 센서의 측정값을 비교해 이상치가 발생하면 운영자가 즉각적으로 조치하여 문제를 해결하고 있으나, 비정상적인 상황 발생시 이를 대처할 시간이 부족하여 적절한 조치가 이루어지지 못하는 경우가 발생 되고 있다. 따라서, 이러한 문제점을 해결하기 위해 A 하수처리장 운영자료를 활용하여 결과 예측이 신속하고 신뢰도 높은 머신러닝 기반의 예측 모델을 개발하고자 하였다. 모델의 예측 정확도 및 신뢰성을 향상하기 위하여 결과에 영향을 미치는 주요 영향 인자를 분석하고, 이를 기반으로 모델의 추가 분석 및 개선을 수행하여 모델의 예측력을 평가하였다. 금회 연구는 데이터 전처리를 과정을 통한 인사이트를 도출하고 이를 활용하여 하수처리장 운영자료 예측 정확도를 높일 수 있었으며, 이 결과를 바탕으로 다른 하수처리장의 모델 개발시에도 유용하게 활용이 가능할 것으로 검토되었다.

  • PDF

랜덤포레스트기법을 이용한 분변성대장균 예측모델 개발 (Development of fecal coliform prediction model using random forest method)

  • 서일원;최수연
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2016년도 학술발표회
    • /
    • pp.124-124
    • /
    • 2016
  • 하천에서의 분변성대장균은 분변성 오염 정도를 나타내는 지표로서, 이 농도가 높을수록 오염된 하천수와의 접촉을 통한 호흡기, 소화기 및 피부 관련 질병의 발발 확률이 높다고 알려져 있다. 따라서 하천에서의 수영, 수상스키 등과 같은 입수형 친수활동을 할 때, 분변성대장균 농도가 농도 기준 이하인지를 확인하고 이러한 정보를 친수활동에 이용할 필요가 있다. 그러나 분변성대장균의 경우, 현재 자동수질측정망에서 측정되고 있는 다른 수질인자들과는 달리 실시간 측정이 불가능하다고 알려져 있다. 분변성대장균을 측정하는데 있어 최소 18시간 이상이 필요하며, 이러한 분변성대장균 측정 방식은 하천 이용자들이 안전한 친수활동을 영위하는데 있어 적절한 수질 정보를 제공하지 못한다. 그러므로 분변성대장균을 예측하는 모델을 개발하고, 이를 이용하여 실시간 분변성대장균 정보를 생성하여 하천 이용자들에게 제공할 필요가 있다. 본 연구에서는 친수활동이 활발하게 이루어지는 곳 중 하나인 북한강의 대성리 지점에 대해 데이터 기반 모델을 이용하여 분변성대장균을 예측하였다. 데이터 기반 모델은 물리 기반 모델에서 필요한 지형데이터나 비점오염원 등의 초기 오염물의 양에 대한 데이터를 필요로 하지 않고, 대신 독립변수로 사용되는 기상 및 수질데이터를 필요로 한다. 이러한 기상 및 수질데이터는 기존 기상관측소, 수질관측소에서 매일 자동으로 측정되기 때문에 데이터 기반 모델은 물리 기반 모델에 비해 입력데이터를 구성하기가 쉽다는 장점을 지닌다. 이러한 데이터 기반 모델 중 분류 모델은 회귀 모델과 달리 분변성대장균 농도가 일정 수질기준 이상을 넘는지를 바로 예측할 수 있다. 본 연구에서는 분류 모델 중 높은 예측력을 가진다고 알려진 랜덤포레스트(random forest) 기법을 이용하여 분변성대장균 예측 모델을 개발하였다. 분변성대장균 예측 모델은 주어진 기상 및 수질 조건에 대해 분변성대장균이 200 CFU/100ml가 넘는지를 예측하였다. 예측된 분변성대장균이 기준을 넘는 경우를 2등급, 넘지 않는 경우를 1등급으로 명명하였다. 모델을 개발하기 위하여 북한강 대성리 인근 측정소에서 2010년부터 2015년까지 측정된 기상 및 수질데이터를 수집하였다. 수집한 데이터를 훈련 및 검증데이터로 샘플링하였으며, 이 때 샘플링한 데이터가 기존 데이터가 가지고 있던 등급별 비율을 유지하기 위하여 층화샘플링을 하였다. 본 연구에서는 샘플링에 의한 불확실성을 줄이기 위하여 랜덤하게 50번 샘플링된 각각의 훈련데이터에 대해 모델을 개발하였다. 50개의 모델의 검증 결과를 종합한 결과, 전체 예측률은 0.139로 나타났다.

  • PDF

임계값 설정을 통한 근치적 위절제술 후 합병증 발생 예측 모델의 성능 평가 (Performance of a Model to Predict Complication Occurance after Radical Gastrectomy according to Thresholds)

  • 임수연;최자윤
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2024년도 춘계학술발표대회
    • /
    • pp.687-689
    • /
    • 2024
  • 위암은 전 세계적인 주요 건강문제이며, 근치적 위절제술은 위암의 표준치료이다. 근치적 위절제술 후 치료목표는 합병증 발생을 낮춰 병전 상태로 빠르게 회복하는 데 있다. 따라서, 근치적 위절제술 후 합병증 발생 여부를 선별하여 예측할 수 있는 성능이 좋은 모델을 개발하는 것은 위암환자의 회복에 매우 중요하다. 랜덤포레스트 모델은 여러 개의 결정트리를 활용한 배깅 방식의 대표적인 알고리즘으로 의료 데이터를 기반으로 한 예측에 있어 뛰어난 성능을 보여 주었다. 그러나 실제 데이터는 불균형이 빈번하게 발생하여 모델의 예측 성능에 영향을 미치므로, 최적의 분류 임계값을 설정하여 다수 클래스에 대한 편향을 줄이는 것이 중요하다. 따라서, 본 연구는 최근 10년 간 일개 대학병원의 전자의무기록 데이터를 활용하여 근치적 위절제술 후 합병증 발생을 예측하는 랜덤포레스트 모델을 개발하고, 임계값 설정을 통해 불균형 데이터에 대한 모델의 성능을 평가하고자 한다.

앙상블 칼만필터 이론을 이용한 분포형모델의 홍수유출예측 (Flood Forecasting by using Distributed Models with Ensemble Kalman Filter)

  • 박효길;최현일;지홍기
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2009년도 학술발표회 초록집
    • /
    • pp.27-31
    • /
    • 2009
  • 홍수피해를 예방할 수 있는 대책에는 여러 가지 방법이 있으나 비구조물적인 방법 중에서 대표적인 것이 홍수예경보이다. 이에 합리적인 설계홍수량 산정을 위해 하천유역에서 강우-유출과정의 정확한 해석과 유출예측은 수자원의 효율적인 활용과 하천의 이수, 치수를 위한 수문학적 해석에 있어서 매우 중요하며, 이를 위해서는 강우로부터 정도 높은 유출량 예측이 요구된다. 뿐만 아니라 하천범람 등의 재해로부터 인명과 재산을 보호하기 위한 홍수예경보 시스템의 구축이 필요하다. 홍수예경보 시스템의 효율적인 관리를 위해서는 실시간 홍수예측(Real-time Flood Prediction)기법의 개발이 필요하다. 홍수유출모형에 있어 공간적 변화특성과 평균 강우량의 공간분포를 반영할 수 있는 분포형 매개변수 모형(Distributed-Parameter Model)인 분포형 모델을 대상으로 앙상블 칼만필터(Ensemble Kalman Filter, EnKF) 이론을 적용하여 비선형시스템에서 오차를 포함한 반응을 실시간으로 처리하여 불확실성을 정량적으로 감소시켜 홍수유출을 예측하는데 그 목적이 있다. 하천유역특성을 이용한 홍수유출예측을 위하여 비선형시스템에서의 앙상블 칼만필터 기법을 적용한 분포형 모형을 이용하여 더욱 정밀한 홍수유출을 예측하게 되고 향후 홍수예경보모형으로서 적정 유역분할 규모를 결정해주는 근거를 제시할 수 있을 것으로 기대된다.

  • PDF

빅데이터를 이용한 독감, 폐렴 및 수족구 환자수 예측 모델 연구 (The Study of Patient Prediction Models on Flu, Pneumonia and HFMD Using Big Data)

  • 우종필;이병욱;이차민;이지은;김민성;황재원
    • 한국빅데이터학회지
    • /
    • 제3권1호
    • /
    • pp.55-62
    • /
    • 2018
  • 본 연구에서는 그동안 해외에서 주로 실행되어 왔던 빅데이터를 이용한 다양한 질병(독감, 폐렴, 수족구병) 환자수 예측 모델을 개발해 보았다. 기존의 환자수 예측이 병원에서 실제 환자수를 카운팅한 수를 수집하여 발표하는 시스템이라면, 이번에 개발한 연구 모델은 실시간으로 제공되는 질병 관련 단어 및 다양한 기후 데이터를 접목하여 기계학습 방법으로 알고리즘을 만들고, 이를 기반으로 정부에서 발표하기 전 환자수를 예측하는 모델이다. 특히 유행성 질병이 빠르게 확산될 경우, 실시간으로 전파 속도를 파악할 수 있다는 점에서 그 장점이 있다. 이를 위하여 구글 플루 트렌드에서 실패한 부분을 최대한 보완하여 다양한 데이터를 활용한 예측 모델을 개발하였다.

서울시 도시침수 예측시스템의 개선 및 운영 (Improvement and Operation of Urban Inundation Forecasting System in Seoul)

  • 심재범;김호성;강태훈;이병주
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.481-481
    • /
    • 2021
  • 서울시는 '10년, '11년, '18년의 기록적인 호우로 인해 막대한 재산피해를 기록하였다. 이로 인해 서울시는 수재해 최소화 대책의 필요성을 인지하여 방재시설물 확충 등의 구조적 대책과 함께 침수지역 예측, 호우 영향 예보와 관련된 비구조적 대책 수립을 위해 노력하고 있다. 그 일환으로 2018~2019년 『서울시 강한 비구름 유입경로 및 침수위험도 예측 용역』 수행을 통해 레이더 실황강우 기반의 강한 비구름 이동경로 추정 기술, 강우시나리오 기반의 침수위험지역추정 기술이 적용된 서울시 도시침수 예측시스템을 개발하였다. 또한, 침수피해에 선제적으로 대응하기 위해 2019~2020년 『서울시 내수침수 위험지역 실시간 예측기술 개발』을 통하여 이류모델 기반의 예측강우정보 추정 기술, 예측강우정보 기반의 실시간 침수위험지역 추정기술을 적용하였다. 현재 서울시 도시침수 예측시스템은 서울시 전역의 강우 및 침수정보를 제공하며, 관로 113,286개(전체 385,768개), 맨홀 106,097개(전체 272,133개), 빗물펌프장 117개소(전체 121개소)가 반영되어 있다. 서울시 도시침수 예측시스템에서는 서울시 25개 자치구를 대상으로 실황 및 예측 강우정보, 강한 비구름에 대한 이동경로정보, 시나리오 및 실시간 침수정보를 제공하고 있다. 강우정보는 10분 및 1시간 단위 AWS 실황정보와 10분 단위 이류모델 기반 예측정보, 1시간 단위 LDAPS 기반 예측정보를 제공한다. 또한, 레이더 실황정보를 통해 판별된 강한 비구름에 대해 10분 단위 1시간 예측경로를 제공한다. 침수정보는 총강우량, 강우지속기간, 빗물받이효율 조건을 반영한 강우시나리오 기반의 6m 고해상도 격자단위 침수시나리오 정보와 자치구별 침수위험정보를 제공한다. 또한, 이류모델 기반의 레이더 예측정보를 이용하여 실시간 침수 예측정보를 제공한다. 향후 서울시 내 모든 수방시설물의 적용, 관로 유출구별 기점수위 반영, 관측자료를 이용한 도시유출 및 도시침수 모델 최적화 등 지속적으로 고도화를 수행하고자 하며, 서울시 도시침수 예측시스템을 통해 서울시 및 자치구 풍수해 담당자가 침수피해를 대비, 대응할 수 있을 것으로 기대된다.

  • PDF

머신러닝을 이용한 한국프로야구 관중 수 예측모델 (Prediction Model of the Number of Spectators in Korean Baseball League Using Machine Learning)

  • 서원빈;길이만
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2019년도 춘계학술대회
    • /
    • pp.330-333
    • /
    • 2019
  • 본 연구는 기존 관중 수 예측에 주로 사용되는 ARIMA 모형과 다른 GKFN(Network with Gaussian kernel functions) 모델을 시계열 모델로 제안하고 여러 변수 간의 상관관계를 분석한 MLP(Multilayer Perceptron) 모델을 각각 따로 만들어 두 가지 RMSE값의 가중치를 결합한 새로운 모델을 최종적으로 제안한다. GKFN 모델은 phase space 분석을 위해 smoothness measure를 측정하고 커널 개수를 늘려가며 학습시키는 방법이다. 또한, MLP 모델은 관중 수에 영향을 주는 여러 변수(날짜, 날씨 등 팀과 관련된 특징들)의 상관관계를 correlation coefficient 값을 이용해 분석하고 높은 상관관계를 가지는 변수들을 이용해 MLP 모델을 만들어 학습하는 것이다. 이를 통해 프로야구팀 기아 타이거즈의 일일 단위 관중 수를 예측하고자 하였다. 관중 수 예측을 통해 구단과 관객 모두 긍정적인 활용이 가능할 것이다. 훈련 자료는 2010년부터 2018년까지 9년 동안 기아 타이거즈의 일별 관중 수를 자료로 하였다.

  • PDF