• 제목/요약/키워드: NN Model

검색결과 280건 처리시간 0.034초

영화 관객 수 예측을 위한 기계학습 기법의 성능 평가 연구 (A Study on the Performance Evaluation of Machine Learning for Predicting the Number of Movie Audiences)

  • 정찬미;민대기
    • 한국전자거래학회지
    • /
    • 제25권2호
    • /
    • pp.49-63
    • /
    • 2020
  • 영화 제작에 막대한 비용이 투입되지만 관객수요는 매우 불확실하기 때문에 개선된 수요예측은 수익 개선을 위한 의사결정의 중요 수단으로 활용될 수 있다. 본 연구에서는 영화의 개봉 후 수요를 예측함에 있어 기계학습 기법의 적용 타당성을 예측 성능의 관점에서 검증하였다. 분석결과를 종합하면 다음과 같다. 첫째, 대안변수에 대한 통계적 검증 결과 기본 영화 특성(감독, 배우)과 함께 개봉 후 2주차까지의 스크린수, 상영횟수, 관객수, 주요 배우에 대한 관심도 등 시계열 자료가 수요예측에 유의미한 것을 확인하였다. 둘째, Random Forest Classifier와 SVM(Support Vector Machine) 등 분류 기반 기계학습 기법과 Random Forest Regressor와 k-NN Regressor와 같은 회귀모형 기반 기계학습 기법에 적용하여 예측 성능을 평가한 결과, Random Forest 기법이 우수한 결과를 보였다. 셋째, 누적관객수가 1분위보다 작은 영화에서 회귀모형 기반 기법은 낮은 예측 정확도를 보였으며, 분류기반 기법은 반대로 가장 우수한 결과를 얻었다. 즉, 영화 수요의 분포 특성에 따라서 차별화된 기계학습 기법을 적용하는 것이 필요하다.

변수변환을 통한 포항지역 미세먼지의 통계적 예보모형에 관한 연구 (A Study on Statistical Forecasting Models of PM10 in Pohang Region by the Variable Transformation)

  • 이영섭;김현구;박종석;김희경
    • 한국대기환경학회지
    • /
    • 제22권5호
    • /
    • pp.614-626
    • /
    • 2006
  • Using the data of three environmental monitoring sites in Pohang area(KME112, KME113, and KME114), statistical forecasting models of the daily maximum and mean values of PM10 have been developed. Since the distributions of the daily maximum and mean PM10 values are skewed, which are similar to the Weibull distribution, these values were log-transformed to increase prediction accuracy by approximating the normal distribution. Three statistical forecasting models, which are regression, neural networks(NN) and support vector regression(SVR), were built using the log-transformed response variables, i.e., log(max(PM10)) or log(mean (PM10)). Also, the forecasting models were validated by the measure of RMSE, CORR, and IOA for the model comparison and accuracy. The improvement rate of IOA before and after the log-transformation in the daily maximum PM10 prediction was 12.7% for the regression and 22.5% for NN. In particular, 42.7% was improved for SVR method. In the case of the daily mean PM10 prediction, IOA value was improved by 5.1% for regression, 6.5% for NN, and 6.3% for SVR method. As a conclusion, SVR method was found to be performed better than the other methods in the point of the model accuracy and fitness views.

미세먼지 수치 예측 모델 구현을 위한 데이터마이닝 알고리즘 개발 (Development of Data Mining Algorithm for Implementation of Fine Dust Numerical Prediction Model)

  • 차진욱;김장영
    • 한국정보통신학회논문지
    • /
    • 제22권4호
    • /
    • pp.595-601
    • /
    • 2018
  • 최근 미세먼지 수치가 급격히 상승함에 따라 이에 대한 관심도가 굉장히 높아지고 있다. 미세먼지의 노출은 호흡기 및 심혈관계 질환의 발생과 관련이 있으며, 사망률도 증가시키는 것으로 보고되고 있다. 뿐만 아니라, 산업현장에서도 미세먼지에 대한 피해가 속출한다. 그러나 현대인의 삶에서 미세먼지 노출은 불가피하다. 그러므로 미세먼지를 예측하여, 이에 대한 노출을 최소화하는 것이 건강 및 산업 피해축소에 가장 효율적인 방법일 것이다. 기존의 미세먼지 예측 모델은 농도 수치가 아닌 미세먼지의 농도 범위에 따라 좋음, 보통, 나쁨, 매우 나쁨으로만 나누어 예보하고 있다. 본 논문은 기존의 실제 기상 및 대기 질 데이터를 이용, 기계학습 알고리즘인 Artificial Neural Network (ANN)알고리즘과 K-Nearest Neighbor (K-NN)알고리즘을 상호 응용하여 미세먼지 수치 (PM 10)를 예측하고자 하였다.

TextRank 알고리즘을 이용한 문서 범주화 (Text Categorization Using TextRank Algorithm)

  • 배원식;차정원
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권1호
    • /
    • pp.110-114
    • /
    • 2010
  • 본 논문에서는 TextRank 알고리즘을 이용한 문서 범주화 방법에 대해 기술한다. TextRank 알고리즘은 그래프 기반의 순위화 알고리즘이다. 문서에서 나타나는 각각의 단어를 노드로, 단어들 사이의 동시출현성을 이용하여 간선을 만들면 문서로부터 그래프를 생성할 수 있다. TextRank 알고리즘을 이용하여 생성된 그래프로부터 중요도가 높은 단어를 선택하고, 그 단어와 인접한 단어를 묶어 하나의 자질로 사용하여 문서 분류를 수행하였다. 동시출현 자질(인접한 단어 쌍)은 단어 하나가 갖는 의미를 보다 명확하게 만들어주므로 문서 분류에 좋은 자질로 사용될 수 있을 것이라 가정하였다. 문서 분류기로는 지지 벡터 기계, 베이지언 분류기, 최대 엔트로피 모델, k-NN 분류기 등을 사용하였다. 20 Newsgroups 문서 집합을 사용한 실험에서 모든 분류기에서 제안된 방법을 사용했을 때, 문서 분류 성능이 향상된 결과를 확인할 수 있었다.

무시할 수 없는 무응답에서 편향 보정을 이용한 무응답 대체 (Bias corrected imputation method for non-ignorable non-response)

  • 이민하;신기일
    • 응용통계연구
    • /
    • 제35권4호
    • /
    • pp.485-499
    • /
    • 2022
  • 표본오차와 비표본오차를 포함하는 총오차(total survey error)를 관리하는 것은 표본설계에서 매우 중요하다. 무응답으로 인해 발생한 비표본오차는 총오차에서 차지하는 비중이 매우 크며 이를 해결하는 방법인 무응답 대체에 관한 다수의 연구가 수행되었다. 최근 전통적 통계학 관련 기법에 추가하여 기계학습 관련 기법을 이용한 무응답 대체법이 다수 연구되고 실질적으로 사용되고 있다. 기존에 발표된 다수의 방법은 MCAR(missing completely at random) 또는 MAR(missing at random) 가정을 사용하고 있다. 그러나 관심변수에 영향을 받는 MNAR(missing not at random) 또는 무시할 수 없는 무응답(non-ignorable non-response; NN)은 편향을 발생시켜 대체 결과의 정확성을 크게 떨어뜨리지만 이에 관한 연구는 상대적으로 미미하다. 본 연구에서는 무시할 수 없는 무응답이 발생한 경우에 적용 가능한 무응답 대체법을 제안하였다. 특히 편향을 추정한 후 이를 제거하는 방법을 이용하여 무응답 대체 결과의 정확성을 향상하는 방법을 제안하였다. 또한, 모의실험을 이용하여 제안된 방법의 타당성을 확인하였다.

Predicting sorptivity and freeze-thaw resistance of self-compacting mortar by using deep learning and k-nearest neighbor

  • Turk, Kazim;Kina, Ceren;Tanyildizi, Harun
    • Computers and Concrete
    • /
    • 제30권2호
    • /
    • pp.99-111
    • /
    • 2022
  • In this study, deep learning and k-Nearest Neighbor (kNN) models were used to estimate the sorptivity and freeze-thaw resistance of self-compacting mortars (SCMs) having binary and ternary blends of mineral admixtures. Twenty-five environment-friendly SCMs were designed as binary and ternary blends of fly ash (FA) and silica fume (SF) except for control mixture with only Portland cement (PC). The capillary water absorption and freeze-thaw resistance tests were conducted for 91 days. It was found that the use of SF with FA as ternary blends reduced sorptivity coefficient values compared to the use of FA as binary blends while the presence of FA with SF improved freeze-thaw resistance of SCMs with ternary blends. The input variables used the models for the estimation of sorptivity were defined as PC content, SF content, FA content, sand content, HRWRA, water/cementitious materials (W/C) and freeze-thaw cycles. The input variables used the models for the estimation of sorptivity were selected as PC content, SF content, FA content, sand content, HRWRA, W/C and predefined intervals of the sample in water. The deep learning and k-NN models estimated the durability factor of SCM with 94.43% and 92.55% accuracy and the sorptivity of SCM was estimated with 97.87% and 86.14% accuracy, respectively. This study found that deep learning model estimated the sorptivity and durability factor of SCMs having binary and ternary blends of mineral admixtures higher accuracy than k-NN model.

HR 데이터 기반의 퇴사 예측 모델 개발 (Development of a Resignation Prediction Model using HR Data)

  • 박연정;이도길
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.100-103
    • /
    • 2021
  • 대부분의 기업에서는 우수한 인적 자원의 유출을 방지하기 위해 직원들이 이직 및 퇴사하는 이유를 연구한다. 이에 기업은 직원이 퇴사하기 전에 면담을 하거나 설문조사를 통해서 연구에 필요한 데이터를 얻는다. 하지만 설문조사에서는 직원들이 직장 생활을 하는 데에 불리할 수도 있는 의견을 드러내려고 하지 않아 정확한 결과를 얻기 힘든 것이 현실이다. 한편, 한국노동연구원에서 발표한 자료에 따르면 기업이 요구하는 최소 학력 수준과 직원의 학력 수준 간의 차이가 클수록 이직 경향이 커진다. 따라서 본 연구에서는 한국노동연구원의 자료에 착안하여, 직원이 가지고 있는 객관적 데이터인 전공, 교육수준, 재직 중인 회사 유형 등의 데이터를 기반으로 직원의 퇴사 여부를 예측하고자 한다. 퇴사 예측 모델을 생성하기 Decision Tree, XGBoost, kNN, SVM을 활용하였으며 각각의 성능을 비교했다. 이 결과, 지금까지 설문조사로 진행되었던 연구에서 파악하지 못한 다양한 요인을 알아낼 수 있었다. 이를 통해 기업이 퇴사 예측 모델을 이용하여 직원이 퇴사하기 전에 미리 이를 인지하고 방지하는 데에 도움을 줄 수 있을 것으로 예상된다.

  • PDF

A vibration-based approach for detecting arch dam damage using RBF neural networks and Jaya algorithms

  • Ali Zar;Zahoor Hussain;Muhammad Akbar;Bassam A. Tayeh;Zhibin Lin
    • Smart Structures and Systems
    • /
    • 제32권5호
    • /
    • pp.319-338
    • /
    • 2023
  • The study presents a new hybrid data-driven method by combining radial basis functions neural networks (RBF-NN) with the Jaya algorithm (JA) to provide effective structural health monitoring of arch dams. The novelty of this approach lies in that only one user-defined parameter is required and thus can increase its effectiveness and efficiency, as compared to other machine learning techniques that often require processing a large amount of training and testing model parameters and hyper-parameters, with high time-consuming. This approach seeks rapid damage detection in arch dams under dynamic conditions, to prevent potential disasters, by utilizing the RBF-NNN to seamlessly integrate the dynamic elastic modulus (DEM) and modal parameters (such as natural frequency and mode shape) as damage indicators. To determine the dynamic characteristics of the arch dam, the JA sequentially optimizes an objective function rooted in vibration-based data sets. Two case studies of hyperbolic concrete arch dams were carefully designed using finite element simulation to demonstrate the effectiveness of the RBF-NN model, in conjunction with the Jaya algorithm. The testing results demonstrated that the proposed methods could exhibit significant computational time-savings, while effectively detecting damage in arch dam structures with complex nonlinearities. Furthermore, despite training data contaminated with a high level of noise, the RBF-NN and JA fusion remained the robustness, with high accuracy.

퍼지 동정에 의한 교통경로선택 (Traffic Rout Choice by means of Fuzzy Identification)

  • 오성권;남궁문;안태천
    • 한국지능시스템학회논문지
    • /
    • 제6권2호
    • /
    • pp.81-89
    • /
    • 1996
  • 퍼지모델링의 설계 방법을 교통경로선택의 모델동정을 위하여 제안한다. 제안된 퍼지모델은 최적화이론, 퍼지구현규칙을 사용하여 ""IF..., THEN...""의 효율적인 형태로 시스템구조와 파라미터 동정을 시행한다. 이 논문에서 간략추론, 선형추론, 병형된 선형추론의 3가지종류의 퍼지모델링 방법을 제시한다. 이 퍼지추론 방법은 인간의 교통행동의 정확한 추정과 정밀한 묘사를 위해 교통경로선택 모델을 개발하기 위해 이용된다. 퍼지규칙의 전반부 구조와 파라미터를 동정하기 위해 개선된 컴플렉스법을 사용하고, 최적후반부 파라미터를 동정하기 위해 최소자승법이 사용된다. 교통경로선택 데이타가 제안된 퍼지모델 성능을 평가하기 위해 사옹된다. 제안된 방법이 기존의 다른 연구들 - 즉 BL, PS, FL, NN, FNNs 모델 등 - 보다 더 높은 정확도를 가진 퍼지모델을 생성함을 보인다. 생성함을 보인다.

  • PDF

트렌드와 계절성을 가진 시계열에 대한 순수 모형과 하이브리드 모형의 비교 연구 (Comparison Studies of Hybrid and Non-hybrid Forecasting Models for Seasonal and Trend Time Series Data)

  • 정철우;김명석
    • 지능정보연구
    • /
    • 제19권1호
    • /
    • pp.1-17
    • /
    • 2013
  • 본 연구에서는 시계열 예측을 위해 선형 모형과 비선형 모형의 하이브리드 모형 및 순수 모형의 성과를 비교 평가하였다. 이를 위해 5가지 서로 다른 패턴을 가지는 데이터를 생성하여 시뮬레이션을 진행하였다. 본 연구에서 고려한 선형 모형은 AR(autoregressive model)과 SARIMA(seasonal autoregressive integrated moving average model)이고 비선형 모형은 인공신경망(artificial neural networks model)과 GAM(generalized additive model)이다. 특히, GAM은 여러 장점에도 불구하고 시계열 예측을 위한 비선형 모형으로 기존 연구들에서는 거의 쓰이지 않았던 모형이다. 시뮬레이션 결과, seasonality를 가지는 시계열에 대해서는 AR 및 AR-AR 모형이, trend를 가지는 시계열에 대해서는 SARIMA 및 SARIMA와 다른 모형의 하이브리드 모형이 다른 모형에 비해 높은 성과를 보였다. 한편, 인공신경망과 GAM을 비교하면, 트렌드와 계절성이 더해진 시계열에 대해 SARIMA와 GAM의 하이브리드 모형이 거의 모든 노이즈(noise) 수준에 대해 높은 성과를 보인 반면, 노이즈 수준이 미미한 경우에 한해 SARIMA와 인공신경망의 하이브리드 모형이 높은 성과를 보였다.