• 제목/요약/키워드: 10-fold cross validation

검색결과 203건 처리시간 0.026초

사회적 변수와 개개인의 감정지수를 함께 고려한 딥러닝 기반 행복 지수 모델 설계 (Deep Learning-based Happiness Index Model Considering Social Variables and Individual Emotional Index)

  • 오수민;박민서
    • 문화기술의 융합
    • /
    • 제10권1호
    • /
    • pp.489-493
    • /
    • 2024
  • 행복 지수는 집단적인 행복 정도를 직관적으로 파악하는데 효과적인 측정 시스템이다. 가치관의 변화에 따라행복 지수에 행동의 가치를 추가한 연구들이 제안되고 있으나, 개인이 느끼는 감정을 활용하여 관계성을 분석한 연구는 부족한 실정이다. 따라서 본 연구는 행동의 가치를 나타내는 사회적 변수와 개개인의 감정지수를 함께 고려해 행복 지수를 예측하는 딥러닝 모델을 설계한다. 첫째, 2005년 1월 ~ 2020년 12월의 사회적, 감정적 변수를 수집한다. 둘째, 데이터 전처리 및 유의변수 탐색을 수행한다. 셋째, 딥러닝 기반의 회귀 모델로 학습하고, 5-Fold 교차 검증(Cross Validation)으로 학습 모델을 평가한다. 본 연구의 제안 모델은 테스트 데이터에서 90.65%의 높은 예측 정확도를 보인다. 향후 이 연구는 국가별 데이터로 확대 적용하여 행복 지수 주요 요인 분석 등의 연구에 활용될 수 있을 것으로 기대된다.

Analysis of Feature Variables for Breast Cancer Diagnosis

  • Jung, Yong Gyu;Kim, Jang Il;Sihn, Sung Chul;Heo, Jun
    • International journal of advanced smart convergence
    • /
    • 제2권2호
    • /
    • pp.36-39
    • /
    • 2013
  • It is becoming more important as the growing of health information and increasing in cancer patients diagnose over the time gradually. Among the various types of cancer, we focuses on breast cancer diagnosis. The accuracy of breast cancer diagnosis is increasing when the diagnosis is based on evidence and statistics. To do this we use the weka data mining tools and analysis algorithms significantly associated with the decision tree uses rules. In addition, the data pre-processing and cross-validation are used to increase the reliability of the results. The number and cause of the disease becomes important to increase evidence-based medical doctors. As the evidence-based medical, the data obtained from patients in the past through the disease by calculating the probability for future patients to diagnose and predict disease and treatment plan. It can be found by improving the survival rate plays an important role.

An Intelligent Gold Price Prediction Based on Automated Machine and k-fold Cross Validation Learning

  • Baguda, Yakubu S.;Al-Jahdali, Hani Meateg
    • International Journal of Computer Science & Network Security
    • /
    • 제21권4호
    • /
    • pp.65-74
    • /
    • 2021
  • The rapid change in gold price is an issue of concern in the global economy and financial markets. Gold has been used as a means for trading and transaction around the world for long period of time and it plays an integral role in monetary, business, commercial and financial activities. More importantly, it is used as economic measure for the global economy and will continue to play an important economic vital role - both locally and globally. There has been an explosive growth in demand for efficient and effective scheme to predict gold price due its volatility and fluctuation. Hence, there is need for the development of gold price prediction scheme to assist and support investors, marketers, and financial institutions in making effective economic and monetary decisions. This paper primarily proposed an intelligent based system for predicting and characterizing the gold market trend. The simulation result shows that the proposed intelligent gold price scheme has been able to predict the gold price with high accuracy and precision, and ultimately it has significantly reduced the prediction error when compared to baseline neural network (NN).

Motion Recognition for Kinect Sensor Data Using Machine Learning Algorithm with PNF Patterns of Upper Extremities

  • Kim, Sangbin;Kim, Giwon;Kim, Junesun
    • The Journal of Korean Physical Therapy
    • /
    • 제27권4호
    • /
    • pp.214-220
    • /
    • 2015
  • Purpose: The purpose of this study was to investigate the availability of software for rehabilitation with the Kinect sensor by presenting an efficient algorithm based on machine learning when classifying the motion data of the PNF pattern if the subjects were wearing a patient gown. Methods: The motion data of the PNF pattern for upper extremities were collected by Kinect sensor. The data were obtained from 8 normal university students without the limitation of upper extremities. The subjects, wearing a T-shirt, performed the PNF patterns, D1 and D2 flexion, extensions, 30 times; the same protocol was repeated while wearing a patient gown to compare the classification performance of algorithms. For comparison of performance, we chose four algorithms, Naive Bayes Classifier, C4.5, Multilayer Perceptron, and Hidden Markov Model. The motion data for wearing a T-shirt were used for the training set, and 10 fold cross-validation test was performed. The motion data for wearing a gown were used for the test set. Results: The results showed that all of the algorithms performed well with 10 fold cross-validation test. However, when classifying the data with a hospital gown, Hidden Markov model (HMM) was the best algorithm for classifying the motion of PNF. Conclusion: We showed that HMM is the most efficient algorithm that could handle the sequence data related to time. Thus, we suggested that the algorithm which considered the sequence of motion, such as HMM, would be selected when developing software for rehabilitation which required determining the correctness of the motion.

A Deep Learning Approach for Classification of Cloud Image Patches on Small Datasets

  • Phung, Van Hiep;Rhee, Eun Joo
    • Journal of information and communication convergence engineering
    • /
    • 제16권3호
    • /
    • pp.173-178
    • /
    • 2018
  • Accurate classification of cloud images is a challenging task. Almost all the existing methods rely on hand-crafted feature extraction. Their limitation is low discriminative power. In the recent years, deep learning with convolution neural networks (CNNs), which can auto extract features, has achieved promising results in many computer vision and image understanding fields. However, deep learning approaches usually need large datasets. This paper proposes a deep learning approach for classification of cloud image patches on small datasets. First, we design a suitable deep learning model for small datasets using a CNN, and then we apply data augmentation and dropout regularization techniques to increase the generalization of the model. The experiments for the proposed approach were performed on SWIMCAT small dataset with k-fold cross-validation. The experimental results demonstrated perfect classification accuracy for most classes on every fold, and confirmed both the high accuracy and the robustness of the proposed model.

GLS와 Bass 모형을 결합한 하이브리드 모형을 이용한 영화 관객 수 예측 (Prediction of movie audience numbers using hybrid model combining GLS and Bass models)

  • 김보경;임창원
    • 응용통계연구
    • /
    • 제31권4호
    • /
    • pp.447-461
    • /
    • 2018
  • 국내 영화 산업 매출은 매년 증가하고 있다. 극장은 영화의 1차 판매 경로이며, 극장을 이용하는 관객 수는 부가판권에 영향을 준다. 따라서 극장을 이용하는 관객의 수는 영화 산업 매출에 직결되는 중요한 요소이다. 본 논문에서 특정일의 관객 수를 예측하기 위하여 다중선형회귀모형과 Bass 모형을 결합한 Hybrid 모형을 고려한다. 두 모형을 결합함으로써 회귀분석의 예측값을 Bass 모형의 예측값으로 보정하였다. 분석에는 개봉일이 모두 다른 세 영화를 이용하였다. All subset regression 방법을 이용해 모든 가능한 조합을 생성하고 5중 교차검증(5-fold cross validation)을 통해 5번 모형을 추정한다. 이 때 제곱근평균오차가 가장 작은 모형으로 예측값을 구한 뒤 Bass 모형의 예측값과 결합해 최종 예측값을 구하게 된다. 과거데이터가 존재할수록 Bass 모형의 가중치는 증가하면서 예측값에 보정효과를 준다는 것을 확인할 수 있었다.

퍼지 AHP와 퍼지 연관규칙을 이용하여 고차원 데이터를 처리하는 영화 추천 시스템 (A Movie Recommendation System processing High-Dimensional Data with Fuzzy-AHP and Fuzzy Association Rules)

  • 오재택;이상용
    • 디지털융복합연구
    • /
    • 제17권2호
    • /
    • pp.347-353
    • /
    • 2019
  • 최근 추천 시스템들은 고차원 데이터를 사용할 수 있는 시스템으로 발전하고 있다. 그러나 고차원 데이터는 차원을 확장시켜 알고리즘 복잡도가 증가하여 추천 항목의 정확도를 저하시킬 수 있다. 또한 데이터의 희소성(Sparsity) 문제가 발생할 수 있어 사용자들에게 적합한 추천 항목을 제공하는 것이 어렵다. 본 연구에서는 Fuzzy-AHP를 이용하여 사용자들의 주관적 기준의 데이터를 객관적 기준으로 분류한 후, 퍼지 연관규칙 분석을 이용하여 반복적 패턴을 띄는 규칙들을 활용하는 알고리즘을 제안하였다. 본 연구에서 적용된 알고리즘이 고차원 데이터의 문제점들을 어떻게 완화하는지 확인하기 위해 사용자 수의 변화에 따른 5-fold Cross Validation을 진행하였다. 그 결과 본 알고리즘이 적용된 시스템의 정확도는 Fuzzy-AHP만을 적용한 시스템보다 12.5% 정도 정확도가 우수하였고, 데이터의 희소성 문제도 완화할 수 있다는 것을 확인하였다.

연관규칙을 이용한 상황인식 음악 추천 시스템 (A Music Recommendation System based on Context-awareness using Association Rules)

  • 오재택;이상용
    • 디지털융복합연구
    • /
    • 제17권9호
    • /
    • pp.375-381
    • /
    • 2019
  • 최근 추천 시스템은 패션, 동영상, 음악 등을 중심으로 맞춤형 추천 서비스가 제공되어 사용자들의 관심을 모으고 있다. 그러나 이러한 서비스들은 실시간으로 발생하는 상황 정보를 사용하지 않아 여러 상황에 따른 적합한 서비스를 사용자에게 제공하기가 어렵다. 또한 적용되는 상황 정보가 차원을 확장시킬 경우, 데이터 희소성(Data Sparsity)을 증가시켜 사용자들에게 적합한 음악들을 추천할 수 없는 문제가 발생한다. 본 연구에서는 이러한 문제점을 해소시키기 위해 연관규칙(Association Rules)을 적용하여 사용자의 현재 위치 정보와 시간 정보에 대한 관계성 및 규칙들을 이용하여 실시간 상황에서 적합한 음악을 추천하는 시스템을 제안하였다. 수집된 상황 정보를 바탕으로 5-fold Cross Validation을 진행하여 위치와 시간 정보에 따른 추천 시스템의 정확도를 측정하였다. 그 결과 상황 정보가 누적됨에 따라 추천 시스템의 정확도가 향상되는 것을 확인할 수 있었다.

빅 데이터 기반의 체납 수용가 예측 모델 (Prediction Model for Unpaid Customers Using Big Data)

  • 정재안;이규환;정회경
    • 한국정보통신학회논문지
    • /
    • 제24권7호
    • /
    • pp.827-833
    • /
    • 2020
  • 본 논문에서는 지자체의 요금 체납을 줄이기 위해 특정 지자체를 대상으로 검침원의 면담 등을 통해 지방상수도 통합정보시스템에서 체납에 영향을 미치는 내부 데이터 요소를 찾았다. 또한 국가 통계 데이터 중에서 체납에 영향을 미치는 후보 데이터를 도출하였다. 독립변수가 종속변수에 미치는 영향도는 정보이득이라는 데이터 집합에서 종속변수에 대한 무질서도를 조사하여 표본 데이터를 수집하였다. 그리고 빅 데이터 분석 알고리즘인 의사결정트리와 로지스틱 회귀기법 중 어느 알고리즘이 더 높은 예측율을 나타내는지 n-fold cross-validation 방법을 사용하여 평가하였다. 이를 통해 지자체의 데이터를 기초로 알고리즘의 성능을 비교한 결과 의사결정트리가 로지스틱회귀보다 더 정확한 수용가 납부 패턴을 찾을 수 있음을 확인하였다. 머신러닝을 이용한 분석 알고리즘 모델 개발의 과정에서는 알고리즘의 정확성 향상을 위해 의사결정트리의 복잡성과 정확성에 직접적인 영향을 주는 최소 데이터 개수와 최대 순도라는 두 개의 환경변수의 최적값을 도출하였다.

2D-QSAR방법을 이용한 농약류의 무지개 송어 급성 어독성 분석 및 예측 (Prediction and analysis of acute fish toxicity of pesticides to the rainbow trout using 2D-QSAR)

  • 송인식;차지영;이성광
    • 분석과학
    • /
    • 제24권6호
    • /
    • pp.544-555
    • /
    • 2011
  • 본 연구는 농약류에 대하여 구조-활성의 정량적 관계(QSAR)를 이용하여 무지개 송어(학명: Oncorhynchus mykiss)의 급성 독성을 예측-분석하는 과정을 수행하였다. 모델 구현을 위해 사용된 275종의 농약류에 대한 수중 독성(96h $LC_{50}$) 값은 DEMETRA프로젝트의 데이터를 사용하였다. 예측 모델에 사용된 2차원 분자 표현자는 PreADMET프로그램으로부터 계산을 하였고, 선형 (다중 선형 회귀 방법)모델과 비선형(서포트 벡터 머신, 인공 신경망) 학습 방법들은 실험값과 예측값의 적합도를 고려하여 최적화 되었다. 데이터 전처리 과정을 거친 뒤에, 5묶음 교차 검증과정을 포함한 모집단 기반 전진 선택법을 통해서 각 학습 방법의 최적의 표현자 집합을 결정하였다. 가장 좋은 결과는 SVM 방법 ($R^2_{CV}$=0.677, RMSECV=0.887, MSECV=0.674) 이었고, EU의 규제 기준에 따른 분류에서는 87%의 정확도를 나타내었다. MLR방법을 통해서는 무지개 송어의 급성 독성에 대하여 독성을 나타내는 농약류의 구조적 특징과 지질 층과의 상호작용을 설명할 수 있었다. 개발된 모든 모델들은 5묶음 교차 검증과 Y-scrambling test을 통해 검증되었다.