• 제목/요약/키워드: Machine Learning Procedure

검색결과 116건 처리시간 0.025초

RHIPE 플랫폼에서 빅데이터 로지스틱 회귀를 위한 학습 알고리즘 (Learning algorithms for big data logistic regression on RHIPE platform)

  • 정병호;임동훈
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권4호
    • /
    • pp.911-923
    • /
    • 2016
  • 빅데이터 시대에 머신러닝의 중요성은 더욱 부각되고 있고 로지스틱 회귀는 머신러닝에서 분류를 위한 방법으로 의료, 경제학, 마케팅 및 사회과학 전반에 걸쳐 널리 사용되고 있다. 지금까지 R과 Hadoop의 통합환경인 RHIPE 플랫폼은 설치 및 MapReduce 구현의 어려움으로 인해 거의 연구가 이루지 지지 않았다. 본 논문에서는 대용량 데이터에 대해 로지스틱 회귀 추정을 위한 두가지 알고리즘 즉, Gradient Descent 알고리즘과 Newton-Raphson 알고리즘에 대해 MapReduce로 구현하고, 실제 데이터와 모의실험 데이터를 가지고 이들 알고리즘 간의 성능을 비교하고자 한다. 알고리즘 성능 실험에서 Gradient Descent 알고리즘은 학습률에 크게 의존하고 또한 데이터에 따라 수렴하지 않는 문제를 갖고 있다. Newton-Raphson 알고리즘은 학습률이 불필요 할 뿐만 아니라 모든 실험 데이터에 대해 좋은 성능을 보였다.

Normal data based rotating machine anomaly detection using CNN with self-labeling

  • Bae, Jaewoong;Jung, Wonho;Park, Yong-Hwa
    • Smart Structures and Systems
    • /
    • 제29권6호
    • /
    • pp.757-766
    • /
    • 2022
  • To train deep learning algorithms, a sufficient number of data are required. However, in most engineering systems, the acquisition of fault data is difficult or sometimes not feasible, while normal data are secured. The dearth of data is one of the major challenges to developing deep learning models, and fault diagnosis in particular cannot be made in the absence of fault data. With this context, this paper proposes an anomaly detection methodology for rotating machines using only normal data with self-labeling. Since only normal data are used for anomaly detection, a self-labeling method is used to generate a new labeled dataset. The overall procedure includes the following three steps: (1) transformation of normal data to self-labeled data based on a pretext task, (2) training the convolutional neural networks (CNN), and (3) anomaly detection using defined anomaly score based on the softmax output of the trained CNN. The softmax value of the abnormal sample shows different behavior from the normal softmax values. To verify the proposed method, four case studies were conducted, on the Case Western Reserve University (CWRU) bearing dataset, IEEE PHM 2012 data challenge dataset, PHMAP 2021 data challenge dataset, and laboratory bearing testbed; and the results were compared to those of existing machine learning and deep learning methods. The results showed that the proposed algorithm could detect faults in the bearing testbed and compressor with over 99.7% accuracy. In particular, it was possible to detect not only bearing faults but also structural faults such as unbalance and belt looseness with very high accuracy. Compared with the existing GAN, the autoencoder-based anomaly detection algorithm, the proposed method showed high anomaly detection performance.

하향식 기계학습의 반복적 오차 역투영에 기반한 고해상도 얼굴 영상의 복원 (Reconstruction of High-Resolution Facial Image Based on Recursive Error Back-Projection of Top-Down Machine Learning)

  • 박정선;이성환
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권3호
    • /
    • pp.266-274
    • /
    • 2007
  • 본 논문에서는 하향식 기계 학습 및 반복적 오차 역투영음 이용하여 한 장의 저해상도 얼굴 영상으로부터 고해상도 얼굴 영상을 복원하는 방법을 제안한다. 먼저 얼굴 영상을 독립된 형태 기저와 질감 기저의 선형 중첩으로 표현하고, 주어진 저해상도 얼굴 영상을 형태 기저와 질감 기저의 선형 중첩으 로 최대한 근사하게 표현할 수 있는 계수를 추정한다. 이 추정된 계수를 고해상도 얼굴 영상의 형태 기저 와 질감 기저의 선형 중첩 계수로 사용함으로써 고해상도 얼굴 영상을 복원한다. 또한, 복원된 고해상도 얼굴 영상의 정확도를 개선하기 위하여 학습 기반 오차 역투영 과정을 반복적으로 적용한다. 다양한 실험을 통하여, 제안된 방법이 저해상도 얼굴 영상으로부터 고해상도 얼굴 영상을 효과적으로 복원함을 입증하였으며, 이 방법을 사용하여 원거리 감시 시스템에서 획득된 저해상도 얼굴 영상을 고해상도 얼굴 영상으로 합성함으로써, 얼굴 인식 시스템의 성능을 높일 수 있음을 확인하였다.

초임계 압력조건에서 기체수소-액체산소 연소해석의 층류화염편 라이브러리에 대한 인공신경망 학습 적용 (Application of Artificial Neural Network to Flamelet Library for Gaseous Hydrogen/Liquid Oxygen Combustion at Supercritical Pressure)

  • 전태준;박태선
    • 한국추진공학회지
    • /
    • 제25권6호
    • /
    • pp.1-11
    • /
    • 2021
  • 층류화염편 라이브러리에 대한 효율적인 계산과정을 개발하기 위하여 초임계 압력조건의 기체수소/액체산소 연소기에 대해 인공신경망을 이용한 기계학습과정이 적용되었다. 학습성능과 계산효율성에 근거한 최적의 계산과정을 찾기 위하여 은닉층에 대한 ReLU와 쌍곡탄젠트 함수의 25가지 조합이 선택되었다. 정확성이 우수한 높은 학습성능을 얻는데 쌍곡탄젠트 활성화함수가 적절하였다. 인공신경망의 학습성능을 개선하기 위해서 학습데이터 변환이 제안되었다. 4개의 은닉층에 최적의 노드를 배치할 때 학습성능 및 계산비용 관점에서 모두 효율적인 것으로 나타났다. 층류화염편 라이브러리의 보간법보다 인공신경망을 사용하는 경우 전체 계산시간은 37%, 시스템 메모리는 99.98% 감소되었다.

Advanced performance evaluation system for existing concrete bridges

  • Miyamoto, Ayaho;Emoto, Hisao;Asano, Hiroyoshi
    • Computers and Concrete
    • /
    • 제14권6호
    • /
    • pp.727-743
    • /
    • 2014
  • The management of existing concrete bridges has become a major social concern in many developed countries due to the large number of bridges exhibiting signs of significant deterioration. This problem has increased the demand for effective maintenance and renewal planning. In order to implement an appropriate management procedure for a structure, a wide array of corrective strategies must be evaluated with respect to not only the condition state of each defect but also safety, economy and sustainability. This paper describes a new performance evaluation system for existing concrete bridges. The system evaluates performance based on load carrying capability and durability from the results of a visual inspection and specification data, and describes the necessity of maintenance. It categorizes all girders and slabs as either unsafe, severe deterioration, moderate deterioration, mild deterioration, or safe. The technique employs an expert system with an appropriate knowledge base in the evaluation. A characteristic feature of the system is the use of neural networks to evaluate the performance and facilitate refinement of the knowledge base. The neural network proposed in the present study has the capability to prevent an inference process and knowledge base from becoming a black box. It is very important that the system is capable of detailing how the performance is calculated since the road network represents a huge investment. The effectiveness of the neural network and machine learning method is verified by comparing diagnostic results by bridge experts.

안개관련 특징을 이용한 효과적인 머신러닝 기반 안개제거 기법 (Effective machine learning-based haze removal technique using haze-related features)

  • 이주희;강봉순
    • 전기전자학회논문지
    • /
    • 제25권1호
    • /
    • pp.83-87
    • /
    • 2021
  • 자율주행 및 인공지능 CCTV는 안개와 같은 악조건 상황에서 주변의 사물과 사람인식에 대한 카메라의 가시성 및 검출 능력이 저하된다. 이러한 악조건 상황에서도 중요한 정보를 정확하게 얻기 위해서 안개 제거 알고리즘에 대한 연구가 필요하다. 과거부터 현재까지 안개 제거 기술은 컴퓨터 비전/ 데이터 기반 등 다양한 방법을 이용한 연구가 진행되고 있다. 안개 제거 기술 중에서 입력영상에 대한 깊이 정보를 통한 안개 전달량을 추정하는 방법이 중요하다. 본 논문에서는 영상의 특징 DCP, saturation∗value, sharpness가 깊이정보와 선형관계에 있다는 가정을 통해 선형모델을 제시한다. 제안한 선형모델을 통한 안개제거방법은 기존의 방법들과 정량적 수치평가에서 평균적으로 10% 향상된 결과를 보여주며 알고리즘의 성능의 우수성을 증명하였다.

물류 회전설비 고장예지 시스템 (A Fault Prognostic System for the Logistics Rotational Equipment)

  • 김수형;볘르드바에브 예르갈리;조형기;김규익;김진석
    • 산업경영시스템학회지
    • /
    • 제46권2호
    • /
    • pp.168-175
    • /
    • 2023
  • In the era of the 4th Industrial Revolution, Logistic 4.0 using data-based technologies such as IoT, Bigdata, and AI is a keystone to logistics intelligence. In particular, the AI technology such as prognostics and health management for the maintenance of logistics facilities is being in the spotlight. In order to ensure the reliability of the facilities, Time-Based Maintenance (TBM) can be performed in every certain period of time, but this causes excessive maintenance costs and has limitations in preventing sudden failures and accidents. On the other hand, the predictive maintenance using AI fault diagnosis model can do not only overcome the limitation of TBM by automatically detecting abnormalities in logistics facilities, but also offer more advantages by predicting future failures and allowing proactive measures to ensure stable and reliable system management. In order to train and predict with AI machine learning model, data needs to be collected, processed, and analyzed. In this study, we have develop a system that utilizes an AI detection model that can detect abnormalities of logistics rotational equipment and diagnose their fault types. In the discussion, we will explain the entire experimental processes : experimental design, data collection procedure, signal processing methods, feature analysis methods, and the model development.

신경망 학습앙상블에 관한 연구 - 주가예측을 중심으로 - (A Study on Training Ensembles of Neural Networks - A Case of Stock Price Prediction)

  • 이영찬;곽수환
    • 지능정보연구
    • /
    • 제5권1호
    • /
    • pp.95-101
    • /
    • 1999
  • In this paper, a comparison between different methods to combine predictions from neural networks will be given. These methods are bagging, bumping, and balancing. Those are based on the analysis of the ensemble generalization error into an ambiguity term and a term incorporating generalization performances of individual networks. Neural Networks and AI machine learning models are prone to overfitting. A strategy to prevent a neural network from overfitting, is to stop training in early stage of the learning process. The complete data set is spilt up into a training set and a validation set. Training is stopped when the error on the validation set starts increasing. The stability of the networks is highly dependent on the division in training and validation set, and also on the random initial weights and the chosen minimization procedure. This causes early stopped networks to be rather unstable: a small change in the data or different initial conditions can produce large changes in the prediction. Therefore, it is advisable to apply the same procedure several times starting from different initial weights. This technique is often referred to as training ensembles of neural networks. In this paper, we presented a comparison of three statistical methods to prevent overfitting of neural network.

  • PDF

분산정보를 이용한 특징 선택과 PCA-ELM 기반의 유도전동기 고장진단 기법 개발 (Development of Induction Motor Diagnosis Method by Variance Based Feature Selection and PCA-ELM)

  • 이대종;전명근
    • 조명전기설비학회논문지
    • /
    • 제24권8호
    • /
    • pp.55-61
    • /
    • 2010
  • 본 논문은 클래스 내와 클래스 간의 분산정보를 이용한 주파수 성분의 선택적 추출기법과 PCA-ELM 기반의 유도전동기 고장진단 시스템을 제안한다. 제안된 방법은 취득된 전류신호를 DFT에 의해 주파수 영역으로 변환한 후 분산정보를 이용하여 고장상태별로 차별성이 큰 순서대로 주파수 성분을 추출한다. 다음 단계로 선택된 주파수 성분에 대해서 PCA를 이용하여 고장상태별 특징들을 추출한다. 마지막 단계는 학습속도가 매우 우수한 ELM분류기에 의해 유도전동기의 상태를 진단하게 된다. 다양한 부하에 대하여 몇몇의 전기적 고장과 기계적 고장 하에서 획득한 데이터를 이용하여 제안된 방법의 타당성을 검증한다.

의사결정트리를 이용한 개별 공시지가 비교표준지의 자동 선정 (An Automatic Method for Selecting Comparative Standard Land Parcels in Land Price Appraisal Using a Decision Tree)

  • 김종윤;박수홍
    • 한국지리정보학회지
    • /
    • 제7권1호
    • /
    • pp.9-19
    • /
    • 2004
  • 개별 공시지가 산정에 있어 비교 표준지의 선정은 가장 중요한 작업으로서, 최대한 객관적이고 합리적으로 이루어져야 한다. 그러나 현재 비교표준지를 선정하는 작업은 담당 공무원의 수작업에 의해 이루어지기 때문에 효율성이나 객관성을 보장하기가 어렵다. 본 연구에서는 현행 비교표준지 선정방식을 분석하여 문제를 정의하고 비교표준지 선정 업무의 자동화에 적용가능한 기계학습 알고리즘으로 의사결정트리를 선정하고 비교표준지를 선정하여 규칙을 주제지향적인 데이터베이스를 기반으로 학습하였다. 이렇게 학습된 규칙을 이용하여 비교표준지를 선정하고 그 결과를 평가 분석하여 새로운 비교표준지 선정 방법을 제안하였다.

  • PDF