• 제목/요약/키워드: Automated Machine Learning

검색결과 184건 처리시간 0.029초

Azure 클라우드 플랫폼의 가상서버 호스팅을 이용한 데이터 수집환경 및 분석에 관한 연구 (A study on data collection environment and analysis using virtual server hosting of Azure cloud platform)

  • 이재규;조인표;이상엽
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2020년도 제62차 하계학술대회논문집 28권2호
    • /
    • pp.329-330
    • /
    • 2020
  • 본 논문에서는 Azure 클라우드 플랫폼의 가상서버 호스팅을 이용해 데이터 수집 환경을 구축하고, Azure에서 제공하는 자동화된 기계학습(Automated Machine Learning, AutoML)을 기반으로 데이터 분석 방법에 관한 연구를 수행했다. 가상 서버 호스팅 환경에 LAMP(Linux, Apache, MySQL, PHP)를 설치하여 데이터 수집환경을 구축했으며, 수집된 데이터를 Azure AutoML에 적용하여 자동화된 기계학습을 수행했다. Azure AutoML은 소모적이고 반복적인 기계학습 모델 개발을 자동화하는 프로세스로써 기계학습 솔루션 구현하는데 시간과 자원(Resource)를 절약할 수 있다. 특히, AutoML은 수집된 데이터를 분류와 회귀 및 예측하는데 있어서 학습점수(Training Score)를 기반으로 보유한 데이터에 가장 적합한 기계학습 모델의 순위를 제공한다. 이는 데이터 분석에 필요한 기계학습 모델을 개발하는데 있어서 개발 초기 단계부터 코드를 설계하지 않아도 되며, 전체 기계학습 시스템을 개발 및 구현하기 전에 모델의 구성과 시스템을 설계해볼 수 있기 때문에 매우 효율적으로 활용될 수 있다. 본 논문에서는 NPU(Neural Processing Unit) 학습에 필요한 데이터 수집 환경에 관한 연구를 수행했으며, Azure AutoML을 기반으로 데이터 분류와 회귀 등 가장 효율적인 알고리즘 선정에 관한 연구를 수행했다.

  • PDF

Field Test of Automated Activity Classification Using Acceleration Signals from a Wristband

  • Gong, Yue;Seo, JoonOh
    • 국제학술발표논문집
    • /
    • The 8th International Conference on Construction Engineering and Project Management
    • /
    • pp.443-452
    • /
    • 2020
  • Worker's awkward postures and unreasonable physical load can be corrected by monitoring construction activities, thereby increasing the safety and productivity of construction workers and projects. However, manual identification is time-consuming and contains high human variance. In this regard, an automated activity recognition system based on inertial measurement unit can help in rapidly and precisely collecting motion data. With the acceleration data, the machine learning algorithm will be used to train classifiers for automatically categorizing activities. However, input acceleration data are extracted either from designed experiments or simple construction work in previous studies. Thus, collected data series are discontinuous and activity categories are insufficient for real construction circumstances. This study aims to collect acceleration data during long-term continuous work in a construction project and validate the feasibility of activity recognition algorithm with the continuous motion data. The data collection covers two different workers performing formwork at the same site. An accelerator, as well as portable camera, is attached to the worker during the entire working session for simultaneously recording motion data and working activity. The supervised machine learning-based models are trained to classify activity in hierarchical levels, which reaches a 96.9% testing accuracy of recognizing rest and work and 85.6% testing accuracy of identifying stationary, traveling, and rebar installation actions.

  • PDF

자동기계학습 TPOT 기반 저수위 예측 정확도 향상을 위한 시계열 교차검증 기법 연구 (A Study on Time Series Cross-Validation Techniques for Enhancing the Accuracy of Reservoir Water Level Prediction Using Automated Machine Learning TPOT)

  • 배주현;박운지;이서로;박태선;박상빈;김종건;임경재
    • 한국농공학회논문집
    • /
    • 제66권1호
    • /
    • pp.1-13
    • /
    • 2024
  • This study assessed the efficacy of improving the accuracy of reservoir water level prediction models by employing automated machine learning models and efficient cross-validation methods for time-series data. Considering the inherent complexity and non-linearity of time-series data related to reservoir water levels, we proposed an optimized approach for model selection and training. The performance of twelve models was evaluated for the Obong Reservoir in Gangneung, Gangwon Province, using the TPOT (Tree-based Pipeline Optimization Tool) and four cross-validation methods, which led to the determination of the optimal pipeline model. The pipeline model consisting of Extra Tree, Stacking Ridge Regression, and Simple Ridge Regression showed outstanding predictive performance for both training and test data, with an R2 (Coefficient of determination) and NSE (Nash-Sutcliffe Efficiency) exceeding 0.93. On the other hand, for predictions of water levels 12 hours later, the pipeline model selected through time-series split cross-validation accurately captured the change pattern of time-series water level data during the test period, with an NSE exceeding 0.99. The methodology proposed in this study is expected to greatly contribute to the efficient generation of reservoir water level predictions in regions with high rainfall variability.

기계학습 기반의 인포그래픽 자동 추천 시스템 (Automated infographic recommendation system based on machine learning)

  • 김형균;이상희
    • 디지털융복합연구
    • /
    • 제19권11호
    • /
    • pp.17-22
    • /
    • 2021
  • 본 논문에서는 기존의 인포그래픽 제작방식을 개선하기 위하여 기계학습 기반의 인포그래픽 자동 추천 시스템을 제안하였다. 이 시스템은 복수의 인포그래픽 이미지를 기계학습하는 부분과 사용자의 기초자료 입력만으로 인포그래픽을 인공지능으로 자동 추천하는 부분으로 구성된다. 추천된 인포그랙픽은 라이브러리 형태로 제공되고, 드래그 & 드롭방식으로 추가적인 자료의 입력이 가능하게 된다. 또한, 입력한 자료의 크기에 따라 인포그래픽 이미지가 동적으로 조절되도록 설계하였다. 기계학습 기반의 인포그래픽 자동 추천 과정을 분석한 결과 레이아웃과 키워드에 대한 일치 성공율은 매우 높고, 타입에 대한 일치 성공률은 다소 낮게 나타났다. 추후 인포그래픽 부분별 이미지 타입에 대한 일치 성공률을 향상시키기 위한 연구가 필요할 것이다.

자율 기계 학습을 위한 효과적인 스마트 온실 데이터 전처리 시스템 (An Effective Smart Greenhouse Data Preprocessing System for Autonomous Machine Learning)

  • 임종태;;김윤아;백정현;유재수
    • 스마트미디어저널
    • /
    • 제12권1호
    • /
    • pp.47-53
    • /
    • 2023
  • 최근 정보통신기술을 농업과 접목해 새로운 가치를 창출하는 스마트팜 연구가 활발하게 진행되고 있다. 국내 스마트팜 기술이 농업 선진국 수준의 생산성을 가지기 위해서는 기계 학습을 활용한 자동화된 의사결정이 필요하다. 그러나 현재의 스마트 온실 데이터 수집 기술은 빅데이터 분석이나 기계 학습을 수행하기에 충분하지 않다. 본 논문에서는 자율 기계 학습을 위한 스마트 온실 데이터 전처리 시스템을 설계하고 구현한다. 제안하는 시스템은 대상 데이터를 다양한 전처리 기법에 적용하고 평가를 수행하여 최적 전처리 기법을 탐색하고 저장한다. 이렇게 탐색 된 최적 전처리 기법은 새롭게 수집된 데이터에 대하여 전처리를 수행하는데 활용된다.

기계학습 기반 비선형 전력수요 패턴 GP 모델링 (GP Modeling of Nonlinear Electricity Demand Pattern based on Machine Learning)

  • 김용길
    • 한국인터넷방송통신학회논문지
    • /
    • 제21권3호
    • /
    • pp.7-14
    • /
    • 2021
  • 자동화된 스마트 그리드의 등장은 이러한 문제에 대응을 위한 필수적인 장치가 되고 있으며 스마트 그리드 기반 사회로의 진전을 가져오고 있다. 스마트 그리드는 전기 공급 업체와 소비자 간의 양방향 통신을 가능하게 하는 새로운 패러다임이다. 스마트 그리드는 전력 그리드를 보다 안정적이고 신뢰할 수 있으며 효율적이고 안전하게 만들기 위한 엔지니어의 이니셔티브로 인해 등장했다. 스마트 그리드는 전력 소비자가 전력 사용에서 더 큰 역할을 할 수 있는 기회를 창출하고 전력을 현명하고 효율적으로 사용하도록 동기를 부여한다. 이에 본 연구에서는 기계 학습을 통한 전력 수요 관리에 중점을 둔다. 기계 학습을 사용한 수요 예측과 관련하여 현재 다양한 기계 학습 모델이 소개되어 적용되고 있는 데 이에 관한 체계적인 접근이 요구되고 있다. 특히 GP 학습 모델의 경우에 일반 소비 예측 및 데이터의 가시화와 관련해서 다른 학습 모델보다 장점이 있지만, 스마트 미터 데이터의 예측과 관련해서는 데이터 독립성에 강한 영향을 받는다.

Medical Image Analysis Using Artificial Intelligence

  • Yoon, Hyun Jin;Jeong, Young Jin;Kang, Hyun;Jeong, Ji Eun;Kang, Do-Young
    • 한국의학물리학회지:의학물리
    • /
    • 제30권2호
    • /
    • pp.49-58
    • /
    • 2019
  • Purpose: Automated analytical systems have begun to emerge as a database system that enables the scanning of medical images to be performed on computers and the construction of big data. Deep-learning artificial intelligence (AI) architectures have been developed and applied to medical images, making high-precision diagnosis possible. Materials and Methods: For diagnosis, the medical images need to be labeled and standardized. After pre-processing the data and entering them into the deep-learning architecture, the final diagnosis results can be obtained quickly and accurately. To solve the problem of overfitting because of an insufficient amount of labeled data, data augmentation is performed through rotation, using left and right flips to artificially increase the amount of data. Because various deep-learning architectures have been developed and publicized over the past few years, the results of the diagnosis can be obtained by entering a medical image. Results: Classification and regression are performed by a supervised machine-learning method and clustering and generation are performed by an unsupervised machine-learning method. When the convolutional neural network (CNN) method is applied to the deep-learning layer, feature extraction can be used to classify diseases very efficiently and thus to diagnose various diseases. Conclusions: AI, using a deep-learning architecture, has expertise in medical image analysis of the nerves, retina, lungs, digital pathology, breast, heart, abdomen, and musculo-skeletal system.

배전계획을 고려한 실데이터 및 기계학습 기반의 배전선로 부하예측 기법에 대한 연구 (Prediction of Electric Power on Distribution Line Using Machine Learning and Actual Data Considering Distribution Plan)

  • Kim, Junhyuk;Lee, Byung-Sung
    • KEPCO Journal on Electric Power and Energy
    • /
    • 제7권1호
    • /
    • pp.171-177
    • /
    • 2021
  • In terms of distribution planning, accurate electric load prediction is one of the most important factors. The future load prediction has manually been performed by calculating the maximum electric load considering loads transfer/switching and multiplying it with the load increase rate. In here, the risk of human error is inherent and thus an automated maximum electric load forecasting system is required. Although there are many existing methods and techniques to predict future electric loads, such as regression analysis, many of them have limitations in reflecting the nonlinear characteristics of the electric load and the complexity due to Photovoltaics (PVs), Electric Vehicles (EVs), and etc. This study, therefore, proposes a method of predicting future electric loads on distribution lines by using Machine Learning (ML) method that can reflect the characteristics of these nonlinearities. In addition, predictive models were developed based on actual data collected at KEPCO's existing distribution lines and the adequacy of developed models was verified as well. Also, as the distribution planning has a direct bearing on the investment, and amount of investment has a direct bearing on the maximum electric load, various baseline such as maximum, lowest, median value that can assesses the adequacy and accuracy of proposed ML based electric load prediction methods were suggested.

머신 러닝 접근 방식을 통한 가짜 채용 탐지 (Detecting Fake Job Recruitment with a Machine Learning Approach)

  • 일킨 타히예프;이재흥
    • 스마트미디어저널
    • /
    • 제12권2호
    • /
    • pp.36-41
    • /
    • 2023
  • 지원자 추적 시스템의 등장으로 온라인 채용이 활성화되면서 채용 사기가 심각한 문제로 대두되고 있다. 이 연구는 온라인 채용 환경에서 채용 사기를 탐지할 수 있는 신뢰할 수 있는 모델을 개발하여 비용 손실을 줄이고 개인 사생활 보호를 강화하고자 한다. 이 연구의 주요 기여는 데이터를 탐색적으로 분석하여 얻은 통찰력을 활용하여 어떤 채용 정보가 사기인지, 아니면 합법적인지를 구분할 수 있는 자동화된 방법론을 제공하는데 있다. 캐글에서 제공하는 채용 사기 데이터 집합인 EMSCAD를 사용하여 다양한 단일 분류기 및 앙상블 분류기 기반 머신러닝 모델을 훈련하고 평가하였으며, 그 결과로 앙상블 분류기인 랜덤 포레스트 분류기가 정확도 98.67%, F1 점수 0.81로 가장 좋은 결과를 보이는 것을 알 수 있었다.

Application of machine learning for merging multiple satellite precipitation products

  • Van, Giang Nguyen;Jung, Sungho;Lee, Giha
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.134-134
    • /
    • 2021
  • Precipitation is a crucial component of water cycle and play a key role in hydrological processes. Traditionally, gauge-based precipitation is the main method to achieve high accuracy of rainfall estimation, but its distribution is sparsely in mountainous areas. Recently, satellite-based precipitation products (SPPs) provide grid-based precipitation with spatio-temporal variability, but SPPs contain a lot of uncertainty in estimated precipitation, and the spatial resolution quite coarse. To overcome these limitations, this study aims to generate new grid-based daily precipitation using Automatic weather system (AWS) in Korea and multiple SPPs(i.e. CHIRPSv2, CMORPH, GSMaP, TRMMv7) during the period of 2003-2017. And this study used a machine learning based Random Forest (RF) model for generating new merging precipitation. In addition, several statistical linear merging methods are used to compare with the results of the RF model. In order to investigate the efficiency of RF, observed data from 64 observed Automated Synoptic Observation System (ASOS) were collected to evaluate the accuracy of the products through Kling-Gupta efficiency (KGE), probability of detection (POD), false alarm rate (FAR), and critical success index (CSI). As a result, the new precipitation generated through the random forest model showed higher accuracy than each satellite rainfall product and spatio-temporal variability was better reflected than other statistical merging methods. Therefore, a random forest-based ensemble satellite precipitation product can be efficiently used for hydrological simulations in ungauged basins such as the Mekong River.

  • PDF