• 제목/요약/키워드: machine learning (ML)

검색결과 280건 처리시간 0.024초

A Study on Predicting the demand for Public Shared Bikes using linear Regression

  • HAN, Dong Hun;JUNG, Sang Woo
    • 한국인공지능학회지
    • /
    • 제10권1호
    • /
    • pp.27-32
    • /
    • 2022
  • As the need for eco-friendly transportation increases due to the deepening climate crisis, many local governments in Korea are introducing shared bicycles. Due to anxiety about public transportation after COVID-19, bicycles have firmly established themselves as the axis of daily transportation. The use of shared bicycles is spread, and the demand for bicycles is increasing by rental offices, but there are operational and management difficulties because the demand is managed under a limited budget. And unfortunately, user behavior results in a spatial imbalance of the bike inventory over time. So, in order to easily operate the maintenance of shared bicycles in Seoul, bicycles should be prepared in large quantities at a time of high demand and withdrawn at a low time. Therefore, in this study, by using machine learning, the linear regression algorithm and MS Azure ML are used to predict and analyze when demand is high. As a result of the analysis, the demand for bicycles in 2018 is on the rise compared to 2017, and the demand is lower in winter than in spring, summer, and fall. It can be judged that this linear regression-based prediction can reduce maintenance and management costs in a shared society and increase user convenience. In a further study, we will focus on shared bike routes by using GPS tracking systems. Through the data found, the route used by most people will be analyzed to derive the optimal route when installing a bicycle-only road.

Machine learning techniques for prediction of ultimate strain of FRP-confined concrete

  • Tijani, Ibrahim A.;Lawal, Abiodun I.;Kwon, S.
    • Structural Engineering and Mechanics
    • /
    • 제84권1호
    • /
    • pp.101-111
    • /
    • 2022
  • It is widely known that axially loaded fiber-reinforced polymer (FRP) confined concrete presents significant and enhanced mechanical properties with reference to the unconfined concrete. Therefore, to predict the mechanical behavior of FRP-confined concrete two quantities-peak strength and ultimate strain are required. Despite the significant advances, the determination of the ultimate strain of FRP-confined concrete is one of the most challenging problems to be resolved. This is often attributed to our persistence in desiring the conventional methods as the sole technique to examine this phenomenon and the complex nature of the ultimate strain of FRP-confined concrete. To bridge the research gap, this study adopted two machine learning (ML) techniques-artificial neural network (ANN) and Gaussian process regression (GPR)-to analyze observations obtained from 627 datasets of FRP-confined concrete circular and non-circular sections under axial loading test. Besides, the techniques are also used to predict the ultimate strain of FRP-confined concrete. Seven parameters namely width/diameter of the specimens, corner radius ratio, the strength of concrete, FRP elastic modulus, FRP thickness, FRP tensile rupture strain, and the axial strain of unconfined concrete-are the input parameters used to predict the ultimate strain of FRP-confined concrete. The results of the current study highlight the merit of using AI techniques in structural engineering applications given their extraordinary ability to comprehend multidimensional phenomena of FRP-confined concrete structures with ease, low computational cost, and high performance over the existing empirical models.

한국어 사전학습 모델을 활용한 자연어 처리 모델 자동 산출 시스템 설계 (An Automated Production System Design for Natural Language Processing Models Using Korean Pre-trained Model)

  • 장지형;최호윤;이건우;최명석;홍참길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.613-618
    • /
    • 2022
  • 효과적인 자연어 처리를 위해 제안된 Transformer 구조의 등장 이후, 이를 활용한 대규모 언어 모델이자 사전학습 모델인 BERT, GPT, OPT 등이 공개되었고, 이들을 한국어에 보다 특화한 KoBERT, KoGPT 등의 사전학습 모델이 공개되었다. 자연어 처리 모델의 확보를 위한 학습 자원이 늘어나고 있지만, 사전학습 모델을 각종 응용작업에 적용하기 위해서는 데이터 준비, 코드 작성, 파인 튜닝 및 저장과 같은 복잡한 절차를 수행해야 하며, 이는 다수의 응용 사용자에게 여전히 도전적인 과정으로, 올바른 결과를 도출하는 것은 쉽지 않다. 이러한 어려움을 완화시키고, 다양한 기계 학습 모델을 사용자 데이터에 보다 쉽게 적용할 수 있도록 AutoML으로 통칭되는 자동 하이퍼파라미터 탐색, 모델 구조 탐색 등의 기법이 고안되고 있다. 본 연구에서는 한국어 사전학습 모델과 한국어 텍스트 데이터를 사용한 자연어 처리 모델 산출 과정을 정형화 및 절차화하여, 궁극적으로 목표로 하는 예측 모델을 자동으로 산출하는 시스템의 설계를 소개한다.

  • PDF

Image texture feature를 이용하여 비소세포폐암 전이 예측 머신러닝 모델 연구 (Study of machine learning model for predicting non-small cell lung cancer metastasis using image texture feature)

  • 주혜민;우상근
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.313-315
    • /
    • 2023
  • 본 논문에서는 18F-FDG PET과 CT에서 추출한 영상인자를 이용하여 비소세포폐암의 전이를 예측하는 머신러닝 모델을 생성하였다. 18F-FDG는 종양의 포도당 대사 시 사용되며 이를 추적하여 환자의 암 세포를 진단하는데 사용되는 의료영상 기법 중 하나이다. PET과 CT 영상에서 추출한 이미지 특징은 종양의 생물학적 특성을 반영하며 해당 ROI로부터 계산되어 정량화된 값이다. 본 연구에서는 환자의 의료영상으로부터 image texture 프절 전이 예측에 있어 유의한 인자인지를 확인하기 위하여 AUC를 계산하고 단변량 분석을 진행하였다. PET과 CT에서 각각 4개(GLRLM_GLNU, SHAPE_Compacity only for 3D ROI, SHAPE_Volume_vx, SHAPE_Volume_mL)와 2개(NGLDM_Busyness, TLG_ml)의 image texture feature를 모델의 생성에 사용하였다. 생성된 각 모델의 성능을 평가하기 위해 accuracy와 AUC를 계산하였으며 그 결과 random forest(RF) 모델의 예측 정확도가 가장 높았다. 추출된 PET과 CT image texture feature를 함께 사용하여 모델을 훈련하였을 때가 각각 따로 사용하였을 때 보다 예측 성능이 개선됨을 확인하였다. 추출된 영상인자가 림프절 전이를 나타내는 바이오마커로서의 가능성을 확인할 수 있었으며 이러한 연구 결과를 바탕으로 개인별 의료 영상을 기반으로 한 비소세포폐암의 치료 전략을 수립할 수 있을 것이라 기대된다.

  • PDF

지진으로 인한 건물 손상 예측 모델의 효율성 분석 (Evaluating the Efficiency of Models for Predicting Seismic Building Damage)

  • 채송화;임유진
    • 정보처리학회 논문지
    • /
    • 제13권5호
    • /
    • pp.217-220
    • /
    • 2024
  • 지진 발생은 정확히 예측하기 어렵고, 이러한 무작위성을 갖는 사건에 대비하여 모든 건물에 내진 설계를 도입하는 것은 현실적으로 어려운 과제이다. 건물의 특징 분석을 통한 건물 손상 예측을 기반으로 건물의 취약점을 보완한다면, 내진 설계를 도입하지 않은 건물에서도 피해를 최소화할 수 있으므로 건물 손상 예측 모델의 효율성을 분석하는 연구가 필요하다. 본 논문에서는 2015년 네팔 대지진으로 인해 손상된 건물 데이터를 활용하여 Random Forest, Extreme Gradient Boosting, LightGBM, CatBoost 기계학습 분류 알고리즘을 사용하여 지진 피해 예측 모델의 정확도를 비교하였다.

국내 항공기 위치 데이터를 활용한 이착륙 접근 단계에서의 항공 위험상황 탐지를 위한 데이터 전처리 및 머신 러닝 분석 기법 (Data Preprocessing and ML Analysis Method for Abnormal Situation Detection during Approach using Domestic Aircraft Safety Data)

  • 이상호;손일락;정규호;박노삼
    • Journal of Platform Technology
    • /
    • 제11권5호
    • /
    • pp.110-125
    • /
    • 2023
  • 본 논문에서는 2019년 국내 공항을 기준으로 측정된 시계열 항공기 위치 데이터를 활용하여 국내 공항에 이착륙 시 접근 단계에서의 항공 위험상황 중 Go-Around 및 UOC_D 를 분석하고, 다양한 클러스터링 기반 머신 러닝 기법을 적용하여 국내 항공 데이터에서 가장 알맞은 분석 기법이 무엇인지를 실험을 통해 제시한다. 항공기 위치를 측정하기 위한 센서는 ADS-B를 단일로 사용하였으며, 클러스터링 기법들 중 K-Means, GMM, DBSCAN 등의 알고리즘을 사용하여 이상상황을 분류하기 위한 모델을 설계하였다. 그 중 해외에서는 RF 모델이 가장 나은 성능을 보였으나, 국내 항공 데이터에 대해서는 국내 지형에 특화된 부분을 반영한 GMM이 가장 높은 분류 성능을 보이는 것으로 실험을 통해 확인하였다.

  • PDF

도로교통 이머징 리스크 탐지를 위한 AutoML과 CNN 기반 소프트 보팅 앙상블 분류 모델 (AutoML and CNN-based Soft-voting Ensemble Classification Model For Road Traffic Emerging Risk Detection)

  • 전병욱;강지수;정경용
    • 융합정보논문지
    • /
    • 제11권7호
    • /
    • pp.14-20
    • /
    • 2021
  • 겨울철 도로 결빙으로 인한 사고는 대부분 큰 사고로 이어진다. 이는 운전자가 도로의 결빙을 사전에 자각하기 어렵기 때문이다. 본 연구에서는 AutoML과 CNN의 앙상블 모델을 이용하여 도로교통 이머징 리스크를 정확하게 탐지하는 방법을 연구한다. 비정형 데이터인 이미지를 이용한 CNN 이미지 특징 추출 기반 도로교통 이머징 리스크 분류 모델과 정형 데이터인 기상 데이터를 이용한 AutoML 기반 도로교통 이머징 리스크 분류 모델을 각각 학습시킨다. 그 후 모델들에서 도출된 확률값을 입력하여 CNN 기반 분류 모델을 보완하도록 앙상블 모델을 설계한다. 이를 통해 도로교통 이머징 리스크 분류 성능을 향상하고 더 정확하고 빠르게 운전자에게 경고하여 안전한 주행이 가능하도록 한다.

앙상블 조합 방법에 따른 주가 예측 성능 비교 (Comparison of Stock Price Forecasting Performance by Ensemble Combination Method)

  • 양현성;박준;소원호;심춘보
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.524-527
    • /
    • 2022
  • 본 연구에서는 머신러닝(Machine Learning, ML)과 딥러닝(Deep Learning, DL) 모델을 앙상블(Ensemble)하여 어떠한 주가 예측 방법이 우수한지에 대한 연구를 하고자 한다. 연구에 사용된 모델은 하이퍼파라미터(Hyperparameter) 조정을 통하여 최적의 결과를 출력한다. 앙상블 방법은 머신러닝과 딥러닝 모델의 앙상블, 머신러닝 모델의 앙상블, 딥러닝 모델의 앙상블이다. 세 가지 방법으로 얻은 결과를 평균 제곱근 오차(Root Mean Squared Error, RMSE)로 비교 분석하여 최적의 방법을 찾고자 한다. 제안한 방법은 주가 예측 연구의 시간과 비용을 절약하고, 최적 성능 모델 판별에 도움이 될 수 있다고 사료된다.

불규칙한 빠짐을 포함한 탄성파 탐사 자료의 머신러닝을 이용한 트레이스 기반 내삽 (Trace-based Interpolation Using Machine Learning for Irregularly Missing Seismic Data)

  • 이재우;박지호;설순지;윤대웅;변중무
    • 지구물리와물리탐사
    • /
    • 제26권2호
    • /
    • pp.62-76
    • /
    • 2023
  • 최근에 활발히 적용되고 있는 머신러닝 기반 탄성파 내삽 기법들은 대부분 모음 자료를 2차원 영상화 하여 빠짐을 채우는 방법으로 하는 훈련(training)-추론(inference) 전략에 기초하므로 완벽히 채워진 다수의 모음자료가 훈련을 위해 필요하게 된다. 이 연구는 이와는 달리 트레이스 기반 내삽을 수행하는 내삽 기술의 훈련-추론 전략을 기본으로, 불규칙한 빠짐이 있는 현장자료 만을 이용하여 훈련-추론을 모두 수행할 수 있는 머신러닝을 이용한 트레이스 기반 불규칙한 빠짐의 내삽 기술을 제시하였다. 이 연구에서는 불규칙한 빠짐이 있는 자료를 훈련과 추론에 체계적으로 사용하는 최대 연속빠짐 간격에 따라 정해지는 네트워크를 구성하는 방법 및 훈련하는 방법을 기술하였다. 또한, 서호주 Exmouth Sub-basin 지역의 Vincent 유전에서 얻어진 시간 참반사 보정된 탄성파 자료에 개발된 방법을 적용한 후, 예측 결과를 전통적인 내삽 방법의 결과와 비교 및 분석하였다. 신호대잡음비나 구조유사성과 같은 정량적인 지표를 통해 두 방법 모두 내삽 성능이 높은 것을 확인하였으며, 모든 주파수 대역에서도 골고루 좋은 결과를 보임을 확인하였다.

건강보험 청구 데이터를 활용한 머신러닝 기반유방암 환자의 생존 여부 예측 (The Prediction of Survival of Breast Cancer Patients Based on Machine Learning Using Health Insurance Claim Data)

  • 이덕규;변경근;이형동;신선희
    • 한국산업정보학회논문지
    • /
    • 제28권2호
    • /
    • pp.1-9
    • /
    • 2023
  • 유방암 관련 기존 AI 연구는 보조적인 진단 예측이나 임상적 요인에 따른 진료 결과를 예측하는 주제가 많았다. 또한 연구기관의 코호트 자료나 일부 환자 자료를 이용하는 경우가 대부분이었다. 본 논문에서는 건강보험심사평가원이 보유하고 있는 전 국민 유방암 환자의 전수 데이터를 활용하여 유방암 환자의 40~50대와 다른 연령대 간의 생존 여부 예측과 생존 여부에 미치는 요인의 차이점을 분석했다. 그 결과, 환자들의 생존 여부 예측 정밀도는 40~50대가 평균 0.93으로 60~80대 0.86 보다 높았으며, 요인에 있어서도 40~50대는 치료횟수(46%)가, 60~80대는 나이(32%)의 변수 중요도가 제일 높았다. 기존 연구와 성능 비교 결과, 평균 정밀도가 0.90으로 기존 논문의 정밀도 0.81보다 높았다. 적용 알고리즘별 성능 비교 결과, 의사결정나무(Decision Tree), 랜덤포레스트(Random Forest) 및 그래디언트부스팅(Gradient Boosting)의 전체 평균 정밀도는 0.90, 재현율은 1.0으로 연령대 그룹 내에서 동일하였으며, 다층퍼셉트론(Multi-Layer Perceptron)의 정밀도는 0.89, 재현율은 1.0 이었다. 심평원의 전 국민 심사청구 빅데이터 가치 활용을 제고하기 위해 비전문가용 머신러닝 자동화(Auto ML) 도구를 사용한 더 많은 연구가 진행되기를 바란다.