• 제목/요약/키워드: 기계학습(머신러닝)

검색결과 150건 처리시간 0.027초

심혈관질환 위험 예측을 위한 비용민감 학습 모델 (Cost-Sensitive Learning for Cardio-Cerebrovascular Disease Risk Prediction)

  • 이유나;이경희;조완섭
    • 한국빅데이터학회지
    • /
    • 제6권2호
    • /
    • pp.161-168
    • /
    • 2021
  • 본 연구에서는 기계 학습을 사용하여 심혈관 질환 예측 모델을 제안한다. 먼저 두 집단간에 다양한 차이를 다차원분석하고 그 결과를 시각화한다. 특히, 질환과 같이 정상집단과 환자집단 간에 높은 클래스 불균형이 존재하는 경우에 대하여 민감도를 향상시킬 수 있는 비용 민감 학습을 사용하는 예측 모델을 제안한다. 본 연구에서는 대표적인 머신러닝 기술인 CART와 XGBoost를 사용하여 예측모델을 개발하고, 심혈관 질환 환자 데이터를 대상으로 예측하고 성능을 비교한다. 연구결과에 따르면 CART가 XGBoost 보다 더 높은 정확도와 특이도를 보였으며, 정확도는 약 70%~74%로 나타났다.

웨어러블 센서를 이용한 라이프로그 데이터 자동 감정 태깅 (Automated Emotional Tagging of Lifelog Data with Wearable Sensors)

  • 박경화;김병희;김은솔;조휘열;장병탁
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권6호
    • /
    • pp.386-391
    • /
    • 2017
  • 본 논문에서는 실생활에서 수집한 웨어러블 센서 데이터에서 사용자의 체험 기반 감정 태그정보를 자동으로 부여하는 시스템을 제안한다. 사용자 본인의 감정과 사용자가 보고 듣는 정보를 종합적으로 고려하여 네 가지의 감정 태그를 정의한다. 직접 수집한 웨어러블 센서 데이터를 중심으로 기존 감성컴퓨팅 연구를 통해 알려진 보조 정보를 결합하여, 다중 센서 데이터를 입력으로 하고 감정 태그를 구분하는 머신러닝 기반 분류 시스템을 학습하였다. 다중 모달리티 기반 감정 태깅 시스템의 유용성을 보이기 위해, 기존의 단일 모달리티 기반의 감정 인식 접근법과의 정량적, 정성적 비교를 한다.

희박한 고객 활동 데이터에서 최신성 기반 추천 성능 향상 연구

  • 백상훈;김주영;안순홍
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.781-784
    • /
    • 2019
  • 최근 AI를 산업 서비스에 적용하기 위해 많은 회사들이 활발히 연구를 하고 있다. 아마존과 넷플릭스 같은 거대 기업들은 이미 빅데이터와 AI 머신러닝을 이용한 추천 시스템을 구현하였고 아마존은 매출의 35%가 추천에 의해 발생하고 넷플릭스 75%의 사용자가 추천을 통해 영화를 선택한다고 보고되었다. 이러한 두 기업의 높은 추천 효율성의 이유는 협업 필터링(Collaborative filtering)과 같은 다양한 추천 알고리즘과 방대한 상품 및 고객 행동(구매, 시청 등) 데이터 등이 존재하고 있기 때문이다. 기계학습에서 알고리즘 학습을 위한 데이터의 양이 많지 않을 경우 알고리즘의 성능을 보장할 수 없다는 것이 일반적인 의견이다. 방대한 데이터를 가진 기업에서 추천 알고리즘을 적극적으로 활용 및 연구하고 있는 것도 이러한 이유 때문이다. 반면, 오프라인 및 여행사 기반에서 온라인 기반으로 영역을 차츰 확대하고 있는 항공 서비스 고객 데이터의 경우, 산업의 특성상 많은 회원에 비해 고객 1명당 온라인에서 활동하는 이력이 많지 않은 것이 특징이다. 이는, 추천 알고리즘을 통한 서비스 제공에서 큰 제약사항으로 작용한다. 본 연구에서는, 이러한 희박한 고객 활동 데이터에서 최신성 기반의 추천 시스템을 통하여 제약사항을 극복하고 추천 효율을 높이는 방법을 제안한다. 고객의 최근 접속 이력 로그를 시간 기준으로 데이터 셋을 분할하여 추천 알고리즘에 반영하였을 때, 추천된 노선에 대한 고객의 반응을 추천 성능 지표인 CTR(Click-Through Rate)로 측정하여 성능을 확인해 보았다.

머신러닝/ADAS 정보 활용 충돌안전 제어로직 개발 (Development of Collision Safety Control Logic using ADAS information and Machine Learning)

  • 박형욱;송수성;신장호;한광철;최세경;하헌석;윤성로
    • 자동차안전학회지
    • /
    • 제14권3호
    • /
    • pp.60-64
    • /
    • 2022
  • In the automotive industry, the development of automobiles to meet safety requirements is becoming increasingly complex. This is because quality evaluation agencies in each country are continually strengthening new safety standards for vehicles. Among these various requirements, collision safety must be satisfied by controlling airbags, seat belts, etc., and can be defined as post-crash safety. Apart from this safety system, the Advanced Driver Assistance Systems (ADAS) use advanced detection sensors, GPS, communication, and video equipment to detect the hazard and notify driver before the collision. However, research to improve passenger safety in case of an accident by using the sensor of active safety represented by ADAS in the existing passive safety is limited to the level that utilizes the sudden braking level of the FCA (Forward Collision-avoidance Assist) system. Therefore, this study aims to develop logic that can improve passenger protection in case of an accident by using ADAS information and driving information secured before a collision. The proposed logic was constructed based on LSTM deep learning techniques and trained using crash test data.

LightGBM 알고리즘을 활용한 고속도로 교통사고심각도 예측모델 구축 (Predicting of the Severity of Car Traffic Accidents on a Highway Using Light Gradient Boosting Model)

  • 이현미;전교석;장정아
    • 한국전자통신학회논문지
    • /
    • 제15권6호
    • /
    • pp.1123-1130
    • /
    • 2020
  • 본 연구는 고속도로 교통사고 심각도 예측모델을 구축하기 위해 다섯가지 머신러닝 기반의 분류모형 적용하였다. 2015년~2017년 동안 전국 고속도로에서 발생한 사고 데이터 21,013건을 5가지의 분류 모형을 적용한 결과 LightGBM(Light Gradient Boosting Model)이 가장 좋은 성능을 나타내는 것으로 나타났다. LightGBM에서는 교통사고심각도 추정에 있어 우선순위 요인으로 사고차량 수, 사고유형, 사고지점, 사고차로유형, 사고차량 유형 순으로 나타났다. 이러한 모형의 결과를 기반으로 일관적인 사고심각도 예측 과정을 통하여 교통사고대응관리 전략 수립에 활용할 수 있다. 본 연구는 국내 기계학습을 활용한 사례가 적은 여건에서 향후 빅데이터 기반의 다양한 기계학습 기법을 활용이 가능함을 제시하고 있다.

GPS 재밍탐지를 위한 기계학습 적용 및 성능 분석 (Application and Performance Analysis of Machine Learning for GPS Jamming Detection)

  • 정인환
    • 한국정보기술학회논문지
    • /
    • 제17권5호
    • /
    • pp.47-55
    • /
    • 2019
  • 최근 GPS 재밍으로 인한 피해가 증가되면서 GPS 재밍을 탐지하고 대비하기 위한 연구가 활발히 진행되고 있다. 본 논문은 다중 GPS 수신채널과 3가지 기계학습을 이용한 GPS 재밍 탐지 방법을 다루고 있다. 제안된 다중 GPS 채널은 항재밍 기능이 없는 상용 GPS 수신기와 항잡음 재밍능력만 있는 수신기, 항잡음/항기만 재밍능력이 있는 수신기로 구성되고 운용자는 각각의 수신기에 수신된 좌표를 비교하여 재밍신호의 특성을 식별할 수 있다. 본 논문에서는 신호특성이 다른 각각의 5개 재밍신호를 입력하고, 3가지 기계학습방법(AB: Adaptive Boosting, SVM: Support Vector Machine, DT: Decision Tree)을 이용하여 재밍탐지 시험을 수행하였다. 시험 결과 머신러닝 기법을 단독으로 사용하였을 때 DT 기법이 96.9% 탐지율로 가장 우수한 성능을 보였으며 이진분류기 기법에 비해 모호성 낮고 하드웨어가 단순하여 GPS 재밍탐지에 효과적임을 확인하였다. 또한, 모호성을 해결해주는 추가기법을 적용할 경우 SVM 기법을 활용할 수 있음을 확인하였다.

효율적 수입식품 검사를 위한 머신러닝 기반 부적합 건강기능식품 탐지 방법 (A Method of Machine Learning-based Defective Health Functional Food Detection System for Efficient Inspection of Imported Food)

  • 이경수;박예린;신윤종;손권상;권오병
    • 지능정보연구
    • /
    • 제28권3호
    • /
    • pp.139-159
    • /
    • 2022
  • 코로나19 이후 건강기능식품의 관심이 높아짐에 따라 수입 식품 안전성 검사의 중요성도 더욱 커지고 있다. 그러나 매년 증가하는 건강기능식품 수입량과 반대로 식품 검사에 필요한 예산과 인력은 한계점에 다다르고 있다. 따라서 본 연구의 목적은 수출입 식품 중 건강기능식품을 대상으로 데이터의 특성을 살펴보고, 판별의 정확성과 결과의 설명 가능성을 고려하여 효율적으로 부적합 식품을 탐지할 수 있는 기계학습 모델 기반 자동화 시스템 설계 방안을 제시하는 것이다. 이를 위해 첫째, 부적합 판정에 영향을 미치는 식품 검사 데이터로부터 부적합 판정에 유의한 파생변수를 생성하며, 둘째, 건강기능식품 수출입 검사 데이터에 대한 탐색적 분석을 통해 클래스 불균형과 비선형성 등을 고려하여 영향변수를 선정하며, 셋째, 다양한 머신러닝 기법을 적용하여 모델 별 성능과 해석가능성에 대해 비교를 수행하고자 한다. 성능 분석 결과, 앙상블 모델이 가장 우수하였으며, 본 연구에서 제안하는 파생변수 및 모델이 수출입 식품 검사에서 활용하고 있는 시스템에 도움이 될 수 있음을 확인하였다.

머신러닝 기반의 온실 VPD 예측 모델 비교 (Comparison of Machine Learning-Based Greenhouse VPD Prediction Models)

  • 장경민;이명배;임종현;오한별;신창선;박장우
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권3호
    • /
    • pp.125-132
    • /
    • 2023
  • 본 연구에서는 식물의 영양분 흡수에 따른 식물 성장뿐만 아니라 기공 기능 및 광합성에도 영향을 끼치는 온실의 수증기압차(VPD, Vapor Pressure Deficit)예측을 위한 머신러닝 모델들의 성능을 비교해보았다. VPD 예측을 위해 온실 내·외부 환경요소 및 시계열 데이터의 시간적 요소들과의 상관관계를 확인하고 상관관계가 높은 요소들이 VPD에 어떤 영향을 미치는지 확인하였다. 예측 모델의 성능을 분석하기 전 분석 시계열 데이터의 양(1일, 3일, 7일), 간격(20분, 1시간)이 예측 성능에 미치는 영향을 확인하여 데이터의 양과 간격을 조절하였다. 마지막으로 4개의 머신러닝 예측 모델(XGB Regressor, LGBM Regressor, Random Forest Regressor 등)을 적용하여 모델별 예측 성능을 비교했다. 모델의 예측 결과로 20분 간격의 1일의 데이터를 사용했을 때 LGBM에서 MAE는 0.008, RMSE는 0.011의 가장 높은 예측 성능을 보였다. 또한 20분 후 VPD 예측에 가장 큰 영향을 미치는 요소는 환경적 요인보다는 과거 20분 전의 VPD(VPD_y__71)임을 확인하였다. 본 연구의 결과를 활용하여 VPD 예측을 통해 작물의 생산성을 높이고, 온실의 결로, 병 발생 예방 등이 가능하다. 향후 온실의 환경 데이터 예측뿐만 아니라 더 나아가 생산량 예측, 스마트팜 제어 모델 등 다양한 분야에 활용할 수 있을 것이다.

머신러닝 기반 효과적인 가뭄예측 (Effective Drought Prediction Based on Machine Learning)

  • 김교식;유재환;김병현;한건연
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.326-326
    • /
    • 2021
  • 장기간에 걸쳐 넓은 지역에 대해 발생하는 가뭄을 예측하기위해 많은 학자들의 기술적, 학술적 시도가 있어왔다. 본 연구에서는 복잡한 시계열을 가진 가뭄을 전망하는 방법 중 시나리오에 기반을 둔 가뭄전망 방법과 실시간으로 가뭄을 예측하는 비시나리오 기반의 방법 등을 이용하여 미래 가뭄전망을 실시했다. 시나리오에 기반을 둔 가뭄전망 방법으로는, 3개월 GCM(General Circulation Model) 예측 결과를 바탕으로 2009년도 PDSI(Palmer Drought Severity Index) 가뭄지수를 산정하여 가뭄심도에 대한 단기예측을 실시하였다. 또, 통계학적 방법과 물리적 모델(Physical model)에 기반을 둔 확정론적 수치해석 방법을 이용하여 비시나리오 기반 가뭄을 예측했다. 기존 가뭄을 통계학적 방법으로 예측하기 위해서 시도된 대표적인 방법으로 ARIMA(Autoregressive Integrated Moving Average) 모델의 예측에 대한 한계를 극복하기위해 서포트 벡터 회귀(support vector regression, SVR)와 웨이블릿(wavelet neural network) 신경망을 이용해 SPI를 측정하였다. 최적모델구조는 RMSE(root mean square error), MAE(mean absolute error) 및 R(correlation Coefficient)를 통해 선정하였고, 1-6개월의 선행예보 시간을 갖고 가뭄을 전망하였다. 그리고 SPI를 이용하여, 마코프 연쇄(Markov chain) 및 대수선형모델(log-linear model)을 적용하여 SPI기반 가뭄예측의 정확도를 검증하였으며, 터키의 아나톨리아(Anatolia) 지역을 대상으로 뉴로퍼지모델(Neuro-Fuzzy)을 적용하여 1964-2006년 기간의 월평균 강수량과 SPI를 바탕으로 가뭄을 예측하였다. 가뭄 빈도와 패턴이 불규칙적으로 변하며 지역별 강수량의 양극화가 심화됨에 따라 가뭄예측의 정확도를 높여야 하는 요구가 커지고 있다. 본 연구에서는 복잡하고 비선형성으로 이루어진 가뭄 패턴을 기상학적 가뭄의 정도를 나타내는 표준강수증발지수(SPEI, Standardized Precipitation Evapotranspiration Index)인 월SPEI와 일SPEI를 기계학습모델에 적용하여 예측개선 모형을 개발하고자 한다.

  • PDF

빅데이터 분석과 머신러닝을 활용한 특정 정치인의 견해와 평판에 대한 프로파일링 기술 (Profile Generation on a Politician' Views and Reputations by using Big Data Analysis and Machine Learning)

  • 김민희;강재은;최주영;황채연;김명주
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 춘계학술발표대회
    • /
    • pp.385-388
    • /
    • 2020
  • 선거 기간 때마다 유권자들은 어떤 후보자에게 투표권을 행사해야 올바른 선택을 하게 될지 고민하게 되며, 후보자의 선거캠프에서는 후보자에 대한 유권자의 평판에 관심을 가지게 된다. 이러한 고민을 해결하기 위하여 본 논문에서는 TF-IDF 기법과 양방향 LSTM 기계학습모델을 활용해 특정 정치인의 분야별 행보와 여론에 대해 시계열 파악이 가능한 프로파일 보고서를 생성한다. 이를 통해 유권자는 후보자의 정치 철학과 경륜에 대한 이해가 쉬워져 올바른 투표권을 행사할 수 있으며 선거캠프에서는 데이터 기반 평판에 대한 올바른 선거전략을 수립할 수 있게 된다.