• 제목/요약/키워드: 로지스틱모델

검색결과 239건 처리시간 0.026초

기계학습을 활용한 도로비탈면관리시스템 데이터 품질강화에 관한 연구 (The Study for Improvement of Data-Quality of Cut-Slope Management System Using Machine Learning)

  • 이세혁;김승현;우용훈;문재필;양인철
    • 지질공학
    • /
    • 제31권1호
    • /
    • pp.31-42
    • /
    • 2021
  • 도로비탈면관리시스템(Cut-Slope Management System, CSMS)은 전국 일반국도 비탈면에 대해 기초·정밀 조사를 바탕으로 데이터베이스를 구축해왔다. 그런데 이러한 데이터는 사람에 의해 기록되기 때문에 데이터 누락 및 오기입 문제가 발생할 수밖에 없다. 본 연구에서는 데이터의 불완전성 문제를 극복하기 위해 여러 머신러닝 기반의 예측모델들을 개발하고 이를 이용한 데이터 품질 강화 가능성을 검토하고자 하였다. 우선 다 범주 문자형 데이터를 수치화하는 과정을 수행하였고, 선정된 데이터 항목들에 대해 다항 로지스틱 회귀분석(Multinomial Logistic Regression)과 심층신경망(Deep-Neural-Network) 기반의 예측모델들을 개발하였다. 그 결과, 심층신경망 모델들의 정확도가 월등히 높은 것으로 나타났다. 향후 개발된 모델들을 활용하여 누락 및 오기입 데이터의 보완이 가능할 것으로 기대된다.

음성신호를 이용한 기계학습 기반 피로도 분류 모델 (Fatigue Classification Model Based On Machine Learning Using Speech Signals)

  • 이수화;권철홍
    • 문화기술의 융합
    • /
    • 제8권6호
    • /
    • pp.741-747
    • /
    • 2022
  • 피로는 개인의 능력을 저하되게 하여 업무 수행을 어렵게 하며, 피로가 누적되면 집중력이 저하되어 안전사고를 초래할 가능성이 증가하게 된다. 피로에 대한 자각은 주관적이나, 실제 현장에서는 피로의 수준을 정량적으로 측정할 필요가 있다. 기존 연구에서 피로 수준은 다원적 피로 척도와 같은 주관적 평가에, 생체신호 분석 등의 객관적지표를 추가하여 전문가의 판단으로 측정하는 방식이 제안되었으나, 이러한 방법은 일상생활에서 실시간으로 피로도를 평가하기 어렵다. 본 논문은 현장에서 녹음한 음성 데이터를 이용하여 실시간으로 작업자의 피로 수준을 판정하는 피로도 분류 모델에 관한 연구이다. 현장에서 수집한 음성 데이터를 이용하여 로지스틱 분류, 서포트 벡터 머신, 랜덤 포레스트 등의 기계학습 모델을 학습시킨다. 성능을 평가한 결과, 정확도가 0.677 ~ 0.758로 우수한 성능을 보여주었고, 이 중에서 로지스틱 분류가 가장 우수한 성능을 나타냈다. 실험 결과로부터 음성신호를 이용하여 피로도를 분류하는 것이 가능하다는 것을 알 수 있다.

머신러닝을 이용한 지하철 고장 탐지 및 예측 (Detection and Prediction of Subway Failure using Machine Learning)

  • 성국경
    • 산업과 과학
    • /
    • 제2권4호
    • /
    • pp.11-16
    • /
    • 2023
  • 지하철은 현대 도시의 교통 체계에서 중요한 역할을 하는 대중 교통 수단이다. 하지만, 갑작스런 고장 및 시스템 불통 등의 이유로 혼잡을 야기시키는 경우가 종종 발생하여 불편을 초래하고 있다. 따라서, 본 논문에서는 지하철 시스템의 효율적 운영을 위해 머신러닝을 활용한 고장 예측 및 예방 연구를 진행하였다. UC Irvine의 MetroPT-3 데이터셋을 활용하고, 로지스틱 회귀를 이용하여 지하철 고장 예측 모델을 구축하였다. 모델은 0.991의 높은 정확도로 비고장 상태를 예측하나, 정밀도와 재현율은 상대적으로 낮아 고장 예측에 있어 오류 가능성을 시사하고 있다. ROC_AUC 값이 0.901로, 모델이 무작위 추측보다 뛰어난 분류를 할 수 있다. 구축한 모델은 지하철 시스템의 안정적인 운영 운영에 유용하나, 성능 개선을 위한 추가 연구가 필요하다고 생각한다. 따라서 학습 데이터가 많고 데이터의 정제가 잘 이루어진다면 고장 예측을 통해 사전 점검을 하여 예방할 수 있다.

언어모델도 남녀유별을 아는가? - 'Fill-Mask' 태스크로 보는 성별과 직업의 관계 (Do language models know the distinctions between men and women? An insight into the relationships between gender and profession Through "Fill-Mask" task)

  • 비립;최재현;김한샘
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.3-9
    • /
    • 2022
  • 본연구는 한국어 언어모델 트레이닝 단계에서 자주 사용되는 Fill-Mask 태스크와 직업 관련 키워드로 구성되는 각종 성별 유추 템플릿을 이용해 한국어 언어모델에서 발생하는 성별 편향 현상을 정량적으로 검증하고 해석한다. 결과를 봤을 때 현재 직업 키워드에서 드러나는 성별 편향은 각종 한국어 언어모델에서 이미 학습된 상태이며 이를 해소하거나 차단하는 방법을 마련하는 것이 시급한 과제이다.

  • PDF

수질인자의 합성에 의한 하천 레크리에이션 지수 모델의 개발 (Development of River Recreation Index Model by Synthesis of Water Quality Parameters)

  • 서일원;최수연
    • 대한토목학회논문집
    • /
    • 제34권5호
    • /
    • pp.1395-1408
    • /
    • 2014
  • 본 연구에서는 시민들이 하천에서 안전하고 쾌적하게 레크리에이션 활동을 할 수 있도록 종합 수질 정보를 제공하는 하천 레크리에이션 지수 산정 모델을 개발하였다. 하천 레크리에이션 지수 모델은 분변성 대장균 모델과 수질지수 모델을 통합하여 구성하였다. 분변성 대장균 모델에서는 로지스틱 회귀분석을 사용하여 분변성 대장균 등급을 예측하였고, 수질지수 모델에서는 DO, pH, 탁도, 클로로필 a를 퍼지 합성방법을 통해 종합화하여 수질 지수를 산정하였다. 최종 단계에서 분변성 대장균 등급과 수질 지수를 통합하여 하천 레크리에이션 지수를 산정할 수 있도록 모델을 개발하였다. 제안된 모델을 낙동강의 강정고령보 상류 지점에 적용한 결과, 하천 레크리에이션 지수는 개별 수질인자들의 변화를 잘 반영하는 것으로 나타났다. 특히 하천 레크리에이션 지수와 클로로필 a의 상관계수가 -0.85로 나타나 클로로필 a가 하천 레크리에이션 지수에 가장 많은 영향을 미치고 있음을 확인할 수 있었다. 본 모델에서 산정한 종합수질지수는 기존 수질 정보 제공 시스템인 실시간 수질지수보다 보수적인 결과를 보였는데, 이는 등급에 따라 현재의 수질 상태가 어떠한 상태에 속하는지를 계산하고 수질 기준의 불확실성을 적절하게 고려하기 때문인 것으로 판단되었다. 나아가서, 분변성 대장균 등급이 낮을 경우 하천 레크리에이션 지수가 분변성 대장균을 고려하지 않고 있는 실시간 수질지수보다 낮은 결과를 제시하는 것으로 나타났다.

실시간 CRM을 위한 분류 기법과 연관성 규칙의 통합적 활용;신용카드 고객 이탈 예측에 활용

  • 이지영;김종우
    • 한국경영정보학회:학술대회논문집
    • /
    • 한국경영정보학회 2007년도 International Conference
    • /
    • pp.135-140
    • /
    • 2007
  • 이탈 고객 예측은 데이터 마이닝에서 다루는 주요한 문제 중에 하나이다. 이탈 고객 예측은 일종의 분류(classification) 문제로 의사결정나무추론, 로지스틱 회귀분석, 인공신경망 등의 기법이 많이 활용되어왔다. 일반적으로 이탈 고객 예측을 위한 모델은 고객의 인구통계학적 정보와 계약이나 거래 정보를 입력변수로 하여 이탈 여부를 목표변수로 보는 형태로 분류 모델을 생성하게 된다. 본 연구에서는 고객과의 지속적인 접촉으로 발생되는 추가적인 사건 정보를 활용하여 연관성 규칙을 생성하고 이 결과를 기존의 방식으로 생성된 분류 모델과 결합하는 이탈 고객 예측 방법을 제시한다. 제시한 방법의 유용성을 확인하기 위해서 특정 국내 신용카드사의 실제 데이터를 활용하여 실험을 수행하였다. 실험 결과 제시된 방법이 기존의 전통적인 분류 모델에 비해서 향상된 성능을 보이는 것을 확인할 수 있었다. 제시된 예측 방법의 장점은 기존의 이탈 예측을 위한 입력 변수들 이외에 고객과 회사간의 접촉을 통해서 생성된 동적 정보들을 통합적으로 활용하여 예측 정확도를 높이고 실시간으로 이탈 확률을 갱신할 수 있다는 점이다.

  • PDF

딥러닝 기반 시추장비 이상 예측 및 진단 모델 개발 연구 (A Study on the Development of Anomaly Detection Prediction Model for Deep Learning-Based Drilling Equipment)

  • 한동권;김민수;권순일;최정호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 춘계학술발표대회
    • /
    • pp.404-407
    • /
    • 2021
  • 석유개발 현장에서 시추장비의 고장으로 인한 장비교체 및 시추시간 증가는 막대한 비용소모를 발생시킨다. 본 논문은 딥러닝 기반의 시추장비 중 드릴비트의 동력을 구동시키는 디젤엔진의 고장 요소를 분류하고 이 요소에 따른 고장여부를 판별하는 딥러닝 기반의 이상 예측 및 진단 모델을 개발하였다. 또한 제안한 모델의 우수성을 확인하기 위해 로지스틱 회귀분석 분류모델과의 예측성능 비교분석도 수행하였다.

초음파 비파괴검사의 신뢰도 평가 모델 (Models of Reliability Assessment of Ultrasonic Nondestructive Inspection)

  • 박익근;박은수;김현묵;박윤원;강석철;최영환;이진호
    • 비파괴검사학회지
    • /
    • 제21권6호
    • /
    • pp.607-611
    • /
    • 2001
  • 초음파검사 시스템은 검사자, 검사장비, 검사절차서로 구성되어진다. 따라서 각각의 구성의 성능에 따라 초음파검사의 신뢰도가 좌우되며, 또한 검사환경이나 검사체의 재질, 결함의 유형에 따라서도 검사의 신뢰도는 영향을 받게된다. 이러한 다양한 인자들로 인해 비파괴검사의 신뢰도를 평가하는 것이 쉽지 않다. 본 연구에서는 로지스틱 모델과 몬테 카를로 시뮬레이션을 이용하여 초음파검사의 신뢰도를 척도할 수 있는 검출확률을 평가하고자 한다. 신뢰도 평가의 유용성을 검증하기 위해 원진배관에 대한 순회시험의 데이터에 신뢰도 평가 모델을 적용하였다.

  • PDF

개체 수 변화에 대한 이산적 모델의 역사적 개요와 컴퓨터 소프트웨어를 이용하는 시각적 분석 방법 (A Historical Review on Discrete Models of Population Changes and Illustrative Analysis Methods Using Computer Softwares)

  • 심성아
    • 한국수학사학회지
    • /
    • 제27권3호
    • /
    • pp.197-210
    • /
    • 2014
  • Species like insects and fishes have, in many cases, non-overlapping time intervals of one generation and their descendant one. So the population dynamics of such species can be formulated as discrete models. In this paper various discrete population models are introduced in chronological order. The author's investigation starts with the Malthusian model suggested in 1798, and continues through Verhulst model(the discrete logistic model), Ricker model, the Beverton-Holt stock-recruitment model, Shep-herd model, Hassell model and Sigmoid type Beverton-Holt model. We discuss the mathematical and practical significance of each model and analyze its properties. Also the stability properties of stationary solutions of the models are studied analytically and illustratively using GSP, a computer software. The visual outputs generated by GSP are compared with the analytical stability results.

로지스틱 회귀, 랜덤포레스트, LSTM 기법을 활용한 서리예측모형 평가 (Comparative assessment of frost event prediction models using logistic regression, random forest, and LSTM networks)

  • 전종안;이현주;임슬희;김대하;백상수
    • 한국수자원학회논문집
    • /
    • 제54권9호
    • /
    • pp.667-680
    • /
    • 2021
  • 이 연구의 목적은 서리 발생일과 무상일 기간의 특성을 분석하고 로지스틱 회귀, 랜덤 포레스트, Long-short Term Memory (LSTM) 기법을 활용하여 서리발생 예측모델을 개발하고 평가하는데 있다. 수원, 청주, 광주 지점에서 봄철과 가을철 서리발생 예측모델 개발을 위한 기상변수들을 수집하였으며, 수집기간은 1973년부터 2019년까지이다. 프리시전(precision), 리콜(Recall), f-1 스코어와, AUC 및 Reliability Diagram과 같은 그래피컬 평가기법을 이용해 서리발생 예측모델을 평가하였다. 봄철과 가을철 모두 서리발생일이 줄어드는 경향성(유의수준: 0.01)을 보였다. 0.9 이상의 높은 AUC 값에도 불구하고, 신뢰도는 일정한 값을 보여주지는 않았다. 서리발생일 측뿐만 아니라, 초상일과 종상일을 정확히 예측할 수 있도록 모형 개선이 필요해 보이며, 다른 지역의 더 많은 지점에서 동일한 기법을 적용해 보는 연구가 필요해 보인다.