• 제목/요약/키워드: Machine learning algorithm

검색결과 1,480건 처리시간 0.028초

시계열 특징을 갖는 선박용 공기 압축기 전류 데이터의 이상 탐지 알고리즘 적용 실험 (Experimental Study on Application of an Anomaly Detection Algorithm in Electric Current Datasets Generated from Marine Air Compressor with Time-series Features)

  • 이정형
    • 해양환경안전학회지
    • /
    • 제27권1호
    • /
    • pp.127-134
    • /
    • 2021
  • 본 연구는 선박용 공기압축기의 상태기반보전 시스템에 필요한 이상치 탐지 알고리즘 적용에 대한 실험적 연구로서 고장모사 실험을 통해 시계열 전류 센서 데이터를 이용한 이상탐지 적용 가능성을 확인하였다. 고장 유형 10개에 대해 실험실 규모의 고장 모사 실험을 수행하여 정상 운전데이터와 고장 데이터를 구축하였다. 실험 결과 구축된 이상탐지 모델은 시계열 데이터의 주기에 변화를 유발하는 이상은 잘 탐지하는 반면 미세한 부하 변동에 대한 탐지 성능은 떨어졌다. 또한 오토인코더를 이용한 시계열 이상탐지 모델은 입력 시퀀스의 길이와 초모수 조정에 따라 이상 탐지 성능이 상이한 것으로 나타났다.

랜덤포레스트 모델을 활용한 청년층 차입자의 채무 불이행 위험 연구 (Predicting Default Risk among Young Adults with Random Forest Algorithm)

  • 이종희
    • 가족자원경영과 정책
    • /
    • 제26권3호
    • /
    • pp.19-34
    • /
    • 2022
  • 청년층 및 저소득층을 포함한 취약계층과 제2금융권을 중심으로 한 부채 불이행에 대한 우려가 증가하고 있다. 청년층의 가계부채 건전성은 최근 고용 부진, 학자금대출 부담 증가, 제2금융권에서 고금리 대출 증가 등이 복합적으로 작용하여 더욱 취약해졌다. 본 연구의 목적은 한국의 청년층 차입자를 대상으로 채무 불이행 가능성을 진단하고, 그 가능성에 영향을 주는 요인을 예측하는 것이다. 이러한 목적을 달성하기 위하여 본 연구는 2021년 「가계금융·복지조사」를 활용하고, 청년층의 채무 불이행 가능성과 관련된 요인들을 포괄적으로 분석하기 위하여 머신러닝 알고리즘의 랜덤포레스트 방법을 적용하였다. 청년층 차입자의 채무 불이행 위험을 예측하는 모형을 탐색한 뒤 중요도 지수를 산출하고, 중요도가 높은 설명변수들을 선별한 뒤, 주요 결정요인들의 부분 의존성 도표를 제시하고자 하였다. 최종적으로 자산대비부채비율(DTA), 의료비 비중, 가계부실위험지수(HDRI), 통신비 비중, 주거비 비중이 주요한 변인으로 나타났다.

A Novel Approach to COVID-19 Diagnosis Based on Mel Spectrogram Features and Artificial Intelligence Techniques

  • Alfaidi, Aseel;Alshahrani, Abdullah;Aljohani, Maha
    • International Journal of Computer Science & Network Security
    • /
    • 제22권9호
    • /
    • pp.195-207
    • /
    • 2022
  • COVID-19 has remained one of the most serious health crises in recent history, resulting in the tragic loss of lives and significant economic impacts on the entire world. The difficulty of controlling COVID-19 poses a threat to the global health sector. Considering that Artificial Intelligence (AI) has contributed to improving research methods and solving problems facing diverse fields of study, AI algorithms have also proven effective in disease detection and early diagnosis. Specifically, acoustic features offer a promising prospect for the early detection of respiratory diseases. Motivated by these observations, this study conceptualized a speech-based diagnostic model to aid in COVID-19 diagnosis. The proposed methodology uses speech signals from confirmed positive and negative cases of COVID-19 to extract features through the pre-trained Visual Geometry Group (VGG-16) model based on Mel spectrogram images. This is used in addition to the K-means algorithm that determines effective features, followed by a Genetic Algorithm-Support Vector Machine (GA-SVM) classifier to classify cases. The experimental findings indicate the proposed methodology's capability to classify COVID-19 and NOT COVID-19 of varying ages and speaking different languages, as demonstrated in the simulations. The proposed methodology depends on deep features, followed by the dimension reduction technique for features to detect COVID-19. As a result, it produces better and more consistent performance than handcrafted features used in previous studies.

유사도와 연관규칙분석을 이용한 암호화폐 추천모형 (Cryptocurrency Recommendation Model using the Similarity and Association Rule Mining)

  • 김예찬;김진영;김채린;김경재
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.287-308
    • /
    • 2022
  • 최근 비트코인을 필두로한 암호화폐의 폭발적인 성장이 금융 시장의 주요 이슈로 떠오르고 있다. 이에 전 세계적인 암호화폐 투자의 관심이 증가하고 있지만, 24시간 365일 운영되는 시장과 가격 변동성, 그리고 기하 급수적으로 증가하고 있는 암호화폐 종류는 암호화폐 투자자들에게 리스크로 제공되고 있어, 특히 암호화폐 포트폴리오를 구상하는데 있어 추천에 적합하지 않는 암호화폐들을 구분하여 투자자들의 리스크를 감소시킬 수 있는 연구의 필요성이 제기되고 있다. 이에 본 논문은 기존에 있었던 단순히 암호화폐 가격의 미래를 예측하여 수익률을 극대화 하거나, 수익률에 초점을 맞추어 암호화폐 포트폴리오를 구성하는 연구들과 달리, 투자자들의 성향을 반영하고, 투자에 적합한 암호화폐를 머신러닝 기법 중 하나인 Apriori 알고리즘을 활용하여 추천하되, 추천에 적합한 알트코인들을 비트코인의 유사도와 연관규칙을 중심으로 선별하여, 투자자들의 리스크를 감소시킬 수 있는 적합한 추천 방식과 해석을 제시한다.

양식장 펌프 모터 전류 데이터를 이용한 머신러닝 기반 이상 감지 알고리즘에 관한 연구 (A study on machine learning-based anomaly detection algorithm using current data of fish-farm pump motor)

  • 박세용;장태욱;임태호
    • 인터넷정보학회논문지
    • /
    • 제24권2호
    • /
    • pp.37-45
    • /
    • 2023
  • 4차 산업혁명에 맞춰 스마트팩토리 구축을 위한 설비보전 기술들이 관심을 받으며 고도화되고 있다. 또한 스마트팩토리에 이어 스마트팜, 스마트 양식장에도 기술이 접목되고 있다. 그중에서도 순환여과식 양식장의 경우는 수조의 안정적인 수질 환경을 위해 물을 순환하는 펌프 모터가 존재한다. 순환여과식 양식장 펌프 모터 보전 활동은 예방 정비와 진동센서에서 취득된 데이터를 기반으로 수행한다. 예방정비는 사전계획 이전에 일어나는 이상에 대해서는 대처할 수 없으며 진동센서는 외부 환경에 영향을 받는다. 본 논문에서는 소음, 온도, 진동센서에 비해 외부 환경의 영향을 적게 받는 전류 센서를 통해 수집된 데이터를 기반으로 펌프 모터 이상 감지에 있어 Python 오픈소스인 ADTK를 활용하는 이상 감지 알고리즘을 제안한다.

Application of Decision Tree to Classify Fall Risk Using Inertial Measurement Unit Sensor Data and Clinical Measurements

  • Junwoo Park;Jongwon Choi;Seyoung Lee;Kitaek Lim;Woochol Joseph Choi
    • 한국전문물리치료학회지
    • /
    • 제30권2호
    • /
    • pp.102-109
    • /
    • 2023
  • Background: While efforts have been made to differentiate fall risk in older adults using wearable devices and clinical methodologies, technologies are still infancy. We applied a decision tree (DT) algorithm using inertial measurement unit (IMU) sensor data and clinical measurements to generate high performance classification models of fall risk of older adults. Objects: This study aims to develop a classification model of fall risk using IMU data and clinical measurements in older adults. Methods: Twenty-six older adults were assessed and categorized into high and low fall risk groups. IMU sensor data were obtained while walking from each group, and features were extracted to be used for a DT algorithm with the Gini index (DT1) and the Entropy index (DT2), which generated classification models to differentiate high and low fall risk groups. Model's performance was compared and presented with accuracy, sensitivity, and specificity. Results: Accuracy, sensitivity and specificity were 77.8%, 80.0%, and 66.7%, respectively, for DT1; and 72.2%, 91.7%, and 33.3%, respectively, for DT2. Conclusion: Our results suggest that the fall risk classification using IMU sensor data obtained during gait has potentials to be developed for practical use. Different machine learning techniques involving larger data set should be warranted for future research and development.

머신러닝 기반 안면인식 기능을 포함한 비접촉 잠금장치 설계 및 개발 (Design and development of non-contact locks including face recognition function based on machine learning)

  • 윤여훈;김기창;조휘진;김홍준
    • 융합보안논문지
    • /
    • 제22권1호
    • /
    • pp.29-38
    • /
    • 2022
  • 감염 질병의 심각한 확산으로 인해 방역의 중요성이 점점 커지고 있다. 또한 방역 이슈가 없는 언택트 산업에 대한 관심도 늘어나고 있다. 본 논문에서는 등록된 사용자의 얼굴을 인식함으로써 비접촉 방식으로 출입을 통제하는 비용 효율적인 라즈베리파이 기반 도어락 시스템을 설계하고 개발한다. 우선, OpenCV의 Haar-based cascade를 사용하여 매우 단순한 특징들을 조합하여 객체를 찾고, 얼굴 인식을 진행한다. 그리고 LBPH (Local Binary Pattern Histogram)을 사용하여 이미지의 질감을 이진화하여 특징을 찾아낸다. 라즈베리파이 3B+ 보드, 초음파 센서, 카메라 모듈, 모터 등으로 언택트 도어락 하드웨어를 구현하고, 얼굴 인식 및 매칭 알고리즘을 포함한 소프트웨어를 기반으로 약 500장의 이미지 데이터를 학습시켜 실험한 결과, 최대 85.7%의 인식률을 보이며 사용자를 구분하는 성능을 검증할 수 있었다. 또한, Haar-cascade 알고리즘 성능의 광원에 대한 영향성을 파악하여 그 개선 가능성을 살펴보았다.

산업용 무선 센서 네트워크에서의 기계학습 기반 이동성 지원 방안 (Mobility Support Scheme Based on Machine Learning in Industrial Wireless Sensor Network)

  • 김상대;김천용;조현종;정관수;오승민
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제9권11호
    • /
    • pp.256-264
    • /
    • 2020
  • 산업용 무선 센서 네트워크는 여러 산업 분야에서의 생산성 향상, 비용 절감 등을 위해 사용되고 있으며, 저지연, 고신뢰 데이터 전송과 같은 성능을 요구한다. 이를 달성하기 위해서, 산업용 무선 센서 네트워크에서는 네트워크 매니저를 통해 네트워크 위상에 대한 그래프 생성 및 자원 할당을 수행하여, 각 장치의 전송 주기 및 경로를 미리 결정한다. 하지만, 이러한 네트워크 관리 방법은 네트워크 위상 변화 시에 그래프 재생성 및 자원 재할당을 수행해야 하므로, 잦은 위상 변화가 발생하는 네트워크 환경에서는 관리비용 증가와 요구성능의 일시적 저하와 같은 현상이 발생하므로 적합하지 않다. 즉, 최근에 다양한 이동 장치를 활용하는 산업용 무선 센서 네트워크에서는 이동 장치로 인한 경로 단절 및 경로 재구성 과정에서 발생하는 지연 전송과 전송 신뢰성 저하를 방지할 수 있는 네트워크 관리 방안에 관한 연구가 필요하다. 본 논문에서는 기계학습을 이용하여 이동 장치의 시간별 위치 및 이동 주기를 분석하고, 이에 기반한 이동 패턴을 추출한다. 또한, 추출된 이동 패턴 정보를 기반으로 예측되는 시간별 네트워크 위상에 대한 그래프 생성 및 자원 할당을 수행하는 네트워크 관리 기능을 제안함으로써, 이동 장치의 이동으로 인한 성능 저하의 문제를 방지한다. 성능평가 결과는 제안 방안이 추출한 이동 패턴과 실제 이동 패턴을 비교하였을 때 약 86%의 예측 정확도를 보이고, 기존의 방법에 비해 높은 전송 성공률 및 낮은 자원 점유율의 성능을 보여준다.

전통문화 콘텐츠 표준체계를 활용한 자동 텍스트 분류 시스템 (A System for Automatic Classification of Traditional Culture Texts)

  • 허윤아;이동엽;김규경;유원희;임희석
    • 한국융합학회논문지
    • /
    • 제8권12호
    • /
    • pp.39-47
    • /
    • 2017
  • 한국 문화의 역사, 전통과 관련된 디지털 웹 문서가 증가하게 되었다. 하지만 창작자 또는 전통 문화와 관련된 소재를 찾는 사용자들은 정보를 검색해도 결과가 충분하지 않았으며 원하는 정보를 얻지 못하는 경우가 나타나고 있다. 이런 효과적인 정보를 접하기 위해서는 문서 분류가 필요하다. 과거에 문서 분류는 작업자가 수작업으로 문서 분류하여 시간과 비용이 많이 소비하는 어려움이 있었지만, 최근 기계학습 기반으로 한 자동 문서 분류를 통해 효율적인 문서 분류가 이루어진다. 이에 본 논문은 전통문화 콘텐츠를 체계적인 분류체계로 구성한 한민족정보문화마당 데이터를 기반으로 전통문화 콘텐츠 자동 텍스트 분류 모델을 개발한다. 본 연구는 한민족정보문화마당 텍스트 데이터에 대해 단어 빈도수를 추출하기 위해 TF-IDF모델, Bag-of-Words 모델, TF-IDF/Bag-of-Words를 결합한 모델을 적용하여 각각 SVM 분류 알고리즘을 사용하여 전통문화 콘텐츠 자동 텍스트 분류 모델을 개발하여 성능평가를 확인하였다.

지도학습 기반 암상 분류 시 클래스 간 자료 불균형을 고려한 평가지표 개발 (Development of Evaluation Metrics that Consider Data Imbalance between Classes in Facies Classification)

  • 김도완;최준환;변중무
    • 지구물리와물리탐사
    • /
    • 제23권3호
    • /
    • pp.131-140
    • /
    • 2020
  • 머신러닝을 이용한 분류 모델 훈련에서 학습자료의 양과 질은 학습한 모델의 성능을 좌우하므로 학습자료 생성이 매우 중요한 역할을 한다. 그러나 자료 생성에 높은 비용이 들어 이상적인 학습자료 생성이 어려울 때에는 클래스 간 자료 불균형 문제가 발생한다. 만약 학습자료로 사용될 탐사자료가 클래스 간 불균형하게 얻어지면, 클래스 별로 균형있는 학습이 이루어지기 힘들다. 따라서 데이터가 상대적으로 적은 클래스는 재현율이 현저히 떨어지게 된다. 그 뿐만 아니라 정확도와 정밀도 등의 평가지표들에 대한 신뢰도가 떨어지게 된다. 따라서 이 연구에서는 두 단계에 걸쳐 자료 불균형 문제를 해소하고자 하였다. 첫 번째로 기존의 정확도와 정밀도를 개선하여 자료 불균형을 고려할 수 있는 새로운 평가지표로 가중정확도와 가중정밀도를 고안하였다. 다음으로 클래스 간의 가중정밀도와 재현율의 균형을 맞추어 주도록 오버샘플링을 수행하였다. 개발한 알고리듬을 물리검층 자료를 이용한 암상 및 공극유체 규명 문제에 적용함으로써 검증하였다. 그 결과 다수 클래스와 소수 클래스들 간의 불균형이 상당 부분 완화되었고, 클래스 간의 경계를 보다 명확하게 확인할 수 있었다.