• 제목/요약/키워드: Classification algorithms

검색결과 1,173건 처리시간 0.03초

기계학습 기반 모델을 활용한 시화호의 수질평가지수 등급 예측 (WQI Class Prediction of Sihwa Lake Using Machine Learning-Based Models)

  • 김수빈;이재성;김경태
    • 한국해양학회지:바다
    • /
    • 제27권2호
    • /
    • pp.71-86
    • /
    • 2022
  • 해양환경을 정량적으로 평가하기 위해 수질평가지수(water quality index, WQI)가 사용되고 있다. 우리나라는 해양수산부고시 해양환경기준에 따라 WQI를 5개 등급으로 구분하여 수질을 평가한다. 하지만, 방대한 수질 조사 자료에 대한 WQI 계산은 복잡하고 많은 시간이 요구된다. 이 연구는 기존의 조사된 수질 자료를 활용하여 WQI 등급을 예측할 수 있는 기계학습(machine learning, ML) 기반의 모델을 제안하고자 한다. 특별관리해역인 시화호를 모델링 지역으로 선정하였다. AdaBoost와 TPOT 알고리즘을 모델 훈련을 위해 사용하였으며, 분류 모델 평가 지표(정확도, 정밀도, F1, Log loss)로 모델 성능을 평가하였다. 훈련하기 전, 각 알고리즘 모델의 최적 입력자료 조합을 탐색하기 위해 변수 중요도와 민감도 분석을 수행하였다. 그 결과 저층 용존산소(dissolved oxygen, DO)는 모델의 성능에서 가장 중요한 인자였다. 반면, 표층 용존무기질소(dissolved inorganic nitrogen, DIN)와 표층 용존무기인(dissolved inorganic phosphorus, DIP)은 상대적으로 영향이 적었다. 한편, 최적 모델의 시공간적 민감도와 WQI 등급 별 민감도를 비교한 결과 각 조사 정점 및 시기, 등급 별 모델의 예측 성능이 상이하였다. 결론적으로 TPOT 알고리즘이 모든 입력자료 조합에서 성능이 더 우수하여 충분한 자료로 훈련된 최적 모델은 새로운 수질 조사 자료의 WQI 등급을 정확하게 분류할 수 있을 거라 판단된다.

머신러닝 기반 아파트 주동형상 자동 판별 모형 개발 및 적용 - 주동형상에 따른 아파트 개발 특성분석을 중심으로 - (Application and development of a machine learning based model for identification of apartment building types - Analysis of apartment site characteristics based on main building shape -)

  • 한상욱;서정석;;;김정섭
    • 한국지리정보학회지
    • /
    • 제26권2호
    • /
    • pp.55-67
    • /
    • 2023
  • 본 연구의 목적은 GIS와 머신러닝 알고리즘을 활용하여 아파트 단지의 주동형상을 자동으로 판별해주는 모형을 개발하고, 이를 주동형상과 단지특성 관의 관계 분석에 적용하는 것이다. 지리정보데이터를 사용하여 아파트단지별 주동 데이터베이스를 구축하고 랜덤포레스트 알고리즘을 활용하여 단지 내 개별동을 형태에 따라 판상형, 탑상협, 혼합형으로 분류하였다. 또한, 아파트단지별 주동형상별 비중과 개발밀도, 층수 등 단지특성 정보간의 관계를 분석하여 부동산 분야 지리정보응용 가능성을 제안하였다. 본 연구는 인공지능 기반 건축물 유형 분류와 관련한 기초연구로서 다양한 공간분석 및 부동산 분석에 활용될 것으로 예상한다.

이기종 네트워크 장치를 사용하는 시스템의 효율적인 관리를 위한 로그 수집 방법 (Log Collection Method for Efficient Management of Systems using Heterogeneous Network Devices)

  • 양재호;김영곤
    • 한국인터넷방송통신학회논문지
    • /
    • 제23권3호
    • /
    • pp.119-125
    • /
    • 2023
  • IT 인프라 운영이 고도화하면서 시스템을 관리하는 방식이 널리 보급되어 있으며, 최근에는 Syslog를 활용한 개선방법들이 연구되고 있다. 그러나 이러한 방법으로 수집한 로그 데이터를 활용하여 시스템 관제를 할 경우 다양한 형식으로 추출되는 로그를 전문 인력이 분석해야 하는 어려움이 있다. 본 논문은 엣지 컴퓨팅을 활용하여 Syslog 데이터를 분산 수집하고 중복 데이터를 전처리하여 중앙 데이터베이스에 적재하는 시스템을 구축 방법을 제시하고자 한다. 또한, 데이터사전을 구성하여 실시간으로 데이터를 분류하고 카운팅하는 기능을 제공하며, 데이터사전에 등록된 데이터에 대해서는 중앙 데이터베이스로의 전송을 제한하는 시스템을 구현한다. 이를 통해 데이터 사전의 정의어 패턴을 유지하며, 중복 데이터와 시간 중복을 제어하여 중앙 데이터베이스에 정제된 데이터를 적재함으로써 빅데이터 분석을 위한 기초 자료를 확보할 수 있다. 시뮬레이션결과 제안된 알고리즘과 프로시저를 구체적인 예시와 함께 설명하고, syslog 데이터를 활용하여 그 성능을 검증하였다. syslog 데이터는 실제 로그 데이터에서 추출한 예시를 포함하고 있으며 이를 통해 로그 데이터로부터 필요한 정보를 정확하게 추출하였고, 분류 및 적재 과정에서 정상적인 처리가 이루어지는지를 확인하였다. 이러한 시스템은 엣지 환경에서 로그 데이터를 효율적으로 수집하고 관리하기 위한 솔루션으로 활용하여 기술의 확산 측면에서도 효과를 기대할 수 있다.

제조업 노동자 근골격계 부담요인 데이터셋 클래스 분류와 유효성 검증 (Class Classification and Validation of a Musculoskeletal Risk Factor Dataset for Manufacturing Workers)

  • 강영진;노태경;김기환;정석찬
    • 한국빅데이터학회지
    • /
    • 제8권1호
    • /
    • pp.49-59
    • /
    • 2023
  • 제조업의 안전보건 기준은 다양한 항목이 존재하지만, 질병 재해자 기준에서 업무상 질병과 근골격계 질환으로 나눌 수 있다. 이 중 근골격계 질환은 제조업에서 가장 많이 발생하며, 나아가서 제조 현장의 노동생산성감소 및 경쟁력 약화까지 유발할 수 있어서 이를 사전에 확인할 수 있는 시스템이 필요한 실정이다. 본 논문에서는 제조업 노동자의 근골격계 유해 요인을 검출하기 위하여 근골격계 부담작업 요인 분석 데이터 속성, 유해 요인 작업자세, 관절 키포인트를 정의하고 인공지능 학습용 데이터를 구축하였다. 구축한 데이터의 유효성을 판단하기 위해서 YOLO, Dite-HRNet, EfficientNet 등의 AI 알고리즘을 활용하여 학습하고 검증하였다. 실험 결과 사람 탐지 정확도는 99%, 탐지된 사람의 관절 위치 추론 정확도는 @AP0.5 88%, 추론된 관절 위치를 종합하여 자세를 평가한 정확도는 LEGS 72.2%, NECT 85.7%, TRUNK 81.9%, UPPERARM 79.8%, LOWERARM 92.7%를 도출하였으며, 추가로 딥러닝 기반의 근골격계 질병을 예방할 수 있는 연구에 필요한 요소를 고찰하였다.

넙치 질병 증상 분류를 위한 객체 탐지 딥러닝 모델 성능 평가 (Performance Evaluation of Object Detection Deep Learning Model for Paralichthys olivaceus Disease Symptoms Classification)

  • 조경원;백란;정종호;김찬진;최한석;정석원;손현승
    • 스마트미디어저널
    • /
    • 제12권10호
    • /
    • pp.71-84
    • /
    • 2023
  • 넙치 양식은 우리나라 양식 산업의 절반 이상 차지할 정도로 큰 비중을 차지한다. 그러나 연중 총사육량의 25~30% 정도가 질병으로 인한 집단 폐사가 발생하여 양식장의 경제성에 매우 나쁜 영향을 준다. 넙치 양식장의 경제성 성장을 위해서는 넙치 질병 증상 진단을 자동화하여 빠르고 정확하게 질병 진단을 하는 방법이 필요하다. 본 연구에서는 독창적인 학습 데이터 수집 방법과 학습 정제 알고리즘 및 학습 데이터 분리 기법을 사용하여 학습 데이터를 구축하고 4가지 객체 탐지 딥러닝 모델(YOLOv8, Swin, Vitdet, MvitV2)의 넙치 질병증상 감지 성능을 비교한다. 실험 결과 YOLOv8 모델이 평균 인식률(mAP)과 예상 도착 시간(ETA) 관점에서 우수하다는 결론을 얻었다. 본 연구에서 제안하는 AI 모델의 성능이 검증되면 넙치 양식장에서는 실시간으로 넙치 질병을 진단할 수 있고, 진단 결과에 따른 신속한 예방 조치로 양식장의 생산성은 크게 향상될 것이라 기대된다.

선형기계학습모델을 이용한 자갈해빈상에서의 쇄파지표 예측 (A Study on the Predictions of Wave Breaker Index in a Gravel Beach Using Linear Machine Learning Model)

  • 안을혁;이영찬;김도삼;이광호
    • 한국해안·해양공학회논문집
    • /
    • 제36권2호
    • /
    • pp.37-49
    • /
    • 2024
  • 지금까지 쇄파는 발생기구의 본질적인 복잡성으로 인해 실내수리모형실험을 통해 쇄파파고 및 쇄파수심 등의 쇄파지표 예측을 위한 많은 경험식이 제안되어 왔다. 하지만, 자갈해빈에 대한 쇄파의 특성 및 쇄파지표예측을 위한 연구는 거의 수행되어 있지 않았다. 본 연구에서는 자갈해빈을 대상으로 쇄파파고 및 쇄파수심의 예측을 위하여 회귀 또는 분류 문제와 관련된 다양한 연구 분야에서 높은 예측 성능을 보이는 대표적인 선형기반 기계학습기법에 기반한 쇄파지표를 예측하고자 하였다. 먼저, 자갈해빈에 대하여 기존에 제안된 쇄파지표의 경험식의 적용성을 검토하고 기존의 경험식의 자갈해빈의 쇄파지표 예측성능의 한계성을 극복하기 위하여 다양한 선형기반 기계학습 알고리즘을 적용하여 쇄파지표 예측모델을 구축하였다. 구축된 기계학습모델 중 자갈해빈에서 발생하는 쇄파파고 및 쇄파수심에 대한 높은 예측성능을 보인 모델을 기반으로 손쉬운 계산이 가능한 쇄파지표에 대한 새로운 산정식을 제안하였고 수리모형실험결과 및 기존의 경험식과 비교하고 새롭게 제안한 쇄파지표의 예측성능을 검증하였다. 본 연구에서 제안한 쇄파지표에 대한 경험식은 단순한 다항식임에도 불구하고 자갈해빈에 대한 양호한 예측성능을 보였다.

개선된 배깅 앙상블을 활용한 기업부도예측 (Bankruptcy prediction using an improved bagging ensemble)

  • 민성환
    • 지능정보연구
    • /
    • 제20권4호
    • /
    • pp.121-139
    • /
    • 2014
  • 기업의 부도 예측은 재무 및 회계 분야에서 매우 중요한 연구 주제이다. 기업의 부도로 인해 발생하는 비용이 매우 크기 때문에 부도 예측의 정확성은 금융기관으로서는 매우 중요한 일이다. 최근에는 여러 개의 모형을 결합하는 앙상블 모형을 부도 예측에 적용해 보려는 연구가 큰 관심을 끌고 있다. 앙상블 모형은 개별 모형보다 더 좋은 성과를 내기 위해 여러 개의 분류기를 결합하는 것이다. 이와 같은 앙상블 분류기는 분류기의 일반화 성능을 개선하는 데 매우 유용한 것으로 알려져 있다. 본 논문은 부도 예측 모형의 성과 개선에 관한 연구이다. 이를 위해 사례 선택(Instance Selection)을 활용한 배깅(Bagging) 모형을 제안하였다. 사례 선택은 원 데이터에서 가장 대표성 있고 관련성 높은 데이터를 선택하고 예측 모형에 악영향을 줄 수 있는 불필요한 데이터를 제거하는 것으로 이를 통해 예측 성과 개선도 기대할 수 있다. 배깅은 학습데이터에 변화를 줌으로써 기저 분류기들을 다양화시키는 앙상블 기법으로 단순하면서도 성과가 매우 좋은 것으로 알려져 있다. 사례 선택과 배깅은 각각 모형의 성과를 개선시킬 수 있는 잠재력이 있지만 이들 두 기법의 결합에 관한 연구는 아직까지 없는 것이 현실이다. 본 연구에서는 부도 예측 모형의 성과를 개선하기 위해 사례 선택과 배깅을 연결하는 새로운 모형을 제안하였다. 최적의 사례 선택을 위해 유전자 알고리즘이 사용되었으며, 이를 통해 최적의 사례 선택 조합을 찾고 이 결과를 배깅 앙상블 모형에 전달하여 새로운 형태의 배깅 앙상블 모형을 구성하게 된다. 본 연구에서 제안한 새로운 앙상블 모형의 성과를 검증하기 위해 ROC 커브, AUC, 예측정확도 등과 같은 성과지표를 사용해 다양한 모형과 비교 분석해 보았다. 실제 기업데이터를 사용해 실험한 결과 본 논문에서 제안한 새로운 형태의 모형이 가장 좋은 성과를 보임을 알 수 있었다.

SVM을 이용한 VKOSPI 일 중 변화 예측과 실제 옵션 매매에의 적용 (VKOSPI Forecasting and Option Trading Application Using SVM)

  • 라윤선;최흥식;김선웅
    • 지능정보연구
    • /
    • 제22권4호
    • /
    • pp.177-192
    • /
    • 2016
  • 기계학습(Machine Learning)은 인공 지능의 한 분야로, 데이터를 이용하여 기계를 학습시켜 기계 스스로가 데이터 분석 및 예측을 하게 만드는 것과 관련한 컴퓨터 과학의 한 영역을 일컫는다. 그중에서 SVM(Support Vector Machines)은 주로 분류와 회귀 분석을 목적으로 사용되는 모델이다. 어느 두 집단에 속한 데이터들에 대한 정보를 얻었을 때, SVM 모델은 주어진 데이터 집합을 바탕으로 하여 새로운 데이터가 어느 집단에 속할지를 판단해준다. 최근 들어서 많은 금융전문가는 기계학습과 막대한 데이터가 존재하는 금융 분야와의 접목 가능성을 보며 기계학습에 집중하고 있다. 그러면서 각 금융사는 고도화된 알고리즘과 빅데이터를 통해 여러 금융업무 수행이 가능한 로봇(Robot)과 투자전문가(Advisor)의 합성어인 로보어드바이저(Robo-Advisor) 서비스를 발 빠르게 제공하기 시작했다. 따라서 현재의 금융 동향을 고려하여 본 연구에서는 기계학습 방법의 하나인 SVM을 활용하여 매매성과를 올리는 방법에 대해 제안하고자 한다. SVM을 통한 예측대상은 한국형 변동성지수인 VKOSPI이다. VKOSPI는 금융파생상품의 한 종류인 옵션의 가격에 영향을 미친다. VKOSPI는 흔히 말하는 변동성과 같고 VKOSPI 값은 옵션의 종류와 관계없이 옵션 가격과 정비례하는 특성이 있다. 그러므로 VKOSPI의 정확한 예측은 옵션 매매에서의 수익을 낼 수 있는 중요한 요소 중 하나이다. 지금까지 기계학습을 기반으로 한 VKOSPI의 예측을 다룬 연구는 없었다. 본 연구에서는 SVM을 통해 일 중의 VKOSPI를 예측하였고, 예측 내용을 바탕으로 옵션 매매에 대한 적용 가능 여부를 실험하였으며 실제로 향상된 매매 성과가 나타남을 증명하였다.

온라인 주식 포럼의 핫토픽 탐지를 위한 감성분석 모형의 개발 (Development of Sentiment Analysis Model for the hot topic detection of online stock forums)

  • 홍태호;이태원;리징징
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.187-204
    • /
    • 2016
  • 소셜 미디어를 이용하는 사용자들이 직접 작성한 의견 혹은 리뷰를 이용하여 상호간의 교류 및 정보를 공유하게 되었다. 이를 통해 고객리뷰를 이용하는 오피니언마이닝, 웹마이닝 및 감성분석 등 다양한 연구분야에서의 연구가 진행되기 시작하였다. 특히, 감성분석은 어떠한 토픽(주제)를 기준으로 직접적으로 글을 작성한 사람들의 태도, 입장 및 감성을 알아내는데 목적을 두고 있다. 고객의 의견을 내포하고 있는 정보 혹은 데이터는 감성분석을 위한 핵심 데이터가 되기 때문에 토픽을 통한 고객들의 의견을 분석하는데 효율적이며, 기업에서는 소비자들의 니즈에 맞는 마케팅 혹은 투자자들의 시장동향에 따른 많은 투자가 이루어지고 있다. 본 연구에서는 중국의 온라인 시나 주식 포럼에서 사용자들이 직접 작성한 포스팅(글)을 이용하여 기존에 제시된 토픽들로부터 핫토픽을 선정하고 탐지하고자 한다. 기존에 사용된 감성 사전을 활용하여 토픽들에 대한 감성값과 극성을 분류하고, 군집분석을 통해 핫토픽을 선정하였다. 핫토픽을 선정하기 위해 k-means 알고리즘을 이용하였으며, 추가로 인공지능기법인 SOM을 적용하여 핫토픽 선정하는 절차를 제시하였다. 또한, 로짓, 의사결정나무, SVM 등의 데이터마이닝 기법을 이용하여 핫토픽 사전 탐지를 하는 감성분석을 위한 모형을 개발하여 관심지수를 통해 선정된 핫토픽과 탐지된 핫토픽을 비교하였다. 본 연구를 통해 핫토픽에 대한 정보 제공함으로써 최신 동향에 대한 흐름을 알 수 있게 되고, 주식 포럼에 대한 핫토픽은 주식 시장에서의 투자자들에게 유용한 정보를 제공하게 될 뿐만 아니라 소비자들의 니즈를 충족시킬 수 있을 것이라 기대된다.

적대적 생성 모델을 활용한 사용자 행위 이상 탐지 방법 (Anomaly Detection for User Action with Generative Adversarial Networks)

  • 최남웅;김우주
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.43-62
    • /
    • 2019
  • 한때, 이상 탐지 분야는 특정 데이터로부터 도출한 기초 통계량을 기반으로 이상 유무를 판단하는 방법이 지배적이었다. 이와 같은 방법론이 가능했던 이유는 과거엔 데이터의 차원이 단순하여 고전적 통계 방법이 효과적으로 작용할 수 있었기 때문이다. 하지만 빅데이터 시대에 접어들며 데이터의 속성이 복잡하게 변화함에 따라 더는 기존의 방식으로 산업 전반에 발생하는 데이터를 정확하게 분석, 예측하기 어렵게 되었다. 따라서 기계 학습 방법을 접목한 SVM, Decision Tree와 같은 모형을 활용하게 되었다. 하지만 지도 학습 기반의 모형은 훈련 데이터의 이상과 정상의 클래스 수가 비슷할 때만 테스트 과정에서 정확한 예측을 할 수 있다는 특수성이 있고 산업에서 생성되는 데이터는 대부분 정답 클래스가 불균형하기에 지도 학습 모형을 적용할 경우, 항상 예측되는 결과의 타당성이 부족하다는 문제점이 있다. 이러한 단점을 극복하고자 현재는 클래스 분포에 영향을 받지 않는 비지도 학습 기반의 모델을 바탕으로 이상 탐지 모형을 구성하여 실제 산업에 적용하기 위해 시행착오를 거치고 있다. 본 연구는 이러한 추세에 발맞춰 적대적 생성 신경망을 활용하여 이상 탐지하는 방법을 제안하고자 한다. 시퀀스 데이터를 학습시키기 위해 적대적 생성 신경망의 구조를 LSTM으로 구성하고 생성자의 LSTM은 2개의 층으로 각각 32차원과 64차원의 은닉유닛으로 구성, 판별자의 LSTM은 64차원의 은닉유닛으로 구성된 1개의 층을 사용하였다. 기존 시퀀스 데이터의 이상 탐지 논문에서는 이상 점수를 도출하는 과정에서 판별자가 실제데이터일 확률의 엔트로피 값을 사용하지만 본 논문에서는 자질 매칭 기법을 활용한 함수로 변경하여 이상 점수를 도출하였다. 또한, 잠재 변수를 최적화하는 과정을 LSTM으로 구성하여 모델 성능을 향상시킬 수 있었다. 변형된 형태의 적대적 생성 모델은 오토인코더의 비해 모든 실험의 경우에서 정밀도가 우세하였고 정확도 측면에서는 대략 7% 정도 높음을 확인할 수 있었다.