• 제목/요약/키워드: machine-learning method

검색결과 2,080건 처리시간 0.032초

인공신경망을 이용한 KOMPSAT-3/3A/5 영상으로부터 자연림과 인공림의 분류 (Classification of Natural and Artificial Forests from KOMPSAT-3/3A/5 Images Using Artificial Neural Network)

  • 이용석;박숭환;정형섭;백원경
    • 대한원격탐사학회지
    • /
    • 제34권6_3호
    • /
    • pp.1399-1414
    • /
    • 2018
  • 자연림은 산림의 조성 과 보육 등에 인공적인 사람의 힘이 가해지지 않은 자연 상태의 산림이다. 반면 인공림은 사람이 조성 및 보육관리 하는 숲으로 목재생산, 자연재해 예방, 방풍 등의 목적을 가지는 산림이다. 인공림은 목재생산 등 인간이 목적을 가지고 관리하여 단위 면적당 더 많은 목재를 생산할 수 있는 경제적 장점도 가지고 있다. 자연림과 인공림의 구분은 산림 형태의 관리 방법과 목정이 상이하여 산림조사에서 기본적으로 조사하는 요소이며, 자연림과 인공림의 구분은 항공사진 판독과 현지조사 등의 절차를 통해 이루어진다. 본 연구에서는 자연림과 인공림의 분류에 KOMPSAT-3, 3A, 5 위성 영상데이터에 인공신경망(Artificial Neural Network: ANN)을 적용하여 자연림과 인공림의 분류도를 만들고, 산림청의 1/5,000임상도의 자연림과 인공림 분류도와 비교하여 평가하였다. 인공신경망을 이용한 산림의 자연림과 인공림 구분의 연구를 진행한 결과, 1/5,000 임상도와 비교했을 때, 학습결과 분류 전체 정확도는 77.03%이다. 영상의 획득 시기와 산림의 침엽수와 활엽수 등 기타요인이 인공신경망을 이용한 산림의 인공림과 자연림의 구분에 많은 영향을 미치는 것을 확인하였다.

순환신경망을 이용한 자기장 기반 실내측위시스템 (Indoor Positioning System using Geomagnetic Field with Recurrent Neural Network Model)

  • 배한준;최린;박병준
    • 한국차세대컴퓨팅학회논문지
    • /
    • 제14권6호
    • /
    • pp.57-65
    • /
    • 2018
  • BLE 또는 Wi-Fi 기반 지문인식과 같은 기존의 RF 신호 기반 실내 위치인식 기술은 RF 신호의 불안정한 수신 신호 세기로 인해 소규모 실내 환경에서도 작지 않은 오차를 발생시키며 공항, 백화점과 같은 대규모 실내 환경에 적용하기가 어렵다. 이 논문에서는 RF 신호보다 안정적인 신호 강도를 갖는 자기장 신호를 이용한 실내측위 시스템을 제안한다. 유사한 자기장 값이 같은 실내 공간에 여럿 존재하지만, 사용자의 이동이 계속됨에 따라 자기장 신호는 고유 시퀀스를 가지게 된다. 본 논문에서는 시간에 따라 변화하는 센서 데이터 시퀀스를 인식하는 데 효과적인 순환 신경망 (Recurrent neural network, RNN)이라 불리는 심층 신경망 모델을 사용하여 사용자의 현재 위치와 이동 경로를 추적한다. 제안된 신경망 기반의 지자기 실내측위시스템의 평가를 위해 약 $94m{\times}26$ 크기의 교내 테스트베드에서 자기장 맵을 구축하고 자기장맵으로부터 추출한 다양한 이동 경로와 위치 정보를 이용하여 RNN을 학습한 결과, 테스트베드에서 제안된 시스템은 평균 1.20 미터의 테스트 측위 오차를 달성할 수 있었다.

편광현미경 이미지 기반 염기성 화산암 분류를 위한 인공지능 모델의 효용성 평가 (Evaluating the Effectiveness of an Artificial Intelligence Model for Classification of Basic Volcanic Rocks Based on Polarized Microscope Image)

  • 심호;정원우;홍성식;서재원;박창윤;송윤구
    • 자원환경지질
    • /
    • 제55권3호
    • /
    • pp.309-316
    • /
    • 2022
  • 암석 분류에 필요한 인적, 시간적 소모를 최소화하기 위해 최근 인공지능을 활용한 암석 분류 연구가 대두되었다. 이에 본 연구에서는 편광현미경 박편 이미지를 활용하여 염기성 화산암을 세분류하고자 하였다. 분류에 사용된 인공지능 모델은 Tensorflow, Keras 라이브러리를 기반으로 합성곱 신경망 모델을 자체 제작하였다. Olivine basalt, basaltic andesite, olivine tholeiite, trachytic olivine basalt 기준시료 박편을 개방 니콜, 직교 니콜, 그리고 gypsum plate를 장착하고 촬영한 이미지 총 720장을 인공지능 모델에 training : test = 7 : 3 비율로 학습시켰다. 학습결과, 80~90%이상의 분류 정확도를 보였다. 각각의 인공지능 모델의 분류 정확도를 확인하였을 때, 본 모델의 암석분류 방식이 지질학자의 암석 분류 프로세스와 크게 다르지 않을 것으로 예상된다. 나아가 본 모델 뿐 아니라 보다 다양한 암석종을 세분시키는 모델을 제작하여 통합한다면, 데이터 분류의 신속성과 비전문가의 접근성 모두를 만족시키는 인공지능 모델을 개발할 수 있으며, 이를 통해 암석학 기초연구의 새로운 틀을 마련할 수 있을 것으로 생각된다.

Deep Neural Network를 활용한 초미세먼지 농도 예측에 관한 연구 (A Study on Prediction of PM2.5 Concentration Using DNN)

  • 최인호;이원영;은범진;허정숙;장광현;오종민
    • 환경영향평가
    • /
    • 제31권2호
    • /
    • pp.83-94
    • /
    • 2022
  • 본 연구는 국가측정망(에어코리아)에서 제공하는 2017년, 2019년 및 2020년도 대기질확정 데이터를 이용하여 Deep Neural Network(DNN) 모델을 학습하고, 2016년과 2018년도 데이터를 이용하여 학습된 모델을 평가·검증하였다. 피어슨 상관계수 0.2를 기준으로 SO2, CO, NO2, PM10 항목을 독립변수로 하여 초기 모델링을 진행하였고, 예측의 정확도를 높이기 위한 방법으로 시계열적 요소를 반영한 월별 모델링(개선모델)을 진행하여 초기모델과 비교·분석하였다. 분석에 사용한 지표는 RMSE(Root mean square error) 방법으로 오차를 계산하였으며, 예측 결과 초기모델의 RMSE값은 5.78로 국가측정망의 예측이동 평균모델의 결과(10.77)와 비교하여 초기모델에서 약 46% 오차가 감소하였다. 또한, 개선모델의 경우, 초기모델 대비 11월 모델을 제외한 모든 월별모델에서 정확도 향상이 있었다. 따라서, 본 연구에서는 DNN 모델링이 PM2.5 농도 예측에 효과적인 방법임을 제안할 수 있었으며, 향후 추가적인 독립변수 선정 및 시계열 요소를 고려한 방법으로 모델의 정확도 개선 가능성을 확인할 수 있었다.

Faster R-CNN을 이용한 갓길 차로 위반 차량 검출 (Detecting Vehicles That Are Illegally Driving on Road Shoulders Using Faster R-CNN)

  • 고명진;박민주;여지호
    • 한국ITS학회 논문지
    • /
    • 제21권1호
    • /
    • pp.105-122
    • /
    • 2022
  • 최근 5년간 고속도로에서 발생한 사망 사고의 통계를 살펴보면, 고속도로 전체 사망자 중 갓길에서 발생한 사망자의 사망률이 약 3배 높은 것으로 나타났다. 이는 갓길 사고 발생 시 사고의 심각도가 매우 높다는 것을 보여주며, 갓길 차로 위반 차량을 단속하여 사고를 미연에 방지하는 것이 중요하다는 것을 시시한다. 이에 본 연구는 Faster R-CNN 기법을 활용하여 갓길 차로 위반 차량을 검출할 수 있는 방법을 제안하였다. Faster R-CNN 기법을 기반으로 차량을 탐지하고, 추가적인 판독 모듈을 구성하여 갓길 위반 여부를 판단하였다. 실험 및 평가를 위해 현실세계와 유사하게 상황을 재현할 수 있는 시뮬레이션 게임인 GTAV를 활용하였다. 이미지 형태의 학습데이터 1,800장과 평가데이터 800장을 가공 및 생성하였으며, ZFNet과 VGG16에서 Threshold 값의 변화에 따른 성능을 측정하였다. 그 결과 Threshold 0.8 기준 ZFNet 99.2%, Threshold 0.7 기준 VGG16 93.9%의 검출율을 보였고, 모델 별 평균 검출 속도는 ZFNet 0.0468초, VGG16 0.16초를 기록하여 ZFNet의 검출율이 약 7% 정도 높았으며, 검출 속도 또한 약 3.4배 빠름을 확인하였다. 이는 비교적 복잡하지 않은 네트워크에서도 입력 영상의 전처리 없이 빠른 속도로 갓길 차로 위반 차량의 검출이 가능함을 보여주며, 실제 영상자료 기반의 학습데이터셋을 충분히 확보한다면 지정 차로 위반 검출에 본 알고리즘을 활용할 수 있다는 것을 시사한다.

MLOps를 위한 효율적인 AI 모델 드리프트 탐지방안 연구 (A Study on Efficient AI Model Drift Detection Methods for MLOps)

  • 이예은;이태진
    • 인터넷정보학회논문지
    • /
    • 제24권5호
    • /
    • pp.17-27
    • /
    • 2023
  • 오늘날 AI(Artificial Intelligence) 기술이 발전하면서 실용성이 증가함에 따라 실생활 속 다양한 응용 분야에서 널리 활용되고 있다. 이때 AI Model은 기본적으로 학습 데이터의 다양한 통계적 속성을 기반으로 학습된 후 시스템에 배포되지만, 급변하는 데이터의 상황 속 예상치 못한 데이터의 변화는 모델의 성능저하를 유발한다. 특히 보안 분야에서 끊임없이 생성되는 새로운 공격과 알려지지 않은 공격에 대응하기 위해서는 배포된 모델의 Drift Signal을 찾는 것이 중요해짐에 따라 모델 전체의 Lifecycle 관리 필요성이 점차 대두되고 있다. 일반적으로 모델의 정확도 및 오류율(Loss)의 성능변화를 통해 탐지할 수 있지만, 모델 예측 결과에 대한 실제 라벨이 필요한 점에서 사용 환경의 제약이 존재하며, 실제 드리프트가 발생한 지점의 탐지가 불확실한 단점이 있다. 그 이유는 모델의 오류율의 경우 다양한 외부 환경적 요인, 모델의 선택과 그에 따른 파라미터 설정, 그리고 새로운 입력데이터에 따라 크게 영향을 받기에 해당 값만을 기반으로 데이터의 실질적인 드리프트 발생 시점을 정밀하게 판단하는 것은 한계가 존재하게 된다. 따라서 본 논문에서는 XAI(eXplainable Artificial Intelligence) 기반 Anomaly 분석기법을 통해 실질적인 드리프트가 발생한 시점을 탐지하는 방안을 제안한다. DGA(Domain Generation Algorithm)를 탐지하는 분류모델을 대상으로 시험한 결과, 배포된 이후 데이터의 SHAP(Shapley Additive exPlanations) Value를 통해 Anomaly score를 추출하였고, 그 결과 효율적인 드리프트 시점탐지가 가능함을 확인하였다.

자살 고위험군 노인: 원인 파악 및 예측 모델 개발 (High Suicidal Risk Group of Elderly: Identification of Causal Factors and Development of Predictive Model)

  • 박가연;신우식;김희웅
    • 경영정보학연구
    • /
    • 제25권3호
    • /
    • pp.59-81
    • /
    • 2023
  • 한국의 노인(65세 이상) 자살 문제는 점차 심각해지고 있는 추세이다. 급격한 인구 고령화 흐름에 따라 이러한 고령층의 자살 추세가 더욱 가속화될 것으로 추정되고 있어, 노인 자살을 예방하고 감소시키는 것이 개인 뿐만 아니라 중요한 사회적 과제로 대두되고 있다. 따라서 본 연구는 한국 노인들을 대상으로 자살 생각의 원인 요인을 파악하고 예측 모델을 개발하는 것을 목적 한다. 본 연구는 한국복지패널조사에서 제공하는 7개년의 패널 데이터를 활용하였으며 자살의 대인 관계 이론(interpersonal theory of suicide)과 사회 해체 이론(social disorganization theory)을 바탕으로 노인 자살의 잠재 원인 요인들을 선정한다. 다음으로 노인의 자살 생각에 대한 원인 요인 파악을 위해 패널 로짓 모형 분석을 진행하고 노인 자살 생각의 예측 모델 개발을 위해 딥 러닝과 머신 러닝 알고리즘을 활용한다. 본 연구는 계량 모형 분석을 통해 검증한 주요 원인 요인들을 활용하여 노인 자살을 예방할 수 있는 구체적인 노인 복지 정책 수립에 기여하고자 한다. 본 연구에서 제시된 예측 모델은 자살 고위험군 노인을 선별하고 관리할 수 있는 방안 마련의 기반을 제공한다. 또한 본 연구는 혼합방법론의 시너지를 보였다는 점에서 학술적 시사점을 가진다.

특징집합 IG-MLP 평가 기반의 최적화된 특징선택 방법을 이용한 질환 예측 머신러닝 모델 (Optimized Feature Selection using Feature Subset IG-MLP Evaluation based Machine Learning Model for Disease Prediction)

  • 김경륜;김재권;이종식
    • 한국시뮬레이션학회논문지
    • /
    • 제29권1호
    • /
    • pp.11-21
    • /
    • 2020
  • 암을 제외한 한국인의 가장 높은 사망원인은 심뇌혈관질환으로 사망원인의 24%를 차지한다. 현재 국내 환자의 심혈관질환의 위험도 산출은 프레밍험 위험지수를 기반으로 하지만, 국외의 가이드라인에 의존하고 있어 정확도가 떨어지는 편이며, 뇌혈관질환의 예측에 대한 위험도는 산출할 수 없다. 심뇌혈관질환은 예방을 위한 조기증상들의 특징 분석이 어려워 질환예측이 힘들며, 한국인에 적합한 예측 방법이 필요하다. 본 연구의 목적은 심뇌혈관질환 데이터를 이용하여, 특징집합 IG-MLP 평가 기반의 특징선택 방법론을 시뮬레이션 하여 검증하는 것이다. 제안하는 방법은 제4~7기 국민건강영양조사 원시자료를 이용한다. 심뇌혈관질환의 예측에 중요한 특징들을 선별하기 위해, 속성들의 심뇌혈관질환에 대한 정보이득-다층신경망을 이용한 분석을 실시하며, 최종적으로 선별된 특징을 이용한 심뇌혈관질환 예측 모델을 제공한다. 제안하는 방법으로 한국인의 심뇌혈관질환에 관련된 중요한 특징들을 찾을 수 있으며, 최적화된 특징들로 구성된 예측 모델은 한국인에 대해 더욱 정확한 심뇌혈관 예측을 할 수 있다.

선형 강도 교정을 이용한 라만 스펙트럼 인식 (The identification of Raman spectra by using linear intensity calibration)

  • 박준규;백성준;박아론
    • 한국산학기술학회논문지
    • /
    • 제19권3호
    • /
    • pp.32-39
    • /
    • 2018
  • 라만 스펙트럼은 측정 장비 및 환경 조건에 따라 동일한 물질이라도 스펙트럼의 강도 차이를 보인다. 이는 라만 분광의 패턴 인식적인 접근에 제약을 주기 때문에 장비간의 호환성 및 라만 데이터베이스의 재사용을 위해 반드시 해결해야 하는 문제다. 이를 위해 이전의 주요 연구들에서는 측정 장비 간에 전달 함수를 가정하고 이를 구한 후 직접적인 스펙트럼의 교정을 수행하였다. 하지만 이 방식은 강도 왜곡을 발생시키는 다른 조건들에 대해서는 대처 할 수 없는 방법이다. 따라서 본 논문에서는 다양한 측정 조건에 보다 유연하게 대응 할 수 있는 선형 강도 교정을 이용한 분류 방법을 제안하였다. 제안한 방법의 성능 평가를 위해 실험에서는 14033종의 화학 물질에서 측정된 라만 라이브러리를 실험물질에 대한 판별 지표로 사용하였으며, 3개의 라만 분광기로부터 측정된 10종의 화학 물질 라만 스펙트럼을 실험 데이터로 사용하였다. 실험결과에 따르면 제안한 방법을 사용하였을 때 강도 왜곡된 스펙트럼에 대해 100%의 판별 성능을 보였으며, 판별된 스펙트럼에 대해서도 이전보다 높은 상관점수를 보여 사용자가 화학 물질을 판별하는 데 유용한 도구로 사용될 수 있음을 확인하였다.

시계열 데이터와 랜덤 포레스트를 활용한 시간당 초미세먼지 농도 예측 (Hourly Prediction of Particulate Matter (PM2.5) Concentration Using Time Series Data and Random Forest)

  • 이득우;이수원
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권4호
    • /
    • pp.129-136
    • /
    • 2020
  • 최근 환경 문제에서 중요한 화두로 떠오른 초미세먼지(PM2.5)는 미세먼지(PM10)보다도 작은 부유물질이다. PM2.5는 안구나 호흡기 질환을 일으키며 뇌혈관에까지 침투할 수 있어서 시간별로 수치를 예측하여 대비하는 것이 중요하다. 그러나 PM2.5의 생성과 이동에 관한 명확한 설명이 아직까지는 제시되지 않고 있어서 예측에 어려움이 따른다. 따라서 PM2.5 예측뿐만 아니라 예측 결과에 대한 설명력을 갖는 예측 방법이 제시될 필요가 있다. 본 연구에서는 서울시의 시간당 PM2.5를 예측하고자 하며, 이를 위해 각기 다른 지상관측 데이터를 시계열로 전처리하고 부트스트랩수를 조정한 랜덤 포레스트(Random Forest)를 데이터 학습 및 예측에 사용하는 방법을 제안한다. 이 방법은 예측 모델이 입력 데이터의 시각별 정보를 균형 있게 학습하게 하며 예측 결과에 대한 설명이 가능하다는 장점을 갖는다. 예측 정확도 평가를 위해 기존 모델과의 비교실험을 수행한 결과 제안 방법은 모든 레이블에서 가장 뛰어난 예측 성능을 보였으며, PM2.5의 생성과 관련된 변수와 중국의 영향과 관련된 변수가 예측 결과에 중요한 영향을 미치는 것을 보여주었다.