• 제목/요약/키워드: machine-learning method

검색결과 2,080건 처리시간 0.031초

서울 지역 지상 NO2 농도 공간 분포 분석을 위한 회귀 모델 및 기계학습 기법 비교 (Comparative Assessment of Linear Regression and Machine Learning for Analyzing the Spatial Distribution of Ground-level NO2 Concentrations: A Case Study for Seoul, Korea)

  • 강은진;유철희;신예지;조동진;임정호
    • 대한원격탐사학회지
    • /
    • 제37권6_1호
    • /
    • pp.1739-1756
    • /
    • 2021
  • 대기 중 이산화질소(NO2)는 주로 인위적인 배출요인으로 발생하며 화학 반응을 통해 이차오염 물질 및 오존 형성에 매개 역할을 하는 인체 건강에 악영향을 미치는 물질이다. 우리나라는 지상 관측소에 의한 실시간 NO2 모니터링을 수행하고 있지만, 이는 점 기반의 관측 값으로써 미관측 지역의 공간 분포 분석이 어렵다는 한계점을 지닌다. 본 연구에서는 선형 회귀 기반 모델인 다중 선형 회귀와 회귀 크리깅, 기계학습 알고리즘인 Random Forest (RF), Support Vector Regression (SVR)을 적용한 공간 내삽 모델링을 통해 서울 지역의 지상 NO2 농도 지도를 제작하였고, 일별 Leave-One-Out Cross Validation (LOOCV) 교차 검증을 시행하였다. 2020년 연구기간 내 일별 LOOCV에서 MLR, RK, SVR 모델의 일별 평균 Index of agreement (IOA)는 약 0.57로 유사한 성능을 보였으며, RF (0.50)보다 높은 성능이 확인되었다. RK의 일별 평균 nRMSE는 0.9483%으로 MLR (0.9501%)보다 상대적으로 낮은 오차를 나타냈다. MLR과 RK, RF 모델의 계절별 공간 분포는 비슷한 양상을 보였으며, RF는 다른 모델에 비해 좁은 NO2 농도 범위가 확인되었다. 본 연구에서 제안된 선형 회귀 기반 공간 내삽은 지상 NO2 뿐 아니라 다른 대기 오염 물질의 도시 지역 공간 내삽을 위해 활용 가능성이 높을 것으로 기대된다.

우리나라 시군단위 벼 수확량 예측을 위한 다종 기상자료의 비교평가 (A Comparative Evaluation of Multiple Meteorological Datasets for the Rice Yield Prediction at the County Level in South Korea)

  • 조수빈;윤유정;김서연;정예민;김근아;강종구;김광진;조재일;이양원
    • 대한원격탐사학회지
    • /
    • 제37권2호
    • /
    • pp.337-357
    • /
    • 2021
  • 노지에서 재배되는 벼는 필연적으로 기상요소의 영향을 받을 수밖에 없으며, 벼 생장에 영향을 미치는 최적의 기상자료 확보 및 변수 선정은 벼 수확량 예측 모델링에 있어 매우 중요하다. 본 연구에서는 1996-2019년의 7월, 8월, 9월에 대하여, 다종의 기상자료 비교평가를 통해 우리나라 벼 수확량 모델링에 대한 적합성을 살펴보고, 기상요소와 벼 수확량 사이의 비선형적인 관계를 고려하여 기계학습 기법을 이용한 수확량 하인드캐스트 실험을 수행하고자 한다. 다종의 기상자료로는, 기상청 ASOS 지상관측과 함께, CRU-JRA ver. 2.1, ERA5 재분석장을 사용하였다. 이들 기상자료에서 공통적으로 도출할 수 있는 월 단위 기온, 상대습도, 일사량, 강수량 변수에 대한 비교를 통하여, 각 자료의 특성 및 벼 수확량과의 연관성을 분석하였다. CRU-JRA ver. 2.1 재분석장은 전반적으로 타 자료와 높은 일치성을 나타냈으며, 변수별 특징을 보았을 때, 상대습도는 벼 수확량에 미치는 영향이 거의 없었으나, 일사량은 벼 수확량과의 상관성이 상당히 높은 것으로 나타났다. 7월, 8월, 9월의 기온, 일사량, 강수량을 랜덤 포리스트 모델에 투입하여 벼 수확량 하인드캐스트 실험을 수행한 결과, CRU-JRA ver. 2.1 재분석장은 세 종류 기상자료 중에 가장 높은 정확도를 나타냈다(CC = 0.772). 또한 예측 모델에서 변수의 중요도는 일사량이 가장 높게 나타나, 기존의 농학적 연구결과와 일치하였다. 본 연구는 벼 수확량 예측을 위한 다종 기상자료의 선택에 있어 하나의 합리적 방법을 제시한 것으로써 의미가 있다고 하겠다.

Deep Convolution Neural Networks 이용하여 결함 검출을 위한 결함이 있는 철도선로표면 디지털영상 재 생성 (Regeneration of a defective Railroad Surface for defect detection with Deep Convolution Neural Networks)

  • 김현호;한석민
    • 인터넷정보학회논문지
    • /
    • 제21권6호
    • /
    • pp.23-31
    • /
    • 2020
  • 본 연구는 철도표면상에 발생하는 노후 현상 중 하나인 결함 검출을 위해 학습데이터를 생성함으로써 결함 검출 모델에서 더 높은 점수를 얻기 위해 진행되었다. 철도표면에서 결함은 선로결속장치 및 선로와 차량의 마찰 등 다양한 원인에 의해 발생하고 선로 파손 등의 사고를 유발할 수 있기 때문에 결함에 대한 철도 유지관리가 필요 하다. 그래서 철도 유지관리의 자동화 및 비용절감을 위해 철도 표면 영상에 영상처리 또는 기계학습을 활용한 결함 검출 및 검사에 대한 다양한 연구가 진행되고 있다. 일반적으로 영상 처리 분석기법 및 기계학습 기술의 성능은 데이터의 수량과 품질에 의존한다. 그렇기 때문에 일부 연구는 일반적이고 다양한 철도표면영상의 데이터베이스를 확보하기위해 등간격으로 선로표면을 촬영하는 장치 또는 탑재된 차량이 필요로 하였다. 본연구는 이러한 기계적인 영상획득 장치의 운용비용을 감소시키고 보완하기 위해 대표적인 영상생성관련 딥러닝 모델인 생성적 적대적 네트워크의 기본 구성에서 여러 관련연구에서 제시된 방법을 응용, 결함이 있는 철도 표면 재생성모델을 구성하여, 전용 데이터베이스가 구축되지 않은 철도 표면 영상에 대해서도 결함 검출을 진행할 수 있도록 하였다. 구성한 모델은 상이한 철도 표면 텍스처들을 반영한 철도 표면 생성을 학습하고 여러 임의의 결함의 위치에 대한 Ground-Truth들을 만족하는 다양한 결함을 재 생성하도록 설계하였다. 재생성된 철도 표면의 영상들을 결함 검출 딥러닝 모델에 학습데이터로 사용한다. 재생성모델의 유효성을 검증하기 위해 철도표면데이터를 3가지의 하위집합으로 군집화 하여 하나의 집합세트를 원본 영상으로 정의하고, 다른 두개의 나머지 하위집합들의 몇가지의 선로표면영상을 텍스처 영상으로 사용하여 새로운 철도 표면 영상을 생성한다. 그리고 결함 검출 모델에서 학습데이터로 생성된 새로운 철도 표면 영상을 사용하였을 때와, 생성된 철도 표면 영상이 없는 원본 영상을 사용하였을 때를 나누어 검증한다. 앞서 분류했던 하위집합들 중에서 원본영상으로 사용된 집합세트를 제외한 두 개의 하위집합들은 각각의 환경에서 학습된 결함 검출 모델에서 검증하여 출력인 픽셀단위 분류지도 영상을 얻는다. 이 픽셀단위 분류지도영상들과 실제 결함의 위치에 대한 원본결함 지도(Ground-Truth)들의 IoU(Intersection over Union) 및 F1-score로 평가하여 성능을 계산하였다. 결과적으로 두개의 하위집합의 텍스처 영상을 이용한 재생성된 학습데이터를 학습한 결함 검출모델의 점수는 원본 영상만을 학습하였을 때의 점수보다 약 IoU 및 F1-score가 10~15% 증가하였다. 이는 전용 학습 데이터가 구축되지 않은 철도표면 영상에 대해서도 기존 데이터를 이용하여 결함 검출이 상당히 가능함을 증명하는 것이다.

기계학습을 활용한 특허수명 예측 및 영향요인 분석 (Prediction of patent lifespan and analysis of influencing factors using machine learning)

  • 김용우;김민구;김영민
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.147-170
    • /
    • 2022
  • 특허의 사적 가치(private value)를 나타내는 특허수명 추정은 오래전부터 연구되었으나 추정과정에서 선형모델에 의존하는 경우가 대부분이었고, 기계학습 방법을 사용하더라도 변수 간 관계에 대한 해석이나 설명이 부족하였다. 본 연구에서는 특허의 생존 기간이 특허의 가치를 대리한다는 기존 연구결과를 바탕으로 특허 등록 이후의 생존 기간(연장횟수) 예측을 통해 특허의 가치를 추정한다. 이를 위해 1996~2017년까지 미국 특허청(USPTO)에 출원하여 등록된 특허 4,033,414개를 수집하였다. 특허수명을 예측하기 위해 기존 연구에서 특허수명에 영향을 미친다고 밝혀진 특허의 특성, 특허의 소유자 특성, 특허의 발명가 특성을 반영할 수 있는 다양한 변수가 사용되었다. 서로 다른 4개의 모델(Ridge Regression, Random Forest, Feed-forward Neural Network, Gradient Boosting Models)을 생성하고, 모델 학습 과정에서는 5-fold Cross Validation으로 초매개변수 조정이 이루어졌다. 이후 생성된 모델의 성능을 평가하고 특허수명을 추정할 수 있는 예측변수의 상대적 중요도를 제시하였다. 또한, 성능이 우수했던 Gradient Boosting Model을 기반으로 Accumulated Local Effects Plot을 제시하여 예측변수와 특허수명 간 관계를 시각적으로 나타내었다. 마지막으로 모델에 의해서 평가된 개별 특허의 평가 근거를 제시하기 위하여 Kernal SHAP(SHapley Additive exPlanations)을 적용하고 특허평가 시스템에의 적용 가능성을 제시한다. 본 연구는 기존에 특허수명을 추정하는 연구에 누적적으로 기여한다는 점 그리고 선형성을 바탕으로 진행된 기존 특허수명 추정 연구들의 한계를 보완하고 복잡한 비선형 관계를 설명가능한 방식으로 제시하였다는 점에서 학문적 의의가 있다. 또한, 개별 특허의 평가 근거를 도출하는 방법을 소개하고 특허평가 시스템에의 적용 가능성을 제시하였다는 점에서 실무적 의의가 있다.

GK2A/AMI와 GK2B/GOCI-II 자료를 융합 활용한 주간 고해상도 안개 탐지 알고리즘 개발 (Development of High-Resolution Fog Detection Algorithm for Daytime by Fusing GK2A/AMI and GK2B/GOCI-II Data)

  • 유하영;서명석
    • 대한원격탐사학회지
    • /
    • 제39권6_3호
    • /
    • pp.1779-1790
    • /
    • 2023
  • 위성 자료의 성능이 크게 개선됨에 따라 최근에는 위성을 이용하여 광범위한 영역에 대한 실시간 안개 탐지 알고리즘들이 개발되고 있다. 한반도 주변을 관측하는 기상위성 중 관측주기가 10분으로 시간해상도가 가장 우수한 GEO-KOMPSAT-2A/Advanced Meteorological Imager (GK2A/AMI)는 공간해상도가 500 m이다. 반면 GEO-KOMPSAT-2B/Geostationary Ocean Color Imager-II (GK2B/GOCI-II)는 해상도가 250 m지만, 1시간 주기로 관측하고 가시채널만 보유하고 있다. 따라서 본 연구에서는 한반도 주변에서 발생하는 안개를 10분 및 250 m 해상도로 탐지하기 위해 GK2AB 융합 안개 탐지 알고리즘(Fog Detection Algorithm, FDA)인 GK2AB FDA를 개발하였다. GK2AB FDA는 세 파트로 구성된다. 첫 번째로 현업 운용중인 GK2A 안개 탐지 알고리즘(GK2A FDA)으로 10분 및 500 m 해상도로 안개를 탐지한다. 두 번째 단계에서는 두 위성 자료 간 시공간 일치, 태양천정각과 파장역 차이를 보정한 GK2A normalized visible (NVIS)의 10분 변화량을 이용하여 GK2B NVIS를 10분 간격으로 외삽한다. 마지막 단계에서는 외삽된 GK2B NVIS, 태양천정각, GK2A FDA 산출물 등을 입력자료로 기계학습(의사결정나무)을 이용하여 개발된 GK2AB FDA로 지리적위치에 따라 안개를 탐지(250 m, 10분)한다. GK2AB FDA의 훈련에는 6개 사례, 검증에는 4개 사례가 이용되었다. GK2AB FDA의 정량적 검증에는 지상관측 시정, 풍속 그리고 상대습도 자료를 이용하였다. GK2AB FDA는 GK2A FDA에 비해 공간해상도가 4배 증가함에 따라 안개 및 비안개 화소가 보다 자세히 구분되었다. 또한 검증방법에 관계없이 GK2A FDA에 비해 probability of detection (POD)은 높고 Hanssen-Kuiper Skill score (KSS)는 높거나 비슷함을 보여 안개 탐지 수준이 개선된 것으로 보인다. 하지만 일부 사례에서는 GK2AB FDA의 false alarm ratio (FAR)와 Bias가 크게 나타나 안개를 과대탐지하는 문제를 보이고 있다.

데이터마이닝 기법을 이용한 상수도 시스템 내의 탁도 예측모형 개발에 관한 연구 (A Study on the Turbidity Estimation Model Using Data Mining Techniques in the Water Supply System)

  • 박노석;김순호;이영주;윤석민
    • 대한환경공학회지
    • /
    • 제38권2호
    • /
    • pp.87-95
    • /
    • 2016
  • 탁도는 송 배수 관로의 부식 등에 의해 발생되는 것으로 알려진 'Discolored Water'현상을 수용가의 물 사용자가 인지할 수 있는 주요 지표로서 활용되고 있다. 즉, 'Discolored Water'는 수돗물 사용자가 육안으로 인지할 수 있는 정도의 탁도를 가진 상태로 정의할 수 있으며, 사용자는 수돗물에 존재하는 불특정의 용존 물질보다는 미세한 입자들에 대한 시각적인 인지인 탁도를 통해서 'Discolored Water'를 인식하게 된다. 이에 본 연구에서는 실제 국내 상수도 시스템 내에서 관측된 다항목의 수질데이터(탁도, pH 및 잔류염소)를 대상으로 하여 탁도 이외의 수질데이터들을 예측모형의 설명변수로 설정한 후 데이터 마이닝 기법(data mining)을 통해 기계학습(machine learning)을 수행하여, 상수도 시스템 내에서의 탁도 변화를 예측하는 모형을 수립하고자 하였다. 수집된 수질 데이터를 대상으로 데이터 마이닝 기법인 Decision Tree를 이용해 탁도 예측모형을 구축한 결과 pH 및 잔류염소를 설명변수로 적용한 모형이 가장 높은 예측결과를 나타내었다. 하지만 예측모형들은 peak 관측치에 대해서는 예측오차가 다소 증가하였는데 이를 보완하기 위해 고주파통과필터를 이용한 전처리 과정을 적용하였다. 그 결과 탁도 데이터의 시계열변화 및 peak 관측치에 대한 예측오차가 감소하는 것으로 나타났다.

뉴럴 디코딩의 원리와 최신 연구 동향 소개 (Principles and Current Trends of Neural Decoding)

  • 김광수;안정열;차성광;구교인;구용숙
    • 대한의용생체공학회:의공학회지
    • /
    • 제38권6호
    • /
    • pp.342-351
    • /
    • 2017
  • 뉴럴 디코딩은 뉴론이 발화한 스파이크 트레인으로부터 뉴론에 인가된 원 자극을 추정하는 작업을 말한다. 디코딩은 뉴론들끼리 어떻게 신호를 주고 받는 지를 이해함으로써 궁극적으로 뇌가 어떻게 정보처리를 하는 지 이해하는 기초적인 작업이다. 이 논문에서 우리는 3가지 뉴럴 디코딩 방법, 즉 빈도 디코딩, 시간 디코딩, 군집 디코딩 방법에 대해 설명하겠다. 빈도 디코딩은 자극에 대한 스파이크의 발화빈도 정보를 이용하여 자극을 복원하는 방법을 말한다. 역사적으로 가장 먼저 시도되었고 가장 간단한 디코딩 방법이다. 그러나 정수 개인 스파이크 개수로부터 빈도를 계산하는 과정에서 빈도자체가 불연속이고 양자화될 가능성이 높기 때문에 간단하고 정적인 자극이 아닌 경우 빈도 디코딩으로는 자극을 복원하기 어렵다는 한계를 가지고 있다. 시간 디코딩은 스파이크 발생 빈도가 아닌 개별 스파이크들의 발생시각을 이용한 디코딩 방법을 말하며 실제 빠르게 변화하는 자극의 경우 신경세포는 빈도 디코딩이 아니라 시간 디코딩을 통해 자극을 추정하는 것으로 이해되고 있다. 군집 디코딩은 단일 신경세포가 아닌 군집 신경세포로부터 자극을 복원하는 방법이다. 군집 디코딩은 단일 신경 세포 디코딩에 비해 신경 세포의 가변성에 따른 불확실성을 감소시킬 수 있고 서로 다른 자극의 특성을 동시에 표현할 수 있다는 장점을 갖는다. 이 논문에서는 먼저 세 가지 뉴럴디코딩 방법에 대해 소개하고 정보이론이 뉴럴디코딩에 어떻게 적용되는 지를 다룬 후 마지막으로 최근에 각광받고 있는 기계학습 방법에 의한 뉴럴 디코딩에 대해 다루도록 하겠다.

유제품 산업의 품질검사를 위한 빅데이터 플랫폼 개발: 머신러닝 접근법 (Building an Analytical Platform of Big Data for Quality Inspection in the Dairy Industry: A Machine Learning Approach)

  • 황현석;이상일;김성현;이상원
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.125-140
    • /
    • 2018
  • 품질검사는 중간상품이나 최종상품을 품질관리 표준을 만족하는 양품과 불량품으로 분리하는 일을 수행한다. 대량생산체계에서 품질을 수작업으로 검사하는 것은 일관성과 효율성을 저하시키므로 대량으로 생산되는 상품의 품질을 검사하는 것은 다수의 공정에서 기계에 의한 자동 확인과 분류를 포함하게 된다. 생산공정에서 발생하는 데이터를 활용하여 공정을 개선하고 최적화하려는 선행 연구들이 많았음에도 불구하고, 실시간에 많은 데이터를 처리하는데 있어서의 기술적인 한계로 인해 실제 구현에서의 제약이 많이 있었다. 최근 빅데이터에 관한 연구에서는 데이터 처리기술을 개선하였고, 실시간에 데이터를 수집, 처리, 분석하는 과정을 가능하게 하게 하고 있다. 본 논문에서는 품질검사를 위한 빅데이터 적용의 단계와 세부사항을 제안하고, 유제품 산업에 적용 사례를 제시하려고 한다. 먼저 선행 연구들을 조사하고, 제조 부문에 적용할 수 있는 빅데이터 분석절차를 제안하며 제안된 방법의 실현가능성을 평가하기 위해서, 유제품 산업 분야의 품질검사과정 중 하나에 회선신경망(Convolutional Neural Network) 기술 및 랜덤포레스트(Random Forest) 기술을 적용하였다. 품질검사를 위해 제품의 뚜껑 및 빨대의 사진을 수집, 처리, 분석하여, 결함 여부를 판단하고, 과거 품질 검사결과와 비교하였다. 제안된 방법은 과거에 수행되었던 품질검사에 비해 분류 정확성 측면에서 의미 있는 개선을 확인할 수 있었다. 본 연구를 통해, 유제품 산업의 빅데이터 활용을 통한 품질검사 정확도 개선 가능성을 확인하였다.

단층 코어넷 다단입력 인공신경망회로의 함수에 관한 구현가능 연구 (The Implementable Functions of the CoreNet of a Multi-Valued Single Neuron Network)

  • 박종준
    • 전기전자학회논문지
    • /
    • 제18권4호
    • /
    • pp.593-602
    • /
    • 2014
  • 인공신경망회로 목표 중의 하나는 최소한의 회로구성으로 구현가능함수를 가능한 많게 하는데 있다. 본 논문은 인공신경망회로의 가장 기본이 되는 하나의 입력노드와 하나의 출력노드, 그리고 입출력에 다단(multi-level)값을 갖는 단층(입출력 2 layer) 다단 코어넷(CoreNet)을 제안하고 그 처리 용량을 구하였고, 무게값 공간에서 구현 가능한 함수와 각 무게값 좌표(${\omega}$,${\theta}$)를 계산으로 구하여 한 함수의 구현 가능 여부를 알 수 있게 하였다. 또 입력 단계(level)값 설정 방법으로 cot(${\sqrt{x}}$)을 제안하였다. 제안된 p단 입력과 q단 출력을 갖는 코어넷의 처리용량(구현 가능한 함수의 수)은 $a_{p,q}={\frac{1}{2}}p(p-1)q^2-{\frac{1}{2}}(p-2)(3p-1)q+(p-1)(p-2)$임을 유도 증명하였다. 시뮬레이션으로 5단(level) 입력 값과, 6단 출력 값을 갖는 1(5)-1(6) 모델을 분석한 결과, cot(${\sqrt{x}}$) 입력 레벨링법에서 총 246가지의 함수가 구현가능 함을 보였다. 이 모델의 시뮬레이션 결과에서는 최대 219개의 함수가 수렴(구현 가능)하였고, 구현가능 함수 중에서 나머지 수렴되지 않은 27개의 함수는 무게값 공간에서 무게값 좌표를 계산하여 구현 가능함을 보였다. 이는 앞에서 제시된 코어넷 처리용량 $a_{5,6}(=246)$에 의한 계산 값과 일치하였다. 무게값 공간에서, 구현 가능한 함수가 차지하는 영역의 함수번호 매김 방법도 제시하여 구현 가능함수의 번호도 알 수 있도록 하였다.

디지털 X-선 영상을 통한 치아우식증 진단 보조 시스템으로써 치아 와동 자동 검출 프로그램 연구 (Studies of Automatic Dental Cavity Detection System as an Auxiliary Tool for Diagnosis of Dental Caries in Digital X-ray Image)

  • 허장용;남혜원;김주혜;박지만;신석영;이레나
    • 한국의학물리학회지:의학물리
    • /
    • 제26권1호
    • /
    • pp.52-58
    • /
    • 2015
  • 본 연구팀이 개발한 신개념 강내형 치과 진단 장치에서 촬영한 X선 치아영상으로부터 치아 우식증을 조기 단계에서 판별하고 치과의사의 정확한 진단을 돕기 위해서 병변진단 보조시스템인 치아 와동 자동 검출 프로그램을 개발하고자 하였다. 치아 와동 자동 검출 시스템을 구성하고 있는 기본 알고리즘은 치아 와동과 정상 치아를 구분 할 수 있는 영상분별 알고리즘과 치아 영상의 고유 특성 정보를 분석하고 이를 병변 검출에 적용할 수 있는 알고리즘으로 나눌 수가 있는데, 본 연구에서는 먼저, DRLSE 방법을 적용하여 병변과 정상치아 사이의 윤곽선 분할 성능을 테스트 하였다. 개발된 알고리즘의 와식 판별 성능을 테스트하기 위해서 다양한 형태의 와식을 포함하는 전치, 견치, 소구치 등의 7개의 치아팬텀을 제작하고 치아 와식 분별을 실시하였다. 총 14 개의 와식 중에 와식의 경계를 부분적으로 식별한 2개를 제외하고는 12개 와식의 경계를 정확하게 구별하여 개발된 자동 치아 병변 알고리즘의 가능성을 입증하였다. 그러나 실제 치아 와식의 형태는 개개인마다 다르고 복잡하기 때문에 무작위로 선택된 실제 치아에 적용하기 위해서는 보강된 알고리즘이 필요하다. 향후에는 치아에 대한 사전정보를 처리하고 적용하는 패턴 인식 혹은 기계학습 알고리즘을 추가하여 보다 효과적이고 정확한 병변 알고리즘으로 개선할 예정이다.