• 제목/요약/키워드: Confusion matrix

검색결과 115건 처리시간 0.025초

휴대형 근적외선/가시광선 분광기를 이용한 의약품 분류기법 (Classification of Tablets Using a Handheld NIR/Visible-Light Spectrometer)

  • 김태동;이승현;백경진;장병준;정경훈
    • 한국전자파학회논문지
    • /
    • 제28권8호
    • /
    • pp.628-635
    • /
    • 2017
  • 의약품은 인간의 건강 및 생명과 밀접한 관련이 있기 때문에 증상에 맞는 의약품을 처방받아 복용하는 것은 매우 중요한 문제이다. 더욱이 세계적으로 위조 의약품이 증가하는 상황에서 정품 의약품들을 정확하게 분류하는 기술은 점점 중요해진다. 그러나 의약품을 제대로 분류할 수 있는 전문적인 지식을 갖춘 인력이 제한적이라는 측면에서 의약품을 자동적으로 분류하는 기술이 필요하다. 본 논문에서는 휴대용 분광기를 이용하여 의약품의 근적외선 및 가시광선 스펙트럼을 추출하고, Support Vector Machine(SVM) 기법을 이용하여 추출한 스펙트럼 데이터를 학습시켜 분류하는 방법을 제안하였다. 모의실험을 통해 근적외선과 가시광선 스펙트럼 데이터를 사용하여 6종의 의약품을 학습시키고 분류하였을 때 평균적으로 99.9 %의 정확도를 얻었다. 또한 본 논문에서는 위조 의약품 검출을 위한 2단계 SVM 분류 기법을 제안하였으며, 이를 통해 정품과 위조 의약품을 구분하는 정확도가 향상되고, 처리속도가 개선되는 것을 확인하였다.

CART알고리즘과 Landsat-8 위성영상 분석을 통한 계절별 지하수함양량 변화 (Variation of Seasonal Groundwater Recharge Analyzed Using Landsat-8 OLI Data and a CART Algorithm)

  • 박승혁;정교철
    • 지질공학
    • /
    • 제31권3호
    • /
    • pp.395-432
    • /
    • 2021
  • 지하수함양은 시공간적으로 다양하여 직접적으로 측정하기 어렵기 때문에 함양추정을 위해 수치모델이 널리 사용되고 있다. 이 연구에서는 지하수함양을 추정하기 위한 방법으로 기계학습법의 하나인 분류회귀트리(CART)모형을 적용하기 위해 수정된 수직식생지수(mPVI), 정규식생지수(NDVI), 정규경작지수(NDTI), 정규나지지수(NDRI) 같은 토양-식생관련 지수와 강우, 지형인자(고도, 경사, 경사방향)를 입력하고 김천지역 SWAT-MODFLOW의 함양량 결과를 추출 및 학습하여 함양량을 예측하였다. SWAT-MODFLOW의 함양량 분포에 대한 CART모형의 예측값의 전반적인 정확도는 0.5~0.7, 카파계수는 0.3~0.6으로 나타나 위성영상자료를 통해 토양-식생에 따른 함양량 변화를 합리적으로 예측할 수 있었다.

이어도 해양과학기지 수온 시계열 자료의 이상값 검출을 위한 국제 품질검사의 성능 평가 (Evaluation of International Quality Control Procedures for Detecting Outliers in Water Temperature Time-series at Ieodo Ocean Research Station)

  • 민용침;전현정;정진용;박숭환;이재익;정종민;민인기;김용선
    • Ocean and Polar Research
    • /
    • 제43권4호
    • /
    • pp.229-243
    • /
    • 2021
  • Quality control (QC) to process observed time series has become more critical as the types and amount of observed data have increased along with the development of ocean observing sensors and communication technology. International ocean observing institutions have developed and operated automatic QC procedures for these observed time series. In this study, the performance of automated QC procedures proposed by U.S. IOOS (Integrated Ocean Observing System), NDBC (National Data Buy Center), and OOI (Ocean Observatory Initiative) were evaluated for observed time-series particularly from the Yellow and East China Seas by taking advantage of a confusion matrix. We focused on detecting additive outliers (AO) and temporary change outliers (TCO) based on ocean temperature observation from the Ieodo Ocean Research Station (I-ORS) in 2013. Our results present that the IOOS variability check procedure tends to classify normal data as AO or TCO. The NDBC variability check tracks outliers well but also tends to classify a lot of normal data as abnormal, particularly in the case of rapidly fluctuating time-series. The OOI procedure seems to detect the AO and TCO most effectively and the rate of classifying normal data as abnormal is also the lowest among the international checks. However, all three checks need additional scrutiny because they often fail to classify outliers when intermittent observations are performed or as a result of systematic errors, as well as tending to classify normal data as outliers in the case where there is abrupt change in the observed data due to a sensor being located within a sharp boundary between two water masses, which is a common feature in shallow water observations. Therefore, this study underlines the necessity of developing a new QC algorithm for time-series occurring in a shallow sea.

닥나무 인피섬유와 한지의 원산지 판별모델 개발을 위한 NIR 및 MIR 스펙트럼 데이터의 PLS-DA 적용 (Discrimination model for cultivation origin of paper mulberry bast fiber and Hanji based on NIR and MIR spectral data combined with PLS-DA)

  • 장경주;정소윤;고인희;정선화
    • 분석과학
    • /
    • 제32권1호
    • /
    • pp.7-16
    • /
    • 2019
  • 본 연구에서는 닥나무 인피섬유와 이를 이용하여 제조한 한지의 FT-NIR및 FT-MIR 스펙트럼 데이터를 각각PLS-DA에 적용하여 닥나무 인피섬유 및 한지의 원산지 판별 모델을 개발하고자 하였다. 본 연구를 위하여 서로 다른 원산지의 국내산 닥나무 인피섬유 10점을 채취하여 한지로 제조하였다. 상기시료의 FT-NIR 및 FT-IR 스펙트럼 데이터는 데이터 전처리 과정을 거쳐 PLS-DA를 수행하였다. 모델링 결과, 닥나무 인피섬유와 한지의 NIR 스펙트럼 데이터가 판별모델의 교차 검증결과 및 성능평가(정확도, 민감도, 특이도)에서 모두 100 %로 MIR 스펙트럼 데이터보다 우수한 판별 성능을 나타냈다. 또한 지역별로 4 개의 그룹을 형성하는 것을 확인 할 수 있었으며, 닥나무 인피섬유와 한지의 원산지 판별 모델 간 score 형태가 유사하게 나타내는 것을 확인하였다.

연속수치지형도를 활용한 격자기준 관심 지역 추출기법의 평가 (Evaluation of Grid-Based ROI Extraction Method Using a Seamless Digital Map)

  • 정종철
    • 지적과 국토정보
    • /
    • 제49권1호
    • /
    • pp.103-112
    • /
    • 2019
  • 위성영상 분류를 위한 관심 지역 추출은 국토 공간을 효율적으로 관리하기 위한 중요한 기술 중 하나이다. 하지만 위성영상 분류에 관한 최근의 연구들은 관심 지역을 선택하는데 있어서 영상 내의 정보에 의존하는 경우가 많다. 본 연구에서는 고해상도 영상으로부터 구축된 공간정보인 연속수치지형도를 활용하여 효과적인 관심 지역 선택 방안을 제시하였다. 본 연구에 사용된 공간정보는 국토지리정보원에서 제공하는 2013년~2017년 연속수치지형도와 환경부에서 제공하는 2015년 세종시 토지피복도를 활용하였다. 공간정보를 통해 추출된 관심 지역의 정확도 검증을 위해 2015년 10월 28일과 2018년 7월 7일 촬영된 KOMPSAT-3A호 위성영상을 사용하였다. 2013년~2015년 동안 연속수치지형도에서 변화하지 않은 영역과 2015년 토지피복지도를 사용하여 2015년 기초샘플을 추출하였다. 또한, 2015년~2017년 동안 연속수치지형도에서 변화하지 않은 영역과 2015년 토지피복지도를 사용하여 2018년 기초샘플을 추출하였다. 연속수치지형도와 토지피복도를 융합할 때 발생하는 중복된 영역은 데이터의 혼동을 방지하기 위해 모두 제거하였다. 최종적으로 관심 지역 내에서 검사점을 생성하고, 2015년, 2018년 K3A 위성영상과 오차행렬을 통해 추출된 관심 지역의 정확도를 나타냈으며 전체 정확도는 각각 약 93%, 72%로 나타났다. 관심 지역의 정확도 검증을 통해 정확하게 분류된 지역은 관심 지역으로써 사용할 수 있고 오분류된 지역은 변화탐지를 위한 참고자료로서 활용할 수 있다고 판단된다.

제조 설비 이상탐지를 위한 지도학습 및 비지도학습 모델 설계에 관한 연구 (A Study on the Design of Supervised and Unsupervised Learning Models for Fault and Anomaly Detection in Manufacturing Facilities)

  • 오민지;최은선;노경우;김재성;조완섭
    • 한국빅데이터학회지
    • /
    • 제6권1호
    • /
    • pp.23-35
    • /
    • 2021
  • 제4차 산업혁명 선언 이후 생산 제조 기술과 정보통신기술(ICT)이 융합된 스마트 팩토리가 큰 주목을 받고 사물인터넷(IoT) 기술 및 빅데이터 기술 등이 발전하면서 생산 시스템의 자동화가 가능해졌다. 고도화된 제조 산업에서 생산 시스템에는 예정되지 않은 성능 저하 및 가동 중지 발생 가능성이 존재하며, 가능한 한 빨리 잠재적인 오류를 감지하여 이를 복구해 안전 위험을 줄여나가야 한다는 요구가 있다. 본 연구는 유압 시스템에 부착된 다중 센서 데이터를 기반으로 장비의 고장 예측과 이상 발생 시점 예측을 결합하여 제조 설비 이상탐지를 위한 지도학습 및 비지도학습 모델을 설계한다. 지도학습 분석 방법으로 XGBoost, LightGBM, CNN 모델의 정확도를 비교하였다. 혼동행렬 기반의 평가지표를 통해 LightGBM의 예측력이 97%로 가장 우수한 것을 확인하였다. 또한 비지도 학습 분석 방법으로 MD, AE, LSTM-AE 모델을 구축하여 각 모델을 비교 분석한 결과 LSTM-AE 모델이 이상패턴을 75% 감지하여 가장 우수한 성능을 보였다. 본 연구는 지도학습과 비지도학습 기법을 종합하여 설비의 고장여부를 정확하게 진단하고 이상상황이 발생하는 시점을 예측함으로써 이상상황에 대한 선제대응을 할 수 있는 기반을 마련하여 스마트 팩토리 고도화에 기여하고자 한다.

저선량 흉부 CT를 이용한 VGGNet 폐기종 검출 유용성 평가 (Effectiveness of the Detection of Pulmonary Emphysema using VGGNet with Low-dose Chest Computed Tomography Images)

  • 김두빈;박영준;홍주완
    • 한국방사선학회논문지
    • /
    • 제16권4호
    • /
    • pp.411-417
    • /
    • 2022
  • 본 연구에서는 저선량 흉부 CT 영상을 이용하여 VGGNet을 학습시키고 폐기종 검출 모델을 구현하고 성능을 확인하고자 한다. 연구에 사용된 저선량 흉부 CT 영상은 정상 진단 8000장, 폐기종 진단 3189장이며, 모델 학습을 위해 정상 데이터와 폐기종 데이터를 train, validation, test dataset으로 각각 60%, 24%, 16%로 무작위 추출하여 구분하였다. 학습을 위한 인공신경망은 VGGNet 중 VGG16과 VGG19를 사용하였으며, 학습이 완료된 모델 평가를 위해 정확도, 손실율, 오차 행렬, 정밀도, 재현율, 특이도, F1-score의 평가지표를 사용하였다. 폐기종 검출 정확도와 손실율은 VGG16과 VGG19 각각 92.35%, 95.88%, 0.21%, 0.09%, 정밀도는 91.60%, 96.55%, 재현율은 98.36%, 97.39%, 특이도는 77.08%, 92.72%, F1-score는 94.86%, 96.97%였다. 위의 평가지표를 통해 VGG19 모델의 폐기종 검출 성능이 VGG16 모델에 비해 우수하다고 판단된다. 본 연구를 통해 VGGNet과 인공신경망을 이용한 폐기종 검출 모델 연구에 기초자료로 사용할 수 있을 것으로 사료된다.

의사결정나무 및 랜덤포레스트 분류 모델을 이용한 교량 안전등급 예측 (Prediction of Safety Grade of Bridges Using the Classification Models of Decision Tree and Random Forest)

  • 홍지수;전세진
    • 대한토목학회논문집
    • /
    • 제43권3호
    • /
    • pp.397-411
    • /
    • 2023
  • 국내에서 공용연수 30년 이상인 노후 교량의 수가 급증하고 있다. 이에 따라 교량 노후도, 상태 및 성능 예측을 바탕으로 한 첨단 유지관리 기술의 중요성이 점차 주목받고 있다. 이 연구에서는 머신러닝 기반의 의사결정나무 및 랜덤포레스트 분류 모델을 사용하여 교량의 안전등급을 예측하는 방법을 제안하였다. 일반국도상 교량 8,850개를 대상으로 해당 모델들을 혼동행렬, 균형 정확도, 재현율, ROC 곡선 및 AUC와 같이 여러가지 평가 지표를 통해 분석한 결과 전반적으로 랜덤포레스트가 의사결정나무보다 더 나은 예측 성능을 보유하였다. 특히 랜덤포레스트 중 랜덤 언더 샘플링 기법은 노후도가 비교적 커서 유지관리에 주의를 기울여야 하는 C, D등급 교량에 대해 재현율 83.4%로 다른 샘플링 기법들보다 예측 성능이 더 뛰어난 것으로 나타났다. 제안된 모델은 최근 점검이 실시되지 않은 교량들의 신속한 안전등급 파악 및 효율적이고 경제적인 유지관리 계획 수립에 유용하게 활용될 수 있을 것으로 기대된다.

신경 망의 지도 학습을 위한 로그 간격의 학습 자료 구성 방식과 손실 함수의 성능 평가 (Performance Evaluation of Loss Functions and Composition Methods of Log-scale Train Data for Supervised Learning of Neural Network)

  • 송동규;고세헌;이효민
    • Korean Chemical Engineering Research
    • /
    • 제61권3호
    • /
    • pp.388-393
    • /
    • 2023
  • 지도 학습 기반의 신경 망을 활용한 공학적 자료의 분석은 화학공학 공정 최적화, 미세 먼지 농도 추정, 열역학적 상평형 예측, 이동 현상 계의 물성 예측 등 다양한 분야에서 활용되고 있다. 신경 망의 지도 학습은 학습 자료를 요구하며, 주어진 학습 자료의 구성에 따라 학습 성능이 영향을 받는다. 빈번히 관찰되는 공학적 자료 중에는 DNA의 길이, 분석 물질의 농도 등과 같이 로그 간격으로 주어지는 자료들이 존재한다. 본 연구에서는 넓은 범위에 분포된 로그 간격의 학습 자료를 기계 학습으로 처리하는 경우, 사용 가능한 손실 함수들의 학습 성능을 정량적으로 평가하였으며, 적합한 학습 자료 구성 방식을 연구하였다. 이를 수행하고자, 100×100의 가상 이미지를 활용하여 기계 학습의 회귀 과업을 구성하였다. 4개의 손실 함수들에 대하여 (i) 오차 행렬, (ii) 최대 상대 오차, (iii) 평균 상대 오차로 정량적 평가하여, mape 혹은 msle가 본 연구에서 다룬 과업에 대해 최적의 손실 함수가 됨을 알아내었다. 또한, 학습 자료의 값이 넓은 범위에 걸쳐 분포하는 경우, 학습 자료의 구성을 로그 간격 등을 고려하여 균등 선별하는 방식이 높은 학습 성능을 보임을 밝혀내었다. 본 연구에서 다룬 회귀 과업은 DNA의 길이 예측, 생체 유래 분자 분석, 콜로이드 용액의 농도 추정 등의 공학적 과업에 적용 가능하며, 본 결과를 활용하여 기계 학습의 성능과 학습 효율의 증대를 기대할 수 있을 것이다.

Establishment of a deep learning-based defect classification system for optimizing textile manufacturing equipment

  • YuLim Kim;Jaeil Kim
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권10호
    • /
    • pp.27-35
    • /
    • 2023
  • 본 논문에서는 복합소재 생산 분야에서 수요가 높은 프리프레그 섬유 제조 공정에 딥러닝 기반의 결함 검출 및 분류 시스템을 적용하여 생산성을 높이는 과정을 제안한다. 다양한 조건별 다량의 불량 발생으로 해결방안이 필요한 토우 프리프레그 제조 장비에 적용하기 위해 우선 결함 감지와 분류 모델 제작에 필요한 카메라 및 조명을 선정하여 최적의 환경을 구축하였다. 그리고 다중 분류 모델 제작에 필요한 데이터를 수집하고 정상 및 불량 조건에 따라 라벨링을 진행하였다. 다중 분류 모델은 CNN 기반으로 제작하였으며 VGGNet과 MobileNet, ResNet 등의 사전 학습모델을 적용하여 성능을 비교하고 정확도 및 손실 그래프로 개선 방향을 파악한다. 주요 문제로 과적합 문제를 확인하여 개선하기 위해 데이터 증강 및 Dropout 기법을 적용하여 보완하였다. 모델에 대한 성능 평가를 위해 혼돈행렬을 성능지표로 한 성능 평가를 진행하였으며 99% 이상의 성능을 확인하였다. 또한, 실제 공정에 적용하여 실시간 획득된 이미지에 대한 분류 결과를 확인해보며 판별 값이 정확히 도출되는지 확인한다.