• 제목/요약/키워드: 단일 클래스 분류

검색결과 69건 처리시간 0.033초

딥러닝 기반 배추 심 중심 영역 및 깊이 분류 모델 개발 (Development of a deep learning-based cabbage core region detection and depth classification model)

  • 권기현;노종혁;김아나;김태형
    • 한국정보전자통신기술학회논문지
    • /
    • 제16권6호
    • /
    • pp.392-399
    • /
    • 2023
  • 본 논문에서는 김치 제조 공정 중 배추 심 제거 공정의 로봇 자동화를 위한 배추 심 영역 및 깊이를 판별하는 딥러닝 모델을 제안하는 것이다. 또한 계측된 배추의 심 깊이를 예측하는 것이 아닌 discrete 클래스로 변환하여 영역 검출 및 분류를 동시에 하는 모델을 제시하였다. 딥러닝 모델 학습 및 검증을 위하여 전처리 과정을 거지치 않고 수확된 배추 522 포기에 대한 RGB 영상을 획득하였다. 획득한 영상으로부터 심 영역 및 깊이 라벨링 그리고 데이터 증강 기법을 적용하였다. 제안하는 YOLO-v4 딥러닝 모델 기반 배추 심 영역 검출 및 분류 모델의 성능을 평가하기 위하여 mAP, IoU, accuracy, sensitivity, specificity 그리고 F1-score로 선정하였다. 그 결과 배추 심 영역 검출은 mAP 그리고 IoU 값이 각각 0.97 그리고 0.91로 나타났으며, 심 깊이 분류의 경우 accuracy 그리고 F1-score 값이 각각 96.2% 그리고 95.5%로 나타났다. 본 연구 결과를 통하여 배추의 심 영역 검출 및 깊이 정보 분류가 가능하며, 추후 배추 심 제거 공정의 로봇-자동화 시스템 개발에 활용될 수 있는 가능성을 확인하였다.

H.264 압축과 SVDD를 이용한 영상 감시 시스템에서의 비정상 집단행동 탐지 (Abnormal Crowd Behavior Detection via H.264 Compression and SVDD in Video Surveillance System)

  • 오승근;이종욱;정용화;박대희
    • 정보보호학회논문지
    • /
    • 제21권6호
    • /
    • pp.183-190
    • /
    • 2011
  • 감시카메라 환경에서 군중의 비정상 집단행동 탐지란 감시카메라로부터 유입되는 영상에서 다중 객체가 위험에 처한 상황을 신속하고 정확하게 탐지하는 분야를 말한다. 본 논문에서는 CCTV 등과 같은 감시카메라 환경에서 움직임 벡터와 SVDD를 이용하여 집단내의 비정상 상황을 탐지하는 프로토타입 시스템을 제안한다. 제안된 시스템은 H.264 압축과정에서의 움직임 벡터 정보를 이용하여 영상내의 움직임 정보를 추출 표현하였으며, 비정상 집단행동의 판별 문제를 실용적 차원의 단일 클래스 분류 문제로 재해석하여 단일 클래스 SVM의 대표적 모델인 SVDD를 탐지기로 설계하였다. 제안된 시스템은 H.264 압축 과정에서 얻어지는 움직임 벡터를 이용함으로써, 실시간성을 보장하며 SVDD의 점증적 갱신 학습 능력으로 인하여 비정상 집단행동 데이터베이스의 변화에도 능동적으로 적응할 수 있다. 공개적으로 사용 가능한 벤치마크 데이터 셋인 PETS 2009와 UMN을 이용하여 본 논문에서 제안한 비정상 집단행동 탐지 시스템의 성능을 실험적으로 검증한다.

Classification of Infant Crying Audio based on 3D Feature-Vector through Audio Data Augmentation

  • JeongHyeon Park;JunHyeok Go;SiUng Kim;Nammee Moon
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권9호
    • /
    • pp.47-54
    • /
    • 2023
  • 영아는 비언어적 의사 소통 방식인 울음이라는 수단을 사용한다[1]. 하지만 영아의 울음소리를 파악하는 것에는 어려움이 따른다. 영아의 울음소리를 해석하기 위해 많은 연구가 진행되었다[2,3]. 이에 본 논문에서는 다양한 음성 데이터 증강을 통한 3D 특징 벡터를 이용한 영아의 울음소리 분류를 제안한다. 연구에서는 총 5개의 클래스 복통, 하품, 불편함, 배고픔, 피곤함(belly pain, burping, discomfort, hungry, tired)로 분류된 데이터 세트를 사용한다. 데이터들은 5가지 기법(Pitch, Tempo, Shift, Mixup-noise, CutMix)을 사용하여 증강한다. 증강 기법 중에서 Tempo, Shift, CutMix 기법을 적용하였을 때 성능의 향상을 보여주었다. 최종적으로 우수한 데이터 증강 기법들을 동시 적용한 결과 단일 특징 벡터와 오리지널 데이터를 사용한 모델보다 17.75%의 성능 향상을 도출하였다.

불꽃 감지를 위한 임베디드 시스템에 적합한 딥러닝 구조 (Deep Learning Structure Suitable for Embedded System for Flame Detection)

  • 라승탁;이승호
    • 전기전자학회논문지
    • /
    • 제23권1호
    • /
    • pp.112-119
    • /
    • 2019
  • 본 논문에서는 불꽃 감지를 위한 임베디드 시스템에 적합한 딥러닝 구조를 제안한다. 제안하는 딥러닝 구조의 불꽃 감지 과정은 불꽃 색깔 모델을 사용한 불꽃 영역 검출, 불꽃 색깔 특화 딥러닝 구조를 사용한 불꽃 영상 분류, 검출된 불꽃 영역의 $N{\times}N$ 셀 분리, 불꽃 모양 특화 딥러닝 구조를 사용한 불꽃 영상 분류 등의 4가지 과정으로 구성된다. 첫 번째로 입력 영상에서 불꽃의 색만을 추출한 다음 레이블링하여 불꽃 영역을 검출한다. 두 번째로 검출된 불꽃 영역을 불꽃 색깔에 특화 학습된 딥러닝 구조의 입력으로 넣고, 출력단의 불꽃 클래스 확률이 75% 이상에서만 불꽃 영상으로 분류한다. 세 번째로 앞 단에서 75% 미만 불꽃 영상으로 분류된 영상들의 검출된 불꽃 영역을 $N{\times}N$ 단위로 분할한다. 네 번째로 $N{\times}N$ 단위로 분할된 작은 셀들을 불꽃의 모양에 특화 학습된 딥러닝 구조의 입력으로 넣고, 각 셀의 불꽃 여부를 판단하여 50% 이상의 셀들이 불꽃 영상으로 분류될 경우에 불꽃 영상으로 분류한다. 제안된 딥러닝 구조의 성능을 평가하기 위하여 ImageNet의 불꽃 데이터베이스를 사용하여 실험하였다. 실험 결과, 제안하는 딥러닝 구조는 기존의 딥러닝 구조보다 평균 29.86% 낮은 리소스 점유율과 8초 빠른 불꽃 감지 시간을 나타내었다. 불꽃 검출률은 기존의 딥러닝 구조와 비교하여 평균 0.95% 낮은 결과를 나타내었으나, 이는 임베디드 시스템에 적용하기 위해 딥러닝 구조를 가볍게 구성한데서 나온 결과이다. 따라서 본 논문에서 제안하는 불꽃 감지를 위한 딥러닝 구조는 임베디드 시스템 적용에 적합함이 입증되었다.

Multi-Tasking U-net 기반 파프리카 병해충 진단 (Multi-Tasking U-net Based Paprika Disease Diagnosis)

  • 김서정;김형석
    • 스마트미디어저널
    • /
    • 제9권1호
    • /
    • pp.16-22
    • /
    • 2020
  • 본 연구에서는 Multi-Tasking U-net를 사용하여 영역 세분화 작업(Segmentation) 과 분류 작업(Classification) 이 동시에 수행되게 함으로써 파프리카 병과 충 진단을 수행하였다. 시설 농장의 파프리카에는 병의 종류가 다양하지 않다. 이 연구에서는 비교적 발생빈도가 높은 흰가루병과 응애에 의한 피해, 정상 잎 3개의 클래스에 대해서만 진단 할 수 있도록 하였다. 이를 위한 중추 모델로는 U-net을 사용하였다. 또, 이 모델의 Encoder와 Decoder의 최종 단을 활용하여 분류 작업과 영역 세분화 작업이 각 각 수행되게하여, U-net의 Encoder가 분류작업과 영역 세분화 작업에 공유되도록 하였다. 학습 데이터로는 정상 잎 680장, 응애에 의한 피해 잎 450장, 흰가루병 370장을 사용하였다. 테스트 데이터로는 정상 잎 130장, 응애에 의한 피해 잎 100장, 흰가루병 90장을 사용하였고, 이를 통한 테스트 결과로는 89%의 인식률을 얻었다.

S-MTS를 이용한 강판의 표면 결함 진단 (Steel Plate Faults Diagnosis with S-MTS)

  • 김준영;차재민;신중욱;염충섭
    • 지능정보연구
    • /
    • 제23권1호
    • /
    • pp.47-67
    • /
    • 2017
  • 강판 표면 결함은 강판의 품질과 가격을 결정하는 중요한 요인 중 하나로, 많은 철강 업체는 그동안 검사자의 육안으로 강판 표면 결함을 확인해왔다. 그러나 시각에 의존한 검사는 통상 30% 이상의 판단 오류가 발생함에 따라 검사 신뢰도가 낮은 문제점을 갖고 있다. 따라서 본 연구는 Simultaneous MTS (S-MTS) 알고리즘을 적용하여 보다 지능적이고 높은 정확도를 갖는 새로운 강판 표면 결함 진단 시스템을 제안하였다. S-MTS 알고리즘은 단일 클래스 분류에는 효과적이지만 다중 클래스 분류에서 정확도가 떨어지는 기존 마할라노비스 다구찌시스템 알고리즘(Mahalanobis Taguchi System; MTS)의 문제점을 해결한 새로운 알고리즘이다. 강판 표면 결함 진단은 대표적인 다중 클래스 분류 문제에 해당하므로, 강판 표면 결함 진단 시스템 구축을 위해 본 연구에서는 S-MTS 알고리즘을 채택하였다. 강판 표면 결함 진단 시스템 개발은 S-MTS 알고리즘에 따라 다음과 같이 진행하였다. 첫째, 각 강판 표면 결함 별로 개별적인 참조 그룹 마할라노비스 공간(Mahalanobis Space; MS)을 구축하였다. 둘째, 구축된 참조 그룹 MS를 기반으로 비교 그룹 마할라노비스 거리(Mahalanobis Distance; MD)를 계산한 후 최소 MD를 갖는 강판 표면 결함을 비교 그룹의 강판 표면 결함으로 판단하였다. 셋째, 강판 표면 결함을 분류하는 데 있어 결함 간의 차이점을 명확하게 해주는 예측 능력이 높은 변수를 파악하였다. 넷째, 예측 능력이 높은 변수만을 이용해 강판 표면 결함 분류를 재수행함으로써 최종적인 강판 표면 결함 진단 시스템을 구축한다. 이와 같은 과정을 통해 구축한 S-MTS 기반 강판 표면 결함 진단 시스템의 정확도는 90.79%로, 이는 기존 검사 방법에 비해 매우 높은 정확도를 갖는 유용한 방법임을 보여준다. 추후 연구에서는 본 연구를 통해 개발된 시스템을 현장 적용하여, 실제 효과성을 검증할 필요가 있다.

단일 시기의 Landsat 7 ETM+ 영상을 이용한 산불피해지도 작성 (Fire Severity Mapping Using a Single Post-Fire Landsat 7 ETM+ Imagery)

  • 원강영;임정호
    • 대한원격탐사학회지
    • /
    • 제17권1호
    • /
    • pp.85-97
    • /
    • 2001
  • 인공위성영상(ETM+)을 이용하여 산불피해지역을 분석하기 위해 KT(Kauth-Thomas)변환기법과 IHS(Intensity-Hue-Saturation)변환기법을 적용하여 비교해 보고 산불피해등급지도를 작성하였다. 이 연구는 두 부분으로 나누어 수행되었는데, 그 첫 번째는 기하보정만 수행한 영상의 7, 4, 1밴드를 이용하여 IHS변환을 적용하여 단순 슬라이싱 기법으로 산불피해지역을 피해 정도별로 등급화 하는 것이 가능한가를 분석하였다. 그 결과 각 컴포넌트에서 클래스의 분광 특성이 서로 겹쳐서 단순 슬라이싱 기법으로는 적절한 분류가 이루어지지 않았다. 두 번째는 방사 및 지형보정을 한 영상을 각각 IHS와 KT변환기법으로 변환시킨 후 최대우도법을 이용해 분류하였다. 현장데이타가 부족하여 cross-validation을 수행하였으며, 일관되게 KT변환기법에 의한 분류가 IHS기법에 의한 분류보다 더 좋은 결과를 보여주었다. 또한 KT feature space와 IHS 컴포넌트의 분광분포를 그래프 상에서 분석해 보았다. 이 연구에서는 KT변환기법이 IHS변환기법보다 산불피해지역을 추출함에 있어 더 높은 정확도를 나타내고, 산불과 관련된 지표의 물리적 특성을 더 잘 반영함을 볼 수 있었다.

계층 구조를 고려한 Jena Plug-in 저장소의 평가를 위한 실험 및 시뮬레이션 (Experiment and Simulation for Evaluation of Jena Storage Plug-in Considering Hierarchical Structure)

  • 신희영;정동원;백두권
    • 한국시뮬레이션학회논문지
    • /
    • 제17권2호
    • /
    • pp.31-47
    • /
    • 2008
  • W3C에서 표준 온톨로지 서술 언어로 OWL을 채택함에 따라 많은 온톨로지들이 OWL로 기술 및 구현되고 있다. 이와 관련된 기술 중 Jena는 HP에서 개발한 API로서 저장소는 물론 추론 엔진을 개발할 수 있는 다양한 API를 제공하고 있으며 현재 많은 시스템 개발에 이용되고 있다. 그러나 Jena2의 저장 모델은 단일 테이블에 문서의 정보를 저장하기 때문에 대용량의 온톨로지 데이터 처리에 있어 성능이 저하되는 문제점을 지닌다. 무엇보다 클래스와 프로퍼티의 계층적 구조를 고려하지 않기 때문에 계층 구조를 이용한 질의 처리 시 잦은 조인 연산으로 인해 성능이 급격하게 저하된다. 따라서 본 논문에서는 이러한 문제점들을 해결하기 위해 기존의 Jena2 API를 그대로 이용하면서 Plug-in 형식으로 적용할 수 있는 새로운 OWL 온톨로지 관계형 데이터베이스 모델을 제안한다. 제안 모델은 클래스(Class), 프로퍼티(Property), 인스턴스(Instance)의 정보들을 의미적으로 분류하여 저장하며 계층적 정보들에 대해서도 개별적으로 관리함으로써 질의 처리 성능을 향상시킨다. 또한 기존모델과 이 논문에서 제안하는 모델과의 실험 및 시뮬레이션을 통해 비교 분석 한다. 실험 및 시뮬레이션 결과에서, 제안 시스템이 Jena2보다 나은 성능을 보였다.

  • PDF

I-벡터 기반 오픈세트 언어 인식을 위한 다중 판별 DNN (Multiple Discriminative DNNs for I-Vector Based Open-Set Language Recognition)

  • 강우현;조원익;강태균;김남수
    • 한국통신학회논문지
    • /
    • 제41권8호
    • /
    • pp.958-964
    • /
    • 2016
  • 본 논문에서는 여러 개의 이원 support vector machine (binary SVM)을 사용하여 세 개 이상의 클래스를 분류하는 multi-class SVM과 유사하게 다중의 판별 deep neural network (DNN) 모델을 사용하는 i-벡터 기반의 언어 인식 시스템을 제안한다. 제안하는 시스템은 NIST 2015 i-vector Machine Learning Challenge 데이터베이스에 포함된 i-벡터들을 이용하여 학습 및 테스트 되었으며, 오픈 세트에서 기존의 cosine distance, multi-class SVM 및 단일 neural network (NN) 기반의 언어 인식 시스템에 비하여 높은 성능을 보임이 확인되었다.

Denoising Auto Encoder 기법을 활용한 진동 데이터 전처리 및 성능비교 (Vibration Data Denoising and Performance Comparison Using Denoising Auto Encoder Method)

  • 장준교;노천명;김성수;이순섭;이재철
    • 해양환경안전학회지
    • /
    • 제27권7호
    • /
    • pp.1088-1097
    • /
    • 2021
  • 기계 장비의 진동 데이터는 필연적으로 노이즈를 포함하고 있다. 이러한 노이즈는 기계 장비의 유지보수를 진행하는데 악영향을 끼친다. 그에 따라 데이터의 노이즈를 얼마나 효과적으로 제거해주냐에 따라 학습 모델의 성능을 좌우한다. 본 논문에서는 시계열 데이터를 전처리 함에 있어 특성추출 과정을 포함하지 않는 Denoising Auto Encoder 기법을 활용하여 데이터의 노이즈를 제거했다. 또한 기계 신호 처리에 널리 사용되는 Wavelet Transform과 성능 비교를 진행했다. 성능비교는 고장 탐지율을 계산하여 진행했으며 보다 정확한 비교를 위해 분류 성능 평가기준 중 하나인 F-1 Score를 계산하여 성능 비교를 진행했다. 고장을 탐지하는 과정에서는 One-Class SVM 기법을 활용하여 고장 데이터를 탐지했다. 성능 비교 결과 고장 진단율과 오차율 측면에서 Denoising Auto Encoder 기법이 Wavelet Transform 기법에 비해 보다 좋은 성능을 나타냈다.