• 제목/요약/키워드: 이미지 데이터 셋

검색결과 294건 처리시간 0.026초

뉴로모픽 아키텍처 기반 자율형 IoT 응용 통합개발환경 응용 시나리오 (Application Scenario of Integrated Development Environment for Autonomous IoT Applications based on Neuromorphic Architecture)

  • 박지수;김서연;김회남;정재혁;김경수;정진만;윤영선
    • 스마트미디어저널
    • /
    • 제11권2호
    • /
    • pp.63-69
    • /
    • 2022
  • 다양한 IoT 디바이스 사용이 증가함에 따라 IoT 플랫폼의 중요성 또한 대두되고 있다. 최근에는 IoT 디바이스에 인공지능 기술이 결합되는 추세이며, 저전력으로 많은 연산 처리가 가능한 뉴로모픽 아키텍처를 적용하는 연구도 증가하고 있다. 본 논문에서는 GUI 형식의 뉴로모픽 아키텍처 기반 자율형 IoT 응용 통합개발환경(NA-IDE:Integrated Development Environment for Autonomic IoT Applications based on Neuromorphic Architecture)에서 IoT 디바이스와 뉴로모픽 아키텍처 FPGA 디바이스를 사용하여 NA-IDE의 가능성 및 유효성을 확인하기 위한 IoT 응용 시나리오를 제안한다. 제안된 시나리오는 IoT 디바이스에 카메라 모듈을 연결하여 실시간으로 MNIST 데이터셋 이미지를 수집하여 뉴로모픽 보드를 통해 수집된 이미지를 인식하고 다른 IoT 디바이스에 연결된 센서 모듈을 통해 인식 결과를 표시한다. 이와 같이 이기종 IoT 디바이스에 뉴로모픽 아키텍처를 적용하여 다양한 응용 서비스에 활용한다면 뉴로모픽 아키텍처 기반 자율형 IoT 응용 통합개발환경은 4차 산업혁명을 주도하는 핵심 기술로 부상할 것으로 전망한다.

Knowledge Distillation based-on Internal/External Correlation Learning

  • Hun-Beom Bak;Seung-Hwan Bae
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권4호
    • /
    • pp.31-39
    • /
    • 2023
  • 본 논문에서는 이종 모델의 특징맵 간 상관관계인 외부적 상관관계와 동종 모델 내부 특징맵 간 상관관계인 내부적 상관관계를 활용하여 교사 모델로부터 학생 모델로 지식을 전이하는 Internal/External Knowledge Distillation (IEKD)를 제안한다. 두 상관관계를 모두 활용하기 위하여 특징맵을 시퀀스 형태로 변환하고, 트랜스포머를 통해 내부적/외부적 상관관계를 고려하여 지식 증류에 적합한 새로운 특징맵을 추출한다. 추출된 특징맵을 증류함으로써 내부적 상관관계와 외부적 상관관계를 함께 학습할 수 있다. 또한 추출된 특징맵을 활용하여 feature matching을 수행함으로써 학생 모델의 정확도 향상을 도모한다. 제안한 지식 증류 방법의 효과를 증명하기 위해, CIFAR-100 데이터 셋에서 "ResNet-32×4/VGG-8" 교사/학생 모델 조합으로 최신 지식 증류 방법보다 향상된 76.23% Top-1 이미지 분류 정확도를 달성하였다.

YOLOv8과 무인항공기를 활용한 고해상도 해안쓰레기 매핑 (High-Resolution Mapping Techniques for Coastal Debris Using YOLOv8 and Unmanned Aerial Vehicle)

  • 박수호;김흥민;김영민;이인지;박미소;김탁영;장선웅
    • 대한원격탐사학회지
    • /
    • 제40권2호
    • /
    • pp.151-166
    • /
    • 2024
  • 해안쓰레기 문제는 전 세계적으로 환경에 대한 심각한 위협이 되고 있다. 본 연구에서는 딥러닝과 원격탐사 기술을 활용하여 해안쓰레기의 모니터링 방법을 개선하고자 하였다. 이를 위해 You Only Look Once (YOLO)v8 모델을 이용한 객체 탐지 기법을 적용하여 우리나라 주요 해안쓰레기 11종에 대한 대규모 이미지 데이터셋을 구축하고, 실시간으로 쓰레기를 탐지 및 분석할 수 있는 프로토콜(Protocol)을 제안한다. 낙동강 하구에 위치한 신자도를 대상으로 드론 이미지 촬영 및 자체 개발한 YOLOv8 기반의 분석 프로그램을 적용하여 해안쓰레기 성상별 핫스팟을 식별하였다. 이러한 매핑(Mapping) 및 분석 기법의 적용은 해안쓰레기 관리에 효과적으로 활용될 수 있을 것으로 기대된다.

반려견 자동 품종 분류를 위한 전이학습 효과 분석 (Analysis of Transfer Learning Effect for Automatic Dog Breed Classification)

  • 이동수;박구만
    • 방송공학회논문지
    • /
    • 제27권1호
    • /
    • pp.133-145
    • /
    • 2022
  • 국내에서 지속적으로 증가하는 반려견 인구 및 산업 규모에 비해 이와 관련한 데이터의 체계적인 분석이나 품종 분류 방법 연구 등은 매우 부족한 실정이다. 본 논문에서는 국내에서 양육되는 반려견의 주요 14개 품종에 대해 딥러닝 기술을 이용한 자동 품종 분류 방법을 수행하였다. 이를 위해 먼저 딥러닝 학습을 위한 반려견 이미지를 수집하고 데이터셋을 구축하였으며, VGG-16 및 Resnet-34를 백본 네트워크로 사용하는 전이학습을 각각 수행하여 품종 분류 알고리즘을 만들었다. 반려견 이미지에 대한 두 모델의 전이학습 효과를 확인하기 위해, Pre-trained 가중치를 사용한 것과 가중치를 업데이트하는 실험을 수행하여 비교하였으며, VGG-16 기반으로 fine tuning을 수행했을 때, 최종 모델에서 Top 1 정확도는 약 89%, Top 3 정확도는 약 94%의 정확도 성능을 각각 얻을수 있었다. 본 논문에서 제안하는 국내의 주요 반려견 품종 분류 방법 및 데이터 구축은 동물보호센터에서의 유기·유실견 품종 구분이나 사료 산업체에서의 활용 등 여러가지 응용 목적으로도 활용될 수 있는 가능성을 가지고 있다.

적대적생성신경망을 이용한 연안 파랑 비디오 영상에서의 빗방울 제거 및 배경 정보 복원 (Raindrop Removal and Background Information Recovery in Coastal Wave Video Imagery using Generative Adversarial Networks)

  • 허동;김재일;김진아
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제25권5호
    • /
    • pp.1-9
    • /
    • 2019
  • 본 논문에서는 강우시 빗방울로 인해 왜곡된 연안 파랑 비디오 영상에서 빗방울 제거와 제거된 영역에 대한 배경 정보를 복원하기 위한 적대적생성신경망을 이용한 영상 강화 방법을 제안하고자 한다. 영상 변환에 널리 사용되는 Pix2Pix 네트워크와 현재 단일 이미지에 대한 빗방울 제거에 좋은 성능을 보여주고 있는 Attentive GAN을 실험 대상 모델로 구현하고, 빗방울 제거를 위한 공개 데이터 셋을 이용하여 두 모델을 학습한 후 빗방울 왜곡 연안 파랑 영상의 빗방울 제거 및 배경 정보 복원 성능을 평가하였다. 연안 파랑 비디오에 영상에 대한 빗방울 왜곡 보정 성능을 향상시키기 위해 실제 연안에서 빗방울 유무가 짝을 이룬 데이터 셋을 직접 획득한 후 사전 학습된 모델에 대하여 전이 학습에 사용하여 빗방울 왜곡 보정에 대한 성능 향상을 확인하였다. 모델의 성능은 빗방울 왜곡 영상으로부터 파랑 정보 복원 성능을 최대 신호 대 잡음비와 구조적 유사도를 이용하여 평가하였으며, 전이 학습을 통해 파인 튜닝된 Pix2Pix 모델이 연안 파랑 비디오 영상의 빗방울 왜곡에 대한 가장 우수한 복원 성능을 보였다.

오디오 전처리 방법에 따른 콘벌루션 신경망의 환경음 분류 성능 비교 (Comparison of environmental sound classification performance of convolutional neural networks according to audio preprocessing methods)

  • 오원근
    • 한국음향학회지
    • /
    • 제39권3호
    • /
    • pp.143-149
    • /
    • 2020
  • 본 논문에서는 딥러닝(deep learning)을 이용하여 환경음 분류 시 전처리 단계에서 사용하는 특징 추출 방법이 콘볼루션 신경망의 분류 성능에 미치는 영향에 대해서 다루었다. 이를 위해 환경음 분류 연구에서 많이 사용되는 UrbanSound8K 데이터셋에서 멜 스펙트로그램(mel spectrogram), 로그 멜 스펙트로그램(log mel spectrogram), Mel Frequency Cepstral Coefficient(MFCC), 그리고 delta MFCC를 추출하고 각각을 3가지 분포로 스케일링하였다. 이 데이터를 이용하여 4 종의 콘볼루션 신경망과 이미지넷에서 좋은 성능을 보였던 VGG16과 MobileNetV2 신경망을 학습시킨 다음 오디오 특징과 스케일링 방법에 따른 인식률을 구하였다. 그 결과 인식률은 스케일링하지 않은 로그 멜 스펙트럼을 사용했을 때 가장 우수한 것으로 나타났다. 도출된 결과를 모든 오디오 인식 문제로 일반화하기는 힘들지만, Urbansound8K의 환경음이 포함된 오디오를 분류할 때는 유용하게 적용될 수 있을 것이다.

딥러닝 학습에서 최적의 알고리즘과 뉴론수 탐색 (Optimal Algorithm and Number of Neurons in Deep Learning)

  • 장하영;유은경;김혁진
    • 디지털융복합연구
    • /
    • 제20권4호
    • /
    • pp.389-396
    • /
    • 2022
  • 딥러닝(Deep Learning)은 퍼셉트론을 기반으로 하고 있으며 현재에는 이미지 인식, 음성 인식, 객체 검출 및 약물 개발 등과 같은 다양한 영역에서 사용되고 있다. 이에 따라 학습 알고리즘이 다양하게 제안되었고 신경망을 구성하는 뉴런수도 연구자마다 많은 차이를 보이고 있다. 본 연구는 현재 대표적으로 사용되고 있는 확률적 경사하강법(SGD), 모멘텀법(Momentum), AdaGrad, RMSProp 및 Adam법의 뉴런수에 따른 학습 특성을 분석하였다. 이를 위하여 1개의 입력층, 3개의 은닉층, 1개의 출력층으로 신경망을 구성하였고 활성화함수는 ReLU, 손실 함수는 교차 엔트로피 오차(CEE)를 적용하였고 실험 데이터셋은 MNIST를 사용하였다. 그 결과 뉴런수는 100~300개, 알고리즘은 Adam, 학습횟수(iteraction)는 200회가 딥러닝 학습에서 가장 효율적일 것으로 결론을 내렸다. 이러한 연구는 향후 새로운 학습 데이터가 주어졌을 경우 개발될 알고리즘과 뉴런수의 기준치에 함의를 제공할 것이다.

Deep Metric Learning을 활용한 합성곱 신경망 기반의 피부질환 분류 기술 (Skin Disease Classification Technique Based on Convolutional Neural Network Using Deep Metric Learning)

  • 김강민;김판구;전찬준
    • 스마트미디어저널
    • /
    • 제10권4호
    • /
    • pp.45-54
    • /
    • 2021
  • 피부는 외부 오염으로부터 일차적으로 몸을 보호하는 역할을 한다. 피부병이 발생하게 되면 피부의 보호 기능이 저하되므로 신속한 진단과 처치가 필요하다. 최근 인공지능의 발달로 인해 여러 분야에 기술적용을 위한 연구가 이루어지고 있으며, 피부과에서도 인공지능을 활용해 오진율을 줄여 신속한 치료를 받을 수 있는 환경을 만들기 위한 연구가 진행되고 있다. 종래 연구들의 주된 흐름은 발생 빈도가 낮은 피부질환의 진단이었지만, 본 논문에서는 사람들에게 흔히 발생할 수 있고, 개인이 명확히 판별하기 힘든 티눈과 사마귀를 합성곱 신경망을 통해 분류하는 방법을 제안한다. 사용한 데이터셋은 3개의 클래스로 이루어져 있으며, 총 2,515장의 이미지를 가지고 있다, 학습 데이터 부족과 클래스 불균형 문제가 존재한다. 모델의 학습에는 deep metric 손실 함수와 교차 손실 함수를 이용해 각각 성능을 분석하였으며, 정밀도, 재현율, F1 점수, 정확도의 측면에서 비교한 결과 deep metric 손실 함수에서 더 우수한 성능을 보였다.

Utilizing Mean Teacher Semi-Supervised Learning for Robust Pothole Image Classification

  • Inki Kim;Beomjun Kim;Jeonghwan Gwak
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권5호
    • /
    • pp.17-28
    • /
    • 2023
  • 포장도로에서 발생하는 포트홀은 고속 주행 차량에 치명적인 영향을 미치며, 사망사고를 유발할 수 있는 도로상의 장애물이다. 이를 방지하기 위해 일반적으로는 작업자가 직접 포트홀을 탐지하는 방식을 사용해왔으나, 이는 작업자의 안전 문제와 예측하기 어려운 범주에서 발생하는 모든 포트홀을 인력으로 탐지하는 것이 비효율적이기 때문에 한계가 있다. 또한, 도로 환경과 관련된 지반 환경이 포트홀 생성에 영향을 미치기 때문에, 완벽한 포트홀 방지는 어렵다. 데이터셋 구축을 위해서는 전문가의 지도하에 라벨링 작업이 필요하지만, 이는 매우 시간과 비용이 많이 필요하다. 따라서, 본 논문에서는 Mean Teacher 기법을 사용하여 라벨링된 데이터의 샘플 수가 적더라도 지도학습보다 더욱 강인한 포트홀 이미지 분류 성능을 보여준다. 이러한 결과는 성능지표와 GradCAM을 통해 입증되었으며, 준지도학습을 사용할 때 15개의 사전 학습된 CNN 모델이 평균 90.41%의 정확도를 달성하며, 지도학습과 비교하여 2%에서 9%의 차이로 강인한 성능을 나타내는 것을 확인하였다.

효과적인 워터마킹 기법을 사용한 화재 비디오 영상의 저작권 보호 (Copyright Protection for Fire Video Images using an Effective Watermarking Method)

  • ;김종면
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권8호
    • /
    • pp.579-588
    • /
    • 2013
  • 본 논문에서는 화재 비디오 영상의 저작권 보호를 위해 효과적인 워터마킹 기법을 제안한다. 제안하는 워터마킹 기법은 명암도 동시발생 행렬과 퍼지 클러스터링 알고리즘을 이용하여 화재의 색상과 텍스처의 특징을 효율적으로 이용한다. 명암도 동시발생 행렬은 각 후보 화재 영상의 블록에 대한 에너지와 동질성을 계산하여 텍스처 데이터 셋을 만드는데 사용하며, 퍼지 클러스터링은 화재 비디오 영상의 색상 분할과 워터마커 삽입을 위한 텍스처 블록을 결정하기 위해 사용된다. 선택된 텍스처 블록은 이산 웨이블릿 변환을 통해 네 가지 서브밴드 (LL, LH, HL, HH)를 가지는 1차 레벨 웨이블릿 구조로 분해되고, 워터마커는 사람의 시각에 영향을 주지 않는 LH 영역에 삽입된다. 모의실험결과, 제안한 워터마킹 기법은 약 48 데시벨의 높은 첨부 신호 대 잡음 비와 1.6-2.0의 낮은 M-특이치 분해 값을 보였다. 또한, 제안한 워터마킹 기법은 노이즈 첨가, 필터링, 크로핑, JPEG 압축과 같은 영상처리 공격에서도 기존 이미지 워터마킹 알고리즘보다 정규화된 상관 값에서 높은 성능을 보였다.