• 제목/요약/키워드: YOLO v2

검색결과 38건 처리시간 0.023초

이미지 메타 정보 기반 한국인 표정 감정 인식 (Korean Facial Expression Emotion Recognition based on Image Meta Information)

  • 문형주;임명진;김은희;신주현
    • 스마트미디어저널
    • /
    • 제13권3호
    • /
    • pp.9-17
    • /
    • 2024
  • 최근 팬데믹의 영향과 ICT 기술의 발전으로 인해 비대면·무인 시스템의 활용이 확대되고 있으며, 비대면 상황에서 의사소통은 감정을 이해하는 것이 매우 중요하다. 감정을 이해하기 위해서는 다양한 표정에 대한 감정 인식 방법이 필요함에 따라 이미지 데이터에서 표정 감정 인식 개선을 위한 인공지능 기반 연구가 진행되고 있다. 하지만 기존의 표정 감정 인식 연구는 정확도 향상을 위해 대량의 데이터를 활용하기 때문에 높은 컴퓨팅 파워와 많은 학습 시간이 필요하다. 본 논문에서는 이러한 한계점을 개선하기 위해 소량 데이터로도 표정 감정 인식이 가능한 방법으로 이미지 메타 정보인 연령과 성별을 활용한 표정 감정 인식 방법을 제안한다. 표정 감정 인식을 위해 원본 이미지 데이터에서 Yolo Face 모델을 활용하여 얼굴을 검출하였으며, 이미지 메타 정보를 기반으로 VGG 모델을 통해 연령과 성별을 분류한 다음 EfficientNet 모델을 활용하여 7가지 감정을 인식하였다. 메타 정보 기반 데이터 분류 모델과 전체 데이터로 학습한 모델을 비교한 결과 제안하는 데이터 분류 학습 모델의 정확도가 더 높았음을 확인하였다.

인조 번호판을 이용한 자동차 번호인식 성능 향상 기법 (Improved Method of License Plate Detection and Recognition using Synthetic Number Plate)

  • 장일식;박구만
    • 방송공학회논문지
    • /
    • 제26권4호
    • /
    • pp.453-462
    • /
    • 2021
  • 자동차 번호인식을 위해선 수많은 번호판 데이터가 필요하다. 번호판 데이터는 과거의 번호판부터 최신의 번호판까지 균형 있는 데이터의 확보가 필요하다. 하지만 실제 과거의 번호판부터 최신의 번호판의 데이터를 획득하는데 어려움이 있다. 이러한 문제를 해결하기 위해 인조 번호판을 이용하여 자동차 번호판을 생성하여 딥러닝을 통한 번호판 인식 연구가 진행되고 있다. 하지만 인조 데이터는 실제 데이터와 차이가 존재하며, 이러한 문제를 해결하기 위해 다양한 데이터 증강 기법을 사용한다. 기존 데이터 증강 방식은 단순히 밝기, 회전, 어파인 변환, 블러, 노이즈등의 방법을 사용하였다. 본 논문에서는 데이터 증강 방법으로 인조데이터를 실제 데이터 스타일로 변환하는 스타일 변환 방법을 적용한다. 또한 실제 번호판 데이터는 원거리가 많고 어두운 경우 잡음이 많이 존재한다. 단순히 입력데이터를 가지고 문자를 인식할 경우 오인식의 가능성이 높다. 이러한 경우 문자인식 향상을 위해 본 논문에서는 문자인식을 위하여 화질개선 방법으로 DeblurGANv2 방법을 적용하여 번호판 인식 정확도를 높였다. 번호판 검출 및 번호판 번호인식을 위한 딥러닝의 방식은 YOLO-V5를 사용하였다. 인조 번호판 데이터 성능을 판단하기 위해 자체적으로 확보한 자동차 번호판을 수집하여 테스트 셋을 구성하였다. 스타일 변환을 적용하지 않은 번호판 검출이 0.614mAP를 기록하였다. 스타일 변환을 적용한 결과 번호판 검출 성능이 0.679mAP 기록하여 성능이 향상되었음을 확인하였다. 또한 번호판 문자인식에는 화질 개선을 하지 않은 검출 성공률은 0.872를 기록하였으며, 화질 개선 후 검출 성능이 0.915를 기록하여 성능 향상이 되었음을 확인 하였다.

AI를 이용한 홈CCTV 영상의 반려묘 행동 패턴 분석 및 질병 예측 시스템 연구 (Cat Behavior Pattern Analysis and Disease Prediction System of Home CCTV Images using AI)

  • 한수연;박대우
    • 한국정보통신학회논문지
    • /
    • 제26권9호
    • /
    • pp.1266-1271
    • /
    • 2022
  • 반려동물 중 반려묘의 비중이 2012년 이후 연평균 25.4%의 증가율을 보이며 증가하는 추세이다. 고양이는 강아지에 비해 야생성이 강하게 남아있기 때문에 질병이 생기면 잘 숨기는 특성이 있다. 보호자가 반려묘가 질병이 있음을 알게 되었을 때는 병이 이미 악화되어진 상태일 수 있다. 반려묘의 식욕부진(식사회피), 구토, 설사, 다음, 다뇨 등과 같은 현상은 당뇨, 갑상선기능항진증, 신부전증, 범백혈구감소증 등 고양이 질병 시 나타나는 증상 중 일부이다. 반려묘의 다뇨(소변 양이 많음), 다음(물 많이 마심), 빈뇨(소변을 자주 봄) 현상을 보호자가 보다 빨리 알아차릴 수 있다면 반려묘의 질병 치료에 크게 도움이 될 것이다. 본 논문에서는 인공지능 디바이스에서 작동하는 1) 자세 예측 DeepLabCut의 Efficient 버전, 2) 객체 검출 YOLO v4, 3) 행동 예측 LSTM 4) 객체 추적은 BoT-SORT를 사용한다. 인공지능 기술을 이용하여 홈 CCTV의 영상에서 반려묘의 행동 패턴 분석과 물그릇의 무게 센서를 통해 반려묘의 다음, 다뇨 및 빈뇨를 예측한다. 그리고, 반려묘 행동 패턴 분석을 통해, 질병 예측 및 이상행동 결과를 보호자에게 리포트 하는, 메인 서버시스템과 보호자의 모바일로 전달하는 애플리케이션을 제안한다.

딥러닝 기반 배추 심 중심 영역 및 깊이 분류 모델 개발 (Development of a deep learning-based cabbage core region detection and depth classification model)

  • 권기현;노종혁;김아나;김태형
    • 한국정보전자통신기술학회논문지
    • /
    • 제16권6호
    • /
    • pp.392-399
    • /
    • 2023
  • 본 논문에서는 김치 제조 공정 중 배추 심 제거 공정의 로봇 자동화를 위한 배추 심 영역 및 깊이를 판별하는 딥러닝 모델을 제안하는 것이다. 또한 계측된 배추의 심 깊이를 예측하는 것이 아닌 discrete 클래스로 변환하여 영역 검출 및 분류를 동시에 하는 모델을 제시하였다. 딥러닝 모델 학습 및 검증을 위하여 전처리 과정을 거지치 않고 수확된 배추 522 포기에 대한 RGB 영상을 획득하였다. 획득한 영상으로부터 심 영역 및 깊이 라벨링 그리고 데이터 증강 기법을 적용하였다. 제안하는 YOLO-v4 딥러닝 모델 기반 배추 심 영역 검출 및 분류 모델의 성능을 평가하기 위하여 mAP, IoU, accuracy, sensitivity, specificity 그리고 F1-score로 선정하였다. 그 결과 배추 심 영역 검출은 mAP 그리고 IoU 값이 각각 0.97 그리고 0.91로 나타났으며, 심 깊이 분류의 경우 accuracy 그리고 F1-score 값이 각각 96.2% 그리고 95.5%로 나타났다. 본 연구 결과를 통하여 배추의 심 영역 검출 및 깊이 정보 분류가 가능하며, 추후 배추 심 제거 공정의 로봇-자동화 시스템 개발에 활용될 수 있는 가능성을 확인하였다.

IoMT 표준 기반 Object Detection 서비스 제공을 위한 미디어 분석 서비스 운용 기술 (Design and Implementation of Object Detector based on IoMT Standard)

  • 금승우;문재원;김영기
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2019년도 하계학술대회
    • /
    • pp.296-297
    • /
    • 2019
  • 최근의 IoT 기술의 발전은 다양한 형상, 네트워크 특징 및 서비스 아키텍쳐를 가지는 IoT 기기, 서비스 및 단말을 활용한 서비스의 발전을 가져오고 있다. 특히 OneM2M, OCF 등의 표준기구등은 다양한 IoT 기기 및 서비스 아키텍쳐에 대한 정의를 최근 수년간 진행해 오고 있으며, 이러한 IoT 서비스는 단순히 기기의 원격 상태 확인 및 제어 뿐만 아니라, 클라우드 및 AI 기술과의 연계를 통하여 그 서비스 영역을 지속적으로 확장 중에 있다. 이 중 Internet of Media Things 표준은 다양한 미디어 기반 서비스를 Thing으로 표현하여 다양한 Thing과의 연계 방안을 제시하고 있다. 본 논문에서는 기존에 다양한 기법을 통하여 연구 및 구현되고 있는 영상 기반 서비스를 Internet of Media Things 표준 기반으로 구현하기 위한 방법을 제시한다. 기존 영상 분석 기술은 대부분 정확도의 향상에 그 목적을 가지고 있어 서비스 형태로 제공하고 타 기기와의 연계성을 제공하기 위한 추가적인 기술간 연계가 필요하다. 본 논문에서는 Yolo v3 기반의 Face Detection 기술에 대하여, 해당 기술을 Internet of Media Things 표준으로 표출하기 위한 요구사항을 파악하고 실제 구현하기 위한 방안에 대하여 검토한다.

  • PDF

YOLO v8을 활용한 컴퓨터 비전 기반 교통사고 탐지 (Computer Vision-Based Car Accident Detection using YOLOv8)

  • 마르와 차차 안드레아;이충권;김양석;노미진;문상일;신재호
    • 한국산업정보학회논문지
    • /
    • 제29권1호
    • /
    • pp.91-105
    • /
    • 2024
  • 자동차 사고는 차량 간의 충돌로 인해 발생되며, 이로 인해 차량의 손상과 함께 인적, 물적 피해가 유발된다. 본 연구는 CCTV에 의해 촬영되어 YouTube에 업로드된 차량사고 동영상으로 부터 추출된 2,550개의 이미지 프레임을 기반으로 차량사고 탐지모델을 개발하였다. 전처리를 위해 roboflow.com을 사용하여 바운딩 박스를 표시하고 이미지를 다양한 각도로 뒤집어 데이터 세트를 증강하였다. 훈련에서는 You Only Look Once 버전 8 (YOLOv8) 모델을 사용하였고, 사고 탐지에 있어서 평균 0.954의 정확도를 달성하였다. 제안된 모델은 비상시에 경보 전송을 용이하게 하는 실용적 의의를 가지고 있다. 또한, 효과적이고 효율적인 차량사고 탐지 메커니즘 개발에 대한 연구에 기여하고 스마트폰과 같은 기기에서 활용될 수 있다. 향후의 연구에서는 소리와 같은 추가 데이터의 통합을 포함하여 탐지기능을 정교화하고자 한다.

상처와 주름이 있는 지문 판별에 효율적인 심층 학습 비교연구 (A Comparative Study on the Effective Deep Learning for Fingerprint Recognition with Scar and Wrinkle)

  • 김준섭;림빈 보니카;성낙준;홍민
    • 인터넷정보학회논문지
    • /
    • 제21권4호
    • /
    • pp.17-23
    • /
    • 2020
  • 인간의 특성과 관련된 측정 항목을 나타내는 생체정보는 도난이나 분실의 염려가 없으므로 높은 신뢰성을 가진 보안 기술로서 큰 주목을 받고 있다. 이러한 생체정보 중 지문은 본인 인증, 신원 파악 등의 분야에 주로 사용된다. 신원을 파악할 때 지문 이미지에 인증을 수행하기 어려운 상처, 주름, 습기 등의 문제가 있을 경우, 지문 전문가가 전처리단계를 통해 직접 지문에 어떠한 문제가 있는지 파악하고 문제에 맞는 영상처리 알고리즘을 적용해 문제를 해결한다. 이때 지문에 상처와 주름이 있는 지문 영상을 판별해주는 인공지능 소프트웨어를 구현하면 손쉽게 상처나 주름의 여부를 확인할 수 있고, 알맞은 알고리즘을 선정해 쉽게 지문 이미지를 개선할 수 있다. 본 연구에서는 이러한 인공지능 소프트웨어의 개발을 위해 캄보디아 왕립대학교의 학생 1,010명, Sokoto 오픈 데이터셋 600명, 국내 학생 98명의 모든 손가락 지문을 취득해 총 17,080개의 지문 데이터베이스를 구축했다. 구축한 데이터베이스에서 상처나 주름이 있는 경우를 판별하기 위해 기준을 확립하고 전문가의 검증을 거쳐 데이터 어노테이션을 진행했다. 트레이닝 데이터셋과 테스트 데이터셋은 캄보디아의 데이터, Sokoto 데이터로 구성하였으며 비율을 8:2로 설정했다. 그리고 국내 학생 98명의 데이터를 검증 데이터 셋으로 설정했다, 구성된 데이터셋을 사용해 Classic CNN, AlexNet, VGG-16, Resnet50, Yolo v3 등의 다섯 가지 CNN 기반 아키텍처를 구현해 학습을 진행했으며 지문의 상처와 주름 판독에서 가장 좋은 성능을 보이는 모델을 찾는 연구를 수행했다. 다섯가지 아키텍처 중 지문 영상에서 상처와 주름 여부를 가장 잘 판별할 수 있는 아키텍처는 ResNet50으로 검증 결과 81.51%로 가장 좋은 성능을 보였다.

AI기반 하천 부유쓰레기 모니터링 기술 연구 (A Study of AI-based Monitoring Techniques for Land-based Debris in Stream)

  • 이경수;윤해인;원종화;정상화
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.137-137
    • /
    • 2023
  • 해양쓰레기는 해안의 심미적 가치 저하뿐만 아니라 생태계 파괴, 유령 어업에 따른 수산업 피해 등의 사회적·환경적 문제를 발생시키며, 그중 70% 이상은 육상 기인으로 플라스틱 및 기타 쓰레기가 주를 이루는 해외와 달리 국내의 경우 다량의 초목류를 포함하고 있다. 다양한 부유쓰레기에 대한 기존의 해양쓰레기량 추정의 한계와 하천·하구 쓰레기 수거의 효율화를 위해 해양으로 유입되는 부유쓰레기 방지를 위한 실효성 있는 대책 수립이 필요한 실정이다. 본 연구는 해양 유입 전 하천의 차단시설에 차집된 부유쓰레기의 수거 효율화 및 지속가능한 해양쓰레기 데이터 구축을 위해 AI기반의 기술을 통해 부유쓰레기 성상 분석 기법(Object Detection)과 차집량 분석 기법(Semantic Segmentation)을 활용하였다. 실제와 유사한 데이터 수집을 위해 다양한 하천 환경(정수조, 소하천, 급경사수로)에 대해 탁도(녹조, 유사), 광량, 쓰레기형상, 초목류 함량, 날씨(소하천), 유속(급경사수로) 등의 실험조건에 대하여 해양쓰레기 분류 기준 및 통계를 바탕으로 부유쓰레기 종류 선정하여 학습을 위한 데이터를 수집하였다. 학습 목적에 따라 구분하여 라벨링(Bounding box, Polygon)을 수행하고, 각 분석 기법별 전이학습을 통해 Phase 1(정수조), Phase 2(소하천), Phase 3(급경사수로) 순서로 모델을 고도화하였다. 성상 분석을 위해 YOLO v4를 활용하여 Train, Test DataSet(9:1)을 구성하고 학습 및 평가는 Iteration마다의 mAP, loss 값을 통해 비교하였으며, 학습 Phase에 따라 모델 고도화로 Test Set의 mAP 값이 성상별로 높아짐을 확인하였으며, 차집량 분석을 위해 Unet을 활용하여 Train, Test, Validation DataSet(8.5:1:0.5)을 구성하고 epoch별 IoU(intersection over Union), F1-score, loss 값을 비교하여 정성적, 정량적 평가 모두 Phase 3에서 가장 높은 성능을 확인하였다. 향후 하천 환경에서의 다양한 영양인자별 분석을 통해 주요 영향인자 도출 및 Hyper Parameter 최적화를 통한 모델 고도화로 인해 활용성이 높아질 것으로 판단된다.

  • PDF