• 제목/요약/키워드: 학습영상

검색결과 2,580건 처리시간 0.023초

YOLO 기반 개체 검출과 Node.js 서버를 이용한 반려견 행동 분류 시스템 구현 (Implementation of a Classification System for Dog Behaviors using YOLI-based Object Detection and a Node.js Server)

  • 조용화;이혁재;김영훈
    • 융합신호처리학회논문지
    • /
    • 제21권1호
    • /
    • pp.29-37
    • /
    • 2020
  • 본 논문은 실시간 영상 분석을 통해서 반려견에 대한 객체를 추출해 내고, 추출된 이미지로부터 반려견 행동을 분류하는 방법을 구현한다. 반려견 객체 탐지를 위해서 Darknet YOLO를 사용하였으며, 추출된 이미지로부터 행동 패턴 분류는 구글에서 제공하고 있는 Teachable Machine을 이용하였다. 학습된 Teachable Machine은 구글 드라이브에 저장되어 node.js 서버 상에서 ml5.js로 구현하여 사용할 수 있다. 분류된 행동 패턴 결과는 사용자의 스마트 폰 또는 PC로 실시간 전송되며, 언제 어디서든 확인 가능할 수 있게 node.js 서버에서 socket.io 모듈을 사용해서 상호반응 웹 서버를 구현하였다.

SSD 알고리즘 기반 MI-FL을 적용한 회전 불변의 다중 객체 검출 시스템 구현 (Implementation of Rotating Invariant Multi Object Detection System Applying MI-FL Based on SSD Algorithm)

  • 박수빈;임혜연;강대성
    • 한국정보기술학회논문지
    • /
    • 제17권5호
    • /
    • pp.13-20
    • /
    • 2019
  • 최근 CNN을 기반으로 한 객체 검출 기술의 연구가 활발하다. 객체 검출 기술은 자율주행차, 지능형 영상분석 등에서 중요한 기술로 사용된다. 본 논문에서는 CNN 기반의 객체 검출기 중 하나인 SSD(Single Shot Multibox Detector)에 MI-FL(Moment Invariant-Feature Layer)을 적용하여 회전 변형에 강인한 객체 검출 시스템을 제안한다. 먼저 VGG 네트워크를 기반으로 입력 이미지의 특징을 추출한다. 그 후 총 6개의 특징 계층(Feature layer)을 적용하여 객체의 위치 정보와 종류를 예측해 경계 박스들을 생성한다. 그 후 NMS 알고리즘을 이용해 가장 객체일 확률이 높은 경계 박스를 얻는다. 하나의 객체 경계 박스가 정해지면 MI-FL을 이용해 해당 영역의 불변 모멘트 특징을 추출하여 미리 저장하고 학습한다. 이후 검출 과정에서 미리 저장해둔 불면모멘트 특징 정보를 이용해 검출함으로써 회전된 이미지에 대해 기존 방법보다 더 강인한 검출이 가능하다. 기존의 SSD와 MI-FL을 적용한 SSD의 비교를 통해 약 4~5%의 성능 향상을 확인하였다.

외래잡초 분류 : 합성곱 신경망 기반 계층적 구조 (Exotic Weeds Classification : Hierarchical Approach with Convolutional Neural Network)

  • 유광현;이재원;보호앙트롱;당탄부;후이트완녁;이주환;신도성;김진영
    • 한국정보기술학회논문지
    • /
    • 제17권12호
    • /
    • pp.81-92
    • /
    • 2019
  • 잡초는 농작물에 막대한 피해를 주는 주요한 개체이다. 잡초를 효과적으로 제거하기 위해서는 정확한 분류를 하고 제초제를 사용하여야 한다. 컴퓨팅 기술의 발전으로, 영상 기반의 기계학습 방법들이 이 분야에서 연구되고 있고, 특히 합성곱 신경망 기반의 모델들이 공공데이터에서 좋은 성능을 보이고 있다. 하지만 실제 응용단계에서는 많은 파라미터 수와 연산량 때문에 GPU와 같은 좋은 하드웨어 조건에서만 잘 작동된다. 본 논문은 계층적 구조 기반의 딥러닝 모델을 제안한다. 실험 결과, 제안된 모델은 적은 파라미터 수로 21개의 외래 잡초 종을 최대 97.2612%의 정확도로 성공적으로 분류하였다. 이를 통해 적은 수의 파라미터를 사용하는 제안된 모델은 네트워크 기반의 분류 서비스에서 적용될 수 있을 것으로 기대된다.

반려동물 모니터링을 위한 YOLO 기반의 이동식 시스템 설계 (Design of YOLO-based Removable System for Pet Monitoring)

  • 이민혜;강준영;임순자
    • 한국정보통신학회논문지
    • /
    • 제24권1호
    • /
    • pp.22-27
    • /
    • 2020
  • 최근 1인 가구의 증가로 반려동물을 키우는 가구가 많아짐에 따라, 주인의 부재 시에도 반려동물의 상태나 행동을 모니터링하는 시스템에 대한 필요성이 요구되고 있다. 가정용 CCTV를 이용한 반려동물의 모니터링에는 지역적 한계가 있어, 다수의 CCTV를 필요로 하거나 반려동물의 행동반경을 제한하는 방법을 사용하게 된다. 본 논문에서는 반려동물 모니터링의 지역적 한계를 해결하고자 딥러닝을 이용하여 고양이를 검출하고 추적하는 이동식 시스템을 제안한다. 객체 검출 신경망 모델의 하나인 YOLO(You Look Only Once)를 이용하여 데이터셋을 학습하고, 이를 기반으로 라즈베리파이에 적용하여 영상에서 검출된 객체를 추적한다. 라즈베리파이와 노트북을 무선 랜으로 연결하고 고양이의 움직임과 상태를 실시간으로 확인이 가능한 이동식 모니터링 시스템을 설계하였다.

SRCNN과 VDSR의 구조와 방법 및 개선된 성능평가 함수 (Structure, Method, and Improved Performance Evaluation Function of SRCNN and VDSR)

  • 이광찬;왕광싱;신성윤
    • 한국정보통신학회논문지
    • /
    • 제25권4호
    • /
    • pp.543-548
    • /
    • 2021
  • 이미지는 해상도가 높을수록 이미지를 시청하는 사람들의 만족도가 높아지며 초고해상도 이미지화는 컴퓨터 비전이나 영상처리 분야 중에서도 연구 가치가 꽤 높아지고 있다. 본 연구에서는 주로 딥 러닝 초 해상도 모델을 사용하여 저해상도 이미지 LR의 주요 특징을 추출한다. 추출된 특징을 학습 및 재구성하고, 고해상도 이미지 HR을 생성하는 재구성 기반 알고리즘에 중점을 둔다. 본 논문에서는 재구성에 기반을 둔 초 해상도 알고리즘 모델에서 SRCNN과 VDSR에 대하여 알아보도록 한다. SRCNN과 VDSR모델의 구조 및 알고리즘 프로세스를 간략하게 소개하고 개선된 성능평가 함수에서도 다중 채널과 특수한 형태에 대하여 알아보도록 하며, 실험을 통하여 각 알고리즘의 성능을 이해하도록 한다. 실험에서는 SRCNN 및 VDSR 모델의 결과와 피크 신호 대 잡음 비 및 이미지 구조 유사도를 비교하는 실험을 수행하여 결과를 한눈에 볼 수 있도록 하였다.

딥페이크 영상 학습을 위한 데이터셋 평가기준 개발 (Development of Dataset Evaluation Criteria for Learning Deepfake Video)

  • 김량형;김태구
    • 산업경영시스템학회지
    • /
    • 제44권4호
    • /
    • pp.193-207
    • /
    • 2021
  • As Deepfakes phenomenon is spreading worldwide mainly through videos in web platforms and it is urgent to address the issue on time. More recently, researchers have extensively discussed deepfake video datasets. However, it has been pointed out that the existing Deepfake datasets do not properly reflect the potential threat and realism due to various limitations. Although there is a need for research that establishes an agreed-upon concept for high-quality datasets or suggests evaluation criterion, there are still handful studies which examined it to-date. Therefore, this study focused on the development of the evaluation criterion for the Deepfake video dataset. In this study, the fitness of the Deepfake dataset was presented and evaluation criterions were derived through the review of previous studies. AHP structuralization and analysis were performed to advance the evaluation criterion. The results showed that Facial Expression, Validation, and Data Characteristics are important determinants of data quality. This is interpreted as a result that reflects the importance of minimizing defects and presenting results based on scientific methods when evaluating quality. This study has implications in that it suggests the fitness and evaluation criterion of the Deepfake dataset. Since the evaluation criterion presented in this study was derived based on the items considered in previous studies, it is thought that all evaluation criterions will be effective for quality improvement. It is also expected to be used as criteria for selecting an appropriate deefake dataset or as a reference for designing a Deepfake data benchmark. This study could not apply the presented evaluation criterion to existing Deepfake datasets. In future research, the proposed evaluation criterion will be applied to existing datasets to evaluate the strengths and weaknesses of each dataset, and to consider what implications there will be when used in Deepfake research.

글로벌 콘텐츠가 재현하는 AI 윤리와 인간 정체성의 과제: 넷플릭스 다큐 <소셜딜레마>의 서사 분석을 중심으로 (The Challenges of AI Ethics and Human Identity Reproduced by Global Content: Focusing on Narrative Analysis of Netflix Documentary )

  • 최종환;이현주
    • 한국콘텐츠학회논문지
    • /
    • 제22권7호
    • /
    • pp.548-562
    • /
    • 2022
  • 본 연구는 글로벌 콘텐츠에 나타난 AI 윤리의 문제적 상황을 진단하고, 인간의 정체성을 강화하기 위한 담론이 무엇인지를 파악하고자 했다. 연구 진행을 위해 넷플릭스(Netflix) 오리지널 콘텐츠 <소셜딜레마>(The Social Dilemma)를 분석대상으로 선정했다. 연구방법은 서사분석을 채택했다. 분석결과 <소셜딜레마>는 전통적인 시사 다큐멘터리 구조를 보였으며, 이야기 전개를 위해 주로 전문가와 통계자료를 활용한 것으로 확인되었다. 미얀마 학살 사건, 가짜뉴스 전파 등 국내외 사례를 열거하며 콘텐츠 핵심 주장을 강화하기도 했다. 인물의 관계에서는 개발자와 미디어 기업, 이용자와 광고주 사이의 이항대립이 명확하게 드러났다. 해결책으로는 기업에 대한 강력한 규제와 소셜미디어의 이용 중단을 주장했다. 하지만, <소셜딜레마>는 AI 기술의 오남용을 지적하는 수준에 머무르며, 인간 고유의 정체성과 사회적 관계를 외면하는 서사를 구성했다. 이러한 결과는 AI 시대를 맞아 인간의 사회성과 관계성, 학습 능력의 중요성을 강조하는 콘텐츠의 필요성을 제기한다.

온라인 콘텐츠 활용 교과서의 개념과 미래형 교과서의 방향 정립을 위한 이론적 고찰 (A theoretical study to establish the concept of textbooks using online content and the direction of future textbooks)

  • 안성훈
    • 창의정보문화연구
    • /
    • 제7권4호
    • /
    • pp.257-264
    • /
    • 2021
  • COIVD-19로 인해 2020년부터 온라인 수업이 실시되면서 e-book, 구글 도구, 동영상 등 수업 시 온라인 콘텐츠 활용이 증가하였다. 이에 학생들이 온라인 환경에서도 효과적인 학습이 이루어지도록, 교사가 만들어가는 교과서의 필요성이 대두되고 있다. 또한, 교사들은 온라인 수업 및 다양한 온라인 콘텐츠를 활용하는 학생 참여형 수업이 확대됨에 따라 서책형 교과서뿐 아니라 온라인 콘텐츠 활용 교과서를 능동적으로 활용하고 있다. 즉, 온라인 수업을 위한 대비에만 국한하지 않고, 미래 교육체제로 변환을 위해 온라인 교과서의 개념 정립과 현행 교과서의 제도 및 방향성에 대한 고민이 필요한 시점이다. 이에 본 논문에서는 현재 도입되고 잇는 온라인 콘텐츠 활용 교과서의 개념 정립을 위한 기초 자료들을 분석하였고 향후에 개발될 미래형 교과서의 개발 방향에 대한 이론적 내용을 탐색하였다.

인공지능을 적용한 스쿨존의 LIDAR 시스템 개선 연구 (The Improvement of the LIDAR System of the School Zone Applying Artificial Intelligence)

  • 박문수;박대우
    • 한국정보통신학회논문지
    • /
    • 제26권8호
    • /
    • pp.1248-1254
    • /
    • 2022
  • 스쿨존에서 교통사고를 사전에 예방하려고 노력하고 있다. 하지만, 스쿨존 내 교통사고는 계속 발생하고 있다. 운전자가 어린이보호구역 내 상황 정보를 미리 알 수 있으면, 사고를 줄일 수 있다. 본 논문에서는 스쿨존 내 사각지대를 없애는 카메라, 사전 교통정보를 수집할 수 있는 번호인식 카메라 시스템을 설계한다. 차량속도 및 보행자를 인식하는 LIDAR 시스템을 개선하여 설계한다. 카메라 및 LIDAR에서 인식된 보행자 및 차량 영상 정보를 수집하고 가공하여, 인공지능 시계열 분석 및 인공지능 알고리즘을 적용한다. 본 논문에서 제안한 딥러닝으로 학습된 인공지능 교통사고 예방 시스템은, 스쿨존 진입 전 차량 내 모바일 장치에 스쿨존의 정보를 운전자에게 전달하는 강제 푸시서비스를 한다. 그리고 LED 안내판에 스쿨존 교통정보를 알람으로 제공한다.

컨볼루션 신경망(CNN)을 이용한 폭발물 성분 용량별 분류 성능 평가에 관한 연구 (A Study on the Evaluation of Classification Performance by Capacity of Explosive Components using Convolution Neural Network (CNN))

  • 이창현;조성윤;권기원;임태호
    • 인터넷정보학회논문지
    • /
    • 제23권4호
    • /
    • pp.11-19
    • /
    • 2022
  • 본 논문은 컨볼루션 신경망(CNN)을 이용하여 폭발물 성분의 용량별로 분류할 때의 성능을 평가하는 연구이다. 기존의 폭발물 분류 방식 중에 IMS 증기 탐지기 방식은 폭발물의 농도가 사용자가 장비에서 설정한 임계치를 넘어야만 폭발물의 존재 여부를 판단한다. IMS 증기 탐지기는 폭발물이 존재하더라도 임계치를 넘지 않는 양이면 폭발물이 존재하지 않는다고 판단하는 문제가 있다. 따라서 폭발물 성분의 농도가 임계치를 넘지 않는 양일 때에도 폭발물 성분을 검출하는 방안이 필요하다. 이에 따라 본 논문에서는 폭발물 시계열 데이터를 Gramian Angular Field(GAF) 알고리즘으로 이미지화를 진행한 후 이미지와 영상처리뿐만 아니라 시계열 데이터 처리에도 뛰어난 성능을 보이는 딥러닝 모델인 컨볼루션 신경망(CNN)으로 직접 label을 설정해서 지도학습을 진행한 결과 폭발물 성분의 농도가 임계치를 넘지 않는 양일 때에도 폭발물 성분이 존재한다고 판단함과 동시에 폭발물 성분의 종류와 폭발물 성분의 농도의 양을 같이 판단할 수 있는지 성능평가를 진행했다.