• 제목/요약/키워드: learning through the image

검색결과 951건 처리시간 0.101초

IoT 기반 스마트 냉장고 시스템 (A Smart Refrigerator System based on Internet of Things)

  • 김한진;이승기;김원태
    • 전기전자학회논문지
    • /
    • 제22권1호
    • /
    • pp.156-161
    • /
    • 2018
  • 최근 인구가 급격히 증가하면서 음식물의 부족 및 낭비의 심각성이 대두되고 있다. 이를 해결하기 위해 다양한 국가 및 기업에서는 소비자의 식재료 구매 패턴 연구 및 IoT 기술이 적용된 스마트 냉장고 제품개발 등의 시도를 진행 중에 있다. 그러나, 현재 판매되고 있는 스마트 냉장고들은 기존에 비해 상당한 가격대를 형성하고 있으며, 복잡한 구성으로 인한 오작동 및 파손으로 또 다른 낭비를 초래한다. 본 논문에서는 음식물 부족 및 낭비 해결과 가정 내 원활한 식재료 관리를 위한 저비용의 IoT 기반 스마트 냉장고 시스템을 제안한다. 본 시스템은 QR코드, 이미지 인식, 음성 인식을 통해 식재료를 인식하여 등록하고 이를 바탕으로 다양한 서비스를 제공할 수 있다. 이미지 인식의 정확도를 높이기 위해 우리는 딥 러닝 알고리즘을 사용한 모델을 활용하였으며 정확한 식재료 등록이 가능함을 검증하였다.

다중 센서 융합 알고리즘을 이용한 사용자의 감정 인식 및 표현 시스템 (Emotion Recognition and Expression System of User using Multi-Modal Sensor Fusion Algorithm)

  • 염홍기;주종태;심귀보
    • 한국지능시스템학회논문지
    • /
    • 제18권1호
    • /
    • pp.20-26
    • /
    • 2008
  • 지능형 로봇이나 컴퓨터가 일상생활 속에서 차지하는 비중이 점점 높아짐에 따라 인간과의 상호교류도 점점 중요시되고 있다. 이렇게 지능형 로봇(컴퓨터) - 인간의 상호 교류하는데 있어서 감정 인식 및 표현은 필수라 할 수 있겠다. 본 논문에서는 음성 신호와 얼굴 영상에서 감정적인 특징들을 추출한 후 이것을 Bayesian Learning과 Principal Component Analysis에 적용하여 5가지 감정(평활, 기쁨, 슬픔, 화남, 놀람)으로 패턴을 분류하였다. 그리고 각각 매개체의 단점을 보완하고 인식률을 높이기 위해서 결정 융합 방법과 특징 융합 방법을 적용하여 감정 인식 실험을 하였다. 결정 융합 방법은 각각 인식 시스템을 통해 얻어진 인식 결과 값을 퍼지 소속 함수에 적용하여 감정 인식 실험을 하였으며, 특징 융합 방법은 SFS(Sequential Forward Selection) 특징 선택 방법을 통해 우수한 특징들을 선택한 후 MLP(Multi Layer Perceptron) 기반 신경망(Neural Networks)에 적용하여 감정 인식 실험을 실행하였다. 그리고 인식된 결과 값을 2D 얼굴 형태에 적용하여 감정을 표현하였다.

AI 학습모델 및 AI모델 서빙 서버 개발을 통한 생활안전 예방 서비스 신고 이미지 자동분류 시스템 개발에 대한 연구 (A Study on the Development of an Automatic Classification System for Life Safety Prevention Service Reporting Images through the Development of AI Learning Model and AI Model Serving Server)

  • 정영식;김용운;임정일
    • 한국재난정보학회 논문집
    • /
    • 제19권2호
    • /
    • pp.432-438
    • /
    • 2023
  • 연구목적: 생활안전 예방서비스 앱에서 신고되는 이미지를 AI를 사용하여 실시간으로 위험 카테고리를 자동으로 분류하여 사용자에게 편리한 위험신고를 가능하게 하는 것을 목적으로 한다. 연구방법: 인터넷으로 상호연결되는 생활안전 예방서비스 플랫폼, 생활안전 예방서비스 앱, AI 모델 서빙 서버와 sftp 서버로 구성되는 시스템을 통하여 신고된 생활안전 이미지를 실시간으로 자동분류하며, 이때 사용되는 AI모델 생성을 위한 AI 학습 알고리즘도 개발하였다. 연구결과: 이미지를 실시간으로 AI 처리하여 자동으로 분류할 수 있게 되어, 신고자가 생활안전 관련 사항을 보다 편리하게 신고할 수 있게 되었다. 결론: 본 논문에서 제시하는 AI 이미지 자동분류 시스템은 90% 이상의 분류 정확도로 신고 이미지를 실시간으로 자동분류하여 신고자가 간편하게 생활안전 관련 이미지를 신고할 수 있게 되었으며 향후 생활안전 예방서비스 앱의 사용자의 증가에 따라 더욱 빠르고 정확한 AI 모델 개발 및 시스템 처리용량 향상이 필요하다.

Two-Stream Convolutional Neural Network for Video Action Recognition

  • Qiao, Han;Liu, Shuang;Xu, Qingzhen;Liu, Shouqiang;Yang, Wanggan
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권10호
    • /
    • pp.3668-3684
    • /
    • 2021
  • Video action recognition is widely used in video surveillance, behavior detection, human-computer interaction, medically assisted diagnosis and motion analysis. However, video action recognition can be disturbed by many factors, such as background, illumination and so on. Two-stream convolutional neural network uses the video spatial and temporal models to train separately, and performs fusion at the output end. The multi segment Two-Stream convolutional neural network model trains temporal and spatial information from the video to extract their feature and fuse them, then determine the category of video action. Google Xception model and the transfer learning is adopted in this paper, and the Xception model which trained on ImageNet is used as the initial weight. It greatly overcomes the problem of model underfitting caused by insufficient video behavior dataset, and it can effectively reduce the influence of various factors in the video. This way also greatly improves the accuracy and reduces the training time. What's more, to make up for the shortage of dataset, the kinetics400 dataset was used for pre-training, which greatly improved the accuracy of the model. In this applied research, through continuous efforts, the expected goal is basically achieved, and according to the study and research, the design of the original dual-flow model is improved.

유도형 전력선 통신과 연동된 SSD 기반 화재인식 및 알림 시스템 (SSD-based Fire Recognition and Notification System Linked with Power Line Communication)

  • 양승호;손경락;정재환;김현식
    • 전기전자학회논문지
    • /
    • 제23권3호
    • /
    • pp.777-784
    • /
    • 2019
  • 인적이 드문 한적한 곳이나 산악 지역에서 화재가 발생 하였을 때 화재 상황을 정확하게 파악하고 적절한 초동 대처를 한다면 피해를 최소화할 수 있으므로 사전 화재인지시스템과 자동알림시스템이 요구된다. 본 연구에서는 객체인식을 위한 딥러닝 알고리즘 중 Faster-RCNN 및 SSD(single shot multibox detecter)을 사용한 화재 인식시스템을 전력선 통신과 연동하여 자동알림시스템을 시연하였으며 향 후 고압송전망을 이용한 산불화재 감시에 응용 가능함을 제시하였다. 학습된 모델을 장착한 라즈베리파이에 파이카메라를 설치하여 화재 영상인식을 수행하였으며, 검출된 화재영상은 유도형 전력선 통신망을 통하여 모니터링 PC로 전송하였다. 학습 모델별 라즈베리파이에서의 초당 프레임 율은 Faster-RCNN의 경우 0.05 fps, SSD의 경우 1.4 fps로 SSD의 처리속도가 Faster-RCNN 보다 28배 정도 빨랐다.

Anthropomorphic Animal Face Masking using Deep Convolutional Neural Network based Animal Face Classification

  • Khan, Rafiul Hasan;Lee, Youngsuk;Lee, Suk-Hwan;Kwon, Oh-Jun;Kwon, Ki-Ryong
    • 한국멀티미디어학회논문지
    • /
    • 제22권5호
    • /
    • pp.558-572
    • /
    • 2019
  • Anthropomorphism is the attribution of human traits, emotions, or intentions to non-human entities. Anthropomorphic animal face masking is the process by which human characteristics are plotted on the animal kind. In this research, we are proposing a compact system which finds the resemblance between a human face and animal face using Deep Convolutional Neural Network (DCNN) and later applies morphism between them. The whole process is done by firstly finding which animal most resembles the particular human face through a DCNN based animal face classification. And secondly, doing triangulation based morphing between the particular human face and the most resembled animal face. Compared to the conventional manual Control Point Selection system using an animator, we are proposing a Viola-Jones algorithm based Control Point selection process which detects facial features for the human face and takes the Control Points automatically. To initiate our approach, we built our own dataset containing ten thousand animal faces and a fourteen layer DCNN. The simulation results firstly demonstrate that the accuracy of our proposed DCNN architecture outperforms the related methods for the animal face classification. Secondly, the proposed morphing method manages to complete the morphing process with less deformation and without any human assistance.

Keypoint-based Deep Learning Approach for Building Footprint Extraction Using Aerial Images

  • Jeong, Doyoung;Kim, Yongil
    • 대한원격탐사학회지
    • /
    • 제37권1호
    • /
    • pp.111-122
    • /
    • 2021
  • Building footprint extraction is an active topic in the domain of remote sensing, since buildings are a fundamental unit of urban areas. Deep convolutional neural networks successfully perform footprint extraction from optical satellite images. However, semantic segmentation produces coarse results in the output, such as blurred and rounded boundaries, which are caused by the use of convolutional layers with large receptive fields and pooling layers. The objective of this study is to generate visually enhanced building objects by directly extracting the vertices of individual buildings by combining instance segmentation and keypoint detection. The target keypoints in building extraction are defined as points of interest based on the local image gradient direction, that is, the vertices of a building polygon. The proposed framework follows a two-stage, top-down approach that is divided into object detection and keypoint estimation. Keypoints between instances are distinguished by merging the rough segmentation masks and the local features of regions of interest. A building polygon is created by grouping the predicted keypoints through a simple geometric method. Our model achieved an F1-score of 0.650 with an mIoU of 62.6 for building footprint extraction using the OpenCitesAI dataset. The results demonstrated that the proposed framework using keypoint estimation exhibited better segmentation performance when compared with Mask R-CNN in terms of both qualitative and quantitative results.

딥러닝 데이터 활용한 신호등 색 인식 알고리즘 개발 (Development of Color Recognition Algorithm for Traffic Lights using Deep Learning Data)

  • 백서하;김종호;이경수
    • 자동차안전학회지
    • /
    • 제14권2호
    • /
    • pp.45-50
    • /
    • 2022
  • The vehicle motion in urban environment is determined by surrounding traffic flow, which cause understanding the flow to be a factor that dominantly affects the motion planning of the vehicle. The traffic flow in this urban environment is accessed using various urban infrastructure information. This paper represents a color recognition algorithm for traffic lights to perceive traffic condition which is a main information among various urban infrastructure information. Deep learning based vision open source realizes positions of traffic lights around the host vehicle. The data are processed to input data based on whether it exists on the route of ego vehicle. The colors of traffic lights are estimated through pixel values from the camera image. The proposed algorithm is validated in intersection situations with traffic lights on the test track. The results show that the proposed algorithm guarantees precise recognition on traffic lights associated with the ego vehicle path in urban intersection scenarios.

사출성형 제품의 결함검출 시스템 (Defects Detection System on Injection Molded Part)

  • 박인규;이완범;최규석
    • 한국인터넷방송통신학회논문지
    • /
    • 제11권4호
    • /
    • pp.99-104
    • /
    • 2011
  • 본 논문은 사출성형 제품에 존재하는 여러 가지의 패턴의 결함을 신경회로망을 이용하여 검출하는 방법을 제안하였다. 시스템의 성능을 향상시키기 위하여 룩업테이블을 이용하였고, 기존의 이미지 비교에 의한 방법을 지양하여 결함분류를 위한 신경회로망의 학습표본을 위한 특징점을 추출하고 결함추출과 분류알고리즘을 제안하였다. 총 500개의 사출성형 제품의 패턴에 대하여 신경회로망의 학습을 통하여 약 3%의 제품의 패턴에서 결함을 검출하였고 패턴의 직경에 대한 불량으로 대부분 분류되었다. 제안된 시스템을 이용한 결함 검출 방법은 사출성형 제품의 미세한 패턴을 검출하는 데 시간과 경비를 줄일 수 있는 효과적인 대안으로 기대한다.

ResNet을 이용한 얼굴 인식 기반 출입관리시스템 개발 (Development of Access Management System based on Face Recognition using ResNet)

  • 류세열;김혜진;차경애
    • 한국멀티미디어학회논문지
    • /
    • 제22권8호
    • /
    • pp.823-831
    • /
    • 2019
  • In recent years, there has been developed systems such as a surveillance system and access control using a face recognition function instead of a password or an RFID chip, thereby reducing the risk of falsification. Moreover, deep learning technology has been applied to real-time face recognition technology in video, so it makes possible the development of access control system that improves the accuracy of recognition and efficiency of management. In this paper, we propose a real-time access management system based on face recognition using ResNet. The system is based on web server, which make it possible to manage the access by recognizing the person of the image through the camera and access information stored in the database. It can be accessed by a user application to receive various information. The implemented system identifies a person in real time and allows access control by accurately distinguishing whether they are members or not, and the test results can recognize in 0.2 seconds. The accuracy of recognition rate is up to about 97% depending on the experiment environment. With this system, access can be managed quickly and effectively, even many people rush to it.