• Title/Summary/Keyword: Deep Learning System

Search Result 1,745, Processing Time 0.031 seconds

Fast Convergence GRU Model for Sign Language Recognition

  • Subramanian, Barathi;Olimov, Bekhzod;Kim, Jeonghong
    • Journal of Korea Multimedia Society
    • /
    • v.25 no.9
    • /
    • pp.1257-1265
    • /
    • 2022
  • Recognition of sign language is challenging due to the occlusion of hands, accuracy of hand gestures, and high computational costs. In recent years, deep learning techniques have made significant advances in this field. Although these methods are larger and more complex, they cannot manage long-term sequential data and lack the ability to capture useful information through efficient information processing with faster convergence. In order to overcome these challenges, we propose a word-level sign language recognition (SLR) system that combines a real-time human pose detection library with the minimized version of the gated recurrent unit (GRU) model. Each gate unit is optimized by discarding the depth-weighted reset gate in GRU cells and considering only current input. Furthermore, we use sigmoid rather than hyperbolic tangent activation in standard GRUs due to performance loss associated with the former in deeper networks. Experimental results demonstrate that our pose-based optimized GRU (Pose-OGRU) outperforms the standard GRU model in terms of prediction accuracy, convergency, and information processing capability.

Enhanced 3D Residual Network for Human Fall Detection in Video Surveillance

  • Li, Suyuan;Song, Xin;Cao, Jing;Xu, Siyang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • v.16 no.12
    • /
    • pp.3991-4007
    • /
    • 2022
  • In the public healthcare, a computational system that can automatically and efficiently detect and classify falls from a video sequence has significant potential. With the advancement of deep learning, which can extract temporal and spatial information, has become more widespread. However, traditional 3D CNNs that usually adopt shallow networks cannot obtain higher recognition accuracy than deeper networks. Additionally, some experiences of neural network show that the problem of gradient explosions occurs with increasing the network layers. As a result, an enhanced three-dimensional ResNet-based method for fall detection (3D-ERes-FD) is proposed to directly extract spatio-temporal features to address these issues. In our method, a 50-layer 3D residual network is used to deepen the network for improving fall recognition accuracy. Furthermore, enhanced residual units with four convolutional layers are developed to efficiently reduce the number of parameters and increase the depth of the network. According to the experimental results, the proposed method outperformed several state-of-the-art methods.

Design of Service Delivery System for Stress Relief using Deep Learning Analysis Model (딥러닝 분석 모델 기반 스트레스 완화를 위한 서비스 제공 시스템 설계)

  • Kim, HyunJeong;Yoo, Seoyeon;Im, HyoGyeong;Kim, Kang-Gyoo;Yun, NaRi;Ha, Ok-Kyoon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2021.07a
    • /
    • pp.535-536
    • /
    • 2021
  • 현대의 스트레스 케어는 대부분 비디오 시청, 상담, 취미 활동 등을 통해 진행된다. 시각, 청각을 스트레스 케어에 활용한 사례는 이미 일상에서 쉽게 접할 수 있음으로 다른 새로운 감각을 요구하고 있다. 본 논문에서는 스트레스 케어를 목적으로, 생체정보를 대상으로 딥러닝 기술 기반의 '사용자 스트레스 및 효과적인 스트레스 해소 요소 판단 알고리즘 모델'을 사용하는 서비스 제공 시스템을 설계한다. 생체정보는 손목시계형 웨어러블을 통해 수집된 심박수, 혈압, 체온, 산소포화도, ECG 등 생체데이터를 사용한다. 제시하는 방법은 실시간으로 수집된 생체정보를 알고리즘, 모델을 통해 스트레스 수치를 예측하여 사용자에게 적절한 음악과 조명을 이용한 시청각적 요소와 아로마 요법을 이용한 후각적 요소를 제공한다.

  • PDF

Development of vehicle traffic statistics system using deep learning (딥러닝 영상인식을 이용한 출입 차량 통계 시스템 개발)

  • Mun, Dong-Ho;Hwang, Seung-Hyuk;Jeon, Han-Gyeol;Hwang, Su-Min;Yun, Tae-Jin
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2020.07a
    • /
    • pp.701-702
    • /
    • 2020
  • 본 논문에서는 Jetson-Nano와 데스크탑에서 OpenCV와 YOLOv3 실시간 객체 인식 알고리즘을 이용하여 웹캠을 통해 주차장 등의 출입 차량 인식 통계 시스템을 개발하였다. 최근 에지컴퓨팅에 관심이 증가하고 있는 시점에서 Nvidia사에서 개발하여 보급하고 있는 Jetson-Nano에 YOLOv3 tiny와 OpenCV를 이용하여 차량인식을 수행하고, 구글에서 개발한 오픈 소스 Tesseract-OCR을 이용해 차량번호인식하여 입출차 혹은 주차시 차량정보를 확인할 수 있다. 딥러닝 학습 알고리즘에서 전기차 번호판의 특징점을 인식하여 전기차를 판별하여 일반차량이 전기차 주차구역에 불법주차하는 것을 모니터링할 수도 있다. 출입한 차량 데이터 베이스에서 입출차 시각, 차량번호, 전기차여부등이 확인 가능하다.

  • PDF

Reproduction of Long-term Memory in hydroclimatological variables using Deep Learning Model

  • Lee, Taesam;Tran, Trang Thi Kieu
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2020.06a
    • /
    • pp.101-101
    • /
    • 2020
  • Traditional stochastic simulation of hydroclimatological variables often underestimates the variability and correlation structure of larger timescale due to the difficulty in preserving long-term memory. However, the Long Short-Term Memory (LSTM) model illustrates a remarkable long-term memory from the recursive hidden and cell states. The current study, therefore, employed the LSTM model in stochastic generation of hydrologic and climate variables to examine how much the LSTM model can preserve the long-term memory and overcome the drawbacks of conventional time series models such as autoregressive (AR). A trigonometric function and the Rössler system as well as real case studies for hydrological and climatological variables were tested. Results presented that the LSTM model reproduced the variability and correlation structure of the larger timescale as well as the key statistics of the original time domain better than the AR and other traditional models. The hidden and cell states of the LSTM containing the long-memory and oscillation structure following the observations allows better performance compared to the other tested conventional models. This good representation of the long-term variability can be important in water manager since future water resources planning and management is highly related with this long-term variability.

  • PDF

Analysis of the Effect of Deep-learning Super-resolution for Fragments Detection Performance Enhancement (파편 탐지 성능 향상을 위한 딥러닝 초해상도화 효과 분석)

  • Yuseok Lee
    • Journal of the Korea Institute of Military Science and Technology
    • /
    • v.26 no.3
    • /
    • pp.234-245
    • /
    • 2023
  • The Arena Fragmentation Test(AFT) is designed to analyze warhead performance by measuring fragmentation data. In order to evaluate the results of the AFT, a set of AFT images are captured by high-speed cameras. To detect objects in the AFT image set, ResNet-50 based Faster R-CNN is used as a detection model. However, because of the low resolution of the AFT image set, a detection model has shown low performance. To enhance the performance of the detection model, Super-resolution(SR) methods are used to increase the AFT image set resolution. To this end, The Bicubic method and three SR models: ZSSR, EDSR, and SwinIR are used. The use of SR images results in an increase in the performance of the detection model. While the increase in the number of pixels representing a fragment flame in the AFT images improves the Recall performance of the detection model, the number of pixels representing noise also increases, leading to a slight decreases in Precision performance. Consequently, the F1 score is increased by up to 9 %, demonstrating the effectiveness of SR in enhancing the performance of the detection model.

System for Detection not Wearing Helmet using Deep Learning Video Recognition (딥러닝 영상인식을 이용한 헬멧 미착용 검출 시스템)

  • Ham, Kyoung-Youn;Lee, Jung-Woo;Lee, Jang-Hyeon;Kang, Gil-Nam;Jo, Young-Jun;Park, Dong-Hoon;Ryoo, Myung-chun
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.01a
    • /
    • pp.277-278
    • /
    • 2022
  • 최근 전동킥보드 보급이 이루어지면서 이와 관련된 교통사고가 증가하고 있다. 이에 따라 전동킥보드 주행 시 헬멧 착용을 의무화하는 도로교통법 개정안이 시행되고 있지만, 물리적으로 대부분 현장에서 단속이 어렵다. 본 논문에서는 딥러닝 영상인식 기술을 활용한 객체검출(object detection) 모델인 YOLOv4를 기반으로 전동킥보드 사용자의 헬멧 미착용 검출시스템을 제안하였다. 이를 통해 전동킥보드 주행 시 헬멧 착용 여부를 효율적으로 단속하는데 활용 할 수 있을 것으로 기대한다.

  • PDF

Implementation of Deep Learning-Based Vehicle Model and License Plate Recognition System (딥러닝 기반 자동차 모델 및 번호판 인식 시스템 구현)

  • Ham, Kyoung-Youn;Kang, Gil-Nam;Lee, Jang-Hyeon;Lee, Jung-Woo;Park, Dong-Hoon;Ryoo, Myung-Chun
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.07a
    • /
    • pp.465-466
    • /
    • 2022
  • 본 논문에서는 딥러닝 영상인식 기술을 활용한 객체검출 모델인 YOLOv4를 활용하여 차량의 모델과 번호판인식 시스템을 제안한다. 본 논문에서 제안하는 시스템은 실시간 영상처리기술인 YOLOv4를 사용하여 차량모델 인식과 번호판 영역 검출을 하고, CNN(Convolutional Neural Network)알고리즘을 이용하여 번호판의 글자와 숫자를 인식한다. 이러한 방법을 이용한다면 카메라 1대로 차량의 모델 인식과 번호판 인식이 가능하다. 차량모델 인식과 번호판 영역 검출에는 실제 데이터를 사용하였으며, 차량 번호판 문자 인식의 경우 실제 데이터와 가상 데이터를 사용하였다. 차량 모델 인식 정확도는 92.3%, 번호판 검출 98.9%, 번호판 문자 인식 94.2%를 기록하였다.

  • PDF

Expressway Falling Object recognition system using Deep Learning (딥러닝을 이용한 고속도로 낙하물 객체 인식 시스템)

  • Sang-min Choi;Min-gyun Kim;Seung-yeop Lee;Seong-Kyoo Kim;Jae-wook Shin;Woo-jin Kim;Seong-oh Choo;Yang-woo Park
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2023.07a
    • /
    • pp.451-452
    • /
    • 2023
  • 고속도로에 낙하물이 있으면 사고 방지를 위해 바로 치워야 하지만 순찰차가 발견하거나 신고가 들어오기 전까진 낙하물을 바로 발견하기 힘들며, 대다수의 사람들은 신고하지 않고 지나치는 경우가 있기에 이러한 문제점들을 개선하기 위해 드론과 YOLO를 이용하여 도로의 낙하물을 인식하고 낙하물에 대한 정보를 보내 줄 수 있는 시스템을 개발하였다. 실시간 객체 인식 알고리즘인 YOLOv5를 데스크톱 PC에 적용하여 구현하였고, F450 프레임에 픽스호크와 모듈, 카메라를 장착하여 실시간으로 도로를 촬영할 수 있는 드론을 직접 제작하였다. 개발한 시스템은 낙하물에 대한 인식 결과와 정보를 제공하며 지상관제 시스템과 웹을 통해 확인할 수 있다. 적은 인력으로 더 빠르게 낙하물을 발견할 수 있으므로 빠른 상황 조치를 기대할 수 있다.

  • PDF

Design of a Zone-based Population Estimation System using Deep Learning Image Recognition for Digital Twin (딥러닝 영상인식을 이용한 디지털 트윈 기반 구역별 유동 인구 추정 시스템 설계)

  • Ok-Kyoon Ha;Jin-chan Kim;Yong-jin Kim;Yong-hun Ok;Dong-hun Na;Uk-ryeol Lee
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2023.07a
    • /
    • pp.41-42
    • /
    • 2023
  • 인구 밀집도가 높은 곳에서의 안전사고 대응과 이에 대한 예방을 위한 기술 및 해결 방안의 필요성이 증가하고 있다. 이를 위한 기존의 기술들은 지능형 CCTV 기반의 경고 알림을 울리는 방식과 스마트폰의 신호를 수집하여 유동인구를 측정하는 기술 등이 사용되고 있다. 그러나 군중 밀집 사고의 원인인 병목현상과 군중 난류 현상까지 대응하지는 못하는 문제점이 있다. 본 논문에서는 CCTV로부터 수집된 영상 정보만으로 딥러닝 영상인식 기술을 이용하여 병목현상이 일어나기 쉬운 출입구의 유·출입 인구 카운팅과 광장의 밀집도 분석을 디지털 트윈 기반으로 실시하고 이를 통해 위험 상황 발생 시 출입구의 통제와 대피를 위한 안내가 가능한 시스템을 제시한다. 제시하는 시스템은 유동 인구가 많고 인구의 급격한 밀집으로 인해 발생할 수 있는 안전사고의 예방과 이를 해결하기 위한 통제 및 안내를 위한 대처 방법으로 활용할 수 있다.

  • PDF