• 제목/요약/키워드: Deep Learning based System

검색결과 1,198건 처리시간 0.032초

뇌파 기반 감정 분류를 활용한 작업자 보호를 위한 웹 플랫폼 시스템 개발 (Development of a Web Platform System for Worker Protection using EEG Emotion Classification)

  • 서쌍희
    • 사물인터넷융복합논문지
    • /
    • 제9권6호
    • /
    • pp.37-44
    • /
    • 2023
  • 인터스트리4.0의 주요 기술인 인간-로봇 협업은 작업자의 안전을 보장하기 위한 추가적인 조치들이 필요하다. 협동로봇과 작업자간 충돌을 회피하는 기존 방식은 주로 로봇에 부착된 센서와 카메라를 기반으로 총돌을 탐지한다. 이러한 방식은 로봇, 사람 물체를 지속적으로 추적하고 충돌회피를 위한 복잡한 알고리즘이 필요하며, 작업 환경 변화에 빠르게 대응하지 못하는 단점이 있다. 본 논문은 인간과 로봇이 협업하는 과정에서 작업자가 위험을 느낄 때의 감정을 인식하여 협동로봇과의 충돌을 방지할 수 있는 웹 기반 플랫폼을 개발하였다. 이를 위해 웨어러블 뇌파장치를 이용하여 감정 관련 뇌파를 수집하고 저장하는 웹 기반 애플리케이션을 개발하였으며, 중립/긍정/부정 감정의 특징을 추출하고 분류하는 딥러닝 모델을 제안하였다. 또한 분류된 감정에 따라 모터동작을 제어하는 사물인터넷 인터페이스 프로그램을 개발하였다. 구현된 시스템의 성능분석을 위해 공개 데이터세트와 실제 수집된 데이터 세트를 사용하여 제안한 딥러닝 모델의 성능을 분석하였다. 공개 데이터 세트의 경우 정확도는 96.8%이며, 실제 수집 데이터세트의 경우 정확도는 70.7%이다.

An Adaptation Method in Noise Mismatch Conditions for DNN-based Speech Enhancement

  • Xu, Si-Ying;Niu, Tong;Qu, Dan;Long, Xing-Yan
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권10호
    • /
    • pp.4930-4951
    • /
    • 2018
  • The deep learning based speech enhancement has shown considerable success. However, it still suffers performance degradation under mismatch conditions. In this paper, an adaptation method is proposed to improve the performance under noise mismatch conditions. Firstly, we advise a noise aware training by supplying identity vectors (i-vectors) as parallel input features to adapt deep neural network (DNN) acoustic models with the target noise. Secondly, given a small amount of adaptation data, the noise-dependent DNN is obtained by using $L_2$ regularization from a noise-independent DNN, and forcing the estimated masks to be close to the unadapted condition. Finally, experiments were carried out on different noise and SNR conditions, and the proposed method has achieved significantly 0.1%-9.6% benefits of STOI, and provided consistent improvement in PESQ and segSNR against the baseline systems.

ADD-Net: Attention Based 3D Dense Network for Action Recognition

  • Man, Qiaoyue;Cho, Young Im
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권6호
    • /
    • pp.21-28
    • /
    • 2019
  • Recent years with the development of artificial intelligence and the success of the deep model, they have been deployed in all fields of computer vision. Action recognition, as an important branch of human perception and computer vision system research, has attracted more and more attention. Action recognition is a challenging task due to the special complexity of human movement, the same movement may exist between multiple individuals. The human action exists as a continuous image frame in the video, so action recognition requires more computational power than processing static images. And the simple use of the CNN network cannot achieve the desired results. Recently, the attention model has achieved good results in computer vision and natural language processing. In particular, for video action classification, after adding the attention model, it is more effective to focus on motion features and improve performance. It intuitively explains which part the model attends to when making a particular decision, which is very helpful in real applications. In this paper, we proposed a 3D dense convolutional network based on attention mechanism(ADD-Net), recognition of human motion behavior in the video.

임베디드 시스템에서의 객체 분류를 위한 TVM기반의 성능 최적화 연구 (TVM-based Performance Optimization for Image Classification in Embedded Systems)

  • 허청환;예민해;신익희;이대우
    • 대한임베디드공학회논문지
    • /
    • 제18권3호
    • /
    • pp.101-108
    • /
    • 2023
  • Optimizing the performance of deep neural networks on embedded systems is a challenging task that requires efficient compilers and runtime systems. We propose a TVM-based approach that consists of three steps: quantization, auto-scheduling, and ahead-of-time compilation. Our approach reduces the computational complexity of models without significant loss of accuracy, and generates optimized code for various hardware platforms. We evaluate our approach on three representative CNNs using ImageNet Dataset on the NVIDIA Jetson AGX Xavier board and show that it outperforms baseline methods in terms of processing speed.

YOLOv8을 이용한 실시간 화재 검출 방법 (Real-Time Fire Detection Method Using YOLOv8)

  • 이태희;박천수
    • 반도체디스플레이기술학회지
    • /
    • 제22권2호
    • /
    • pp.77-80
    • /
    • 2023
  • Since fires in uncontrolled environments pose serious risks to society and individuals, many researchers have been investigating technologies for early detection of fires that occur in everyday life. Recently, with the development of deep learning vision technology, research on fire detection models using neural network backbones such as Transformer and Convolution Natural Network has been actively conducted. Vision-based fire detection systems can solve many problems with physical sensor-based fire detection systems. This paper proposes a fire detection method using the latest YOLOv8, which improves the existing fire detection method. The proposed method develops a system that detects sparks and smoke from input images by training the Yolov8 model using a universal fire detection dataset. We also demonstrate the superiority of the proposed method through experiments by comparing it with existing methods.

  • PDF

Variational autoencoder for prosody-based speaker recognition

  • Starlet Ben Alex;Leena Mary
    • ETRI Journal
    • /
    • 제45권4호
    • /
    • pp.678-689
    • /
    • 2023
  • This paper describes a novel end-to-end deep generative model-based speaker recognition system using prosodic features. The usefulness of variational autoencoders (VAE) in learning the speaker-specific prosody representations for the speaker recognition task is examined herein for the first time. The speech signal is first automatically segmented into syllable-like units using vowel onset points (VOP) and energy valleys. Prosodic features, such as the dynamics of duration, energy, and fundamental frequency (F0), are then extracted at the syllable level and used to train/adapt a speaker-dependent VAE from a universal VAE. The initial comparative studies on VAEs and traditional autoencoders (AE) suggest that the former can efficiently learn speaker representations. Investigations on the impact of gender information in speaker recognition also point out that gender-dependent impostor banks lead to higher accuracies. Finally, the evaluation on the NIST SRE 2010 dataset demonstrates the usefulness of the proposed approach for speaker recognition.

위성 영상을 위한 경량화된 CNN 기반의 보간 기술 연구 (A Study on Lightweight CNN-based Interpolation Method for Satellite Images)

  • 김현호;서두천;정재헌;김용우
    • 대한원격탐사학회지
    • /
    • 제38권2호
    • /
    • pp.167-177
    • /
    • 2022
  • 위성 영상 촬영 후 지상국에 전송된 영상을 이용하여 최종 위성 영상을 획득하기 위해 많은 영상 전/후 처리 과정이 수반된다. 전/후처리 과정 중 레벨 1R 영상에서 레벨 1G 영상으로 변환 시 기하 보정은 필수적으로 요구된다. 기하 보정 알고리즘에서는 보간 기법을 필연적으로 사용하게 되며, 보간 기법의 정확도에 따라서 레벨 1G 영상의 품질이 결정된다. 또한, 레벨 프로세서에서 수행되는 보간 알고리즘의 고속화 역시 매우 중요하다. 본 논문에서는 레벨 1R에서 레벨 1G로 변환 시 기하 보정에 필요한 경량화된 심층 컨볼루션 신경망 기반 보간 기법에 대해 제안하였다. 제안한 기법은 위성 영상의 해상도를 2배 향상하며, 빠른 처리 속도를 위해 경량화된 심층 컨볼루션 신경망으로 딥러닝 네트워크를 구성하였다. 또한, panchromatic (PAN) 밴드 정보를 활용하여 multispectral (MS) 밴드의 영상 품질 개선이 가능한 피처 맵 융합 방법을 제안하였다. 제안된 보간 기술을 통해 획득한 영상은 기존의 딥러닝 기반 보간 기법에 비해 정량적인 peak signal-to-noise ratio (PSNR) 지표에서 PAN 영상은 약 0.4 dB, MS 영상은 약 4.9 dB 개선된 결과를 보여주었으며, PAN 영상 크기 기준 36,500×36,500 입력 영상의 해상도를 2배 향상된 영상 획득 시 기존 딥러닝 기반 보간 기법 대비 처리 속도가 약 1.6배 향상됨을 확인하였다.

친환경차 확산전략에 대한 시스템다이내믹스 접근과 인과지도 분석 (System Dynamics Approaches on Green Car Diffusion Strategies and the Causal Diagram Analysis)

  • 박경배
    • 한국시스템다이내믹스연구
    • /
    • 제13권4호
    • /
    • pp.33-55
    • /
    • 2012
  • The research is to identify important diffusion factors and their effects on green car diffusion process using system dynamics perspectives and a causal-loop analysis. Through a deep review on previous research, we have found the important factors of green car diffusion process. Price, driving range, network effect, recharge system, fuel cost had important facilitation on consumer attraction and green car diffusion. Based on the review, we have constructed a causal loop diagram explaining hybrid car diffusion process. We have found 3 important reinforcing loops in the causal loop diagram. Loop for learning & economies of scale(supply side), loop for network effect(consumer side), and loop for battery development(technology side) had most significant roles in the whole diffusion process. Through a deliberate analysis on the 3 causal loops, we have found meaningful results. First, there seems to exist a critical mass in the diffusion. Second, of the 3 loops, the battery technology had most significant role. Third, not consumer installed base but sales must be a standard to decide whether the critical mass is achieved or not. Based on these findings, several meaningful implications are suggested for the government and corporations related to the green car industries.

  • PDF

해상 객체 검출 고속 처리를 위한 영상 전처리 알고리즘 설계와 딥러닝 기반의 통합 시스템 (Design of Video Pre-processing Algorithm for High-speed Processing of Maritime Object Detection System and Deep Learning based Integrated System)

  • 송현학;이효찬;이성주;전호석;임태호
    • 인터넷정보학회논문지
    • /
    • 제21권4호
    • /
    • pp.117-126
    • /
    • 2020
  • 해상 객체 인식은 자율운항선박(MASS)의 지능형 보조 시스템으로써, 선장이 육안으로 해상 주변의 충돌 위험성이 있는 부유물을 확인하던 정보를 컴퓨터를 통해 자동으로 인식하여 사람이 확인하는 방법과 유사한 정확도로 인지하는 방법을 말한다. 선박 주변의 물체를 인식하는 방법으로 기존에는 레이더나 소나와 같은 장치로부터 수집된 정보를 통해 확인하였지만, 인공지능의 기술이 발달하면서 선박 지능형 CCTV를 통해 운항 항로에 있는 다양한 부유물을 인식하는 것이 가능하다. 하지만, 자율 선박의 다양한 요구사항과 복잡성 때문에 영상 데이터의 처리속도가 느려지게 된다면 원활한 서비스 지원은 물론 안전성도 보장할 수 없게 된다. 이러한 문제를 해결하고자 본 논문에서는 해상 객체를 검출하는 데 있어 영상 데이터의 연산량을 최소화하여 처리속도를 높이기 위한 연구를 진행하였다. 해상 객체 인식의 관심 영역을 확보하기 위해서는 일반적으로 수평선을 찾는데 기존 연구들은 허프 변환 알고리즘을 활용하지만 본 논문에서는 속도를 개선하기 위해 이진화 알고리즘을 최적화하여 실제 객체의 위치와 유사한 영역을 찾는 새로운 방법을 제안한다. 또한, 제안하는 방법의 유용성을 증명하기 위해 딥러닝 CNN을 활용하여 해상 객체 인식 시스템을 구현함으로써 알고리즘의 성능을 평가하였다. 제안하는 알고리즘은 기존 방법의 인식 정확도를 유지하면서 약 4배 이상의 빠른 성능을 얻을 수 있었다.

최적화된 Gradient-Boost를 사용한 서울 자전거 데이터의 결정 요인 예측 (Predicting Determinants of Seoul-Bike Data Using Optimized Gradient-Boost)

  • 김차영;김윤
    • 문화기술의 융합
    • /
    • 제8권6호
    • /
    • pp.861-866
    • /
    • 2022
  • 서울시에서는 공유 자전거 시스템, "따릉이"를 2015년부터 도입, 운영하여, 교통량 감축과 대기오염 해소를 위해 노력하고 있다. 하지만 공유 자전거 시스템, "따릉이"의 운영전략 미훕으로 인해 많은 문제가 발생하고 있어 이를 해결하고자 다양한 연구들이 제시되고 있다. 이들 연구의 대다수는 수요와 공급의 불균형을 해결하고자 하는 전략적 "자전거 배치"에 집중되어 있으며 또한 이들 중 다수가 날씨나 계절과 같은 특징을 그룹화함으로써 수요를 예측하고 있다. 그리고 이전에는 이들 예측방법이 주로 시계열 분석을 기반으로 하고 있었으나 최근에는 딥러닝/머신러닝으로 수요를 예측하는 연구들이 속속 등장하고 있다. 본 논문에서는 기존에 제시된 다양한 특징들을 기반으로 하면서, 새로운 특징을 발견하고 선택된 특징들의 중요도를 비교, 이를 순서화함으로써, 보다 정확한 수요 예측이 가능함을 보인다. 그리하여, 우리는 기존의 딥러닝/머신러닝 및 시계열 분석을 그대로 사용하면서 비교적 정확한 결정계수를 획득하고 이를 이용해 개선된 수요예측이 가능하도록 한다.