• 제목/요약/키워드: 1D CNN

검색결과 125건 처리시간 0.022초

행동 인식을 위한 시공간 앙상블 기법 (Spatial-temporal Ensemble Method for Action Recognition)

  • 서민석;이상우;최동걸
    • 로봇학회논문지
    • /
    • 제15권4호
    • /
    • pp.385-391
    • /
    • 2020
  • As deep learning technology has been developed and applied to various fields, it is gradually changing from an existing single image based application to a video based application having a time base in order to recognize human behavior. However, unlike 2D CNN in a single image, 3D CNN in a video has a very high amount of computation and parameter increase due to the addition of a time axis, so improving accuracy in action recognition technology is more difficult than in a single image. To solve this problem, we investigate and analyze various techniques to improve performance in 3D CNN-based image recognition without additional training time and parameter increase. We propose a time base ensemble using the time axis that exists only in the videos and an ensemble in the input frame. We have achieved an accuracy improvement of up to 7.1% compared to the existing performance with a combination of techniques. It also revealed the trade-off relationship between computational and accuracy.

웨어러블 디바이스를 이용한 1D-CNN-LSTM 기반 반려동물 행동 분류 (1D-CNN-LSTM based Pet behavior classification using Wearable device)

  • 김형주;문남미
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.921-923
    • /
    • 2021
  • 최근 반려동물 시장이 커짐으로 인해, 반려동물들의 헬스케어를 위한 제품들이 증가하고 있다. 이에 따라 펫 웨어러블 디바이스를 통한 연구가 활발히 진행되고 있지만, 웨어러블 디바이스를 통해 수집되는 센싱 데이터는 변칙적인 반려동물의 특징 때문에 연구의 한계를 갖는다. 이를 위해 본 논문에서는 1-Dimensional CNN과 LSTM 하이브리드 모델을 기반으로 한 반려동물 행동 분류를 제안한다. 웨어러블 디바이스를 이용해 자이로와 가속도 센서를 수집하여 걸음수를 측정하고, 이후 수집된 센싱 데이터로 반려동물의 행동을 4가지로 분류한다. 행동 분류는 걷기, 뛰기, 앉기, 서기로 분류한다.

Skeleton Keypoints를 활용한 CNN3D 기반의 버스 승객 승하차 예측모델 (CNN3D-Based Bus Passenger Prediction Model Using Skeleton Keypoints)

  • 장진;김수형
    • 스마트미디어저널
    • /
    • 제11권3호
    • /
    • pp.90-101
    • /
    • 2022
  • 버스는 대중적으로 많이 이용되는 교통수단이다. 그만큼 승객의 안전관리를 위해 철저한 대비가 필요하다. 하지만 2018년 승차하기 위해 접근하는 노인을 인지하지 못하고 버스가 출발하면서 사망사고가 발생하는 등 안전 시스템이 미흡한 상황이다. 기존에 뒷문 계단 쪽 센서를 통해 끼임 사고를 방지하는 안전 시스템은 있지만, 이러한 시스템은 위 사고처럼 승하차하려는 과정에서 발생하는 사고를 예방하진 못한다. 버스 승객의 승하차 의도를 예측할 수 있다면, 위와 같은 사고를 예방하는 안전 시스템 개발에 도움이 될 것이다. 그러나 승객의 승하차 의도를 예측하는 연구는 부족한 상태이다. 따라서 본 논문에서는 버스에 부착된 카메라 영상에서 UDP-Pose를 통해 승객의 skeleton keypoints를 추출하고, 이를 활용한 1×1 CNN3D 기반의 버스 승객 승하차 의도를 예측하는 모델을 제안한다. 제안한 모델은 승객의 승하차 의도를 예측하는 부분에서 RNN, LSTM 모델보다 약 1~2% 높은 정확도를 보여준다.

영상기반 비접촉식 PPG 신호 취득을 위한 3D-CNN 설계 (Designing a 3D-CNN for Non-Contact PPG Signal Acquisition Based on Video Imaging)

  • 김태완;염찬욱;곽근창
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.627-629
    • /
    • 2023
  • 생체 신호를 분석하여 사용자의 건강과 정신 상태를 예측하고, 관련 질병에 관해 예방하는 연구가 늘어나고 있다. 생체 신호 중 심박은 사람의 육체, 정신적인 상태를 반영하는 대표적인 신호이지만 기존의 접촉 패드를 통한 ECG나 광학 센서를 통한 PPG로 심박을 예측할 때는 구속적인 환경이 필요하여 일상적인 상황 속에 적용하기 어려웠다. 이러한 단점을 해결하고자 본 논문은 UBFC-RPPG 데이터셋의 동영상 프레임을 RGB 채널마다 다른 가중치를 적용하는 전처리를 하여 학습 데이터의 크기를 줄이면서 정확도를 높이고, 3D-CNN을 활용한 딥러닝으로 순간적인 영상에서도 PPG 신호를 예측할 수 있도록 1초 전처리 영상을 학습한 후, 신호를 예측하는 것을 목표로 한다. 이렇게 비접촉식으로 취득된 신호는 더 다양한 환경에서의 감정분류, 우울증 진단, 질병 감지 등 다양한 분야에 활용될 수 있다.

An Implementation of Effective CNN Model for AD Detection

  • Vyshnavi Ramineni;Goo-Rak Kwon
    • 스마트미디어저널
    • /
    • 제13권6호
    • /
    • pp.90-97
    • /
    • 2024
  • This paper focuses on detecting Alzheimer's Disease (AD). The most usual form of dementia is Alzheimer's disease, which causes permanent cause memory cell damage. Alzheimer's disease, a neurodegenerative disease, increases slowly over time. For this matter, early detection of Alzheimer's disease is important. The purpose of this work is using Magnetic Resonance Imaging (MRI) to diagnose AD. A Convolution Neural Network (CNN) model, Reset, and VGG the pre-trained learning models are used. Performing analysis and validation of layers affects the effectiveness of the model. T1-weighted MRI images are taken for preprocessing from ADNI. The Dataset images are taken from the Alzheimer's Disease Neuroimaging Initiative (ADNI). 3D MRI scans into 2D image slices shows the optimization method in the training process while achieving 96% and 94% accuracy in VGG 16 and ResNet 18 respectively. This study aims to classify AD from brain 3D MRI images and obtain better results.

작물 분류에서 시공간 특징을 고려하기 위한 2D CNN과 양방향 LSTM의 결합 (Combining 2D CNN and Bidirectional LSTM to Consider Spatio-Temporal Features in Crop Classification)

  • 곽근호;박민규;박찬원;이경도;나상일;안호용;박노욱
    • 대한원격탐사학회지
    • /
    • 제35권5_1호
    • /
    • pp.681-692
    • /
    • 2019
  • 이 논문에서는 작물 분류를 목적으로 작물의 시공간 특징을 고려할 수 있는 딥러닝 모델 2D convolution with bidirectional long short-term memory(2DCBLSTM)을 제안하였다. 제안 모델은 우선 작물의 공간 특징을 추출하기 위해 2차원의 합성곱 연산자를 적용하고, 추출된 공간 특징을 시간 특징을 고려할 수 있는 양방향 LSTM 모델의 입력 자료로 이용한다. 제안 모델의 분류 성능을 평가하기 위해 안반덕에서 수집된 다중시기 무인기 영상을 이용한 밭작물 구분 사례 연구를 수행하였다. 비교를 목적으로 기존 딥러닝 모델인 2차원의 공간 특징을 이용하는 2D convolutional neural network(CNN), 시간 특징을 이용하는 LSTM과 3차원의 시공간 특징을 이용하는 3D CNN을 적용하였다. 하이퍼 파라미터의 영향 분석을 통해, 시공간 특징을 이용함으로써 작물의 오분류 양상을 현저히 줄일 수 있었으며, 제안 모델이 공간 특징이나 시간 특징만을 고려하는 기존 딥러닝 모델에 비해 가장 우수한 분류 정확도를 나타냈다. 따라서 이 연구에서 제안된 모델은 작물의 시공간 특징을 고려할 수 있기 때문에 작물 분류에 효과적으로 적용될 수 있을 것으로 기대된다.

OFDM 레이다를 위한 딥러닝 기반 표적의 거리 및 속도 추정 기법 (Deep learning-based target distance and velocity estimation technique for OFDM radars)

  • 최재웅;정의림
    • 한국정보통신학회논문지
    • /
    • 제26권1호
    • /
    • pp.104-113
    • /
    • 2022
  • 본 논문에서는 OFDM 레이다를 위한 딥러닝 기반 표적의 거리 및 속도 추정 기법을 제안한다. 제안하는 기법은 표적으로부터 반사된 수신 신호를 받아 변조신호 제거 후 2차원 FFT를 통해 2차원 주기도를 얻는다. 주기도는 기존 및 제안 방법에서 표적의 거리 및 속도를 추정하는 입력신호이다. 주기도에서 정점은 표적의 위치를 나타내는데 표적의 거리 및 속도 추정을 위해 널리 사용되는 기존 기법은 CFAR (Constant False Alarm Rate) 알고리즘이다. 반면 제안하는 기법은 다중 출력 CNN (Convolutional Neural Network)을 이용하여 거리 및 속도를 추정한다. 기존 기법과 달리 제안 기법은 주기도 이외에 잡음 전력과 같이 추가적인 정보가 필요하지 않아 사용하기 편리하다. 컴퓨터 시뮬레이션 결과에 따르면 제안 추정 기법은 기존 기법보다 거리 및 속도 추정 MSE (Mean Square Error)오차 성능을 5배 이상 개선하며 송신 OFDM 심볼 개수가 증가할수록 정확도가 향상되는 특성을 보인다.

미세먼지 위험 단계 예측을 위한 1-D CRNN 모델 설계 (Design of a 1-D CRNN Model for Prediction of Fine Dust Risk Level)

  • 이기혁;황우성;최명렬
    • 디지털융복합연구
    • /
    • 제19권2호
    • /
    • pp.215-220
    • /
    • 2021
  • 최근 국내 미세먼지 발생의 증가에 따라 발생하는 인체에 유해한 영향을 줄이기 위하여, 미세먼지 수치를 예측하고 사전 조치를 취할 수 있도록 돕는 기술이 필요해지고 있다. 본 논문에서는 국내 미세먼지 위험 수준을 예측하기 위한 1D Convolutional to Recurrent Neural Network (1-D CRNN) 모델을 제안한다. 제안 된 모델은 딥러닝 신경망의 CNN과 RNN을 결합한 구조이며, 다른 종류의 데이터로 구성된 시계열 데이터 세트에서 데이터 예측을 수행 할 수 있다. 데이터 예측을 위해 국내·외 미세먼지, 풍향, 풍속 데이터를 사용한다. 제안된 모델은 약 76%(부분 최대 84%)의 정확도를 달성했으며, 일반 RNN 모델(53%)보다 정확한 예측 결과를 얻었을 수 있었다. 제안된 모델은 향후 여러 개의 시계열 데이터 세트를 고려해야 하는 데이터 예측 모델 학습 및 실험을 목표로 한다.

UWB 시스템에서 합성곱 신경망을 이용한 거리 추정 (Distance Estimation Using Convolutional Neural Network in UWB Systems)

  • 남경모;정태윤;정성훈;정의림
    • 한국정보통신학회논문지
    • /
    • 제23권10호
    • /
    • pp.1290-1297
    • /
    • 2019
  • 본 논문에서는 ultra-wideband(UWB) 시스템에서 합성곱 신경망(CNN)을 이용한 거리 추정 기법을 제안한다. 제안하는 기법은 UWB 신호를 이용하여 송신기와 수신기 사이의 거리를 추정하기 위하여 수신신호의 크기 샘플로 이루어진 1차원 벡터를 2차원 행렬로 재구성하며, 이 2차원 행렬로부터 합성곱 신경망 회귀를 이용하여 거리를 추정한다. IEEE 802.15.4a 표준의 UWB 실내 가시선 채널모델을 이용하여 수신신호를 생성하여 학습데이터를 만들며 합성곱 신경망 모델을 학습시킨다. 또한 실제 필드 시험을 통해 실내환경에서의 실험 데이터를 이용하여 거리추정 성능을 확인한다. 제안하는 기법은 기존의 문턱값 기반의 거리 추정 기법과의 성능비교도 수행하는데, 결과에 따르면 10m 거리에서 제안기법은 0.6m의 제곱근 평균 자승 에러를 보이는데 기존기법은 1.6m로 훨씬 큰 에러를 보인다.

3차원 삼각형 메쉬를 정확하고 효율적으로 학습하기 위한 CNN 아키텍처 (CNN Architecture for Accurately and Efficiently Learning a 3D Triangular Mesh)

  • 나홍은;김종현
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제67차 동계학술대회논문집 31권1호
    • /
    • pp.369-372
    • /
    • 2023
  • 본 논문에서는 삼각형 구조로 구성된 3차원 메쉬(Mesh)에서 합성곱 신경망(Convolution Neural Network, CNN)을 응용하여 정확도가 높은 새로운 학습 표현 기법을 제시한다. 우리는 메쉬를 구성하고 있는 폴리곤의 edge와 face의 로컬 특징을 기반으로 학습을 진행한다. 일반적으로 딥러닝은 인공신경망을 수많은 계층 형태로 연결한 기법을 말하며, 주요 처리 대상은 1, 2차원 데이터 형태인 오디오 파일과 이미지였다. 인공지능에 대한 연구가 지속되면서 3차원 딥러닝이 도입되었지만, 기존의 학습과는 달리 3차원 딥러닝은 데이터의 확보가 쉽지 않다. 혼합현실과 메타버스 시장의 확대로 인해 3차원 모델링 시장이 증가하고, 기술의 발전으로 데이터를 획득할 수 있는 방법이 생겼지만, 3차원 데이터를 직접적으로 학습에 이용하는 방식으로 적용하는 것은 쉽지 않다. 그렇게 때문에 본 논문에서는 산업 현장에서 이용되는 데이터인 메쉬 구조를 폴리곤의 최소 단위인 삼각형 형태로 구성하여 학습 데이터를 구성해 기존의 방법보다 정확도가 높은 학습 기법을 제안한다.

  • PDF