• Title/Summary/Keyword: 컨볼루션 신경망

검색결과 162건 처리시간 0.027초

RGB-D 정보를 이용한 2차원 키포인트 탐지 기반 3차원 인간 자세 추정 방법 (A Method for 3D Human Pose Estimation based on 2D Keypoint Detection using RGB-D information)

  • 박서희;지명근;전준철
    • 인터넷정보학회논문지
    • /
    • 제19권6호
    • /
    • pp.41-51
    • /
    • 2018
  • 최근 영상 감시 분야에서는 지능형 영상 감시 시스템에 딥 러닝 기반 학습 방법이 적용되어 범죄, 화재, 이상 현상과 같은 다양한 이벤트들을 강건하게 탐지 할 수 있게 되었다. 그러나 3차원 실세계를 2차원 영상으로 투영시키면서 발생하는 3차원 정보의 손실로 인하여 폐색 문제가 발생하기 때문에 올바르게 객체를 탐지하고, 자세를 추정하기 위해서는 폐색 문제를 고려하는 것이 필요하다. 따라서 본 연구에서는 기존 RGB 정보에 깊이 정보를 추가하여 객체 탐지 과정에서 나타나는 폐색 문제를 해결하여 움직이는 객체를 탐지하고, 탐지된 영역에서 컨볼루션 신경망을 이용하여 인간의 관절 부위인 14개의 키포인트의 위치를 예측한다. 그 다음 자세 추정 과정에서 발생하는 자가 폐색 문제를 해결하기 위하여 2차원 키포인트 예측 결과와 심층 신경망을 이용하여 자세 추정의 범위를 3차원 공간상으로 확장함으로써 3차원 인간 자세 추정 방법을 설명한다. 향후, 본 연구의 2차원 및 3차원 자세 추정 결과는 인간 행위 인식을 위한 용이한 데이터로 사용되어 산업 기술 발달에 기여 할 수 있다.

스켈레톤 조인트 매핑을 이용한 딥 러닝 기반 행동 인식 (Deep Learning-based Action Recognition using Skeleton Joints Mapping)

  • 타스님;백중환
    • 한국항행학회논문지
    • /
    • 제24권2호
    • /
    • pp.155-162
    • /
    • 2020
  • 최근 컴퓨터 비전과 딥러닝 기술의 발전으로 비디오 분석, 영상 감시, 인터렉티브 멀티미디어 및 인간 기계 상호작용 응용을 위해 인간 행동 인식에 관한 연구가 활발히 진행되고 있다. 많은 연구자에 의해 RGB 영상, 깊이 영상, 스켈레톤 및 관성 데이터를 사용하여 인간 행동 인식 및 분류를 위해 다양한 기술이 도입되었다. 그러나 스켈레톤 기반 행동 인식은 여전히 인간 기계 상호작용 분야에서 도전적인 연구 주제이다. 본 논문에서는 동적 이미지라 불리는 시공간 이미지를 생성하기 위해 동작의 종단간 스켈레톤 조인트 매핑 기법을 제안한다. 행동 클래스 간의 분류를 수행하기 위해 효율적인 심층 컨볼루션 신경망이 고안된다. 제안된 기법의 성능을 평가하기 위해 공개적으로 액세스 가능한 UTD-MHAD 스켈레톤 데이터 세트를 사용하였다. 실험 결과 제안된 시스템이 97.45 %의 높은 정확도로 기존 방법보다 성능이 우수함을 보였다.

딥 컨볼루션 신경망을 이용한 고용 소득 예측 (Predicting Employment Earning using Deep Convolutional Neural Networks)

  • 마렌드라;김나랑;최형림
    • 디지털융복합연구
    • /
    • 제16권6호
    • /
    • pp.151-161
    • /
    • 2018
  • 소득은 경제생활에서 중요하다. 소득을 예측할 수 있으면, 사람들은 음식, 집세와 같은 생활비를 지불 할 수 있는 예산을 세울 수 있을 뿐 아니라, 다른 재화 또는 비상사태를 위한 돈을 별도로 저축 할 수 있다. 또한 소득수준은 은행, 상점 및 서비스 회사에서 마케팅 목적 및 충성도가 높은 고객을 유치하는 데 활용 된다. 이는 소득이 다양한 고객 접점에서 사용되는 중요한 인구 통계 요소이기 때문이다. 따라서 기존 고객 및 잠재 고객에 대한 수입 예측이 필요하다. 이 연구에서는 소득을 예측하기 위해 SVM (Support Vector Machines), Gaussian, 의사 결정 트리, DCNN (Deep Convolutional Neural Networks)과 같은 기계 학습 기법을 사용하였다. 분석 결과 DCNN 방법이 본 연구에서 사용 된 다른 기계 학습 기법에 비해 최적의 결과(88%)를 제공하는 것으로 나타났다. 향후 PCA 같이 데이터 크기를 향상 시킨다면 더 좋은 연구 결과를 제시할 수 있을 것이다.

Deep Convolutional Neural Network를 이용한 주차장 차량 계수 시스템 (Parking Lot Vehicle Counting Using a Deep Convolutional Neural Network)

  • 림 쿠이 송;권장우
    • 한국ITS학회 논문지
    • /
    • 제17권5호
    • /
    • pp.173-187
    • /
    • 2018
  • 본 논문에서는 주차장 관리 시스템의 한 부분으로 차량 계수를 위한 감시 카메라 시스템의 컴퓨터 비전과 심층 학습 기반 기법을 제안하고자 한다. You Only Look Once 버전 2 (YOLOv2) 탐지기를 적용하고 YOLOv2 기반의 심층 컨볼루션 신경망(CNN)을 다른 아키텍처와 두 가지 모델로 구성하였다. 제안 된 아키텍처의 효과를 Udacity의 자체 운전 차량 데이터 세트를 사용하여 설명하였다. 학습 및 테스트 결과, 자동차, 트럭 및 보행자 탐지 시 원래 구조(YOLOv2)의 경우 47.89%의 mAP를 나타내는 것에 비하여, 제안하는 모델의 경우 64.30 %의 mAP를 달성하여 탐지 정확도가 향상되었음을 증명하였다.

Faster R-CNN 기반의 실시간 번호판 검출 (Real-Time License Plate Detection Based on Faster R-CNN)

  • 이동석;윤숙;이재환;박동선
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권11호
    • /
    • pp.511-520
    • /
    • 2016
  • 자동차 번호판 검출 자동화(ALPD: Automatic License Plate Detection) 시스템은 효율적인 교통 관제를 위한 핵심 기술이며, 통행료 지불 시스템, 주차장 및 교통 관리와 같은 많은 응용에 사용되어 업무의 효율을 높이고 있다. 최근까지의 ALPD에 관한 연구에서는 주로 영상처리를 위해 설계된 기존의 특징들을 추출하여 번호판 검출에 사용해왔다. 이러한 종래의 방법은 속도에 이점은 있으나, 다양한 환경 변화에 따른 성능 저하를 보였다. 본 논문에서는 전반적인 성능을 향상시키기 위하여 Faster R-CNN과 CNN으로 구성되는 두 단 구조를 활용하는 방법을 제안한다. 이를 통해 동작 속도를 향상시키고, 다양한 환경변화에 강인하도록 구성하였다. 첫 번째 단계에서는 Faster R-CNN을 적용하여 번호판 영역 후보영역들을 선별하며, 두 번째 단에서 CNN을 활용하여 후보영역들 중에서 False Positives를 제거함으로써 검출률을 향상시켰다. 이를 통해 ZFNet을 기반으로 하여 99.94%의 검출률을 달성하였다. 또한 평균 운용시간은 80ms/image로써 빠르고 강인한 실시간 번호판 검출 시스템을 구현할 수 있었다.

유도전동기의 고정자 고장 진단을 위한 CNN의 활성화 함수 선정 (A Activation Function Selection of CNN for Inductive Motor Static Fault Diagnosis)

  • 김경민;김용현;박근호;이범;이상로;고영진
    • 한국전자통신학회논문지
    • /
    • 제16권2호
    • /
    • pp.287-292
    • /
    • 2021
  • 본 논문에서는 유도전동기 고정자 고장 진단에 있어서 활성화 함수가 미치는 영향을 분석하여 효율적인 CNN 활용 방법을 제안하였다. 일반적으로 유도전동기 고정자 고장 진단의 주된 목적은 미세한 턴 단락을 빠르게 진단함으로 고장을 미리 방지함에 있다. 이에 활성화 함수 활용에 있어서 전반적인 고정자 고장에는 ReLu가 우수성을 보임을 알 수 있었으나, 미세한 턴 단락인 2턴 단락에 있어서는 Sigmoid 함수가 ReLu 함수보다 진단의 정확도에 있어서 23.23% 유용함을 실험을 통해 확인할 수 있었다.

검색 기반의 질문생성에서 중복 방지를 위한 유사 응답 검출 (Detection of Similar Answers to Avoid Duplicate Question in Retrieval-based Automatic Question Generation)

  • 최용석;이공주
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권1호
    • /
    • pp.27-36
    • /
    • 2019
  • 본 연구는 검색 기반의 질문 자동 생성 시스템에서 사용자가 이미 답변한 내용을 재질문하지 않도록 사용자의 응답과 유사도가 높은 응답을 질문-데이터베이스에서 찾는 방법을 제안한다. 유사도가 높게 검출된 응답의 질문은 이미 사용자가 아는 내용일 확률이 높기 때문에 질문 후보군에서 제거한다. 유사 응답 검출에는 두 응답간의 동일 단어, 바꿔쓰기 표현, 문장 내용을 모두 사용하였다. 바꿔쓰기 표현은 통계기반의 기계번역에서 사용하는 구절 테이블을 사용하여 구축하였다. 문장 내용은 두 문장을 주의-기반 컨볼루션 신경망으로 압축하여 유사도를 계산하였다. 평가를 위해 구축한 100개의 평가 응답에 질문-응답 데이터베이스로부터 가장 유사한 응답을 추출해서 얻은 결과는 MRR값 71%의 성능을 보였다.

어종 분류를 위한 CNN의 적용 (Application of CNN for Fish Species Classification)

  • 박진현;황광복;박희문;최영규
    • 한국정보통신학회논문지
    • /
    • 제23권1호
    • /
    • pp.39-46
    • /
    • 2019
  • 본 연구에서 외래어종 퇴치를 위한 시스템 개발에 앞서 물 안의 어류 이미지를 CNN으로 학습하여 어종을 분류하는 알고리즘을 제안하고자 한다. CNN 학습을 위한 원데이터(raw data)는 각 어종에 대해 직접 촬영한 영상을 사용하였으며, 어종 분류성능을 높이기 위해 영상 이미지의 개수를 늘린 데이터세트 1과 최대한 자연환경과 가까운 영상 이미지를 구현한 데이터세트 2를 구성하여 학습 및 테스트 데이터로 사용하였다. 4가지 CNN의 분류성능은 데이터세트 1에 대해 99.97%, 데이터세트 2에 대해 99.5% 이상을 나타내었으며, 특히 데이터세트 2를 사용하여 학습한 CNNs이 자연환경과 유사한 어류 이미지에 대해서도 만족할 만한 성능을 가짐을 확인하였다. 그리고 4가지 CNN 중 AlexNet이 성능에서도 만족스러운 결과를 도출하였으며, 수행시간과 학습시간 역시 가장 짧아 외래어종 퇴치를 위한 시스템 개발에 가장 적합한 구조임을 확인하였다.

CNN과 Grad-CAM 기반의 실시간 화재 감지 (Real-Time Fire Detection based on CNN and Grad-CAM)

  • 김영진;김은경
    • 한국정보통신학회논문지
    • /
    • 제22권12호
    • /
    • pp.1596-1603
    • /
    • 2018
  • 화재에 대한 신속한 예측과 경고는 인명 및 재산피해를 최소화시킬 수 있는 필수적인 요소이다. 일반적으로 화재가 발생하면 연기와 화염이 함께 발생하기 때문에 화재 감지 시스템은 연기와 화염을 모두 감지할 필요가 있다. 그러나 대부분의 화재 감지 시스템은 화염 혹은 연기만 감지하며, 화재 감지를 위한 전처리 작업을 추가함에 따라 처리 속도가 느려지는 단점이 있다. 본 연구에서는 다중 레이블 분류(Multi-labeled Classification)를 지원하는 CNN 모델을 구성해서 화염과 연기를 동시에 예측하고, CNN의 특징을 기반으로 클래스에 대한 위치를 시각화하는 Grad-CAM을 이용해서 실시간으로 화재 상태를 모니터링 할 수 있는 화재 감지 시스템을 구현하였다. 또한, 13개의 화재 동영상을 사용해서 테스트한 결과, 화염과 연기에 대해 각각 98.73%와 95.77%의 정확도를 보였다.

미세먼지 예측 성능 개선을 위한 CNN-LSTM 결합 방법 (CNN-LSTM Combination Method for Improving Particular Matter Contamination (PM2.5) Prediction Accuracy)

  • 황철현;신강욱
    • 한국정보통신학회논문지
    • /
    • 제24권1호
    • /
    • pp.57-64
    • /
    • 2020
  • 최근 IoT 센서의 확산과 빅데이터, 인공지능 관련 기술의 발전으로 인해 미세먼지 오염도에 대한 시계열 예측 관련 연구가 활발하게 진행되고 있다. 하지만 미세먼지 오염도를 나타내는 데이터가 급격히 변하는 특성(Extreme)을 가지고 있어 기존의 시계열 예측방법으로는 현장에서 사용할 수 있는 수준의 정확도를 내지 못하고 있다. 이 논문에서는 LSTM을 활용하여 미세먼지 오염도를 예측할 때 CNN을 통한 환경상황을 분류한 결과를 반영하는 방법을 제안한다. 이 방법은 LSTM과 CNN이 독립적이지만 인터페이스를 통해 하나의 네트워크로 통합되기 때문에, 응용 LSTM보다 이해하기 쉽다. Beijing PM2.5 데이터를 활용한 제안 방법의 검증 실험에서 예측 정확도와 변화 시기에 대한 예측력이 다양한 실험 case에서 일관되게 향상된 결과를 보였다.