Proceedings of the Korea Information Processing Society Conference (한국정보처리학회:학술대회논문집)
- 2017.04a
- /
- Pages.892-895
- /
- 2017
- /
- 2005-0011(pISSN)
- /
- 2671-7298(eISSN)
DOI QR Code
Learning Recurrent Neural Networks for Activity Detection from Untrimmed Videos
비분할 비디오로부터 행동 탐지를 위한 순환 신경망 학습
- Song, YeongTaek (Dept of Computer Science, Kyonggi University) ;
- Suh, Junbae (Dept of Computer Science, Kyonggi University) ;
- Kim, Incheol (Dept of Computer Science, Kyonggi University)
- Published : 2017.04.27
Abstract
본 논문에서는 비분할 비디오로부터 이 비디오에 담긴 사람의 행동을 효과적으로 탐지해내기 위한 심층 신경망 모델을 제안한다. 일반적으로 비디오에서 사람의 행동을 탐지해내는 작업은 크게 비디오에서 행동 탐지에 효과적인 특징들을 추출해내는 과정과 이 특징들을 토대로 비디오에 담긴 행동을 탐지해내는 과정을 포함한다. 본 논문에서는 특징 추출 과정과 행동 탐지 과정에 이용할 심층 신경망 모델을 제시한다. 특히 비디오로부터 각 행동별 시간적, 공간적 패턴을 잘 표현할 수 있는 특징들을 추출해내기 위해서는 C3D 및 I-ResNet 합성곱 신경망 모델을 이용하고, 시계열 특징 벡터들로부터 행동을 자동 판별해내기 위해서는 양방향 BI-LSTM 순환 신경망 모델을 이용한다. 대용량의 공개 벤치 마크 데이터 집합인 ActivityNet 비디오 데이터를 이용한 실험을 통해, 본 논문에서 제안하는 심층 신경망 모델의 성능과 효과를 확인할 수 있었다.
Keywords