DOI QR코드

DOI QR Code

심층 신경망을 이용한 영상 기반 물체 속성 및 공간 관계 탐지

Detecting Visual Attributes and Spatial Relationships with Deep Neural Networks

  • 이재윤 (경기대학교 컴퓨터공학부) ;
  • 이기호 (경기대학교 컴퓨터공학부) ;
  • 김인철 (경기대학교 컴퓨터공학부)
  • Lee, Jae-Yun (Dept. of Computer Science, Kyonggi University) ;
  • Lee, Gi-Ho (Dept. of Computer Science, Kyonggi University) ;
  • Kim, In-Cheol (Dept. of Computer Science, Kyonggi University)
  • 발행 : 2018.05.11

초록

영상이나 비디오에 담긴 장면을 이해하는 것은 컴퓨터 비전의 궁극적인 목표 중 하나이다. 본 논문에서는 입력 영상으로부터 장면을 구성하는 각 물체들과 그들 간의 공간 관계, 개별 물체들의 다양한 속성들을 탐지해, 지식 그래프를 생성해주는 심층 신경망 기반의 물체 속성 및 공간 관계 탐지 모델을 제안한다. 본 논문에서는 이러한 다양한 복합 시각 인식 작업을 동시에 수행하는 탐지 모델의 구성에 대해 설명하고, 대규모 벤치마크 데이터 집합인 CLEVR을 이용한 탐지 모델의 성능 분석 실험 결과를 소개한다.

키워드