DOI QR코드

DOI QR Code

단일 단계 검출 방법을 위한 이미지 합성기반 학습 데이터 증강에 관한 연구

A Study on Synthesizing Training Data for One-stage Object Detector

  • 이선경 (한국전자통신연구원 인공지능연구소 휴먼증강연구실) ;
  • 정치윤 (한국전자통신연구원 인공지능연구소 휴먼증강연구실) ;
  • 문경덕 (한국전자통신연구원 인공지능연구소 휴먼증강연구실) ;
  • 김채규 (부경대학교 IT융합응용공학부)
  • Lee, Seon-Gyeong (Human Enhancement & Assistive Technology Research Section, Artificial Intelligence Research Lab, ETRI) ;
  • Jeong, Chi Yoon (Human Enhancement & Assistive Technology Research Section, Artificial Intelligence Research Lab, ETRI) ;
  • Moon, KyeongDeok (Human Enhancement & Assistive Technology Research Section, Artificial Intelligence Research Lab, ETRI) ;
  • Kim, Chae-Kyu (Dept. of IT Convergence & Application Engineering, Bukyong University)
  • 발행 : 2020.05.29

초록

딥러닝 기반의 영상 분석 방법들은 많은 양의 학습 데이터가 필요하며, 학습 데이터 구축에는 많은 시간과 노력이 소요된다. 특히 객체 검출 분야의 경우 영상 내 객체의 위치, 크기, 범주 등의 정보가 모두 필요하여 학습 데이터 구축에 더 많은 어려움이 있으며, 이를 해결하기 위해 최근 이미지 합성기반 데이터 증강에 관한 연구가 활발히 진행되고 있다. 이미지 합성기반 데이터 증강 방법은 배경 영상에 객체를 합성할 때 객체와 배경 영상이 접한 영역에서 아티팩트(Artifact)가 발생하며, 이는 객체 검출 모델이 아티팩트를 객체의 특징으로 모델링하여 검출 성능이 저하되는 원인이 된다. 이러한 문제를 해결하기 위하여 본 논문에서는 양방향 필터 기반의 이미지 합성 방법을 제안하고, 단일 단계 검출의 대표적인 방법인 RetinaNet을 이용하여 이미지 합성기반 데이터 증강 방법의 성능을 분석하였다. 공개 데이터셋에 대한 실험 결과 본 논문에서 사용한 단일 검출 방법 및 데이터 증강 기법을 사용하면 더 적은 양의 증강 데이터로 기존 방법과 동일한 성능을 보여주는 것을 확인하였다.

키워드