An Efficient Text Detection Model using Bidirectional Feature Fusion

양방향 특징 결합을 이용한 효율적 문자 탐지 모델

  • 임성택 (고려대학교 산업경영공학과) ;
  • 최회련 (고려대학교 산업경영공학과) ;
  • 이홍철 (고려대학교 산업경영공학과)
  • Published : 2021.07.14

Abstract

기존 객체탐지는 경계 상자 회귀방식을 적용하였지만, 문자는 왜곡과 변형이 심한 특성을 가진 객체로 U-net 구조의 이미지 분할 방식을 사용하는 경우가 많다. 따라서 최근 문자 탐지는 통계적 모델에 비해 높은 정확도를 보이는 심층 신경망 기반의 모델 연구가 많이 진행되고 있다. 본 연구에서는 이미지 분할을 통한 양방향 특징 결합 기법을 사용한 문자 탐지 모델을 제안한다. 이미지 분할 방식은 메모리의 효율이 떨어지기 때문에 이를 극복하고자 특징 추출 단계에서 경량화된 네트워크를 적용하였다. 또한, 객체 탐지에서 큰 성과를 보인 양방향 특징 결합 모듈을 U-net 구조에 추가하여 추출된 특징이 효과적으로 결합 되는 결과를 얻었다. 제안하는 모델의 문자 탐지 성능은 합성 문자 데이터셋을 이용한 실험을 통해 기존의 U-net 구조의 이미지 분할 방식보다 향상되었음을 확인하였다.

Keywords

Acknowledgement

본 연구는 4단계 두뇌한국21에 의해 지원되었습니다.