Learning-based Word Segmentation for Text Document Recognition

Lomaliza, Jean-Pierre;Moon, Kwang-Seok;Park, Hanhoon;

Proceedings of the Korean Society of Broadcast Engineers Conference (한국방송∙미디어공학회:학술대회논문집)

2018.06a
/
Pages.41-42
/
2018

The Korean Institute of Broadcast and Media Engineers (한국방송∙미디어공학회)

Learning-based Word Segmentation for Text Document Recognition

텍스트 문서 인식을 위한 학습 기반 단어 분할

Lomaliza, Jean-Pierre (Pukyong National University) ;
Moon, Kwang-Seok (Pukyong National University) ;
Park, Hanhoon (Pukyong National University)

로말리자쟝피에르 (부경대학교) ;
문광석 (부경대학교) ;
박한훈 (부경대학교)

Published : 2018.06.20

PDF

Download PDF

⟨ Previous Next ⟩

Abstract

텍스트 문서 영상으로부터 단어를 검출하고, LLAH(locally likely arrangement hashing) 알고리즘을 이용하여 이웃 단어 사이의 기하 관계를 표현하는 특징 벡터를 계산한 후, 특징 벡터를 비교함으로써 텍스트 문서를 효과적으로 인식하거나 검색할 수 있다. 그러나, 이는 문서 내 각 단어가 정확하고 강건하게 검출된다는 전제를 필요로 한다. 본 논문에서는 텍스트 내 각 라인을 검출하고, 각 라인 내에서 단어 사이의 간격과 글자 사이의 간격을 깊은 신경망(deep neural network)을 이용하여 학습하고 분류함으로써, 보다 카메라와 텍스트 문서 사이의 거리나 방향이 동적으로 변하는 조건에서 각 단어를 강건하게 검출하는 방법을 제안한다. 모바일 환경에서 제안된 방법을 구현하였으며, 실험을 통해 단어 사이의 간격과 글자 사이의 간격을 92.5%의 정확도로 구별할 수 있으며, 이를 통해 동적인 환경에서 단어 검출의 강건성을 크게 개선할 수 있음을 확인하였다.

Proceedings of the Korean Society of Broadcast Engineers Conference (한국방송∙미디어공학회:학술대회논문집)

Learning-based Word Segmentation for Text Document Recognition

텍스트 문서 인식을 위한 학습 기반 단어 분할

Abstract

Keywords

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)