• 제목/요약/키워드: Handwriting Segmentation

검색결과 12건 처리시간 0.025초

Enhanced technique for Arabic handwriting recognition using deep belief network and a morphological algorithm for solving ligature segmentation

  • Essa, Nada;El-Daydamony, Eman;Mohamed, Ahmed Atwan
    • ETRI Journal
    • /
    • 제40권6호
    • /
    • pp.774-787
    • /
    • 2018
  • Arabic handwriting segmentation and recognition is an area of research that has not yet been fully understood. Dealing with Arabic ligature segmentation, where the Arabic characters are connected and unconstrained naturally, is one of the fundamental problems when dealing with the Arabic script. Arabic character-recognition techniques consider ligatures as new classes in addition to the classes of the Arabic characters. This paper introduces an enhanced technique for Arabic handwriting recognition using the deep belief network (DBN) and a new morphological algorithm for ligature segmentation. There are two main stages for the implementation of this technique. The first stage involves an enhanced technique of the Sari segmentation algorithm, where a new ligature segmentation algorithm is developed. The second stage involves the Arabic character recognition using DBNs and support vector machines (SVMs). The two stages are tested on the IFN/ENIT and HACDB databases, and the results obtained proved the effectiveness of the proposed algorithm compared with other existing systems.

Graphemes Segmentation for Arabic Online Handwriting Modeling

  • Boubaker, Houcine;Tagougui, Najiba;El Abed, Haikal;Kherallah, Monji;Alimi, Adel M.
    • Journal of Information Processing Systems
    • /
    • 제10권4호
    • /
    • pp.503-522
    • /
    • 2014
  • In the cursive handwriting recognition process, script trajectory segmentation and modeling represent an important task for large or open lexicon context that becomes more complicated in multi-writer applications. In this paper, we will present a developed system of Arabic online handwriting modeling based on graphemes segmentation and the extraction of its geometric features. The main contribution consists of adapting the Fourier descriptors to model the open trajectory of the segmented graphemes. To segment the trajectory of the handwriting, the system proceeds by first detecting its baseline by checking combined geometric and logic conditions. Then, the detected baseline is used as a topologic reference for the extraction of particular points that delimit the graphemes' trajectories. Each segmented grapheme is then represented by a set of relevant geometric features that include the vector of the Fourier descriptors for trajectory shape modeling, normalized metric parameters that model the grapheme dimensions, its position in respect to the baseline, and codes for the description of its associated diacritics.

Character Segmentation in Chinese Handwritten Text Based on Gap and Character Construction Estimation

  • Zhang, Cheng Dong;Lee, Guee-Sang
    • International Journal of Contents
    • /
    • 제8권1호
    • /
    • pp.39-46
    • /
    • 2012
  • Character segmentation is a preprocessing step in many offline handwriting recognition systems. In this paper, Chinese characters are categorized into seven different structures. In each structure, the character size with the range of variations is estimated considering typical handwritten samples. The component removal and merge criteria are presented to remove punctuation symbols or to merge small components which are part of a character. Finally, the criteria for segmenting the adjacent characters concerning each other or overlapped are proposed.

k-평균 클러스터링을 이용한 필기 문서 영상의 단어 분리법 (Word Segmentation Algorithm for Handwritten Documents based on k-means Clustering)

  • 류제웅;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2014년도 하계학술대회
    • /
    • pp.38-41
    • /
    • 2014
  • 본 논문에서는 필기 문서 영상을 분석하여 단어 단위로 요소들을 분할하는 방법을 제안한다. 일반적으로 인쇄 문서에 비하여 필기 문서에서는 글자 간 간격이 일정하지 않을 뿐만 아니라 필기자 또는 작성된 언어에 따라 특성이 매우 다르게 나타나기 때문에 단어를 분리하는 것은 어려운 문제로 간주되었고 많은 연구가 진행되었다. 제안하는 방법은 이 문제를 해결하기 위하여 글자 획의 두께를 고려하여 정규화시킨 각 연결 요소간 간격과 간격 안에 존재하는 글자 픽셀의 수로 구성된 2 차원의 특징값을 추출하였다. 이 특징값을 바탕으로, 제안하는 방법은 k-평균 클러스터링을 이용하여 각 텍스트라인을 구성하는 연결 요소간 간격을 단어 사이의 간격과 단어 내부 글자간의 간격으로 분류하였다. ICDAR 2013 Handwriting Segmentation Contest 데이터베이스에 대한 실험 결과 제안하는 방법은 가장 우수한 성능을 나타내었다.

  • PDF

Augmentation of Hidden Markov Chain for Complex Sequential Data in Context

  • Sin, Bong-Kee
    • Journal of Multimedia Information System
    • /
    • 제8권1호
    • /
    • pp.31-34
    • /
    • 2021
  • The classical HMM is defined by a parameter triple �� = (��, A, B), where each parameter represents a collection of probability distributions: initial state, state transition and output distributions in order. This paper proposes a new stationary parameter e = (e1, e2, …, eN) where N is the number of states and et = P(|xt = i, y) for describing how an input pattern y ends in state xt = i at time t followed by nothing. It is often said that all is well that ends well. We argue here that all should end well. The paper sets the framework for the theory and presents an efficient inference and training algorithms based on dynamic programming and expectation-maximization. The proposed model is applicable to analyzing any sequential data with two or more finite segmental patterns are concatenated, each forming a context to its neighbors. Experiments on online Hangul handwriting characters have proven the effect of the proposed augmentation in terms of highly intuitive segmentation as well as recognition performance and 13.2% error rate reduction.

A Study on the Preprocessing Method Using Construction of Watershed for Character Image segmentation

  • Nam Sang Yep;Choi Young Kyoo;Kwon Yun Jung;Lee Sung Chang
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2004년도 학술대회지
    • /
    • pp.814-818
    • /
    • 2004
  • Off-line handwritten character recognition is in difficulty of incomplete preprocessing because it has not dynamic and timing information besides has various handwriting, extreme overlap of the consonant and vowel and many error image of stroke. Consequently off-line handwritten character recognition needs to study about preprocessing of various methods such as binarization and thinning. This paper considers running time of watershed algorithm and the quality of resulting image as preprocessing For off-line handwritten Korean character recognition. So it proposes application of effective watershed algorithm for segmentation of character region and background region in gray level character image and segmentation function for binarization image and segmentation function for binarization by extracted watershed image. Besides it proposes thinning methods which effectively extracts skeleton through conditional test mask considering running time and quality. of skeleton, estimates efficiency of existing methods and this paper's methods as running time and quality. Watershed image conversion uses prewitt operator for gradient image conversion, extracts local minima considering 8-neighborhood pixel. And methods by using difference of mean value is used in region merging step, Converted watershed image by means of this methods separates effectively character region and background region applying to segmentation function. Average execution time on the previous method was 2.16 second and on this paper method was 1.72 second. We prove that this paper's method removed noise effectively with overlap stroke as compared with the previous method.

  • PDF

Stroke Width-Based Contrast Feature for Document Image Binarization

  • Van, Le Thi Khue;Lee, Gueesang
    • Journal of Information Processing Systems
    • /
    • 제10권1호
    • /
    • pp.55-68
    • /
    • 2014
  • Automatic segmentation of foreground text from the background in degraded document images is very much essential for the smooth reading of the document content and recognition tasks by machine. In this paper, we present a novel approach to the binarization of degraded document images. The proposed method uses a new local contrast feature extracted based on the stroke width of text. First, a pre-processing method is carried out for noise removal. Text boundary detection is then performed on the image constructed from the contrast feature. Then local estimation follows to extract text from the background. Finally, a refinement procedure is applied to the binarized image as a post-processing step to improve the quality of the final results. Experiments and comparisons of extracting text from degraded handwriting and machine-printed document image against some well-known binarization algorithms demonstrate the effectiveness of the proposed method.

변형된 ICM 방식에 의한 영역판별 (Region Decision Using Modified ICM Method)

  • 황재호
    • 대한전자공학회논문지SP
    • /
    • 제43권5호
    • /
    • pp.37-44
    • /
    • 2006
  • MRF (Markov random fields)로 전후 관계가 모델링된 변형된 형태의 ICM 방식을 소개한다. 특징 추출을 위해 부합블록인접의 새로운 MRF 모델을 제시한다. 이 모델은 현재 고려중인 화소를 기점으로 지엽구조인 복수방향의 기하학적 인접화소군들을 발생시켜 집합을 형성한다. 전처리 작업을 통해 산출한 특정 영역 색도분포의 확률적 데이터를 근거로 매 인접화소군 화소들 사이의 색도분포와 인접화소군들 사이의 관련성 여부를 단계별로 확률적으로 비교 판별함으로 해당화소의 영역귀속을 결정한다. 귀속 영역이 판별된 화소에는 특정 색도를 부여하고 타영역의 원소와 차별한다. 이러한 과정을 전 화소들에 확대 적용하면서 관측영상은 영역별로 순차적으로 분류되며 정보가 추출된다. 대상 영상은 탁본영상으로서 바탕영역과 정보영역을 차별적으로 분류, 색도부여를 통해 문자만의 특징을 선별한다. 이 방식은 종래의 ICM 방식의 단점이었던 과/부족 평활 현상을 최소화하는 동시에, 벡터적 판별력 부가에 의한 특정영역 잡음 제거와 얼룩현상 극소화에 효과가 있음이 실험을 통해 확인할 수 있었다. 또한 MICM 방식을 탁본영상의 문자인식에 적용하면 우수한 효과가 있으리라 기대한다.

동적 프로그래밍 정합을 이용한 효율적인 필기 단어 인식 방법 (An Approach for Efficient Handwritten Word Recognition Using Dynamic Programming Matching)

  • 김경환
    • 전자공학회논문지C
    • /
    • 제36C권4호
    • /
    • pp.54-64
    • /
    • 1999
  • 본 논문에서는 실제 응용분야에서 사용될 수 있는 효율적인 필기 영어 단어 인식 방법을 제안한다. 필기 단어인식과 관련된 대부분의 응용분야에서 제공되는 사전의 활용을 극대화하기 위해 사전단어들을 인식의 초기 단계에서부터 사용한다. 초과 분할된 단어의 세크먼트들과 사전단어들 사이의 정합을 위해 동적 프로그래밍을 사용하며, 정합구간을 가변적으로 조정할 수 있도록 학습단계에서 추출한 문자 분할과 관련된 통계를 활용한다. 또한, 사전단어의 각 문자와 세그먼트들 사이의 정합 결과를 저장하여 반복되는 계산을 피한다. 제안하는 방법의 효용성을 입증하기 위해 다양한 서체를 갖는 실험용 필기 단어영상을 사용하여 실험을 수행한 결과, 사전에 기반한 단어 인식 과정을 최대로 활용하기 위한 가변정합구간 개념 및 문자단위 정합결과 저장 방법이 동적 프로그래밍과 함께 인식 속도 및 정확도 향상에 모두 크게 기여함을 확인하였다.

  • PDF

Watershed 변환을 이용한 효율적인 문자 영상 향상 및 영역 분할 (An Efficient Character Image Enhancement and Region Segmentation Using Watershed Transformation)

  • 최영규;이상범
    • 정보처리학회논문지B
    • /
    • 제9B권4호
    • /
    • pp.481-490
    • /
    • 2002
  • 오프라인 필기체 문자 인식은 동적인 정보를 가지고 있지 않고, 다양한 필기와 자음과 모음의 겹침이 심하며, 획 사이의 잡영을 많이 가지고 있어 불완전한 전처리를 수행하여야 하는 어려움이 있다. 따라서 오프라인 필기체 문자 인식은 다양한 방법의 전처리 즉 이진화 및 세선화에 대한 연구가 필요하다. 본 논문에서는 오프라인 필기체 한글 문자 인식의 전처리로서 워터쉐드 알고리즘의 수행 시간과 결과 영상의 품질을 고려해 그레이 레벨 문자 영상에서의 문자 영역과 배경 영역의 분할을 위한 효과적인 워터쉐드 알고리즘의 적용 방법과 추출된 워터쉐드 영상을 이진화하는 분할 함수를 제안한다. 또한 수행 시간과 골격선의 품질을 고려한 조건 검사 마스크를 통해서 효과적으로 골격선을 추출하는 세선화 방법을 제안하고 기존의 방법과 본 논문 방법을 수행 시간과 품질로써 성능을 평가한다. 실험 결과 기존의 방법은 평균 2.16초, 본 논문 방법은 평균 1.72초의 수행 시간이 걸렸다. 또한 결과 영상의 품질은 본 논문 방법이 문자 획 사이의 잡영을 효과적으로 처리함을 알 수 있었다.