• 제목/요약/키워드: Hangul matching

검색결과 27건 처리시간 0.02초

선분정합에 의한 흘림체 온라인 한글 인식 (A Cursive On-Line Hangul Recognition Based on the Line Segment Matching)

  • 권오성;권영빈
    • 인지과학
    • /
    • 제3권2호
    • /
    • pp.271-289
    • /
    • 1992
  • 본 논문에서는 자소간 츨림의 형태를 허용하는 온라인 한글 인식 시스템을 제안하고 있다.한글의 인식은 자소 분할의 어려움과 후보문자의 증가에 따른 정합과정의 복잡도 증가라는 두 가지의 커다란 문제점을 갖고 있다.그러므로 본 논문에서는 이중 획분할 방법을 제안하고 이러한 획분할을 통하여 얻어진 선분들을 효율적으로 정합하는 인식 시스템의 구현을 설명하고 있다.또한,제안하는 방법이 흘림체 한글 인식에 적합하게 동작하는 것을 실험을 통하여 입증하였다.

영상 대 영상 매칭을 이용한 한글 문서 영상에서의 단어 검색 (Keyword Spotting on Hangul Document Images Using Image-to-Image Matching)

  • 박상철;손화정;김수형
    • 정보처리학회논문지B
    • /
    • 제12B권3호
    • /
    • pp.357-364
    • /
    • 2005
  • 본 논문에서는 두 단계 이미지 매칭을 이용하여 한글 문서영상에서 사용자 검색어를 빠르고 정확하게 검색할 수 있는 시스템을 제안한다. 본 시스템은 문자 분리, 검색어 영상 생성, 특징 추출 그리고 이미지 매칭 과정으로 구성된다. 매칭 과정에서 차원이 다른 두 가지 특징 벡터를 이용한다. 8쪽 분량의 문서 영상을 한국정보과학회 웹사이트에서 다운로드하였고, 그 문서로부터 1600개의 한글단어 영상을 획득하여 실험데이터로 사용하였다 그 결과 제안한 시스템은 기존에 제안된 영상-기반 한글 단어 검색 시스템보다 성능이 크게 향상되었음을 알 수 있었다.

필기체 한글의 오프라인 인식을 위한 효과적인 두 단계 패턴 정합 방법 (Efficient two-step pattern matching method for off-line recognition of handwritten Hangul)

  • 박정선;이성환
    • 전자공학회논문지B
    • /
    • 제31B권4호
    • /
    • pp.1-8
    • /
    • 1994
  • In this paper, we propose an efficient two-step pattern matching method which promises shape distortion-tolerant recognition of handwritten of handwritten Hangul syllables. In the first step, nonlinear shape normalization is carried out to compensate for global shape distortions in handwritten characters, then a preliminary classification based on simple pattern matching is performed. In the next step, nonlinear pattern matching which achieves best matching between input and reference pattern is carried out to compensate for local shape distortions, then detailed classification which determines the final result of classification is performed. As the performance of recognition systems based on pattern matching methods is greatly effected by the quality of reference patterns. we construct reference patterns by combining the proposed nonlinear pattern matching method with a well-known averaging techniques. Experimental results reveal that recognition performance is greatly improved by the proposed two-step pattern matching method and the reference pattern construction scheme.

  • PDF

자소간의 흘림을 허용하는 연속형 온라인 필기 인식 시스템의 구현 (Implementation of An On-Line Continuous Recognition System for Cursive Handwriting)

  • 권오성;권영빈
    • 전자공학회논문지B
    • /
    • 제31B권9호
    • /
    • pp.166-177
    • /
    • 1994
  • In this paper, an implemenation of on-line continuous recognizer for cursive Hangul handwriting is explained. For the Hangul recognition system, we propose a high speed string matching. The editing process in our proposed string matching is accomplished by single editing path. And the matching results are stored in a heap structure and we decide the user comfortibility of unceasing writing during recognition owing to the high speed matching. In the experimental result, a recongition rate of 86.36% at 1.75 second/character over 21,076 characters collected from 50 persons are abtained. And it is shown that the proposed recognition system is operated properly for the on-line recognition for cursive handwring between graphemes.

  • PDF

Matching Algorithm for Hangul Recognition Based on PDA

  • Kim Hyeong-Gyun;Choi Gwang-Mi
    • Journal of information and communication convergence engineering
    • /
    • 제2권3호
    • /
    • pp.161-166
    • /
    • 2004
  • Electronic Ink is a stored data in the form of the handwritten text or the script without converting it into ASCII by handwritten recognition on the pen-based computers and Personal Digital Assistants(PDA) for supporting natural and convenient data input. One of the most important issue is to search the electronic ink in order to use it. We proposed and implemented a script matching algorithm for the electronic ink. Proposed matching algorithm separated the input stroke into a set of primitive stroke using the curvature of the stroke curve. After determining the type of separated strokes, it produced a stroke feature vector. And then it calculated the distance between the stroke feature vector of input strokes and one of strokes in the database using the dynamic programming technique.

필기체 한글의 오프라인 인식을 위한 획 정합 방법 (A Stroke Matching Method for the Off-line Recognition of Handprinted Hangul)

  • 김기철;김영식;이성환
    • 전자공학회논문지B
    • /
    • 제30B권6호
    • /
    • pp.76-85
    • /
    • 1993
  • In this paper, we propose a stroke matching method for the off-line recognition of handprinted Hangul. In this method, the preprocessing steps such as position normalization, contour tracing and thinning are carried out first. Then, after extracting features such as the firection component distribution of contour, the direction component distribution of skeleton, and the distribution of structural feature points, strokes are extracted and matched based on the midpont distribution of the direction and the length of each stroke. In order to reduce the recognition time, a preliminary classification based on the direction component distribution features of the contour is performed. In order to domonstrate the performance of the proposed method, experiments with 520 most frequently used Hangul were performed, and 90.7% of correct recognition rate and 0.46second of recognition time per one character has been obtained. This results reveal that the proposed method can absorb effectively the noise in input character and the variations of stroke slant.

  • PDF

패턴매칭에 의한 이진 한글문서의 유.무손실 압축에 관한 연구 (The Study on Lossy and Lossless Compression of Binary Hangul Textual Images by Pattern Matching)

  • 김영태;고형화
    • 한국통신학회논문지
    • /
    • 제22권4호
    • /
    • pp.726-736
    • /
    • 1997
  • The textual image compression by pattern matching is a coding scheme that exploits the correlations between patterns. When we compress the Hangul (Korean character) text by patern matching, the collerations between patterns may decrease due to randoem contacts between phonemes. Therefore in this paper we separate connected phonemes to exploit effectively the corrlation between patterns by inducting the amtch. In the process of sequation, we decide whether the patterns have vowel component or not, and then vowels connected with consonant ae separated. When we compare the proposed algorithm with the existing algorith, the compression ratio is increased by 1.3%-3.0% than PMS[5] in lossy mode, by 3.4%-9.1% in lossless mode than that of SPM[7] which is submitted to standard committe for second generation binary compression algorithm.

  • PDF

X-treeDiff+ 기반의 한글 문서에 대한 변화 탐지 (Change Detection of Hangul Documents Based on X-treeDiff+)

  • 이석균
    • 한국산업정보학회논문지
    • /
    • 제15권4호
    • /
    • pp.29-37
    • /
    • 2010
  • XML 문서에 대한 변화탐지는 중요한 연구 분야이다. 그러나 한글 문서 파일 형식으로 XML이 지원되고 있음에도 한글 문서의 특성을 반영한 변화 탐지 연구는 아직 미비하다. 한글 문서는 일반적인 XML 문서와는 달리 서식 정보의 비중이 매우 커서 X-treeDiff+와 같은 일반적인 XML 문서의 변화탐지 알고리즘을 그대로 적용하기에는 적합하지 않다. 본 논문에서는 한글 문서에 대한 변화탐지를 위해 새로운 내용 기반의 대응 알고리즘을 제안하고 이를 X -treeDiff+에 구현하였다. 실험을 통해 제안된 알고리즘은 대부분의 편집과정의 문서에 대해 우수한 성능을 보이고 있음을 제시했다.

Pocket PC기반의 효율적인 한글 정합 시스템 구현 (Implementation of an efficient Pocket PC- based Hangul Matching System)

  • 박종민;조범준
    • 한국정보통신학회논문지
    • /
    • 제8권7호
    • /
    • pp.1546-1552
    • /
    • 2004
  • 전자 잉크 데이터는 펜 기반 컴퓨터나 PDA(Personal Digital Assistants)둥에서 자연스럽고 편리한 데이터 입력을 제공하기 위해 펜으로 입력한 데이터를 온라인 문자 인식기를 이용하여 아스키 문자로 변환하지 않고 스크립트 형태로 저장하는 데이터를 말한다. 전자 잉크 데이터를 사용하기 위해 가장 중요한 것 중 하나는 전자 잉크 데이터의 검색 문제이다. 본 연구에서는 전자 잉크 데이터를 획 특징 벡터 형태로 저장하고, 이를 이용해서 잉크 데이터를 검색하는 정합 알고리즘을 제안하고 구현하였다. 제안된 정합 알고리즘은 입력된 데이터를 곡률을 이용하여 기본획으로 분리하고 기본획의 종류를 결정한 다음 획 특징 벡터를 생성한다. 그리고 동적 프로그래밍 기법에 의해 획 특징 벡터의 거리값을 계산한다.

MWLD 알고리즘을 이용한 문자열정합 1차원 Bit-Serial 어레이 프로세서의 설계 (A Study on 1-D Bit-Serial Array Processor Design for Code-String Matching Using a MWLD Algorithm)

  • 박종진;김은원;조원경
    • 전자공학회논문지B
    • /
    • 제29B권2호
    • /
    • pp.1-8
    • /
    • 1992
  • This paper is proposed a Modified WLD (Weighted Levenshtein Distance) algorithm for processor desihn of code-string matching. A proposed MWLD (Modified Weighted Levenshtein Distance) algorithm is consist of 1-dimension bit-serial array processor to pattern matching using a Hamming Distance. The proposed processor is applied to recognition of character with real time input. The recognition rate of Hangul strokes is resulted to 98.65$\%$

  • PDF