• Title/Summary/Keyword: 한글 문자 인식

Search Result 325, Processing Time 0.026 seconds

A Study on the Recognition of Handwritten Mixed Documents (필기체 혼합 문서 인식에 관한 연구)

  • 심동규;김인권;함영국;박래홍;이창범;김상중;윤병남
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.19 no.6
    • /
    • pp.1126-1139
    • /
    • 1994
  • This paper proposes an effective recognition system which recognizes the mixed document consisting of handwritten korean/alphanumeric texts and graphic images. In the preprocessing step, an input image is binarized by the proposed thresholding scheme, then graphic and character regions are separated by using connected components and chain codes. Separated Korean characters are merged based on partial recognition and their character types and sized. In the character recognition step, we use the branch and bound algorithm based on DP matching costs to recognize Korean characters. Also we recognize alphanumeric characters using several robust features. Finally we use a dictionary and information of a recognition step to correct wrong recognition results. Computer simulation with several test documents shows what the proposed algorithm recognized effectively handwritten mixed texts.

  • PDF

Anyword OCR in Ubiquitos Computing (모바일 환경의 OCR Anyword)

  • Park, Jong-Kyeong;Eum, Bong-Kyu;Kwon, Young-Sik;Chin, Seong-Ah
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2006.05a
    • /
    • pp.152-155
    • /
    • 2006
  • 최근 모바일기기에 유비쿼터스 콘텐츠를 구현하는 시도가 활발히 진행되고 있다. 핸드폰을 이용해 위치를 판단한다거나, 핫코드를 찍어 상품을 구매하는 등의 콘텐츠가 개발되었다. 또한, 모바일기기도 발전하여 핸드폰, PDA 같은 모바일기기의 내장 카메라모듈은 필수사항이 되었다. 본 연구는 모바일기기의 내장 카메라모듈을 이용한 모바일 환경에 적합한 한글 문자인식 시스템을 제안한다. 본 연구의 시스템은 모바일기기로 PDA를 사용하였으며, PDA의 카메라모듈을 통하여 인쇄체 한글 영상을 입력받고, 모바일기기의 느린 연산속도를 보완하기 위하여, 서버로 이미지와 기울기 정보를 전달한 후, 서버에서 기울어진 인쇄체 문자영상을 보정하고, 프로젝션을 통해 문자를 추출한 후, 차연산을 이용한 매칭 방법으로 인쇄체 한글을 인식한다. 인식한 문자들은 사용자의 수정을 거쳐 텍스트 문서로 저장할 수 있다.

  • PDF

An Efficient Postprocessing Algorithm for Error Correction in Hangul Address Recognition (한글 주소의 오인식 수정을 위한 효율적인 후처리 알고리즘)

  • Lee, Seong-Whan;Kim, Eun-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 1992.10a
    • /
    • pp.555-566
    • /
    • 1992
  • 본 논문은 한글 주소의 오인식 수정에 관한 연구로서, 필기자의 다양한 필기 형태와 입력 장치의 특성으로 인하여 문자 인식 단계에서 발생할 수 있는 혼동을 줄이고 오류를 효율적으로 수정하는 후처리 알고리즘을 소개한다. 특히, 주소의 행정 구역부에 대해서는 정합해야 할 문자 모델의 범위를 줄여줌으로써 높은 인식률과 처리 속도를 기록하였으며, 문자 인식의 결과에 임계값과 백트랙킹 방법을 도입한 후처리 알고리즘을 적용하여 더욱더 높은 인식률을 나타낼 수 있었다. 번지부와 건물부에 대한 오인식도 제안된 각각의 알고리즘을 적용함으로써 효과적으로 수정할 수 있었다. 우리나라의 25,000여 행정 구역을 바탕으로 작성 가능한 주소들 중에서 임의의 150개 주소 데이타에 대하여 제안된 후처리 방법을 포함한 다양한 후처리 방법으로 실험한 결과, 행정 구역부에 대하여 98%이상의 높은 인식률을 보임으로써, 제안된 후처리 알고리즘이 효과적임을 알 수 있었다.

  • PDF

An Approach to Segmentation of Address Strings of unconstrained handwritten Hangul using Run-Length Code (Rum-Length code를 이용한 제약없이 쓰여진 한글 필기체 주소열 분할)

  • Kim, Gyeonghwan;Yoon, Jason-J
    • Journal of KIISE:Software and Applications
    • /
    • v.28 no.11
    • /
    • pp.813-821
    • /
    • 2001
  • While recognition of isolated units of writing, such as a character or a word, has been extensively studied, emphasis on the segmentation itself has been lacking. In this paper we propose an active segmentation method for handwritten Hangul address strings based on the Run-length code. A slant correction algorithm, which is considered as an important preprocessing step for the segmentation, is presented. Three fundamental candidate estimation functions are introduced to detect the clues on touching points, and the classification of touching types is attempted depending on the structural peculiarity of Hangul. Our experiments show segmentation performance of 88.2% on touching characters with minimal over-segmentation.

  • PDF

Retrieving Information from Korean OCR Text Database (문자 인식에 의해 구축된 한글 문서 데이터베이스에 대한 정보 검색)

  • Lee, Jun-Ho;Lee, Chung-Sik;Han, Seon-Hwa;Kim, Jin-Hyeong
    • The Transactions of the Korea Information Processing Society
    • /
    • v.6 no.4
    • /
    • pp.833-841
    • /
    • 1999
  • The texts constructed with Optical Character Recognition(OCR) contain more errors than those constructed with keyboard typing. Therefore, in order to retrieve useful information from OCR texts, we need to develop an effective automatic indexing method. In this paer, we investigate automatic indexing methods that can retrieve information effectively from Korean OCR text database with the character-level recognition ratio of 90%. Experimental result shows that 2-gram indexing provides similar retrieval effectiveness of morpheme-based indexing for the Korean OCR text database.

  • PDF

A Distinction of the Korean Character, Chinese Character and English Character using the Threshold Stroke Density (임계 획 밀도를 이용한 한글, 한자, 영문구분)

  • 원남식
    • Journal of Korea Society of Industrial Information Systems
    • /
    • v.5 no.4
    • /
    • pp.32-38
    • /
    • 2000
  • It is an important factor to distinguish the kind of the character for increasing recognition rate before the character recognition in the document recognition system composed of the multi-font and multi-letter. All the letters of each country have a various men characteristic in the each composition. In this paper, we used the stroke density as a method to distinguish the letter, and it has been adopted Korean, English and Chinese character. Input data is processed by the normalization to adopt multi-font document. Proposed method has been proved by the results of experiment the fact that the distinction probability of the Korean and English is more than 80%.

  • PDF

Signal analysis of Hangul shaped Chipless RFID Tag (한글형 Chipless RFID tag 신호의 분석)

  • Ryu, Beongju;Lee, Jehun;Koh, Jinhwan
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.38A no.12
    • /
    • pp.983-990
    • /
    • 2013
  • In this paper, we proposed a Hangul type chipless RFID tag, which has better legibility than the conventional chipless RFID tag not only to a computer but also to a human. We made consonant model, vowel model and whole character model by WIPL tool and checked the applicability of Hangul type chipless RFID tag. We obtain the RCS pattern of each character by simulation. Finally, We classify the character from input data in noisy environment using a variance of the data.

A Proposal for Roman Representation of Hangul Characters (한글 문자의 로마문자 표기에 대한 제안)

  • Kang, Joo-Sang
    • Annual Conference on Human and Language Technology
    • /
    • 1989.10a
    • /
    • pp.10-14
    • /
    • 1989
  • 한글문자를 기계화하기 위하여 로마문자로 표기하는 방법에 대한 새로운 제안을 한다. 현재 남한안이나 북한안은 서로 이견을 보이고 있어서 국제적 합의에 이르지 못하고 있다. 본 제안에서는 남, 북한 안과는 달리 영문자의 대문자와 소문자를 모두 활용하며 다양한 모음의 구성에서 음성학적으로 표기한다. 이 표기법은 자체의 합리성, 국제표준과의 호환성 판독의 편리성, 음성인식에의 이용성등에서 기존 표기체계보다 유리하다.

  • PDF

한글 문자의 서체 분류

  • Kim, Sam-Su;Kim, Su-Hyeong
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2002.05a
    • /
    • pp.113-118
    • /
    • 2002
  • 본 논문에서는 한글 문자의 세리프(serif) 계열과 산세리프(sans-serif) 계열의 분류를 위한 특징을 제안한다. 한글의 서체는 세로획의 시작 부분에 장식 세리프(돌기)가 있는 세리프 계열과 그렇지 않은 산세리프 계열로 나눌 수 있다. 제안하는 한글 문자의 서체 분류 방법은 세리프 형태에서 추출한 특징을 이용하여 세리프 또는 산세리프 클래스로 분류하고, 각 클래스별로 적합한 특징 및 분류기를 학습하여 보다 다양한 서체를 인식하도록 계층적으로 설계한다. 제안한 특징의 유용성을 입증하기 위한 실험은 명조, 바탕, 궁서, 고딕, 돋움, 굴림 서체의 3,000개 낱자 영상에 적용하였다.

  • PDF

A Method For the Recognition of Printed Korean Characters (한글 문자의 전자계산조직에 적응하기 위한 특징추출에 관한 연구(I))

  • 이주근
    • Journal of the Korean Institute of Telematics and Electronics
    • /
    • v.6 no.4
    • /
    • pp.8-19
    • /
    • 1969
  • This paper attempts to analyize struture of the Letters for the Purpose of makin grecognition of Han-Gelul printed and described the method of recogniton and design of the optimum system. For the reason of the Consistency of Han-Geul (korean letters) combined with Consonants and vouels, the number of the words used in the daily living is about 2,000words. for this reason the composition of the recognition system is complicated, and therfore, this paper is pursued to recearch to handle the separate way ineach form of Letter between consonant and vouel. and the further description of this paper also indicates us the many parts of savings of elements when the character is extracted as logic system in letter composition.

  • PDF