• 제목/요약/키워드: Optical character recognition

검색결과 181건 처리시간 0.027초

초성자소분리 인식에 의한 필기 한글문자의 대분류에 관한 연구 (A Study on the Pre-Classification of Handwritten Hangeul Characters Using Partial Separation and Recognition of Initial Consonants)

  • 안석출;김명기
    • 한국인쇄학회지
    • /
    • 제6권1호
    • /
    • pp.41-57
    • /
    • 1988
  • Recently, it Is required to develop OCR(Optical Character Reader) along with the progress of the information processing system for Hangeul. Characters have to be recognized clearly so that OCR can be applied, Structure analysis method and lump method are used for the recognition of characters, and OCR is now available for the recognition of printed characters and handwritten alphanumeric characters having simple structure by them However, It is known that there should be much more study on the development of handwritten Hangout's OCR. This paper proposed a new method for the handwritten Hangout character recognition. The units of Initial consonant of Hangout are separated and then recognized from the utilization of the position- Information of Hangeul's units from the normalized patterns using the regression line theory. It is carried out for the extraction of the block which exists in the virtual Initial consonant region from the normalized input patterns and the calculation on maximum value (${\beta}$) of likelihood after comparing the features of separated subpattern with the initial consonant dictionary.

  • PDF

테라헤르츠 신호를 이용한 영상의 글자 추출을 위한 화질 개선처리에 대한 연구 (A Study of Image Enhancement Processing for Letter Extraction of Image Using Terahertz Signal)

  • 김성윤;최현근;박인호;김영섭;이용환
    • 반도체디스플레이기술학회지
    • /
    • 제16권3호
    • /
    • pp.111-115
    • /
    • 2017
  • Terahertz waves are superior to conventional X-ray or Magnetic Resonance Tomography(MRI), and the amount of information that can be transmitted is as large as thousands of times that conventional X-ray or MRI. In addition, Terahertz waves have great performance in analyzing an object which have some layered structure. By using this advantage, we can extract the letters of a page by analyzing information such as absorption amount and reflection amount by irradiating a closed book with pulses of various frequencies within gap of a terahertz wave. However, in the image of each page using the Terahertz wave might be obtained various kinds of noise and the different character occlusion region. So, to extract letters from the terahertz image, we must take the noise and occlusion region away. We have been working to enhancement the image quality in various ways, and keep on studying de-noising processing for enhancement about the image quality and high resolution. Finally, we also keep on studying about OCR(Optical Character Recognition) technology, which based on pattern matching technique, to read letters.

  • PDF

고속 처리를 위한 이진 영상 정규화 하드웨어의 설계 및 구현 (Design and Implementation of Binary Image Normalization Hardware for High Speed Processing)

  • 김형구;강선미;김덕진
    • 전자공학회논문지B
    • /
    • 제31B권5호
    • /
    • pp.162-167
    • /
    • 1994
  • The binary image normalization method in image processing can be used in several fields, Especially, its high speed processing method and its hardware implmentation is more useful, A normalization process of each character in character recognition requires a lot of processing time. Therefore, the research was done as a part of high speed process of OCR (optical character reader) implementation as a pipeline structure with host computer in hardware to give temporal parallism. For normalization process, general purpose CPU,MC68000, was used to implement it. As a result of experiment, the normalization speed of the hardware is sufficient to implement high speed OCR which the recognition speed is over 140 characters per second.

  • PDF

영상처리방식에 의한 OMCR 시스템 설계에 관한 연구 (A Study on the Design of OMCR(Optical Mark and Character Reader) System based on Image Processing)

  • 이기돈;김우성
    • 한국통신학회논문지
    • /
    • 제18권9호
    • /
    • pp.1358-1367
    • /
    • 1993
  • 전적으로 수입에 의존하는 마크판독장치(OMR : Optical Mark Reader)와 문자판독장치(OCR : Optical Character Reader)는 Line scan 방식으로 급지장치가 복잡하며 용지에 제한을 받는 등의 단점을 갖는다. 본 논문에서는 새로운 방식인 CCD카메라와 디지타이져를 입력장치로 하여 영상처리와 패턴인식에 근거한 마크와 숫자를 동시에 실시간 인식 가능한 일명 OMCR(Optical Mark and Character Reader) 시스템을 연구, 개발하였다. 또한 착오에 의하여 마크를 잘못 기입함으로써 발생할 수 있는 문제점을 개선하기 위한 표기방법으로 마크 대신에 제한된 7-segment의 및 필기체 숫자형식을 본 논문에서 제안하였다. 대학의 입학원서, 입시답안지, 수강신청, 성적평가표 및 주소에 대한 수만장의 마크용지와 영수증에 포함된 40개 이내인 인쇄체 숫자부분에 대한 문자용지를 실험대상으로 하였다. 실험결과, 마크용지와 문자용지 모두 판독 에러없이 초당 3~4장의 실시간 판독이 가능하였으며 line scan 방식의 OMR이나 OCR이 갖는 단점을 해결하였음을 입증하였다.

  • PDF

Detection and Recognition of Vehicle License Plates using Deep Learning in Video Surveillance

  • Farooq, Muhammad Umer;Ahmed, Saad;Latif, Mustafa;Jawaid, Danish;Khan, Muhammad Zofeen;Khan, Yahya
    • International Journal of Computer Science & Network Security
    • /
    • 제22권11호
    • /
    • pp.121-126
    • /
    • 2022
  • The number of vehicles has increased exponentially over the past 20 years due to technological advancements. It is becoming almost impossible to manually control and manage the traffic in a city like Karachi. Without license plate recognition, traffic management is impossible. The Framework for License Plate Detection & Recognition to overcome these issues is proposed. License Plate Detection & Recognition is primarily performed in two steps. The first step is to accurately detect the license plate in the given image, and the second step is to successfully read and recognize each character of that license plate. Some of the most common algorithms used in the past are based on colour, texture, edge-detection and template matching. Nowadays, many researchers are proposing methods based on deep learning. This research proposes a framework for License Plate Detection & Recognition using a custom YOLOv5 Object Detector, image segmentation techniques, and Tesseract's optical character recognition OCR. The accuracy of this framework is 0.89.

문자 인식 기술을 이용한 데이터베이스 구축 (Building Database using Character Recognition Technology)

  • 한선화;이충식;이준호;김진형
    • 한국정보처리학회논문지
    • /
    • 제6권7호
    • /
    • pp.1713-1723
    • /
    • 1999
  • 문자 인식 기술은 인쇄도니 형태로 존재하는 수많은 정보를 데이터베이스화 할 수 있는 가장 유용한 대안이다. 본 논문에서는 문자 인식 기술을 사용한 데이터베이스 구축의 타당성을 조사하기 위하여, 문자인식기를 사용한 데이터베이스를 시범적으로 구축하였다. 우선 데이터베이스를 구축할 때 문자 인식기의 선택 시 고려하여야 할 사항들을 살펴보고, 이를 기준으로 4가지의 상용 문자 인식기에 대한 인식 실험을 거친 후 그 중 인식 성능이 가장 좋은 것을 선택하였다. 대상 문서로는 다양한 인쇄 품질 및 특성을 갖는 실제 논문집의 초록을 대상으로 삼았으며, 대량 데이터에 대한 인식률 계산을 위해 수작업된 데이터베이스가 있는 KT 테스트 컬렉션[1]을 선택하였다. 실험은 실제 대용량 데이터베이스 구축과 유사한 환경을 만들기 위해, 문서별 학습이나 기울기 보정 등의 사전 작업을 생략하였다. 실험 결과 970편의 논문 요약문에 대해 평균 문자 인식률 90.5%를 보여, 한글 문자 인식 기술이 아직 데이터베이스 구축에 활용되기에는 이르다는 것을 보였다. 문자 인식에 의한 인식 오류에서는 수작업 한 문서에서 발견되는 오류와는 상이한 유형이 많이 발견된다. 본 논문에서는 추후의 연구를 위하여 문자 인식 텍스트에서 나타나는 오류의 유형을 분류하였다.

  • PDF

한글 문자 인식에서의 오인식 문자 교정을 위한 단어 학습과 오류 형태에 관한 연구 (A Study on Word Learning and Error Type for Character Correction in Hangul Character Recognition)

  • 이병희;김태균
    • 한국정보처리학회논문지
    • /
    • 제3권5호
    • /
    • pp.1273-1280
    • /
    • 1996
  • 본 논문에서는 문자 인식 과정을 거치고 난 후에 발생하게 되는 오인식된 문자들 을 언어적 지식을 이용하여 교정하는 문자 인식 후처리에 관하여 논한다. 문자 인식의 오인식 교정시스템의 경우 후보 단어가 많을 때 많은 후보 단어중에서 가장 적당한 단어를 후보 단어로 올려주기 위해서는 여러 가지 정보가 필요하다. 본 논문에서는 이러한 정보로 이용할 수 있는 것으로 단어들의 특성과, 문자 인식에 발생하는 오인식 형태, 단어 학습에 관하여 논한다. 이를 위한 실험으로 15 만여의 단어가 수록된 국어 사전을 이비력하고 초중고 국어교과서에 나타난 단어 들의 사용빈도를 조사하여 국어 사전에 등록된 단어 중에서 10.7%정도가 실제 초중고 국어교과서에 사용되고 있다는 것을 알 수 있었다. 또한 실제 문자 인식 시스템들을 가지고 여러 문서를 입력하고 인식하여 오인식이 자주 일어나는 글자들 의 형태를 분류하여 보았다. 그리고 한국어 처리 관련 서적이나 논문을 처리하고자 한국어에 관련된 책의 찾아보기에 나타난 단어 를 학습시켜 후보 단어들의 다른 인하여 정확한 단어를 예측하기 힘들던 문제를 해결 하고자 하였다.

  • PDF

문자 인식을 이용한 한글 문서 검색 (Hangul Document Retrieval Using Character Recognition)

  • 안재철;오일석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.544-546
    • /
    • 2001
  • 이 논문은 OCR(Optical Character Reader)로 인식된 한글 문서에서의 오인식 경향을 분석하고, 이를 이용한 한글 단어 검색 방법을 제안한다. OCR로 인식된 많은 야의 한글 문서를 기반으로 자모별 인식 빈도수를 계산하고 이를 바탕으로 초성, 중성, 중성별 인식 혼동 행렬(confusion matrix)을 구성하였다. 또한 인식 정보를 적절히 이용하기 Bayes 정리를 이용하였다. 질의어에 대한 오인식 단어의 검색 방법을 제시하고 혼동 행렬과 이 검색 방법을 바탕으로 OCR 기반 단어 검색 시스템을 구축하였다.

  • PDF

슬라브 영상에 포함된 문자영상의 인식을 위한 비전시스템의 개발 (Development of vision system for the recognition of character image which was included at the slab image)

  • 박상국
    • 한국산업정보학회논문지
    • /
    • 제12권1호
    • /
    • pp.95-100
    • /
    • 2007
  • 철강공정에서 소재에 대한 관리를 위해 소재의 전면에 소재 관리문자를 마킹한다. 본 논문은 철강 연주공정에서 생산되는 슬라브 소재 영상에 포함된 소재 관리문자를 실시간으로 인식하기 위한 비전시스템 개발 결과에 대해 기술한다. 문자인식용 비전시스템은 영상획득을 위한 카메라 시스템, 영상을 장거리로 고속 전송하기위한 광 전송시스템, 기존 제어시스템과의 인터페이스를 위한 입 출력 시스템 및 인식결과를 모니터링 하기위한 모니터링 시스템으로 구성된다. 개발된 문자인식용 비전시스템을 실제 철강 연주공정에 설치하여 운용테스트를 실시했다. 테스트를 통해 시스템의 내구성과 신뢰성을 검증하고 최종적으로 문자 인식률을 검증했다. 개발된 시스템에 대해 문자인식 테스트 결과 약 97.4%의 인식률을 가졌다.

  • PDF