• 제목/요약/키워드: Tesseract OCR

검색결과 24건 처리시간 0.024초

온톨로지를 이용한 tesseract 기반의 OCR 모델 인식률 향상에 관한 연구 (A Study on the Improvement of Tesseract-based OCR Model Recognition Rate using Ontology)

  • 황치곤;윤대열;윤창표
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.438-440
    • /
    • 2021
  • 기계학습의 발전에 따라 다양한 분야에 인공지능 기법이 적용되고 있다. 이 분야 중 이미지에 있는 문자를 텍스트로 변환하는 OCR 기법이 있다. HP에서 개발된 tesseract는 그 기법의 하나다. 그러나 이미지의 문자를 인식하는 인식률이 아직은 낮다. 이를 위해 본 연구에서는 온톨로지를 이용하여 문맥을 인지시키는 후처리 과정을 통해서 이미지의 문자 변환율에 향상을 기하고자 한다.

  • PDF

A Comparative Study on OCR using Super-Resolution for Small Fonts

  • Cho, Wooyeong;Kwon, Juwon;Kwon, Soonchu;Yoo, Jisang
    • International journal of advanced smart convergence
    • /
    • 제8권3호
    • /
    • pp.95-101
    • /
    • 2019
  • Recently, there have been many issues related to text recognition using Tesseract. One of these issues is that the text recognition accuracy is significantly lower for smaller fonts. Tesseract extracts text by creating an outline with direction in the image. By searching the Tesseract database, template matching with characters with similar feature points is used to select the character with the lowest error. Because of the poor text extraction, the recognition accuracy is lowerd. In this paper, we compared text recognition accuracy after applying various super-resolution methods to smaller text images and experimented with how the recognition accuracy varies for various image size. In order to recognize small Korean text images, we have used super-resolution algorithms based on deep learning models such as SRCNN, ESRCNN, DSRCNN, and DCSCN. The dataset for training and testing consisted of Korean-based scanned images. The images was resized from 0.5 times to 0.8 times with 12pt font size. The experiment was performed on x0.5 resized images, and the experimental result showed that DCSCN super-resolution is the most efficient method to reduce precision error rate by 7.8%, and reduce the recall error rate by 8.4%. The experimental results have demonstrated that the accuracy of text recognition for smaller Korean fonts can be improved by adding super-resolution methods to the OCR preprocessing module.

라즈베리파이와 OCR기반의 포터블 차량 번호판 인식기 모듈 개발에 관한 연구 (A Study on Raspberry Pi and OCR-based Vehicle License Plate Recognition Portable Module Development)

  • 권혁호;박성현;임준호;장성원;곽태원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.615-618
    • /
    • 2019
  • 이 모듈은 오픈소스인 Tesseract OCR 및 Open CV 라이브러리와 Raspberry Pi를 사용하여 저렴한 비용으로 구현합니다. 컴팩트한 사이즈로 사람이 직접 들고 움직이면서도 사용이 가능하며 사용자의 니즈에 따라서 한 곳에 위치하여도 사용 가능합니다. Open CV 라이브러리를 사용하여 이미지 이진화, 노이즈 필터링 후에 흑백 이미지를 만들고 윤곽선 검출 알고리즘을 통해서 번호판 영역을 추출하여 Tesseract OCR 엔진을 사용해서 차량 번호판이 추출된 이미지에서 차량 번호를 인식 합니다. 인식된 번호는 Tkinter 와 Python, 데이터베이스를 활용하여 구현된 GUI프로그램을 통해서 유료주차장(선불, 후불) 또는 아파트에서 사용할 수 있는 주차장 관리 서비스를 함께 제공합니다.

딥러닝을 이용한 한글 OCR 정확도 향상에 대한 연구 (A Study on Improvement of Korean OCR Accuracy Using Deep Learning)

  • 강가현;고지현;권용준;권나영;고석주
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 춘계학술대회
    • /
    • pp.693-695
    • /
    • 2018
  • 다음은 본 논문에서는 딥러닝을 통한 한글 OCR 정확도 향상을 제안한다. OCR은 인쇄되거나 손으로 쓴 문자를 광학적 방법으로 감지 인식하여 디지털로 인코딩하는 프로그램이다. 현재 가장 많이 쓰이는 tesseract OCR의 경우, 영문 인식의 정확도가 높다. 하지만 한글은 복잡한 구조에 비해 학습 데이터가 적어 정확도가 떨어진다. 따라서 이 연구에서는 이미지 프로세싱을 통해 원하는 이미지에서 글자 영역을 추출하고, 이를 학습 데이터로 활용한 딥러닝으로 한글 OCR의 정확도를 향상시키는 방법을 제안한다. 기존 영문과 숫자 및 몇 가지 언어에만 국한되어 발전해왔던 OCR을 다양한 언어에도 응용할 수 있을 것으로 기대된다.

  • PDF

Tesseract OCR 기반 인쇄 서적의 키워드 모니터링 시스템 설계 (Design of keyword monitoring system of printing paper based on Tesseract OCR)

  • 이주찬;김무중;유윤섭
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 추계학술발표대회
    • /
    • pp.606-607
    • /
    • 2017
  • 디지털 정보 처리 및 습득 속도에 대한 관심이 높아지면서 이와 관련된 많은 연구가 수행되고 있지만 아날로그 정보에 대한 연구는 많이 부족하다. 따라서 본 논문에서는 자동으로 책을 넘기고 각 페이지의 시잔을 촬영하여 컴퓨터로 전송한 후에 Tesserac-OCR을 이용하여 이를 디지털화 하여 저장하고 사용자가 원하는 키워드가 존재하는 페이지를 찾아 출력하는 시스템을 설계 및 구현한다.

한글 음식 메뉴 인식을 위한 OCR 기반 어플리케이션 개발 (Development an Android based OCR Application for Hangul Food Menu)

  • 이규철;유지상
    • 한국정보통신학회논문지
    • /
    • 제21권5호
    • /
    • pp.951-959
    • /
    • 2017
  • 본 논문에서는 스마트폰으로 음식 메뉴를 촬영한 영상으로부터 글자를 인식하는 안드로이드 기반의 한글 음식 메뉴 인식 어플리케이션을 설계하고 구현한다. Optical Character Recognition (OCR) 기술은 크게 전처리, 인식 그리고 후처리 과정으로 구분된다. 전처리 과정에서는 Maximally Stable Extremal Regions (MSER) 기법을 이용하여 글자를 추출한다. 인식 과정에서는 무료 OCR 엔진인 Tesseract-OCR을 이용하여 글자를 인식한다. 후처리 과정에서는 음식 메뉴에 대한 사전 DB를 이용하여 잘못된 결과를 수정한다. 제안하는 기법의 성능을 평가하기 위해 실제 메뉴판을 DB로 이용하여 인식 성능을 비교 측정하는 실험을 진행하였다. 구글 플레이스토어에 있는 글자 인식 어플리케이션인 OCR Instantly Free, Text Scanner 그리고 Text Fairy와 인식률 측정 실험을 진행하였으며 실험 결과 제안하는 기법이 다른 기법보다 평균적으로 14.1% 높은 인식률을 보여주는 것을 확인하였다.

오픈소스를 이용한 문자/음성 인식 및 번역 앱 개발 (Text/Voice Recognition & Translation Application Development Using Open-Source)

  • 윤태진;서효종;김도헌
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2017년도 제56차 하계학술대회논문집 25권2호
    • /
    • pp.425-426
    • /
    • 2017
  • 본 논문에서는 Google에서 지원하는 오픈소스인 Tesseract-OCR을 이용한 문자/음성 인식 및 번역 앱에 대해 제안한다. 최근 한국어를 포함한 외국어 인식과 번역기능을 이용한 다양한 스마트폰 앱이 개발되어 여행에 필수품으로 자리잡고 있다. 스마트폰의 카메라기능을 이용하여 촬영한 영상을 인식률을 높이도록 처리하고, Crop기능을 넣어 부분 인식기능을 지원하며, Tesseract-OCR의 train data를 보완하여 인식률을 높이고, Google 음성인식 API를 이용한 음성인식 기능을 통해 인식된 유사한 문장들을 선택하도록 하고, 이를 번역하고 보여주도록 개발하였다. 번역 기능은 번역대상 언어와 번역할 언어를 선택할 수 있고 기본적으로 영어, 한국어, 일본어, 중국어로 번역이 가능하다. 이 기능을 이용하여 차량번호 인식, 사진에 포함된 글자를 통한 검색 등 다양한 응용분야에 맞게 앱을 개발할 수 있다.

  • PDF

오픈소스 기반 OCR의 한국어 인식성능 비교분석에 관한 연구 (Comparative Analysis of Korean Language Recognition Performance in Open Source-Based OCR)

  • 김정섭;김현정;유상현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.471-472
    • /
    • 2023
  • 문서 전자화 시스템의 도입에 따라 OCR에 관련된 많은 연구가 진행되고 있으며, 현재 넓은 분야에서 OCR을 활용 중이다. 그러나 OCR 라이브러리들의 한국어 인식성능에 어느 정도 차이가 있는지에 대한 의문이 생기고 있다. 본 논문에서는 현재 사용 중인 OCR 라이브러리의 한국어 인식성능을 비교, 분석하였고 Tesseract OCR이 더 인식성능이 좋다는 결과를 얻었다.

스마트폰 카메라 기반 아동 교육용 산수 블록 인식 애플리케이션 개발 (Development of a Blocks Recognition Application for Children's Education using a Smartphone Camera)

  • 박상아;오지원;홍인식;남윤영
    • 인터넷정보학회논문지
    • /
    • 제20권4호
    • /
    • pp.29-38
    • /
    • 2019
  • 현재 정보사회는 빠르게 격변하며 다양한 분야에서 혁신과 창의성을 요구하고 있으며 논리적 사고의 근간이 될 수 있는 수학의 중요성이 강조되고 있다. 본 논문의 목적은 아동들에게 수학 학습에 대한 동기와 흥미를 유발하기 위해 아동들이 손쉽게 사용할 수 있는 교구를 이용하여 수학영역의 논리적인 사고가 더욱 확장되고 자발적 학습이 일어날 수 있는 수학교육 애플리케이션을 개발하는 것이다. 본 논문에서는 스마트 기기와 블록을 이용하여 수학 교육 애플리케이션을 설계하고 구현하였다. 애플리케이션의 주 기능은 카메라를 이용한 촬영과 수식 계산 값 확인이다. 아동이 산수 교육용 블록을 이용해 수식을 만든 뒤 카메라를 이용하여 블록을 촬영하면 자신이 만든 수식의 계산 값을 직접 확인할 수 있다. 촬영한 이미지의 전 처리 과정과 텍스트 추출, 문자인식은 OpenCV 라이브러리와 Tesseract-OCR 라이브러리로 구현하였다.

Emgu CV를 이용한 자동차 번호판 자동 인식 프로그램의 성능 평가에 관한 연구 (Study on Performance Evaluation of Automatic license plate recognition program using Emgu CV)

  • 김남우;허창우
    • 한국정보통신학회논문지
    • /
    • 제20권6호
    • /
    • pp.1209-1214
    • /
    • 2016
  • 자동차 번호판 인식은 대중적인 감시 기술 중의 한 종류로서, 주어진 비디오나 영상 내 광학문자 인식을 수반한다. 번호판 인식은 자동차 번호판 국부화, 번호판의 크기, 차원, 명암대비, 밝기를 조정하는 정규화, 개별문자를 얻어내는 문자 분할, 문자를 인식하는 광학 문자 인식, 번호판의 형태, 크기, 위치 들이 연도별, 지역별로 차이가 있는 번호판들의 데이터베이스를 비교하여 구문 분석을 하는 절차를 거친다. 본 논문에서는 EmguCV를 이용하여 구현한 번호판 감지를 수행하여 위치를 찾아내고, 오픈 소스 광학 문자 인식 엔진으로 잘 알려져 있는 테서렉트 OCR을 이용하여 번호판의 문자를 인식하는 자동 인식 프로그램을 구현하고 번호판의 촬영 각도, 크기, 밝기에 대한 성능평가 결과에 관해 기술하였다.