• 제목/요약/키워드: OCR(Optical Character Recognition)

검색결과 135건 처리시간 0.024초

나이브 베이즈 분류기와 혼동 행렬을 이용한 OCR에서의 철자 교정 (Using Naïve Bayes Classifier and Confusion Matrix Spelling Correction in OCR)

  • 노경목;김창현;천민아;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.310-312
    • /
    • 2016
  • OCR(Optical Character Recognition)의 오류를 줄이기 위해 본 논문에서는 교정 어휘 쌍의 혼동 행렬(confusion matrix)과 나이브 베이즈 분류기($na{\ddot{i}}ve$ Bayes classifier)를 이용한 철자 교정 시스템을 제안한다. 본 시스템에서는 철자 오류 중 한글에 대한 철자 오류만을 교정하였다. 실험에 사용된 말뭉치는 한국어 원시 말뭉치와 OCR 출력 말뭉치, OCR 정답 말뭉치이다. 한국어 원시 말뭉치로부터 자소 단위의 언어 모델(language model)과 교정 후보 검색을 위한 접두사 말뭉치를 구축했고, OCR 출력 말뭉치와 OCR 정답 말뭉치로부터 교정 어휘 쌍을 추출하고, 자소 단위로 분해하여 혼동 행렬을 만들고, 이를 이용하여 오류 모델(error model)을 구축했다. 접두사 말뭉치를 이용해서 교정 후보를 찾고 나이브 베이즈 분류기를 통해 확률이 높은 교정 후보 n개를 제시하였다. 후보 n개 내에 정답 어절이 있다면 교정을 성공하였다고 판단했고, 그 결과 약 97.73%의 인식률을 가지는 OCR에서, 3개의 교정 후보를 제시하였을 때, 약 0.28% 향상된 98.01%의 인식률을 보였다. 이는 한글에 대한 오류를 교정했을 때이며, 향후 특수 문자와 숫자 등을 복합적으로 처리하여 교정을 시도한다면 더 나은 결과를 보여줄 것이라 기대한다.

  • PDF

문서 처리 자동화를 위한 다양한 표 유형에서 표 구조 인식 방법 (Structure Recognition Method in Various Table Types for Document Processing Automation)

  • 이동석;권순각
    • 한국멀티미디어학회논문지
    • /
    • 제25권5호
    • /
    • pp.695-702
    • /
    • 2022
  • In this paper, we propose the method of a table structure recognition in various table types for document processing automation. A table with items surrounded by ruled lines are analyzed by detecting horizontal and vertical lines for recognizing the table structure. In case of a table with items separated by spaces, the table structure are recognized by analyzing the arrangement of row items. After recognizing the table structure, the areas of the table items are input into OCR engine and the character recognition result output to a text file in a structured format such as CSV or JSON. In simulation results, the average accuracy of table item recognition is about 94%.

CNN 기법을 이용한 자동차 번호판 인식법 연구 (A Study on the Vehicle License Plate Recognition Using Convolutional Neural Networks(CNNs))

  • 응쿤드와나요 세스;채규수
    • 미래기술융합논문지
    • /
    • 제2권4호
    • /
    • pp.7-11
    • /
    • 2023
  • 본 연구에서는 Convolutional Neural Networks(CNNs) 기법을 이용하여 차량 번호판을 인식하는 방법을 제시하였다. 차량 번호판은 일반적으로 차량의 공식 식별 목적으로 사용됩니다. 대부분의 일반적인 광학 문자 인식(OCR) 기술은 문서에 인쇄된 문자를 인식하는 데는 효과적이지만 번호판의 등록 번호는 식별할 수 없다. 그리고 번호판 감지에 대한 기존 접근 방식에서는 차량이 움직이지 않고 정지해 있어야 한다. 번호판 감지에 대한 이러한 문제를 해결하기 위해 CNN 기법을 활용한 번호판 인식 기법을 제안한다. 먼저 획득된 차량 번호판 이미지의 데이터베이스를 생성하고 CNN 기법을 활용하여 자동차 번호판 문자를 인식한다. 본 연구의 결과는 주차관리 시스템과 단속 카메라 등에 유용하게 활용 될 수 있다.

딥러닝 기반 OCR 인식 엔진의 정확도 향상을 위한 전/후처리기 기술 구현 (Implementation of Pre-Post Process for Accuraty Improvement of OCR Recognition Engine Based on Deep-Learning Technology)

  • 장창복;김기봉
    • 융합정보논문지
    • /
    • 제12권1호
    • /
    • pp.163-170
    • /
    • 2022
  • 4차산업 혁명이 도래함에 따라 AI 기술을 적용하는 솔루션 개발이 활발하게 이루어지고 있다. 2017년도부터 금융권, 보험사를 중심으로 AI 기반 RPA(Robotic Process Automation)을 이용한 업무 자동화 솔루션 도입이 이루어지기 시작했으며, 최근에는 RPA 솔루션 도입 단계를 지나 확산하는 시기로 진입하고 있다. 이러한 RPA 솔루션을 이용한 업무 자동화 중에서 각 종 문서들을 이용한 업무 자동화에는 문서내의 문자 정보를 얼마나 정확하게 인식하는지가 매우 중요하다. 이러한 문자 인식은 최근 딥러닝 기술을 도입함으로써 그 정확도가 많이 높아졌지만, 여전히 완벽한 인식 정확도 갖는 인식 모델은 존재하지 않는다. 따라서, 본 논문에서는 딥러닝 기반 문자 인식 엔진에 전/후 처리기 기술을 적용할 경우 얼마나 정확도가 향상되는지를 확인하고 RPA 인식 엔진과 연계 기술을 구현하였다.

Number Plate Detection with a Multi-Convolutional Neural Network Approach with Optical Character Recognition for Mobile Devices

  • Gerber, Christian;Chung, Mokdong
    • Journal of Information Processing Systems
    • /
    • 제12권1호
    • /
    • pp.100-108
    • /
    • 2016
  • In this paper, we propose a method to achieve improved number plate detection for mobile devices by applying a multiple convolutional neural network (CNN) approach. First, we processed supervised CNN-verified car detection and then we applied the detected car regions to the next supervised CNN-verifier for number plate detection. In the final step, the detected number plate regions were verified through optical character recognition by another CNN-verifier. Since mobile devices are limited in computation power, we are proposing a fast method to recognize number plates. We expect for it to be used in the field of intelligent transportation systems.

Optical Character Recognition을 이용한 계측기기 자동 교정시스템구축기술 (Unit Under Tester Auto System using OCR(Optical Character Recognition))

  • 강상무;천영식;김용직
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2011년도 제42회 하계학술대회
    • /
    • pp.1772-1773
    • /
    • 2011
  • 현대기술의 발전에 따라 계측기술 또한 다양하고 복잡하게 변모하였으며, 정밀측정기기의 교정 업무에서는 복잡하고 정확한, 반복적이며 계속적인 데이터 취득을 요구한다. 또한 여러 장비를 사용할 경우, 장시간 소요되는 데이터 취득과 정확한 계측기 사용법 및 고도의 관련기술을 필요로 한다. 그러므로 컴퓨터를 이용 한 계측장비 제어로 측정에 필요한 시간을 최대한 단축하고, 개인오차를 제거할 수 있는 동일한 결과와 쉽게 데이터를 취득할 수 있도록 측정자동화가 필요하다.

  • PDF

이미지 내의 텍스트 데이터 인식 정확도 향상을 위한 멀티 모달 이미지 처리 프로세스 (Multi-modal Image Processing for Improving Recognition Accuracy of Text Data in Images)

  • 박정은;주경돈;김철연
    • 데이타베이스연구회지:데이타베이스연구
    • /
    • 제34권3호
    • /
    • pp.148-158
    • /
    • 2018
  • 광학 문자 인식(OCR)은 텍스트를 포함한 이미지에서 텍스트 영역을 인식하고 이로부터 텍스트를 추출하는 기술이다. 전체 텍스트 데이터 중 상당히 많은 텍스트 정보가 이미지에 포함되어 있기 때문에 OCR은 데이터 분석 분야에 있어 중요한 전처리 단계를 담당한다. 대부분의 OCR 엔진이, 흰 바탕의 검정 글씨의 단순한 형태를 가진 이미지와 같은, 텍스트와 배경의 구분이 뚜렷한 저 복잡도 이미지에 대해서는 높은 인식률을 보이는 반면, 텍스트와 배경의 구분이 뚜렷하지 않은 고 복잡도 이미지에 대해서는 저조한 인식률을 보이기 때문에, 인식률 개선을 위해 입력 이미지를 OCR 엔진이 처리하기 용이한 이미지로 변형하는 전처리 작업이 필요하게 된다. 따라서 본 논문에서는 OCR 엔진의 정확성 증대를 위해 텍스트 라인별로 이미지를 분리하고, 영상처리 기법 기반의 CLAHE 모듈과 Two-step 모듈을 병렬적으로 수행하여 텍스트와 배경 영역을 효율적으로 분리한 후 텍스트를 인식한다. 이어서 두 모듈의 결과 텍스트에 대하여 N-gram방법과 Hunspell 사전을 결합한 알고리즘으로 인식률을 비교하여 가장 높은 인식률의 결과 텍스트를 최종 결과물로 선정하는 방법론을 제안한다. 대표적인 OCR 엔진인 Tesseract와 Abbyy와의 다양한 비교 실험을 통해 본 연구에서 제안하는 모듈이 복잡한 배경을 가진 이미지에서 가장 정확한 텍스트 인식률을 보임을 보였다.

A Methodology for Urdu Word Segmentation using Ligature and Word Probabilities

  • Khan, Yunus;Nagar, Chetan;Kaushal, Devendra S.
    • International Journal of Ocean System Engineering
    • /
    • 제2권1호
    • /
    • pp.24-31
    • /
    • 2012
  • This paper introduce a technique for Word segmentation for the handwritten recognition of Urdu script. Word segmentation or word tokenization is a primary technique for understanding the sentences written in Urdu language. Several techniques are available for word segmentation in other languages but not much work has been done for word segmentation of Urdu Optical Character Recognition (OCR) System. A method is proposed for word segmentation in this paper. It finds the boundaries of words in a sequence of ligatures using probabilistic formulas, by utilizing the knowledge of collocation of ligatures and words in the corpus. The word identification rate using this technique is 97.10% with 66.63% unknown words identification rate.

실시간 글자 인식을 위한 안드로이드 기반의 글자 영역 추출 기술 (A text region extraction algorithm based on Android for real-time text recognition)

  • 이규철;이상용;유지상
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2016년도 추계학술대회
    • /
    • pp.194-196
    • /
    • 2016
  • 본 논문에서는 안드로이드 환경에서 글자 인식을 위한 전처리 과정으로 입력 영상에서 글자 영역만을 추출하는 기법을 제안한다. 대부분의 글자 인식 어플리케이션에서 글자를 인식하는 방법은 RoI(Region of Interest)에 인식하려는 글자를 위치시켜 놓고 사용자가 촬영함으로써 진행된다. 하지만 촬영된 영상 그대로를 인식에 사용하기 때문에 잡음 및 글자가 아닌 영역들을 글자로 인식하는 문제 등으로 인하여 인식률이 현저히 떨어진다. 제안하는 기법에서는 MSER(Maximally Stable Extremal Regions) 기법을 통해 각각의 글자를 추출한 후, 글자의 특성을 이용하여 글자 영역만을 추출한다. 기법의 성능 평가는 무료 OCR(Optical Character Recognition) 엔진인 Tesseract-OCR을 통해 글자 인식률을 비교하였으며, 제안하는 기법을 적용한 글자 인식 시스템이 적용하지 않은 시스템보다 글자의 인식률이 향상되는 것을 확인하였다.

  • PDF

스마트폰 기반 OCR 시스템의 구현 (Implementation of OCR System Based on Smart Phone)

  • 허진규;김현곤;장민석;장석환;권순각;박유현
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2012년도 춘계학술대회
    • /
    • pp.500-503
    • /
    • 2012
  • 스마트폰은 폭발적인 성장세와 더불어 어플리케이션의 시장규모가 크게 증대될 것으로 예상된다. 본 논문에서는 직접 사진을 캡처 시킨 문자들을 텍스트로 변환시켜주고 데이터베이스를 이용해서 그 문자들의 의미를 표현하는 어플리케이션을 구현한다. 어플리케이션의 기능으로는 텍스트로 변환하고자 하는 사진을 찍거나 혹은 앨범에 있는 사진을 불러내어 텍스트로 변환을 시켜서 상대방에게 메시지나 블루투스 등을 이용하여 전송을 가능하게 해줄 수 있으며, 글꼴을 바꾼다거나 크기 등 편집 기능까지 추가적으로 가능하도록 할 수 있다. 이 어플리케이션으로 인한 효과로 인터넷이나 거리를 돌아다니다가 원하는 문구가 있으면 바로 원하는 상대방에게 쉽고 간편하고 빠르게 전달할 수 있는 편리함 등이 있다.

  • PDF