• 제목/요약/키워드: Optical character recognition

검색결과 181건 처리시간 0.025초

문자 인식에서 단어 간의 활자 인쇄선 위치 분석과 클래스 분류 (Typographical Analyses and Classes of Characters and Words in Optical Character Recognition)

  • 정민철
    • 정보처리학회논문지B
    • /
    • 제12B권3호
    • /
    • pp.337-342
    • /
    • 2005
  • 본 논문은 활자 인쇄선 분석과 이에 따른 클래스 분류를 제안한다. 활자 인쇄선 분석은 영문 인쇄체 인식에 있어 불가결한 요소이다. 활자 인쇄선 분석은 문자 인식에서 문자 분할을 위한 전처리 단계이다. 본 논문은 두 부분으로 나뉘는데, 첫 부분에서는 단어 간 활자 인쇄선 분석을 통한 단어 활자선 클래스를 정의한다. 두 번째 부분에서는 문자 간 활자 인쇄선 분석을 통한 문자 활자선 클래스를 정의한다. 이렇게 정의된 단어 활자선 클래스와 문자 활자선 클래스는 문자 분할시 정확한 문자 분할을 위하여 사용된다.

OCR 기반의 개인 처방전 관리 시스템 (A Personal Prescription Management System Employing Optical Character Recognition Technique)

  • 김재완;김상태;윤준용;주양익
    • 한국정보통신학회논문지
    • /
    • 제19권10호
    • /
    • pp.2423-2428
    • /
    • 2015
  • 본 논문에서는 모바일 단말을 이용한 광학문자인식(OCR) 기반의 개인 처방전 관리 시스템을 구현하였다. 이 시스템은 사용자 개인처방전의 정보들을 자동으로 인식하여 입력할 수 있는 기술이다. 또한, 문자 인식률을 높이기 위하여 기존의 시스템에 전처리과정을 추가함으로써 성능개선을 하였다. 본 시스템을 이용한 그 응용 예로써 개인 처방전 관리 시스템, 알람 서비스, 의약정보 등을 구현하였다.

옵티컬 라이브러리 시스템에서의 어드레싱을 위한 광학 문자 인식 알고리즘 제안 (Optical Character Recognition for Addressing in Optical Library System)

  • 정우영;양현석;유승헌
    • 정보저장시스템학회논문집
    • /
    • 제11권1호
    • /
    • pp.6-10
    • /
    • 2015
  • Optical library system consists of disc magazines, cabinets, transfer robot and drive. Transfer robot delivers desired disc or magazine in cabinet to drive which reads data of disc. Conventional archive system stores discs in a line and transfer robot moves in one dimension. However, to store more discs, new optical archive system, optical library system, is developed which stores discs in two dimension like bookcase. Transfer robot should know the position and stored data of desired magazine to get correct data. In this paper, addressing algorithm using optical character recognition is proposed. Proposed algorithm is evaluated by experiments with implemented system.

이미지 인식 기반 향상된 개인정보 식별 및 마스킹 시스템 설계 및 구현 (Design and Implementation of Personal Information Identification and Masking System Based on Image Recognition)

  • 박석천
    • 한국인터넷방송통신학회논문지
    • /
    • 제17권5호
    • /
    • pp.1-8
    • /
    • 2017
  • 최근 클라우드, 모바일 등 ICT 기술의 발전으로 소셜 네트워크를 통한 이미지 활용이 급증하고 있다. 이러한 이미지는 개인정보가 포함되어 있어, 개인정보 유출 사고가 발생될 수 있다. 이에 이미지에서 개인정보를 인식하고 마스킹하는 연구가 진행되고 있다. 그러나 기존 이미지에서 개인정보를 인식 하는 방법인 광학 문자 인식은 이미지의 밝기, 명암, 왜곡에 따라 인식률의 변화가 심하여 한글 인식이 미흡한 문제가 있다. 따라서 본 논문에서는 광학 문자 인식 방법을 기반으로 CNN 알고리즘에 딥러닝을 적용하여 이미지 인식 기반 향상된 개인정보 식별 및 마스킹 시스템을 설계 및 구현하였다. 또한 구현된 제안 시스템을 동일한 이미지를 가지고 광학 문자 인식과 개인정보 인식률을 비교평가를 진행하고, 제안 시스템의 얼굴 인식률을 측정하였다. 테스트 결과 제안 시스템의 개인정보 인식률은 광학 문자인식에 비해 32.7% 향상되었으며 얼굴 인식률은 86.6%로 확인되었다.

심플 프레임 마커: 마커 내부 이미지 및 문자 패턴의 인식 및 추적 기법 구현 (Simple Frame Marker: Implementation of In-Marker Image and Character Recognition and Tracking Method)

  • 김혜진;우운택
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.558-561
    • /
    • 2009
  • 본 논문에서는 증강현실에서 마커에 포함된 이미지뿐만 아니라 문자 인식을 지원하기 위한 심플 프레임 마커를 제안한다. 마커 내부에 임의의 패턴 대신에 문자를 삽입하고 문자 인식 알고리즘(Optical Character Recognition)을 사용하여 인식하면 실행 전 학습과정이 필요 없을 뿐만 아니라 문자의 친숙함 때문에 시각적 장애요인도 줄일 수 있다. 따라서 기존의 마커 방식인 이미지뿐만 아니라 문자도 인식하기 위해서 제안된 심플 프레임 마커는 정의된 마커의 가로세로 비율에 따라 이미지타입의 마커(Square SFMarker)인지 문자타입의 마커(Rectangle SFMarker)인지를 구별하고 각기 다른 인식 알고리즘을 적용한다. 또한 문자 인식을 위한 전처리 과정을 줄이기 위해 디자인 단계에서 마커 테두리에 방향정보를 삽입하고, 인식 단계에서는 이 방향 정보를 추출하여 문자 인식을 빠르고 정확하게 수행한다. 마지막으로 매 프레임 문자를 인식하는 알고리즘을 수행 시 추적 속도가 저하되므로, 프레임간 변화량이 적을 때는 이전 프레임의 인식 결과 정보를 사용하여 수행 속도를 높인다.

  • PDF

Emgu CV를 이용한 자동차 번호판 자동 인식 프로그램의 성능 평가에 관한 연구 (Study on Performance Evaluation of Automatic license plate recognition program using Emgu CV)

  • 김남우;허창우
    • 한국정보통신학회논문지
    • /
    • 제20권6호
    • /
    • pp.1209-1214
    • /
    • 2016
  • 자동차 번호판 인식은 대중적인 감시 기술 중의 한 종류로서, 주어진 비디오나 영상 내 광학문자 인식을 수반한다. 번호판 인식은 자동차 번호판 국부화, 번호판의 크기, 차원, 명암대비, 밝기를 조정하는 정규화, 개별문자를 얻어내는 문자 분할, 문자를 인식하는 광학 문자 인식, 번호판의 형태, 크기, 위치 들이 연도별, 지역별로 차이가 있는 번호판들의 데이터베이스를 비교하여 구문 분석을 하는 절차를 거친다. 본 논문에서는 EmguCV를 이용하여 구현한 번호판 감지를 수행하여 위치를 찾아내고, 오픈 소스 광학 문자 인식 엔진으로 잘 알려져 있는 테서렉트 OCR을 이용하여 번호판의 문자를 인식하는 자동 인식 프로그램을 구현하고 번호판의 촬영 각도, 크기, 밝기에 대한 성능평가 결과에 관해 기술하였다.

Low-Quality Banknote Serial Number Recognition Based on Deep Neural Network

  • Jang, Unsoo;Suh, Kun Ha;Lee, Eui Chul
    • Journal of Information Processing Systems
    • /
    • 제16권1호
    • /
    • pp.224-237
    • /
    • 2020
  • Recognition of banknote serial number is one of the important functions for intelligent banknote counter implementation and can be used for various purposes. However, the previous character recognition method is limited to use due to the font type of the banknote serial number, the variation problem by the solid status, and the recognition speed issue. In this paper, we propose an aspect ratio based character region segmentation and a convolutional neural network (CNN) based banknote serial number recognition method. In order to detect the character region, the character area is determined based on the aspect ratio of each character in the serial number candidate area after the banknote area detection and de-skewing process is performed. Then, we designed and compared four types of CNN models and determined the best model for serial number recognition. Experimental results showed that the recognition accuracy of each character was 99.85%. In addition, it was confirmed that the recognition performance is improved as a result of performing data augmentation. The banknote used in the experiment is Indian rupee, which is badly soiled and the font of characters is unusual, therefore it can be regarded to have good performance. Recognition speed was also enough to run in real time on a device that counts 800 banknotes per minute.

Typographical Analyses and Classes in Optical Character Recognition

  • Jung, Min-Chul
    • 한국산학기술학회논문지
    • /
    • 제5권1호
    • /
    • pp.21-25
    • /
    • 2004
  • This paper presents a typographical analyses and classes. Typographical analysis is an indispensable tool for machine-printed character recognition in English. This analysis is a preliminary step for character segmentation in OCR. This paper is divided into two parts. In the first part, word typographical classes from words are defined by the word typographical analysis. In the second part, character typographical classes from connected components are defined by the character typographical analysis. The character typographical classes are used in the character segmentation.

  • PDF

딥러닝 기반의 의료 OCR 기술 동향 (Trends in Deep Learning-based Medical Optical Character Recognition)

  • 윤성연;최아린;김채원;오수민;손서영;김지연;이현희;한명은;박민서
    • 문화기술의 융합
    • /
    • 제10권2호
    • /
    • pp.453-458
    • /
    • 2024
  • 광학 문자 인식(Optical Character Recognition, OCR)은 이미지 내의 문자를 인식하여 디지털 포맷(Digital Format)의 텍스트로 변환하는 기술이다. 딥러닝(Deep Learning) 기반의 OCR이 높은 인식률을 보여줌에 따라 대량의 기록 자료를 보유한 많은 산업 분야에서 OCR을 활용하고 있다. 특히, 의료 산업 분야는 의료 서비스 향상을 위해 딥러닝 기반의 OCR을 적극 도입하였다. 본 논문에서는 딥러닝 기반 OCR 엔진(Engine) 및 의료 데이터에 특화된 OCR의 동향을 살펴보고, 의료 OCR의 발전 방향에 대해 제시한다. 현재의 의료 OCR은 검출한 문자 데이터를 자연어 처리(Natural Language Processing, NLP)하여 인식률을 개선하였다. 그러나, 정형화되지 않은 손글씨(Handwriting)나 변형된 문자에서는 여전히 인식 정확도에 한계를 보였다. 의료 데이터의 데이터베이스(Database)화, 이미지 전처리(Pre-processing), 특화된 자연어 처리를 통해 더욱 고도화된 의료 OCR을 발전시키는 것이 필요하다.

Construction of an PFT database with various clinical information using optical character recognition and regular expression technique

  • Park, Man Young;Park, Rae Woong
    • 인터넷정보학회논문지
    • /
    • 제18권5호
    • /
    • pp.55-60
    • /
    • 2017
  • The pulmonary function test (PFT) is an essential data source for evaluating the effect of drugs on the lungs or the status of lung function. However, the numeric values of PFT cannot be easily used for clinical studies without labor-intensive manual efforts, because PFTs are usually recorded as image files. This study was aimed at constructing a de-identified, open-access PFT database with various clinical information. For constructing the PFT database, optical character recognition (OCR), regular expression, and the parsing technique were used to extract alphanumeric data from the PFT images in a Korean tertiary teaching hospital. This longitudinal observational database contains 413,000 measurements of PFT from 183,000 patients.