• 제목/요약/키워드: Optical Character Recognition

검색결과 182건 처리시간 0.026초

시각장애인의 라이프 사이클을 지원하는 인공지능 웨어러블 플랫폼 (Artificial intelligence wearable platform that supports the life cycle of the visually impaired)

  • 박시웅;김정은;강현서;박형준
    • Journal of Platform Technology
    • /
    • 제8권4호
    • /
    • pp.20-28
    • /
    • 2020
  • 본 논문에서는 시각장애인의 라이프 사이클을 사전에 학습하여 시각장애인의 자립생활을 돕는 적정기술로 음성인식 기반 스마트 웨어러블 디바이스, 스마트 기기 및 웹 AI서버를 포함하는 음성, 사물 및 문자 인식 플랫폼을 제안하였다. 시각장애인용 웨어러블 기기는 착용편의성과 사물인식기능 효율을 높이기 위해 리버스 넥밴드 구조로 설계하여 제작하였으며, 웨어러블 기기에 부착된 고감도 소형 마이크와 스피커는 웨어러블 기기와 연동된 스마트기기의 앱으로 구성된 음성인식 인터페이스 기능을 지원하도록 구성하였다. 음성, 사물 및 광학문자 인식 서비스는 웹 AI 서버에서 오픈소스 및 구글 API를 활용하였고, 서비스 플랫폼의 음성, 사물 및 광학문자 인식 정밀도는 실험을 통하여 평균 90%이상 달성하였음을 확인하였다.

  • PDF

측면윤곽 패턴을 이용한 접합 문자 분할 연구 (Character Segmentation using Side Profile Pattern)

  • 정민철
    • 지능정보연구
    • /
    • 제10권3호
    • /
    • pp.1-10
    • /
    • 2004
  • 본 논문에서는 영문 인쇄체의 접합 문자를 분할하는 새로운 알고리듬을 제안한다. 본 논문에서 제안하는 문자 분할의 접근 방식은 특징을 기반으로 한 접근 방식(feature-based approaches)과 인식을 기반으로 한 접근 방식(recognition-based approaches)의 단점을 보안한 새로운 문자 분할 방법이다. 접합 문자의 측면 윤곽 특징을 정의하고, 그 측면 윤곽 특징을 이용하여 문자 인식의 도움 없이도 접합 문자 내의 문자를 일차 내정하여 분할 한 후 다시 측면 윤곽 특징을 이용하여 문자 분할을 최종 확정한다. 또한 본 논문에서는 분할 비용을 정의하는데, 분할 비용은 최적의 경로로 문자 분할을 수행하도록 한다. 제안된 문자 분할의 성능은 U.S. 메일에서 주소를 자동으로 인식하여 메일을 자동으로 도착지별로 분류하는 시스템(Envelope Reader System)을 이용해 구해졌다. 3359개의 메일이 실험되어졌는데, 제안된 문자 분할 알고리즘에 의해 분류율이 $68.92\%$에서 $80.08\%$로 성능이 향상되었다.

  • PDF

인쇄체 한글의 광학적 인식을 위한 다중 MACE 필터의 합성 (Synthesis of Multiplexed MACE Filter for Optical Korean Character Recognition)

  • 김정우;김철수;배장근;도양회;김수중
    • 한국통신학회논문지
    • /
    • 제19권12호
    • /
    • pp.2364-2375
    • /
    • 1994
  • 효율적인 인쇄체 한글 인식을 위하여 다중 최소평균 상관 에너지 필터를 제안하였다. 제안된 방법은 기존의 나무구조 알고리듬의 단점인 인식시스템의 방대함과 인식방법의 복잡함을 해결하였다. 오직 하나의 자음 MMACE 필터와 모음 MMACE 필터를 사용하여 완전한 한글을 인식하였다. 각 MMACE 필터는 24개의 자모음으로 합성된 4개의 K-tuple MACE 필터를 이용하여 다중화시켰다. 따라서 제안된 MMACE 필터의 필터평면과 상관분포 평면은 4개의 부평면으로 나누어 진다. 각 상관분포 부평면으로 한글 인식을 위한 코드를 얻었다. 얻어진 코드와 컴퓨터에 내장된 자모음을 인식하기 위한 진리표와 비교하였다. 일치하는 코드의 해당자모음을 찾아 출력상관평면상의 상관첨두 위치에 치환하면 완전한 한글을 인식할 수 있다. 컴퓨터 시뮬레이션과 광 실험을 통하여 제안된 MMACE 필터를 이용한 한글 인식 시스템의 높은 변별력을 확인하였다.

  • PDF

한글 음식 메뉴 인식을 위한 OCR 기반 어플리케이션 개발 (Development an Android based OCR Application for Hangul Food Menu)

  • 이규철;유지상
    • 한국정보통신학회논문지
    • /
    • 제21권5호
    • /
    • pp.951-959
    • /
    • 2017
  • 본 논문에서는 스마트폰으로 음식 메뉴를 촬영한 영상으로부터 글자를 인식하는 안드로이드 기반의 한글 음식 메뉴 인식 어플리케이션을 설계하고 구현한다. Optical Character Recognition (OCR) 기술은 크게 전처리, 인식 그리고 후처리 과정으로 구분된다. 전처리 과정에서는 Maximally Stable Extremal Regions (MSER) 기법을 이용하여 글자를 추출한다. 인식 과정에서는 무료 OCR 엔진인 Tesseract-OCR을 이용하여 글자를 인식한다. 후처리 과정에서는 음식 메뉴에 대한 사전 DB를 이용하여 잘못된 결과를 수정한다. 제안하는 기법의 성능을 평가하기 위해 실제 메뉴판을 DB로 이용하여 인식 성능을 비교 측정하는 실험을 진행하였다. 구글 플레이스토어에 있는 글자 인식 어플리케이션인 OCR Instantly Free, Text Scanner 그리고 Text Fairy와 인식률 측정 실험을 진행하였으며 실험 결과 제안하는 기법이 다른 기법보다 평균적으로 14.1% 높은 인식률을 보여주는 것을 확인하였다.

Convolutional Neural Networks for Character-level Classification

  • Ko, Dae-Gun;Song, Su-Han;Kang, Ki-Min;Han, Seong-Wook
    • IEIE Transactions on Smart Processing and Computing
    • /
    • 제6권1호
    • /
    • pp.53-59
    • /
    • 2017
  • Optical character recognition (OCR) automatically recognizes text in an image. OCR is still a challenging problem in computer vision. A successful solution to OCR has important device applications, such as text-to-speech conversion and automatic document classification. In this work, we analyze character recognition performance using the current state-of-the-art deep-learning structures. One is the AlexNet structure, another is the LeNet structure, and the other one is the SPNet structure. For this, we have built our own dataset that contains digits and upper- and lower-case characters. We experiment in the presence of salt-and-pepper noise or Gaussian noise, and report the performance comparison in terms of recognition error. Experimental results indicate by five-fold cross-validation that the SPNet structure (our approach) outperforms AlexNet and LeNet in recognition error.

부재 일람표 도면 인식을 활용한 증강현실 배근모델 자동 생성 (Automated Bar Placing Model Generation for Augmented Reality Using Recognition of Reinforced Concrete Details)

  • 박우열;안성훈
    • 한국건축시공학회지
    • /
    • 제20권3호
    • /
    • pp.289-296
    • /
    • 2020
  • 본 연구는 철근 배근과 관련된 증강현실을 구현할 수 있도록 2D 도면에서 배근 정보를 자동으로 추출하여 3D 배근 모델을 생성하는 방법론을 제시하였다. 사용자가 쉽게 도면정보를 획득할 수 있도록 휴대용 단말기에 내장된 카메라를 이용하여 도면을 촬영한 후 화상 인식(Image Recogni-tion)과 문자 인식(OCR; Optical Character Recognition) 도구를 활용하여 배근 정보를 추출하는 방법을 제시하였다. 또한, 게임 엔진을 활용하여 도면에서 추출된 정보를 입력받아 자동으로 3D 부재를 모델링하고 이를 실제 이미지와 중첩해서 배근 모델을 검토할 수 있는 증강현실 앱을 구현하였다. 기존에 개발된 프로그래밍 도구를 활용하여 제시한 방법론에 적용할 수 있도록 세부 내용을 기술하였으며, 건설현장에서 전형적인 부재를 대상으로 철근 배근 증강현실 모델을 구현한 결과를 검토하였다. 제시된 증강현실 배근 모델 자동 생성 방법론은 배근 교육이나 시공검토에 활용될 수 있을 것으로 기대된다.

세탁물 관리를 위한 문자인식 딥러닝 모델 경량화 (Lightweight Deep Learning Model of Optical Character Recognition for Laundry Management)

  • 임승진;이상협;박장식
    • 한국산업융합학회 논문집
    • /
    • 제25권6_3호
    • /
    • pp.1285-1291
    • /
    • 2022
  • In this paper, we propose a low-cost, low-power embedded environment-based deep learning lightweight model for input images to recognize laundry management codes. Laundry franchise companies mainly use barcode recognition-based systems to record laundry consignee information and laundry information for laundry collection management. Conventional laundry collection management systems using barcodes require barcode printing costs, and due to barcode damage and contamination, it is necessary to improve the cost of reprinting the barcode book in its entirety of 1 billion won annually. It is also difficult to do. Recognition performance is improved by applying the VGG model with 7 layers, which is a reduced-transformation of the VGGNet model for number recognition. As a result of the numerical recognition experiment of service parts drawings, the proposed method obtained a significantly improved result over the conventional method with an F1-Score of 0.95.

A Vehicular License Plate Recognition Framework For Skewed Images

  • Arafat, M.Y.;Khairuddin, A.S.M.;Paramesran, R.
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권11호
    • /
    • pp.5522-5540
    • /
    • 2018
  • Vehicular license plate (LP) recognition system has risen as a significant field of research recently because various explorations are currently being conducted by the researchers to cope with the challenges of LPs which include different illumination and angular situations. This research focused on restricted conditions such as using image of only one vehicle, stationary background, no angular adjustment of the skewed images. A real time vehicular LP recognition scheme is proposed for the skewed images for detection, segmentation and recognition of LP. In this research, a polar co-ordinate transformation procedure is implemented to adjust the skewed vehicular images. Besides that, window scanning procedure is utilized for the candidate localization that is based on the texture characteristics of the image. Then, connected component analysis (CCA) is implemented to the binary image for character segmentation where the pixels get connected in an eight-point neighbourhood process. Finally, optical character recognition is implemented for the recognition of the characters. For measuring the performance of this experiment, 300 skewed images of different illumination conditions with various tilt angles have been tested. The results show that proposed method able to achieve accuracy of 96.3% in localizing, 95.4% in segmenting and 94.2% in recognizing the LPs with an average localization time of 0.52s.

효과적인 도서목록 검색을 위한 개선된 OCR알고리즘에 관한 연구 (Improvement OCR Algorithm for Efficient Book Catalog RetrievalTechnology)

  • 하문;백영현;문성룡
    • 전자공학회논문지CI
    • /
    • 제47권1호
    • /
    • pp.152-159
    • /
    • 2010
  • 본 논문에서는 기울어진 문자, 다양한 크기, 글씨체, 흐린 문자를 포함한 입력영상의 문자 복원과 인식, 효율적인 도서 검색을 위한 광학문자인식 알고리즘을 제안한다. 본 논문에서 제안한 광학문자 인식알고리즘은 검출부와 인식부로 구성되며, 검출부에서는 복잡한 배경에서 정확한 도서 영역 검출을 위하여 로버츠 에지 연산자와 허도로프 거리 알고리즘을 적용하여 필요한 영역을 검출하였다. 또한 인식부에서는 문자의 크기와 경사도, 부분 손실 등의 영상에 강인성을 갖는 바이큐빅 보간법을 적용하여 데이터 손실 복원과, 반자동 기울기를 갖는 입력 영상의 보정을 하였다. 모의실험 결과 기존 알고리즘 보다 인식률에서는 6%, 검색시간에서는 1.077초 더 우수함을 확인하였다.

OCR 엔진 기반 분류기 애드온 결합을 통한 이미지 내부 텍스트 인식 성능 향상 (Scene Text Recognition Performance Improvement through an Add-on of an OCR based Classifier)

  • 채호열;석호식
    • 전기전자학회논문지
    • /
    • 제24권4호
    • /
    • pp.1086-1092
    • /
    • 2020
  • 일상 환경에서 동작하는 자율 에이전트를 구현하기 위해서는 이미지나 객체에 존재하는 텍스트를 인식하는 기능이 필수적이다. 주어진 이미지에 입력 변환, 특성 인식, 워드 예측을 적용하여 인식된 텍스트에 존재하는 워드를 출력하는 과정에 다양한 딥러닝 모델이 활용되고 있으며, 딥뉴럴넷의 놀라운 객체 인식 능력으로 인식 성능이 매우 향상되었지만 실제 환경에 적용하기에는 아직 부족한 점이 많다. 본 논문에서는 인식 성능 향상을 위하여 텍스트 존재 영역 감지, 텍스트 인식, 워드 예측의 파이프라인에 OCR 엔진과 분류기로 구성된 애드온을 추가하여 기존 파이프라인이 인식하지 못한 텍스트의 인식을 시도하는 접근법을 제안한다. IC13, IC15의 데이터 셋에 제안 방법을 적용한 결과, 문자 단위에서 기존 파이프라인이 인식하는데 실패한 문자의 최대 10.92%를 인식함을 확인하였다.