• 제목/요약/키워드: 광학문자 인식

검색결과 82건 처리시간 0.025초

문서 처리 자동화를 위한 인보이스 이미지의 구조 인식 방법 (Structure Recognition Method of Invoice Document Image for Document Processing Automation)

  • 이동석;권순각
    • 한국산업정보학회논문지
    • /
    • 제28권2호
    • /
    • pp.11-19
    • /
    • 2023
  • 본 논문은 인보이스 문서 이미지에 문서 처리 자동화를 적용하기 위한 문서 구조 인식 방법과 문서 구조 인식 결과를 토대로 스프레드문서 형태로 출력하는 방법을 제안한다. 딥러닝 OCR 엔진을 통해 문서 내 단어 블록들과 해당 블록들의 문자 인식 결과를 얻는다. 단어 블록의 위치 정보들을 통해 같은 행과 같은 열에 존재하는 단어 블록들을 검출한다. 단어 블록들의 배치 정보를 통해 문서 영역을 분할한다. 문서의 구역 정보를 통해 얻어진 문서 구조를 토대로 스프레드시트의 알맞은 위치에 문자 인식 결과를 입력한다. 실험 결과 제안된 방법을 통한 항목 배치는 평균 92.30%의 정확도를 보인다.

CNN 기법을 이용한 자동차 번호판 인식법 연구 (A Study on the Vehicle License Plate Recognition Using Convolutional Neural Networks(CNNs))

  • 응쿤드와나요 세스;채규수
    • 미래기술융합논문지
    • /
    • 제2권4호
    • /
    • pp.7-11
    • /
    • 2023
  • 본 연구에서는 Convolutional Neural Networks(CNNs) 기법을 이용하여 차량 번호판을 인식하는 방법을 제시하였다. 차량 번호판은 일반적으로 차량의 공식 식별 목적으로 사용됩니다. 대부분의 일반적인 광학 문자 인식(OCR) 기술은 문서에 인쇄된 문자를 인식하는 데는 효과적이지만 번호판의 등록 번호는 식별할 수 없다. 그리고 번호판 감지에 대한 기존 접근 방식에서는 차량이 움직이지 않고 정지해 있어야 한다. 번호판 감지에 대한 이러한 문제를 해결하기 위해 CNN 기법을 활용한 번호판 인식 기법을 제안한다. 먼저 획득된 차량 번호판 이미지의 데이터베이스를 생성하고 CNN 기법을 활용하여 자동차 번호판 문자를 인식한다. 본 연구의 결과는 주차관리 시스템과 단속 카메라 등에 유용하게 활용 될 수 있다.

광학문자 인식을 이용한 여행 정보 공유 시스템의 개발 (The Development of Travel Data Sharing System using the Optical Character Reader.)

  • 박주현;이현동;김동현;조대수
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2018년도 제58차 하계학술대회논문집 26권2호
    • /
    • pp.189-190
    • /
    • 2018
  • 최근에는 여행에 대한 각종 정보가 많이 공유되는 추세이다. 최근 사람들은 소셜 네트워크 서비스를 이용 중이거나 웹 서핑을 하는 도중에 기억하고 싶어 하는 여행지를 단순히 캡처 해놓거나 메모장에 기록해둔다. 이러한 방법은 시간이 지나 많은 데이터가 쌓이면 관리하기 어렵다는 문제가 존재한다. 본 논문에서는 사용자의 편리를 고려하여 사진의 텍스트를 광학식 문자 판독을 활용하여 출력하고 게시 글 형태로 저장할 수 있게 개발하였다. 명소의 위치 또한 자동완성 위치 검색 라이브러리를 통하여 편리 저장이 가능하다. 위치 데이터를 통해 향후 사용자가 근접하고 있는 여행지 또한 제공해줄 수 있도록 구현하였다. 이를 위하여 웹을 통해서 이용할 수도 있으며 실시간 검색과 알림 이벤트를 위해 웹 주소 입력 없이도 앱을 실행할 수 있는 프로그래시브웹 앱을 구현하였다.

  • PDF

YOLO와 OCR 알고리즘에 기반한 시각 장애우를 위한 유통기한 알림 시스템 (Expiration Date Notification System Based on YOLO and OCR algorithms for Visually Impaired Person)

  • 김민수;문미경;한창희
    • 한국전자통신학회논문지
    • /
    • 제16권6호
    • /
    • pp.1329-1338
    • /
    • 2021
  • 점자를 제외한 시각 장애우들이 유통기한을 확인할 수 있는 효과적인 방법이 거의 개발되어 있지 않으며, 이로 인하여 시각 장애우들의 식품 안전성이 위협받고 있다. 본 연구에서는 시각 장애우의 식품 안전성 확보를 위해 실시간 객체 인식 알고리즘(you only look once, YOLO) 및 광학 문자 인식 (optical character recognition, OCR)에 기반한 유통기한 알림 시스템을 개발했다. 제안하는 시스템은 총 4가지 단계로 시각 장애우에게 유통기한 정보를 전달한다: (1) 표적 제품의 바코드 스캔을 통한 제품 확인 (2) 실시간으로 입력되는 제품 영상에서 YOLO 알고리즘을 활용하여 유통기한이 표기된 이미지 영역 검출; (3) 검출된 이미지 영역에서 OCR 알고리즘을 활용하여 유통기한 문자 인식; (4) Text to Speech (TTS) 기술을 활용하여 유통기한 정보를 사용자에게 전달. 성능 평가를 위한 온라인 실험 결과, 앞이 보이지 않는 피험자가 개발한 시스템을 사용해서 제품의 유통기한을 평균 86%의 높은 정확도로 확인할 수 있음이 검증되었다. 이러한 결과는 제안하는 시스템이 저시력자를 포함한 시각 장애우들의 식품 안전성 확보에 이바지할 수 있음을 보여준다.

OCR 기반 스마트 가계부 구현 (Development of Smart Household Ledger based on OCR)

  • 채성은;정기석;이정열;노영주
    • 한국인터넷방송통신학회논문지
    • /
    • 제18권6호
    • /
    • pp.269-276
    • /
    • 2018
  • OCR(광학문자인식)은 컴퓨터 분야에 적용된 지 20년의 역사가 되었고, 자동차 번호판 인식을 통한 주차관리 등 여러 분야에서 응용되어왔다. 본 OCR 기반 스마트 가계부 앱 개발연구에서도 이 기술을 이용하였다. 스마트폰 기반 가계부에서 구매 내역을 수기로 일일이 기입하는 불편을 개선하고자 카메라로 영수증을 촬영해서 구입 목록을 자동으로 정리할 수 있도록 하였다. 이 과정에서 기존의 OCR 기술만으로 영수증의 이미지 문자를 판독하면 인식률이 떨어져서 영상처리기술을 이용하여 영수증 사진의 대비를 조절하는 방법으로 영수증의 문자 인식률을 89%에서 92.5%로 향상하였다.

카메라형 광학식문자판독기술(OCR)을 활용한 오프라인 중고서점의 장서 디지털 데이터화 관리 방안 제안 (An Efficient Management Strategy of A Offline Second-Hand Bookstore With Camera Type OCR Technology)

  • 구자민;함승모;김우제;심현동;류기동
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2014년도 제49차 동계학술대회논문집 22권1호
    • /
    • pp.283-286
    • /
    • 2014
  • 본 논문에서는 카메라형 OCR (Optical Character Reader) 기술을 이용해 오프라인 중고서점의 효율적 장서관리 시스템을 구축하기 위한 디지털 데이터화 관리시스템 방안을 제안한다. OCR은 광학적으로 인식할 수 있는 문자를 컴퓨터가 읽을 수 있도록 하는 기술이다. 원리적으로 문자 한 개를 수십 개의 모눈으로 분할해 특정한 모눈의 흑백 또는 자획형상 특징에 의해 문자를 판독한다. 이 논문에서는 OCR 기술을 활용함으로써 디지털 데이터화의 효과는 물론 적용 환경의 개선효과를 기대해 볼 수 있는 오프라인 중고서점 시장을 목표로 했다. 오프라인 중고서점에서 보유하고 있는 장서의 디지털 데이터화는 기업형 중고서점과의 경쟁에 있어서도 생존을 위해 필요한 요소이다. 카메라형 OCR 기술을 활용한 장서 디지털 데이터화는 오프라인 중고서점 판매자가 도서재고 검색 및 판매 관리 효율을 높이도록 도와줄 뿐 아니라, 도서판매 유형, 소비자 분석과 수요 예측을 가능하게 한다. 또한 소비자에게 오프라인 중고서점에서 보유하고 있는 희귀 장서와 중고서적들을 검색해 구입할 수 있는 편의를 제공할 것이다. 오프라인 중고서점 판매를 촉진하고 활성화시킨다면 출판의 선순환적 구조를 만드는 데 기여할 것으로 예상된다.

  • PDF

연결요소 분석에 기반한 인쇄체 한글 주소와 필기체 한글 주소의 구분 (Classification of Handwritten and Machine-printed Korean Address Image based on Connected Component Analysis)

  • 장승익;정선화;임길택;남윤석
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권10호
    • /
    • pp.904-911
    • /
    • 2003
  • 본 논문에서는 우편봉투 상에 기입된 인쇄체 한글 주소와 필기체 한글 주소를 효과적으로 구분할 수 있는 방법을 제안한다. 문자인식 모듈을 포함하는 각종 응용 시스템에서 입력 영상이 인쇄체인지 필기체인지 구분하는 것은 매우 중요하다. 이는 대부분의 경우 인쇄체 영상과 필기체 영상이 갖는 특징이 상이하여, 각 영상에서의 문자 및 문자열 분리 방법, 문자 인식 방법 둥이 매우 상이하게 개발되기 때문이다. 본 논문에서 제안한 구분 방법은 연결요소 추출 및 병합, 특징 추출, 영상 구분 순으로 수행된다. 연결요소 추출 및 병합 단계에서는 입력영상으로부터 연결요소를 추출한 후 일부 연결요소들에 대하여 병합을 시도하며, 특징 추출 단계에서는 병합결과 얻어진 연결요소들의 그룹들로부터 폭과 위치에 관련된 특징을 추출하고, 영상 구분 단계에서는 추출한 특징을 입력으로 제공받는 다충퍼셉트론을 사용하여 구분을 시도한다. 제안한 방법의 우수성을 증명하기 위해 실제 우편물로부터 추출된 3,147개의 한글 주소 영상을 사용하여 실험한 결과, 98.85%의 구분률을 보여주었다.

OCR과 패턴분석 알고리즘을 활용한 인공지능 기반 기록 자동화 서비스 제안 (Proposal Record Automation Service Based on AI by Using OCR and Pattern Analysis Algorithm)

  • 황윤영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.530-532
    • /
    • 2019
  • 제안하는 서비스는 OCR(Optical Character Recognition, 광학문자인식)과 딥러닝 패턴분석 알고리즘을 활용하여 문서를 효율적으로 관리하는 서비스로 필기를 많이 하는 사용자를 위한 기능을 제공한다. 최근 다양한 분야에서의 머신러닝 기반의 OCR의 활용이 증가했지만 기존의 애플리케이션은 패턴 분석 알고리즘과 통계 기반의 OCR을 혼합하여 사용하기 때문에 필기체에 대한 인식률이 높지 않다. 이에 본 논문에서는 OCR과 패턴분석 알고리즘을 활용하여 필기체에 대한 높은 인식률을 제공하는 서비스를 제안한다.

변형 VGG 모델의 전처리를 이용한 부품도면 문자 인식 성능 개선 (Performance Improvement of Optical Character Recognition for Parts Book Using Pre-processing of Modified VGG Model)

  • 신희란;이상협;박장식;송종관
    • 한국전자통신학회논문지
    • /
    • 제14권2호
    • /
    • pp.433-438
    • /
    • 2019
  • 본 논문에서는 기계 서비스 부품 도면에서 숫자를 인식하기 위하여 입력 영상에 대한 전처리와 딥러닝 모델을 제안한다. 서비스 부품 도면의 숫자를 인식하는데 있는 지시선과 도형에 의한 오검출 또는 오인식을 개선하기 위하여 수학적 형태학 필터링 전처리를 한다. 숫자 인식을 위하여 VGG-16 모델을 축소 변형한 7 개의 계층을 가지는 VGG 모델을 적용함으로써 인식 성능을 개선한다. 서비스 부품 도면의 숫자 인식 실험 결과, 제안하는 방법이 인식률 95.57%, 정확도는 92.82%로 종래의 방법에 현저히 개선된 결과를 얻었다.

컨테이너 BIC-code 인식을 위한 Transformer Network (Transformer Network for Container's BIC-code Recognition)

  • 권희주;강현수
    • 한국산업정보학회논문지
    • /
    • 제27권1호
    • /
    • pp.19-26
    • /
    • 2022
  • 본 논문은 컨테이너의 BIC-code를 인식하기 위한 전처리(pre-processing) 방법에 관한 것으로서, BIC-code가 포함된 관심 영역을 찾고 이 관심 영역을 광학 문자 인식에 용이하도록 워핑하기 위한 호모그래피 행렬을 추정할 수 있는 네트워크를 제안한다. 제안하는 네트워크의 구조는 STN(Spatial Transformer Networks)의 구조를 차용하였으며, 관심 영역 검출, 호모그래피 변환을 위한 행렬 추정, 행렬을 이용한 워핑 단계로 구성되어 있다. 제안된 네트워크를 이용하여 관심 영역과 행렬을 동시에 추정하고, 추정된 행렬을 이용하여 관심 영역의 원근 왜곡을 바로 잡음으로써 BIC-code의 인식 정확도 향상에 기여한다. 성능 평가를 위하여 총 5인의 평가원이 출력 영상을 5점 만점으로 평가한 결과 평균 4.25점을 받았으며, 육안으로 확인했을 시 총 312장의 사진 중 224장의 사진이 완벽하게 보정됨과 동시에 관심 영역을 출력하였다.