• 제목/요약/키워드: Intelligent Character Recognition

검색결과 62건 처리시간 0.039초

An EIIiptic Approach to Learning Discriminants

  • Karbou, Fatiha;Karbou, Fatima;Karbou, M.
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 1998년도 The Third Asian Fuzzy Systems Symposium
    • /
    • pp.153-157
    • /
    • 1998
  • It is wisely stated that the most valuable knowledge that a person cam acquire is the knowledge of how to learn. The human's learning is characterized by the ability to extract relationships between the different characters of a given situation. The ellipse is a first approach of comparison. We assimilate each character to a half axis of the ellipse and the result is a geometrical figure that varies according to values of the two characters. Thus, we take into account the two characters as an alone entity.

  • PDF

Illumination-Robust Foreground Extraction for Text Area Detection in Outdoor Environment

  • Lee, Jun;Park, Jeong-Sik;Hong, Chung-Pyo;Seo, Yong-Ho
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권1호
    • /
    • pp.345-359
    • /
    • 2017
  • Optical Character Recognition (OCR) that has been a main research topic of computer vision and artificial intelligence now extend its applications to detection of text area from video or image contents taken by camera devices and retrieval of text information from the area. This paper aims to implement a binarization algorithm that removes user intervention and provides robust performance to outdoor lights by using TopHat algorithm and channel transformation technique. In this study, we particularly concentrate on text information of outdoor signboards and validate our proposed technique using those data.

퍼지 논리기반 HAUSDORFF 거리를 이용한 물체 인식 (Comparing object images using fuzzy-logic induced Hausdorff Distance)

  • 강환일
    • 지능정보연구
    • /
    • 제6권1호
    • /
    • pp.65-72
    • /
    • 2000
  • 본 논문에서는 쿼리 영상에 대하여 가장 정확하게 정합되는 영상을 찾기 위한 새로운 이진 영상 정합 방법인 퍼지 기반 하우스도르프 방법을 제안한다, 먼저 하우스도르프 거리를 이용하여 최소거리 분포를 얻은 후 반경에 해당하는 집함의 개수를 이용하여 소속함수로 표현한다. 제안한 방법에서는 소속함수로 정의된 거리 분포에 대하여 퍼지 추론과정을 도입하여 최종적인 정합 후보를 구하게 된다. 제안된 방법을 실제 잡음이 부가된 얼굴 영상과 문자 인식에 적용하여 그 성능을 검증하였다.

  • PDF

YOLOv2 기반의 영상워핑을 이용한 강인한 오토바이 번호판 검출 및 인식 (Robust Motorbike License Plate Detection and Recognition using Image Warping based on YOLOv2)

  • 당순정;김응태
    • 방송공학회논문지
    • /
    • 제24권5호
    • /
    • pp.713-725
    • /
    • 2019
  • 번호판 자동인식(ALPR: Automatic License Plate Recognition)은 지능형 교통시스템 및 비디오 감시 시스템 등 많은 응용 분야에서 필요한 기술이다. 대부분의 연구는 자동차를 대상으로 번호판 감지 및 인식을 연구하였고, 오토바이를 대상으로 번호판 감지 및 인식은 매우 적은 편이다. 자동차의 경우 번호판이 차량의 전방 또는 후방 중앙에 위치하며 번호판의 뒷배경은 주로 단색으로 덜 복잡한 편이다. 그러나 오토바이의 경우 킥 스탠드를 이용하여 세우기 때문에 주차할 때 오토바이는 다양한 각도로 기울어져 있으므로 번호판의 글자 및 숫자 인식하는 과정이 훨씬 더 복잡하다. 본 논문에서는 다양한 각도로 주차된 오토바이 데이터세트에 대하여 번호판의 문자 인식 정확도를 높이기 위하여 2-스테이지 YOLOv2 알고리즘을 사용하여 오토바이 영역을 선 검출 후 번호판 영역을 검지한다. 인식률을 높이기 위해 앵커박스의 사이즈와 개수를 오토바이 특성에 맞추어 조절하였다. 그 후 기울어진 번호판을 검출한 후 영상 워핑 알고리즘을 적용하였다. 모의실험 결과, 기존 방식의 인식률이 47.74%에 비해 제안된 방식은 80.23%의 번호판의 인식률을 얻었다. 제안된 방법은 전체적으로 오토바이 번호판 특성에 맞는 앵커박스와 이미지 워핑을 통해서 다양한 기울기의 오토바이 번호판 문자 인식을 높일 수 있었다.

옥외영상의 개선된 차량번호판 인식기술 (An Improved License Plate Recognition Technique in Outdoor Image)

  • 김병준;김동훈;이준환
    • 한국지능시스템학회논문지
    • /
    • 제26권5호
    • /
    • pp.423-431
    • /
    • 2016
  • 일반적으로 옥외영상에서의 자동차 번호판 인식은 인위적인 환경에서와는 다르게 기하학적으로 왜곡되어 있을 뿐만 아니라 조명 변화도 크기 때문에 단순환 문제가 아니다. 본 논문에서는 일반 CCTV 카메라로 옥외에서 촬영된 영상에서 자동차 번호판 인식을 위한 개선된 기술들을 제안한다. 먼저 다양한 특징을 상보적으로 사용하는 직렬구조의 다단계 Adaboost 검출기를 제안한다. 제안하는 검출기는 MB-LBP 및 Haar-like 특징을 사용하는 Adaboost 구조를 직렬로 연결하여 번호판 검출의 검출성능을 향상시켰다. 또한 검출된 번호판의 기하학적 왜곡을 보정하고 번호판의 타입을 먼저 결정하여 영상처리를 용이하게 하는 방법을 제안한다. 이런 방법은 그래이 변환, 문자/숫자 분리, 분리된 영상의 영상처리 등에서 사전지식 없이 전체 번호판 영상을 이용하는 경우보다 효율적이다. 본 논문에서 DBN(Deep Belief Network)를 문자/숫자 인식기로 사용하여 영상처리과정에서 기인한 획 손실이나 기울어짐 같은 기하학적인 왜곡에서도 강건한 인식률을 달성하였다.

문서 이미지 데이터 활용을 위한 지능형 OCR 기술 개발 (Development of Intelligent OCR Technology to Utilize Document Image Data)

  • 김상준;유동희;황소영;김민호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.212-215
    • /
    • 2022
  • 오늘날 소위 디지털 전환시대를 맞아, 많은 부분에서 빅데이터의 구축과 활용에 대한 필요성이 높아졌다. 오늘날에 많은 데이터가 디지털기기, 미디어 친화적으로 생산 및 보관되는 것과 달리, 과거 오랜 기간 데이터의 생산 및 보관은 활자 인쇄도서가 주를 이루었다. 따라서 오랜 기간 축적되어온 방대한 활자 인쇄도서를 빅데이터로써 활용하기 위한 광학 문자 판독(OCR: Optical Character Recognition) 기술의 필요성 역시 빅데이터의 필요성에 맞추어 함께 요구되었다. 본 연구에서는 도서 스캔 이미지의 정보를 각 문서 객체별로 세분화하여 그 구조와 내용을 디지털화하는 시스템을 제안한다. 제안 시스템은 크게 1) 문서객체(표, 수식, 그림, 본문)의 영역정보를 인식. 2)인식된 객체의 영역정보를 각각 표 처리, 수식 처리, 텍스트 처리 모듈로 OCR. 3) OCR로 처리된 문서 정보를 JSON형식으로 종합하여 반환하는 세 단계로 구성된다. 본 연구에서 제안하는 모델은 이러한 단계를 수행함에 있어 오픈소스로 공개된 프로젝트를 활용하되, 본 시스템의 목표에 맞추어 추가적인 학습과 개량을 거쳤다. 본 연구에서 제안한 지능형 OCR 시스템은 문서 이미지 내 4종(표, 수식, 이미지, 텍스트)의 객체인식과 처리에 있어 상용 소프트웨어 수준의 성능을 확인할 수 있었다.

  • PDF

지화 인식을 위한 동영상 처리에 관한 연구 (The Study on Dynamic Images Processing for Finger Languages)

  • 강민지;최은숙;손영선
    • 한국지능시스템학회논문지
    • /
    • 제14권2호
    • /
    • pp.184-189
    • /
    • 2004
  • 본 논문에서는 흑백 CCD 카메라를 이용하여 청각 장애인의 의사전달 수단인 지화 동작을 동영상으로 입력받아 인식하여, 편집 가능한 텍스트 문서로 변환하는 시스템을 구현하였다. 일련의 입력 영상들 중에서 흐린 영상과 선명한 영상의 구분은 영상의 잔상을 이용하였고, 촬영된 연속 영상들의 배열로부터 문자 자소를 구하고, 오토마타를 적용하여 완성된 문자를 문서 편집기에 출력시켰다. 획득된 선명한 영상 데이터 중 변화가 심한 손목 부분을 제거한 후, 최대 원형 이동법을 이용하여 손의 무게 중심점을 구하고, 원형 패턴 벡터 알고리즘을 적용하여 지화 해석에 필요한 손을 인식하였다. 손 중심으로부터 거리 스펙트럼을 이용하여 지화 인식에 사용되는 손 모양의 특징 벡터를 추출하고, 퍼지 추론을 적용하여 표준 패턴과 입력 패턴의 특징벡터를 비교, 지화 동작을 인식하였다.

Broca 영역에서의 뇌파 변화에 기반한 뇌-컴퓨터 인터페이스 (Brain-Computer Interface based on Changes of EEG on Broca's Area)

  • 염홍기;장인훈;심귀보
    • 한국지능시스템학회논문지
    • /
    • 제19권1호
    • /
    • pp.122-127
    • /
    • 2009
  • 본 논문에서는 피험자가 A, B, C, D 글자를 말하는 상상을 할 때 사고중추에서와 Broca's area 에서 EEG 신호를 측정하였으며 이 신호를 Event-Related Spectral Perturbation (ERSP), Inter-Trial Coherence (ITC) 그리고 Event Related Potential (ERP) 방법을 통해 분석하여 보았다. 그 결과 F7, FT7 영역의 뇌파에서 각 문자를 보여주는 자극 제시 후 0$\sim$300ms 동안의 1$\sim$13Hz에서 높은 coherence를 보였으며, P300 이 뚜렷하게 나타나는 것을 확인할 수 있었다. 하지만 ERP를 통해 분석해본 결과 각 글자에 대한 차이를 구분하고자 하였던 처음 연구의 동기와 달리 각 글자를 말할 때 ERP가 약간의 차이를 보이기는 하였으나 각 문자에 대한 차이라거나 이 차이를 통해 문자를 구별할 수 있다고 하기는 어려웠다. 하지만 본 논문에서는 이 실험결과를 통해 기존에 운동관련 뇌 영역에 국한되어 있던 BCI 연구의 한계를 극복하고 보다 다양한 서비스를 제공할 수 있는 응용 시스템을 제안하였다.

딥러닝과 의미론적 영상분할을 이용한 자동차 번호판의 숫자 및 문자영역 검출 (Detection of Number and Character Area of License Plate Using Deep Learning and Semantic Image Segmentation)

  • 이정환
    • 한국융합학회논문지
    • /
    • 제12권1호
    • /
    • pp.29-35
    • /
    • 2021
  • 자동차 번호판 인식은 지능형 교통시스템에서 핵심적인 역할을 담당한다. 따라서 효율적으로 자동차 번호판의 숫자 및 문자영역을 검출하는 것은 매우 중요한 과정이다. 본 연구에서는 딥러닝과 의미론적 영상분할 알고리즘을 적용하여 효과적으로 자동차 번호판의 번호영역을 검출하는 방법을 제안한다. 제안된 방법은 화소 투영과 같은 전처리과정 없이 번호판 영상에서 바로 숫자 및 문자영역을 검출하는 알고리즘이다. 번호판 영상은 도로 위에 설치된 고정 카메라로 부터 획득한 영상으로 날씨 및 조명변화 등을 모두 포함한 다양한 실제 상황에서 촬영된 것을 사용하였다. 입력 영상은 색상변화를 줄이기 위해 정규화하고 실험에 사용된 딥러닝 신경망 모델은 Vgg16, Vgg19, ResNet18 및 ResNet50이다. 제안방법의 성능을 검토하기 위해 번호판 영상 500장으로 실험하였다. 학습을 위해 300장을 할당하였으며 테스트용으로 200장을 사용하였다. 컴퓨터모의 실험결과 ResNet50을 사용할 때 가장 우수하였으며 95.77% 정확도를 얻었다.

Construct OCR on mobile mechanic system for android wireless dynamics and structure stabilization

  • Shih, Bih-Yaw;Chen, Chen-Yuan;Su, Wei-Lun
    • Structural Engineering and Mechanics
    • /
    • 제42권5호
    • /
    • pp.747-760
    • /
    • 2012
  • In today's online social structure, people with electronic devices or network have been closely related to whether any of the activities, work, school, etc., is related to electronic devices, intelligent robot, and network control. The best mobility and the first rich media of these products as smart phones, smart phones rise rapidly in recent years, high speed processing performance and high free way to install software, deeply loved by many business people. However, not only for smart phone business aspects of the use, but also can engage in education of the teachers or the students are learning a great help. This study construct OCR-assisted learning software written by the JAVA made, and the installation is provided by the Android mobile phone users.