• 제목/요약/키워드: 문자검출

검색결과 263건 처리시간 0.034초

중첩윤곽 형상에 의한 한글패턴의 정점검출 (A Vertex-Detecting of Hanguel Patterns Using Nested Contour Shape)

  • 고찬;이대영
    • 한국통신학회논문지
    • /
    • 제15권2호
    • /
    • pp.112-123
    • /
    • 1990
  • 본 논문은 한글 문자인식을 위하여 중첩형상데이타에 의한 한글 패턴의 굴곡 특징점과 정점검출에 관하여 논한 것이다. 입력된 2진 문자패턴을 거리변환법에 의한 중첩데이타로 변환하고, 데이터의 특성분석에 의한 변환값의 새로운 파일로 구성하였다. 이 두 데이터 파일로 한글 인식에 유용한 정점들을 검출하는 알고리즘을 제안하였다. 이 알고리즘에서는 오인식의 원인이 되는 돌기부분의 제거, 자소 접촉 부분의 분리, 굴곡 특징 변환값에 따른 코드를 부여하도록 하였따. 여기서의 출력은 한글 문자인식에 활용될 수 있는 형태로 하였다.

  • PDF

웹 이미지로부터 이미지기반 문자추출 (Locating Text in Web Images Using Image Based Approaches)

  • Chin, Seongah;Choo, Moonwon
    • 지능정보연구
    • /
    • 제8권1호
    • /
    • pp.27-39
    • /
    • 2002
  • 본 논문은 다양한 웹 이미지로부터 문자영역(text block)의 위치를 알아내고 문자영역을 추출하는 방법을 제안한다. 인터넷 사용자관점에서 볼 때, 웹 이미지에 포함되어 있는 문자정보는 중요한 정보이지만 최근까지 이 분야의 연구는 그리 활발하지 못했다. 본 연구에서 제안된 알고리즘은 문자의 경사방향(skew)과 문자의 크기나 폰트에 관한 사전 정보 없이 수행되어 질 수 있도록 제안되었다 폰트 스타일과 크기에 제약되지 않고 문자영역을 적합하게 추출하기 위해 유용한 에지 검출, 문자 클러스터링 영역으로 정의되는 문자의 고유한 특성을 위한 히스토그램을 사용하였다. 다수의 실험을 통하여 제안된 방법을 테스트하고 수용할 만한 결과를 도출했다.

  • PDF

모폴로지 연산을 이용한 문서 이미지의 고속 기울기 검출 기법 (Fast Skew Detection of Document Image Using Morphological Operation)

  • 신명진;김도현;차의영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2006년도 춘계종합학술대회
    • /
    • pp.796-799
    • /
    • 2006
  • 본 논문은 스캔한 문서 및 전자 문서 등과 같은 문서 이미지에서의 기울기를 검출하는 기법을 제안하고 있다. 제안한 알고리즘은 처리 속도 향상을 위해 일정 비율로 축소된 이미지를 사용한다. 하지만 여전히 문서 전체를 대상으로 기울기를 검출하는 것은 많은 계산량을 요구하므로 대상영역(ROI)을 선택한다. 대상 영역은 모폴로지 연산을 통해 문자열을 하나의 긴 component로 연결하고 Labeling 과정을 통해 선택된다. 그리고 원본 이미지에서 문자의 baseline을 바탕으로 대상 영역에서 기울기를 검출한다. 실험결과를 통하여, 제안한 방법은 표나 그래프가 포함된 여러 종류의 문서 이미지에서 빠르고 정확한 기울기 값을 검출함을 확인할 수 있다.

  • PDF

비디오 영상 정보 검색을 위한 문자 추출 및 인식 (Caption Detection and Recognition for Video Image Information Retrieval)

  • 구건서
    • 한국컴퓨터산업학회논문지
    • /
    • 제3권7호
    • /
    • pp.901-914
    • /
    • 2002
  • 본 논문에서는 비디오에서 입력된 영상으로부터 내용기반 검색을 위해 자동으로 자막을 추출하여 특징 추출을 기반의 단층 연결 신경망 인식기(FE-MCBP)에 의해 자막 문자를 인식하여 영상 자막의 내용을 검출하는 방법을 제시하였다. 비디오에서 자막 추출은 먼저, 비디오에서 일정한 시간 간격으로 획득한 프레임 중에서 히스토그램 분석을 통하여 키 프레임을 찾는 과정을 수행하며, 그 다음에 각각의 키 프레임에 대하여 칼라 세그먼테이션 후 라인 검사 방법 통하여 자막 영역을 추출하도록 하였다. 마지막으로 추출된 자막영역에서 개별문자를 분리하였다. 본 연구에서는 칼라 히스토그램을 분석 후 지역 최대값을 이용하여 세그먼테이션 후 라인 검사를 수행함으로써 처리 속도와 자막영역 검출의 정확도를 개선하였다. 비디오에서 자막 추출은 비디오 정보를 멀티미디어 데이터베이스화하는 초기 단계로 추출된 자막은 바로 문자 인식기의 입력이 된다. 또한 인식된 자막정보는 데이터베이스로 구축되며 내용기반 검색 기법에 의해 검색되도록 하였다.

  • PDF

SSD-Mobilenet과 ResNet을 이용한 모바일 기기용 자동차 번호판 인식시스템 (Vehicle License Plate Recognition System using SSD-Mobilenet and ResNet for Mobile Device)

  • 김운기;;조성원
    • 스마트미디어저널
    • /
    • 제9권2호
    • /
    • pp.92-98
    • /
    • 2020
  • 본 논문은 고성능의 서버 없이 안드로이드 스마트폰 단독으로 동작할 수 있도록 경량화 딥러닝 모델을 사용하여 구현한 자동차 번호판 인식 시스템을 제안한다. 자동차 번호판 인식시스템은 [번호판검출]-[문자영역 분할]-[문자인식]으로 3단계의 과정으로 구성되며, 번호판검출은 SSD-Mobilenet, 문자영역 분할은 ResNet에 localization을 추가하여 사용하였고 문자인식은 ResNet을 이용하여 구현하였다. 테스트한 기기는 삼성 갤럭시 S7, LG Q9이며 정확도는 약 85.3%, 실행속도는 약 1.1초가 소요된다.

시각적 MMN(vMMN)의 분석을 통한 한국어 글말의 무의식적인 인지과정 연구 (Automatic cognitive processing of korean written language as indexed by visual MMN(vMMN))

  • 이성은
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.67-72
    • /
    • 2009
  • ERP의 일종인 MMN(Mismatch Negativity)은 언어의 청각 인지정보 처리과정(central auditory processing)을 규명하는 데 유용한 수단으로 이용되어 왔다. 그런데, 최근의 연구들은 이러한 MMN이 청각 자극뿐만 아니라 시각 자극에 의해서도 검출될 수 있음을 밝혀냈다. 본 연구는 이러한 시각적 MMN을 이용하여 뇌에서 이루어지는 한국어 화자의 무의식적인 한국어 문자 정보처리과정을 규명하려고 시도하였다. 본 연구에서는 한국어의 글말 최소쌍 '므'/'모'와 '므'/'무', 이에 대응되는 비언어자극 '+ㅡ'/'+ㅗ'와 '+ㅡ'/'+ㅜ'(+표시의 아래에 모음을 붙여서 만든 인공문자, 그림1 참고)를 수동적(passive) Oddball paradigm으로 제시하고 언어 자극에 대한 EEG를 비언어자극과 비교 하에 측정, 분석하였다. 본 연구의 결과, 언어자극과 비언어자극 모두에서 시각적 MMN이 검출되었다. 하지만, 언어자극의 시각적 MMN이 비언어자극의 시각적 MMN보다 높게 나타남을 확인하였다. 이는 한국어 모국어화자들이 무의식적인 인지과정에서 언어자극이 갖는 물리적인 시각 정보뿐만 아니라 한국어 문자의 언어적 정보도 함께 처리하고 있음을 보여주는 것이다. 본 연구의 결과들은 한국어 글말의 무의식적인 인지처리과정을 밝혀주는 한편, 한국어 문자가 인지과학에서 갖는 중요한 지위를 보여줄 수 있을 것으로 기대된다.

  • PDF

딥러닝을 활용한 향상된 라벨인식 방법에 관한 연구 (A Study on Improved Label Recognition Method Using Deep Learning.)

  • 유성근;조성만;송민정;전소연;임송원;정서경;박상일;박구만;김희태;이대성
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.447-448
    • /
    • 2018
  • 라벨인식과 같은 광학 문자 인식은 영상처리를 활용한 컴퓨터 비전의 대표적인 연구분야이다. 본 연구에서는 딥러닝 기반의 라벨인식 시스템을 고안하였다, 생산 라인에 적용되는 라벨인식 시스템은 인식 속도가 중요하기 때문에 기존의 R-CNN기반의 딥러닝 신경망보다 월등히 빠른 오브젝트 검출 시스템 YOLO를 활용하여 문자를 학습 및 인식 시스템을 개발하였다. 본 시스템은 기존 시스템에 근접하는 문자인식 정확도를 제공하고 자동으로 문자영역을 검출 가능하며, 라벨의 인쇄불량을 판독하도록 하였다. 또한 개발, 배포, 적용이 한번에 가능한 프레임워크를 통하여 생산현장에서 발생하는 다양한 이미지 처리에 활용될 전망이다.

비디오 영상에서 시공간적 문자영역 제거방법 (Spatiotemporal Removal of Text in Image Sequences)

  • 이창우;강현;정기철;김항준
    • 전자공학회논문지CI
    • /
    • 제41권2호
    • /
    • pp.113-130
    • /
    • 2004
  • 많은 시각적 정보를 포함한 비디오 데이터들의 자동화된 처리 기술 중, 비디오 데이터들의 시청자적인 정보를 보강시키고, 부가적인 정보를 첨가하기 위한 일환으로 자막을 삽입하는 경우가 많다. 이러한 자막은 때로 영상자료의 재사용성(reusability)을 저해하고, 원 영상을 훼손하는 경우가 발생한다. 본 논문에서는 영상의 재사용성을 높이고 원 영상 복원을 위해 Support Vector Machines(SVM)과 시공간적 영상복원 방법(spatiotemporal restoration)을 이용한 비디오 영상에서의 자동 문자 검출과 제거 방법을 제안한다. 연속적인 두 프레임 이상의 영상을 입력받아, 현재 프레임 영상에서 SVM을 이용하여 문자 영역을 검출한 다음, 검출된 문자 영역을 제거하고, 문자 영역에 의해 가려졌던 원 영상을 복원하기 위한 두 단계- 시간적 복원(temporal restoration)과 공간적 복원(spatial restoration)접근방법을 제안한다. 제안된 복원 방법은 글자 모션(text motion) 정보와 두 영상의 배경 차이(background difference)를 이용하여 영상을 그 특징에 따라 분류하고, 각 영상의 특징에 맞는 복원 방법을 적용한다. 제안된 방법은 다양한 종류의 영상에서 문자뿐만 아니라 관심의 대상이 되는 객체의 자동 검출 및 복원 등 다양한 응용분야를 포함한다.

YOLO, EAST: 신경망 모델을 이용한 문자열 위치 검출 성능 비교 (YOLO, EAST : Comparison of Scene Text Detection Performance, Using a Neural Network Model)

  • 박찬용;임영민;정승대;조영혁;이병철;이규현;김진욱
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권3호
    • /
    • pp.115-124
    • /
    • 2022
  • 본 논문에서는 최근 다양한 분야에서 많이 활용되고 있는 YOLO와 EAST 신경망을 이미지 속 문자열 탐지문제에 적용해보고 이들의 성능을 비교분석 해 보았다. YOLO 신경망은 일반적으로 이미지 속 문자영역 탐지에 낮은 성능을 보인다고 알려졌으나, 실험결과 YOLOv3는 문자열 탐지에 비교적 약점을 보이지만 최근 출시된 YOLOv4와 YOLOv5의 경우 다양한 형태의 이미지 속에 있는 한글과 영문 문자열 탐지에 뛰어난 성능을 보여줌을 확인하였다. 따라서, 이들 YOLO 신경망 기반 문자열 탐지방법이 향후 문자 인식 분야에서 많이 활용될 것으로 전망한다.

사전 정보를 이용한 자동차 번호판의 문자 위치 추출과 세그멘테이션에 관한 연구 (A Study of plate Number Extraction and Segmentation using domain Knowledge)

  • 김병훈;고미애;김영모
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.259-261
    • /
    • 2003
  • 차량 번호판 인식 시스템의 번호판 인식과정은 영상획득 및 번호판 영역 추출, 개별문자 추출, 문자 인식의 3가지 핵심부분으로 구성된다. 이 중에서도 번호판 추출의 정확성은 시스템 전체의 결과에 영향을 줄 수 있는 부분이며 다양한 주변 환경에도 정확한 추출과 빠른 수행 시간을 요구한다. 본 논문에서는 검출 시간의 단축을 위하여 명암값의 차이와 사전정보를 이용하여 먼저 인식대상의 주목표인 등록번호의 위치를 추출 및 검증하고 등록번호에 대한 지역명의 상대적인 위치 정보를 이용하여 문자의 대략적인 위치를 선정, 각 요소들의 외곽 근접 선들의 투영(protection)과 이동을 통하여 번호판의 모든 문자 요소의 위치를 추출한다.

  • PDF