• 제목/요약/키워드: 문자특징 추출

검색결과 252건 처리시간 0.026초

번호판에서의 문자 세그멘테이션에 관한 연구 (A Study on Character Segmentation in Car Plates)

  • 이상훈;김경현;김춘림;차의영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (상)
    • /
    • pp.623-626
    • /
    • 2003
  • 본 논문에서는 현재 자동차 번호판의 형식이 구 번호판과 신 번호판 두 가지 유형으로 구성되어 있다는 점을 고려하여 번호판의 세부적 세그멘테이션의 성능을 개선하는 방법에 대하여 제시한다. 컴퓨터 비젼을 바탕으로 한 자동차 번호판의 인식방법과 문자인식방법은 비용면이나 간편성에서 맡은 장점을 가지고 있으며 여러 응용분야에서 사용될 수 있기 때문에 다방면에서 시도되고 있다. 본 시스템은 모폴로지 연산과 클러스트링을 이용하여 자동차 번호판 전체 영역을 추출하는 방법을 사용한다. 다음으로 구번호판에서 신번호판으로 넘어가는 과도기적 단계에 있는 번호판들의 특징인 용도기능의 표시문자의 위치 차이를 이용하여 구 번호판과 신번호판을 먼저 분류한다. 분류된 번호판에서 두 번호판의 차이점인 차종기초 표시영역의 숫자를 나누어서 세그멘테이션함으로서 기존의 연구방법보다 개선된 세그멘테이션 능력과 이로 인하여 향상된 번호판 인식결과를 얻을 수 있다.

  • PDF

관심 문자열 인식 기술을 이용한 가스계량기 자동 검침 시스템 (Automatic gasometer reading system using selective optical character recognition)

  • 이교혁;김태연;김우주
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.1-25
    • /
    • 2020
  • 본 연구에서는 모바일 기기를 이용하여 획득한 가스계량기 사진을 서버로 전송하고, 이를 분석하여 가스 사용량 및 계량기 기물 번호를 인식함으로써 가스 사용량에 대한 과금을 자동으로 처리할 수 있는 응용 시스템 구조를 제안하고자 한다. 모바일 기기는 일반인들이 사용하는 스마트 폰에 준하는 기기를 사용하였으며, 획득한 이미지는 가스 공급사의 사설 LTE 망을 통해 서버로 전송된다. 서버에서는 전송받은 이미지를 분석하여 가스계량기 기물 번호 및 가스 사용량 정보를 추출하고, 사설 LTE 망을 통해 분석 결과를 모바일 기기로 회신한다. 일반적으로 이미지 내에는 많은 종류의 문자 정보가 포함되어 있으나, 본 연구의 응용분야인 가스계량기 자동 검침과 같이 많은 종류의 문자 정보 중 특정 형태의 문자 정보만이 유용한 분야가 존재한다. 본 연구의 응용분야 적용을 위해서는 가스계량기 사진 내의 많은 문자 정보 중에서 관심 대상인 기물 번호 및 가스 사용량 정보만을 선별적으로 검출하고 인식하는 관심 문자열 인식 기술이 필요하다. 관심 문자열 인식을 위해 CNN (Convolutional Neural Network) 심층 신경망 기반의 객체 검출 기술을 적용하여 이미지 내에서 가스 사용량 및 계량기 기물번호의 영역 정보를 추출하고, 추출된 문자열 영역 각각에 CRNN (Convolutional Recurrent Neural Network) 심층 신경망 기술을 적용하여 문자열 전체를 한 번에 인식하였다. 본 연구에서 제안하는 관심문자열 기술 구조는 총 3개의 심층 신경망으로 구성되어 있다. 첫 번째는 관심 문자열 영역을 검출하는 합성곱신경망이고, 두 번째는 관심 문자열 영역 내의 문자열 인식을 위해 영역 내의 이미지를 세로 열 별로 특징 추출하는 합성곱 신경망이며, 마지막 세 번째는 세로 열 별로 추출된 특징 벡터 나열을 문자열로 변환하는 시계열 분석 신경망이다. 관심 문자열은 12자리 기물번호 및 4 ~ 5 자리 사용량이며, 인식 정확도는 각각 0.960, 0.864 이다. 전체 시스템은 Amazon Web Service 에서 제공하는 클라우드 환경에서 구현하였으며 인텔 제온 E5-2686 v4 CPU 및 Nvidia TESLA V100 GPU를 사용하였다. 1일 70만 건의 검침 요청을 고속 병렬 처리하기 위해 마스터-슬레이브 처리 구조를 채용하였다. 마스터 프로세스는 CPU 에서 구동되며, 모바일 기기로 부터의 검침 요청을 입력 큐에 저장한다. 슬레이브 프로세스는 문자열 인식을 수행하는 심층 신경망으로써, GPU에서 구동된다. 슬레이브 프로세스는 입력 큐에 저장된 이미지를 기물번호 문자열, 기물번호 위치, 사용량 문자열, 사용량 위치 등으로 변환하여 출력 큐에 저장한다. 마스터 프로세스는 출력 큐에 저장된 검침 정보를 모바일 기기로 전달한다.

AVI 시스템을 위한 목표 영역의 새로운 추출 기법 (A New Extraction Method of the Target Regions for AVI System)

  • 조동욱;박영;최동선
    • 한국음향학회지
    • /
    • 제17권5호
    • /
    • pp.22-27
    • /
    • 1998
  • 본 논문에서는 차량 자동 인식 시스템(AVI:Automatic Vehicle Identification)구현에 있어 목표 영역이 되는 차량 번호판과 운전자 얼굴의 특진요소를 효율적으로 추출하기 위한 방법에 대해 다루고자 한다. 이를 위해 카메라를 두 대 설치하여 한 대의 카메라로부터는 차량 번호판 영역을 추출하고 또 하나의 카메라로는 운전자의 얼굴영역을 추출한다. 목표가 되는 두 영역의 추출을 위해 환경에 불변인 경계선 추출 방법을 제안하였고, 히스토그램의 특성을 이용하여 목표영역을 추출한다. 최종적으로 차량 번호판의 경우 추출된 번호판 영역 에 다시 X, Y 라인히스토그램을 이용하여 문자영역의 분리를 행하였고, 운전자의 경우 눈, 코, 입 등에 대한 특징을 추출하였다.

  • PDF

한글필기체의 구조적 특징을 이용한 효율적 기울기 보정 (An Efficient Slant Correction for Handwritten Hangul Strings using Structural Properties)

  • 유대근;김경환
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권1_2호
    • /
    • pp.93-102
    • /
    • 2003
  • 본 논문에서는 한글의 구조적 특징이 반영된 획들의 통계적인 분포에 근거한 필기 문자열의 기울기 보정 방법을 제안한다. 기존의 기울기 보정 방법들은 대부분 영문위주의 보정 방법으로, 영문과 달리 2차원적 구조를 갖는 한글에 적용하는데는 많은 문제가 있다. 일반적인 보정 방법을 적용할 경우 한글에 내재하는 강한 대각선획의 영향으로 인한 역보정의 문제가 가장 많이 나타나며. 기울어진 문자열을 제대로 보정하지 못하는 경우도 빈번하다. 제안하는 방법에서는 추출된 획들의 기울기 분포를 K-평균 군집법을 적용하여 수직획과 대각선획의 두 개의 군집으로 분류하고, 가우시안 분포로의 모델링을 통해 대각선획을 제외하고 수직획만을 이용하여 기울기 보정을 수행하였다. 임의의 필기자에 의해 필기된 우편봉투 주소 문자열 1,300개에 대해 제안하는 방법과 기존의 방법들을 적용하여 실험한 결과 제안하는 방법이 기존방법들에 비해 역보정률을 크게 낮추고, 기울어진 문자열에 대해 완벽한 보정 성능을 보여 그 우수성이 입증되었다.

문서 분류의 개선을 위한 단어-문자 혼합 신경망 모델 (Hybrid Word-Character Neural Network Model for the Improvement of Document Classification)

  • 홍대영;심규석
    • 정보과학회 논문지
    • /
    • 제44권12호
    • /
    • pp.1290-1295
    • /
    • 2017
  • 문서의 텍스트를 바탕으로 각 문서가 속한 분류를 찾아내는 문서 분류는 자연어 처리의 기본 분야 중 하나로 주제 분류, 감정 분류 등 다양한 분야에 이용될 수 있다. 문서를 분류하기 위한 신경망 모델은 크게 단어를 기본 단위로 다루는 단어 수준 모델과 문자를 기본 단위로 다루는 문자 수준 모델로 나누어진다. 본 논문에서는 문서를 분류하는 신경망 모델의 성능을 향상시키기 위하여 문자 수준과 단어 수준의 모델을 혼합한 신경망 모델을 제안한다. 제안하는 모델은 각 단어에 대하여 문자 수준의 신경망 모델로 인코딩한 정보와 단어들의 정보를 저장하고 있는 단어 임베딩 행렬의 정보를 결합하여 각 단어에 대한 특징 벡터를 만든다. 추출된 단어들에 대한 특징 벡터를 바탕으로, 주의(attention) 메커니즘을 이용한 순환 신경망을 단어 수준과 문장 수준에 각각 적용하는 계층적 신경망 구조를 통해 문서를 분류한다. 제안한 모델에 대하여 실생활 데이터를 바탕으로 한 실험으로 효용성을 검증한다.

PCA와 LDA을 이용한 차량 번호판 통합 인식에 관한 연구 (A Study on Recognition of Both of PCA and LAD Using Types of Vehicle Plate)

  • 이진기;김현열;이승규;이건화;박영록;안기남;배철수;박영철
    • 한국정보전자통신기술학회논문지
    • /
    • 제6권1호
    • /
    • pp.6-17
    • /
    • 2013
  • 최근 들어 기존의 녹색 바탕의 차량 번호판에서, 흰색 바탕의 신 차량 번호판으로 교체되고 있다. 하지만, 아직 기존의 차량 번호판이 신 차량 번호판으로 전면 교체 되지 않아 두 번호판 모두 사용되고 있기 때문에 주차 관리 시스템, 속도위반, 신호 위반 등 무인 카메라를 이용한 시스템에서, 기존 차량 번호판과 신 차량 번호판 특징에 맞는 인식 시스템이 요구된다. 따라서 본 논문에서는 이러한 문제를 해결하기 위해 기존의 녹색 번호판과 흰색 번호판 모두를 추출하고 인식 할 수 있는 알고리즘에 관한 연구를 수행하였다. 다양한 환경에서 획득한 차량 영상으로부터 번호판 영역을 추출하기 위하여 형태학적 특징을 이용하였고, 추출된 번호판 영역의 수평, 수직 히스토그램과 문자의 상대적 위치 정보를 이용하여, 문자를 분리하였다. 최종적으로, 분리된 문자를 인식하기 위해 주성분 분석법(PCA : Principal Component Analysis)과 선형 판별 분석법(LDA : Linear Discriminant Analysis)을 적용하여 인식 시스템을 구성하였다. 실험 결과, 불규칙한 조명 상태에서도 상대적으로 높은 추출률과 문자 인식률을 나타내었다.

오프라인 필기체 한글 인식을 위한 자소 내 자획의 분리 (Stroke Extraction in Phoneme for Off-Line Handwritten Hangul Recognition)

  • 정민철
    • 한국산학기술학회논문지
    • /
    • 제7권3호
    • /
    • pp.385-392
    • /
    • 2006
  • 본 논문은 오프라인 필기체 한글 인식을 위한 요소 기술의 하나인 자소 분할을 위한 새로운 자획 추출법을 제안한다. 수평 런 길이를 이용하여 자소의 자획을 수직, 경사, 수평으로 구분 분리한다. 수직 자획이나 경사 자획의 수평 런 길이는 자획 두에가 되며, 수평 자획의 수평 런의 개수가 자획 두께가 된다. 수평 자획을 분리 추출한 후, 끊어진 수직, 경사 자획을 자획 두께의 수평 런으로 연결하여 분리한 자획들이 문자의 특징을 나타내게 한다. 추출된 자획들은 온라인 필기체 한글 인식 시스템에서 개발 사용되고 있는 자획 사전 정합을 통해 문자 인식을 할 수 있다.

  • PDF

HSI 정보와 퍼지 이진화 및 ART2 알고리즘을 이용한 신차량 번호판의 인식 (Recognition of a New Car License Plate Using HSI Information, Fuzzy Binarization and ART2 Algorithm)

  • 김광백;우영운;박충식
    • 한국정보통신학회논문지
    • /
    • 제11권5호
    • /
    • pp.1004-1012
    • /
    • 2007
  • 본 논문에서는 HSI 정보와 신경 망의 비지도 학습 방법인 ART2 알고리즘을 이용하여 신 차량 번호판을 인식하는 방법을 제안한다. 제안된 방법은 차량의 영상에서 번호판 영역을 추출하는 부분과 추출된 번호판 영역의 문자를 인식하는 부분으로 구성된다. 본 논문에서는 차량 번호판 영역을 추출하기 위해 HSI 컬러 모형의 Hue 정보를 이용하여 차량 번호판 영역을 추출하고 개선된 퍼지 이진화 방법을 적용하여 추출된 차량 번호판 영역으로부터 문자를 포함한 특징영역을 이진화한 후에 4-방향 윤곽선 추적 알고리즘을 적용하여 개별 코드를 추출한다. 추출된 개별 코드를 인식하기 위해 잡음과 훼손에 비교적 강한 ART2 알고리즘을 적용한다. 제안된 방법의 차량 번호판 추출 및 인식성능을 평가하기 위하여 실제 비영업용 차량 번호판에 적용한 결과, 기존의 차량 번호판의 추출 방법보다 번호판 영역의 추출률이 개선되었다. 또한 ART2 알고리즘을 적용하여 신 차량 번호판을 인식하는 것이 효율적임을 확인하였다.

신경회로망을 이용한 제약 없이 쓰여진 필기체 문자열로부터 단어 분리 방법 (Segmentation of Words from the Lines of Unconstrained Handwritten Text using Neural Networks)

  • 김경환
    • 전자공학회논문지C
    • /
    • 제36C권7호
    • /
    • pp.27-35
    • /
    • 1999
  • 필기서술의 인식과 관련된 연구는 인식대상 영상이 바르게 분리된 인식단위를 포함한다는 전제로 진행되어 왔다. 그러나 실제적인 필기인식 시스템의 설계에 있어서, 다양한 필기방식으로 인해, 인식단위로의 분리가 선결되어야 할 문제이다. 본 논문에서는 제한없이 쓰여진 필기 문자열로부터 인식의 도움없이 독립된 단어를 분리하는 방법을 제안한다. 구성요소간 물리적인 거리에 의존하는 종래의 방법과 달리, 필기서술 자체로부터 필기자의 띄어쓰기와 관련된 특징들을 적극적으로 추출하고 이를 신경회로망을 사용하여 해석한다. 띄어쓰기와 관련된 정보는 문자 분리과정을 통해 분리된 문자 세그먼트의 높이와 세그먼트 중심선 사이의 간격들을 정규화하여 구한다. 연결요소간의 거리에 기반한 방법들과의 비교실험을 통해 제한한 방법의 유용성을 입증하였다.

  • PDF

명도 한글 글씨 영상에서의 비선형 형태 정규화 알고리즘 (Nonlinear Shape Normalization Algorithms for Gray-Scale Handwritten Hangul Images)

  • 김상엽;김대인;이성환
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.98-104
    • /
    • 1996
  • 일반적으로 비선형 형태 정규화 과정은 필기체 문자에서 발생하는 형태 변형을 보상하기 위하여 사용되며, 현재까지 이진 영상에 대한 비선형 형태 정규화 방법들이 제안되었다. 그러나 현존하는 대부분의 문자 인식 시스템은 스캐너를 통하여 입력된 명도 문자영상을 이진화하여 사용하고 있기 때문에 이진화로 인해 야기되는 물자 영상에 대한 정보 유실 및 잡영 첨가 현상이 비선형 형태 정규화 과정에 누적되어 결과적으로 좋은 특징 추출 결과를 기대하기 어려운 실정이다. 본 연구에서는 이진화에 의한 정보의 손실을 최소화시키고, 필기체 문자에서 발생하는 다양한 형태 변형을 효과적으로 보상할 수 있는 명도 영상에서의 비선형 형태 정규화 방법을 제안한다. 제안된 명도 영상에서의 비선형 형태 정규화 방법들의 성능을 객관적으로 검증하기 위하여 처리 시간 및 복잡도 등을 기준으로 평가하였으며, 다양한 명도 한글 글씨 데이터에 대한 실험을 통하여 이진 영상에서의 비선형 형태 정규화 방법에 비해 제안된 방법이 변형이 심한 한글 글씨 데이타의 품질을 개선하는데 있어서 매우 효율적임을 확인할 수 있었다.

  • PDF