• 제목/요약/키워드: 문자 추출

검색결과 670건 처리시간 0.027초

칼라정보와 주성분분석법을 이용한 차량 번호판 인식에 관한 연구 (Vehicle License Plate Recognition System using Color Information and PCA)

  • 한수환;박성대;김판곤
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2005년도 춘계 종합학술대회 논문집
    • /
    • pp.437-442
    • /
    • 2005
  • 본 연구에서는 칼라정보와 주성분분석법(principal component analysis : PCA)를 이용한 차량 번호판 인식시스템을 구성하였다. 먼저 입력된 차량 영상에서 번호판의 형태적 특징과 녹색 칼라 정보를 이용하여 번호판 영역을 추출하였으며, 추출된 번호판내의 문자 및 숫자의 위치적 특징을 이용하여 번호판의 종류(구형, 신형, 최신형)를 구분하였다. 이렇게 추출되고 구분된 번호판은 문자의 상대적 위치정보와 수평 및 수직 투영 정보를 함께 이용하여 각각의 문자영역을 분리 추출하였다. 추출된 문자영역은 주성분분석법을 이용하여 고유벡터를 추출한 후 문자 인식에 사용하였다. 본 논문의 실험과정에서는 다양한 시간대 환경에서 촬영된 주행 중인 자동차 320대의 자가용 차량영상에 대하여 실험하였으며 높은 번호판 추출률과 번호판종류 구분률 그리고 문자 인식률을 얻을 수 있었다.

  • PDF

장면 이미지로부터 문자-에지 맵 특징을 이용한 텍스트 추출 (Text Extraction using Character-Edge Map Feature From Scene Images)

  • 박종천;황동국;이우람;권교현;전병민
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2006년도 춘계학술발표논문집
    • /
    • pp.139-142
    • /
    • 2006
  • 본 연구는 장면 이미지로부터 텍스트에 존재하는 문자-에지 특징을 이용하여 텍스트를 추출하는 방법을 제안한다. 캐니(Canny)에지 연산자를 이용하여 장면 이미지로부터 에지를 추출하고, 추출된 에지로부터 16종류의 에지-맵 생성한다. 생성된 에지 맵을 재구성하여 문자 특징을 갖는 8종류의 문자-에지 맵을 만단다. 텍스트는 배경과 잘 분리되는 특징이 있으므로 텍스트에 존재하는 '문자-에지 맵'의 특징을 이용하여 텍스트를 추출한다. 텍스트 영역에 대한 검증은 문자-에지 맵의 분포와 텍스트에 존재하는 글자간의 공백 특징으로 한다. 제안한 방법은 다양한 종류의 장면 이미지를 실험대상으로 하였고, 텍스트는 적어도 2글자 이상으로 구성된다는 제한조건과 너무 크거나 작은 텍스트는 텍스트 추출에서 제외하였다. 실험결과 텍스트 영역 추출률은 약 83%를 얻었다.

  • PDF

자연 영상에서 문자열 추출 (Text Location in Scene Images)

  • 최미화;김희승
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.389-391
    • /
    • 2000
  • 본 논문을 자연여상에서 문자열의 위치를 찾아내는데 모폴로지 연산인 WTH(white top-hats)과 BTH(black top-hars)을 사용하였다. 기존의 자연영상에서의 문자열추출은 칼라양자화방법 경우 각 칼라공간에서 문자열 추출과정을 반복 적용하거나 모델기반방법의 경우 문자열의 획의 크기나 특징에 따라서 하나의 영상을 여러 개로 분리 적용하여 추가적인 계산비용을 필요로 한다는 점을 개선하고 공간적 변화도를 이용하여 영상을 직접 처리하는 경우 최소 문자열 후보영역을 찾기 위한 프로세스를 다시 적용해야 한다는 점을 개선하였다. 자연영상에 문자열의 위치를 대략적으로 찾아내기 위해 WTH+BTH을 적용하여 그 결과로 문자열의 대략적 위치와 최소문자열후보영역을 동시에 얻을 수 있다. 문자열이 가지는 특성을 적용하여 문자열-비문자열 분류과정을 적용하고 후처리를 통해 완전한 문자열의 위치를 보여준다.

  • PDF

차량 번호판 인식 시스템에 관한 연구 (A Study on Vehicle License Plate Recognition System)

  • 한수환;우영운;박성대
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 춘계학술발표논문집(상)
    • /
    • pp.346-351
    • /
    • 2002
  • 본 연구에서는 차량 번호판에서 추출된 문자영역의 DCT(Digital Cosine Transform) 계수와 LVQ (Learning Vector Quantization) 신경회로망을 이용하여 차량 번호판 인식 시스템을 구성하였다. 입력된 차량영상의 RGB 칼라정보를 이용하여 번호판 영역을 추출하고 추출된 번호판의 히스토그램과 문자의 상대적 위치정보를 병합하여 문자영역을 추출하였다. 이렇게 추출된 문자영역의 명암도 영상에 DCT를 적용하여 얻은 특징 벡터는 LVQ 신경회로망의 입력으로 사용되어 인식 과정을 수행한다. 제안된 시스템의 검증을 위하여 다양한 환경에서 촬영된 109대의 자가용 차량영상에 대하여 실험하여 상대적으로 높은 번호판 영역 추출율과 인식률을 보였다.

  • PDF

기울기 보정과 블록 분할 합병을 통한 문자 추출 (Text Extraction by Skew Normalization and Block Split & Merge)

  • 김도현;차의영;강민경
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.424-426
    • /
    • 2001
  • 신문, 잡지, 공문서, 영수증 등의 문서로부터 필요한 정보를 자동화하여 처리할 수 있는 문서영상 이해 시스템의 구현에 있어서 문서영상에 존재하는 문자를 추출하는 연구는 문자 인식의 전처리 단계로서 매우 중요한 의미를 지니고 있다. 하지만 현 시점에서 문서 자체가 가지는 다양한 형태 및 배경 등에 의하여 범용화되고 일반화된 방법을 찾기란 매우 어려운 실정이다. 본 논문에서는 특히 배경이 선이나 도표 등으로 이루어진 문서 영상에서 Hough Transform을 사용하여 기울어짐을 보정하고 문자들이 선에 겹친 부분을 효과적으로 보정하며 추출된 영역에 대한 분할 및 합병 과정을 거쳐 최종적으로 완전한 문자 영역을 추출하는 방법에 대하여 다룬다.

  • PDF

레이블링 기법과 밝기값 변화에 기반한 컬러영상의 문자영역 추출 방법 (Text Area Extraction Method for Color Images Based on Labeling and Gradient Difference Method)

  • 원종길;김혜영;조진수
    • 한국콘텐츠학회논문지
    • /
    • 제11권12호
    • /
    • pp.511-521
    • /
    • 2011
  • 영상 입출력 장치 사용이 증가함에 따라 컬러영상 내 문자영역 추출의 중요성 또한 높아지고 있다. 본 논문은 이러한 영상 내 문자영역을 효과적으로 추출하기 위해 레이블링 기법과 화소 단위의 밝기값 변화에 기반한 문자영역 추출 방법을 제안한다. 제안하는 방법은 레이블링 및 필터링 과정을 통해 비문자 영역을 미리 제거하고, 밝기값의 변화가 큰 문자영역의 특성을 이용하여 문자영역 후보군을 추출한 후 노이즈 제거 및 문자영역 병합의 후처리 과정을 통해 문자영역을 추출한다. 제안한 방법의 강점은 기존 방법보다 단순하면서도 높은 정확성에 있다. 실험 결과 제안한 방법의 정확도와 재현율, 비문자 추출의 역 비율(IRNTE)은 각각 99.59%, 98.65%, 82.30%로 측정되었다.

오프라인 문서에서 개별 문자 추출과 한자 인식에 관한 연구 (A Study on the Extraction of an Individual Character and Chinese Characters Recognition on the Off-line Documents)

  • 김의정;김태균
    • 한국정보처리학회논문지
    • /
    • 제4권5호
    • /
    • pp.1277-1288
    • /
    • 1997
  • 본 논문에서는 인체 문서 인식을 위한 전처리 과정인 개별 문자 추출 방법과 인식 방법에 대하여 논한다. 전처리에서는 접촉 문자(touching charadcter) 또는 겹친 문자 (overlaapped character) 등과 같이 추출이 곤란한 문자를 개별 문자로 추출하는 것이다. 기존의 문자 분리 방법에서는 투영((projection)에 의한 방법과 외곽선(edge)추척에 의한 방법 등을 사용하여 왔으나, 제안된 방법은 문자열 추출 후 한번의 투영으로 연결 화소를 이용하여 개별 문자를 추출한다. 인식을 위해서는 최대불록화 방법(Maximum Block Mehtod:MBM)을 이용하여 특징 추출을 한다. 최대불록화는 문자를 투영 중 처음 찾아진 점에서부터 최대한 불록을 확정 시키는 방법이다. 문자를 이루는 최대불록들을 직선 불록과 사선 불록으로 분리후 골격화 시킨다. 특히 한자 인식에서 기존의 상용 문자 인식기와 비교하여 향상된 인식율을 얻을 수 있다.

  • PDF

자동차 영상에서의 번호판 추출과 문자 인식에 관한 연구 (A Study on License Number Plate Extraction in a Car Image and Recognition)

  • 남기환;배철수;나상동
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (상)
    • /
    • pp.713-716
    • /
    • 2002
  • 자동차의 번호판은 각각의 차량을 추분 할 수 있는 것으로, 번호판의 문자를 인식함으로써 전국에 등록되어 있는 모든 차량 중에 1 대를 폭정 지을 수 있다. 그러나 기존의 연구방법 대부분은 번호판 문자 중에서 큰 숫자 4개만을 인식하는 것으로 전국적인 규모에서 완전한 차량인식이 불충분하였다. 따라서 본 논문에서는 차량의 정면에서 촬영한 영상에서 번호판을 추출하고, 그 안에 표기된 모든 문자를 인식하는 방법을 제안한다. 본 연구에서 사용된 방법은 허프변환과 번호판의 형상특징을 이용하여 번호판영역을 추출하고, 추출된 번호판에서 문자의 위치적 특징을 사용하여 각 문자를 추분하고 인식하였다. 160장의 샘플사진으로 실험해 본 결과 번호판 영역을 추출하고, 문자인식을 모두 성공한 종합성공률은 87.5%의 결과를 나타내었다.

  • PDF

윤곽선 추적 알고리즘을 이용한 명함 영상에서의 문자 추출에 관한 연구 (A Study on the Extraction of Character from a Calling Card by using Contour Tracking Algorithm)

  • 박소연;윤수정;이정호;김명재;임은경;김광백
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.723-726
    • /
    • 2001
  • 본 논문은 흑백 영문 명함 영상에서 개별 문자 추출에 관한 연구이다. 20개의 원본 명함 영상을 3배로 축소하고, 가로 세로 스미어링 기법을 이용하여 문자간의 여백을 제거하여, 문자 영역의 추출을 용이하게 하였다. 그리고, 윤곽선 추적 기법을 이용하여 문자열과 개별 문자를 추출하였다. 실험결과에서는 윤곽선 추적 알고리즘을 이용한 명함의 개별 문자 추출이 효과적인 것을 보인다.

  • PDF

여권 인식을 위한 영상 및 문자 영역 추출 (Character Region and Picture Extraction of Passport Image)

  • 김태종;권영빈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 추계학술발표논문집(상)
    • /
    • pp.825-828
    • /
    • 2004
  • 본 논문에서는 여권 인식 시스템을 위한 전처리 단계로 스캔된 여권 영상에서 문자 영역을 추출하는 방법에 대해 제안하였다. 인식에 필요한 문자 영역을 흑 화소로 나머지 영역은 휜 화소로 이진화하기 위해서 문자의 RGB 값을 이용하였다. 이진화하는 임계 값을 자동으로 결정하기 위하여 MRZ 의 일부 영역을 사용하였다. 이진화된 영상에서 비문자 영역인 사진 영역을 제거하기 위하여 가로/세로 프로파일을 수행한다. 결과 값을 분석하여 사진 영역을 결정하고 제거하여 여권 상에서 문자 영역 추출이 가능하였다.

  • PDF