• 제목/요약/키워드: 문자영역추출

검색결과 288건 처리시간 0.028초

투영면 컨벌루션과 결정트리를 이용한 상태 적응적 차량번호판 인식 시스템 (Adaptive Vehicle License Plate Recognition System Using Projected Plane Convolution and Decision Tree Classifier)

  • 이응주;이수현;김성진
    • 한국멀티미디어학회논문지
    • /
    • 제8권11호
    • /
    • pp.1496-1509
    • /
    • 2005
  • 본 논문에서는 투영면 컨벌루션과 결정트리 분류기법을 사용하여 주변 환경이 복잡한 차량영상으로부터 실시간으로 번호판을 추출하고 인식하는 적응적 차량번호판 인식 시스템을 제안하였다. 일반적으로 고속도로 톨게이트와 주차장 출입구에서의 차량영상은 설치 카메라와 도로 환경에 따라 차량번호판의 크기, 각도변화, 주변잡음 등으로 매우 다양하므로 번호판 추출과 분할이 어렵다. 따라서 본 논문에서는 차량 영상을 획득한 후 번호판 후보영역을 검출하고 진입 위치 변화에 따라 번호판의 기울기와 크기를 자동으로 보정하여 인식하는 알고리즘을 제안하였다. 제안한 인식 방법은 차량의 에지누적 분포와 번호판의 일정한 명암값 변화 빈도수를 누적한 투영면 컨벌루션과 체인코드를 사용하여 크기와 기울기가 일정하지 않은 번호판으로부터 번호판영역을 정확히 추출하고, 적응적 이진화 기법을 이용하여 문자를 분할하였다. 본 논문에서 제안한 방법으로써 실험한 결과 복잡한 영상에서 전방 및 후방 차량영상으로부터 번호판 인식이 가능하였으며 각각 $98.8\%$$95.5\%$의 추출률과 분할된 문자영역에서 $97.3\%$$96\%$의 인식률 개선 결과를 나타내었다.

  • PDF

문장 사이의 공백 기울기를 이용한 문서 이미지 기울기 보정 (Deskewing Document Image using the Gradient of the Spaces Between Sentences.)

  • 허우형;구은진;김철기;차의영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2013년도 춘계학술대회
    • /
    • pp.379-381
    • /
    • 2013
  • 본 논문에서는 문서 이미지에서 문장 사이에 공백영역의 기울기를 검출하고 보정하는 방법을 제안한다. 제안하는 방법은 문서 이미지에서 에지를 추출한 문장 사이에 가지는 공백들의 기울기 값을 통해 문서 이미지의 기울기를 보정한다. 문서 이미지를 일부의 영역으로 나누어서 처리함으로써 문서 내 외곽의 여백영역, 그림, 다단형식 등에 대해서 강건한 처리 결과를 보여준다. 제안하는 방법은 문자 영역의 픽셀을 이용하는 것이 아닌, 공백영역을 이용함으로써 기존의 방법보다 선명한 화질은 물론 저화질 문서 이미지에서도 효과적으로 보정된다.

  • PDF

공백행 추출에 의한 기울어진 문서 영상의 보정 (A Skew Correction for Document Images by the Extraction of Blank Lines)

  • 정재영;김문현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.541-543
    • /
    • 1998
  • 본 논문에서는 선형적으로 기울어진 문서 영상의 기울기를 검출하기 위한 단순하면서도 효과적인 알고리즘을 제안한다. 문서 내의 인접한 두 행 사이에는 일정한 두께의 공백 행이 존재하며, 그 공백 행의 기울기는 실제 문서의 기울어진 정도를 반영한다는 사실에 기인한다. 먼저, 간단한 모폴로지 연산을 이용하여 문자행 영역과 공백행 영역을 분리한 후, 이를 일정 간격으로 수직 샘플링하여 수직선 상에 있는 모든 공백행의 중심점(행간점)을 찾는다. 전체 영상으로부터 동일한 공백 행상에 있는 임의의 두 행간점간에 계산된 기울기들의 분포를 보면 실제 문서의 기울기에서 최대 값을 가진다. 제안한 알고리즘을 다양한 형태의 가로쓰기 문서(검출 가능한 최대 기울기 : $\pm$45$^{\circ}$)에 적용하여 0.5$^{\circ}$의 오차범위 내에서 정확한 결과를 얻을 수 있음을 보인다.

  • PDF

주민등록증 이미지의 숫자 인식을 통한 보고서 자동 기입 시스템 (Automatic Reporting System through ID Number Recognition at ID Card Image)

  • 이종호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2002년도 제14회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.57-61
    • /
    • 2002
  • 대부분의 공문서들이 주민등록증에 기입된 정보들을 반복적으로 기입하도록 요구하는 경우가 많다. 자동으로 주민 정보들을 기입하기 위해서 기계적으로 해독 가능한 정보로는 현재 주민등록증의 이미지만이 가능하다. 본 연구에서는 주민등록증을 스캐닝해서 얻은 이미지에서 주민번호를 추출하여, 개인신용정보의 조회나 반복적인 서류 작성에 개인정보들이 자동으로 기입되는 시스템을 개발하였다. 주민증의 이미지에는 사진과 위조 방지 문양, 그리고 성명, 주소, 주민번호 등의 문자 정보들이 들어있는데, 이 중에서 주민번호 숫자만 추출하였다. 이렇게 인식된 주민번호를 이용해서, 전산화가 되어 있는 주민 정보와의 대조를 할 수 있게 하였고, 개인 정보들을 XML로 정리하여 각종 문서 양식에 자동으로 기입될 수 있도록 하였다. 위조방지문양과 스캐너의 잡음 등에 기인한 왜곡을 해소하기 위해, 히스토그램 기법을 이용하여 숫자영역을 분리하고, 이진화한 다음, 특징점(끝점, 교차점, 분기점)의 정보와 ART1를 사용하여 숫자들을 분류하였다.

  • PDF

블록 정합을 이용한 비디오 자막 영역의 원 영상 복원 방법 (A Method for Reconstructing Original Images for Captions Areas in Videos Using Block Matching Algorithm)

  • 전병태;이재연;배영래
    • 방송공학회논문지
    • /
    • 제5권1호
    • /
    • pp.113-122
    • /
    • 2000
  • 이미 방송된 비디오 영상으로부터 자막 영역을 제거하고 원 영상으로 복원할 필요가 종종 발생한다. 복원될 영상의 량이 적을 경우 수 작업에 의한 복원이 가능하나, 비디오 영상과 같이 복원할 영상이 많아질 경우에는 수 작업에 복원은 어렵다고 볼 수 있다. 따라서 자동으로 자막 영역을 원 영상으로 복원할 수 있는 방법이 필요하게 된다. 기존의 영상 복원에 관한 연구는 주로 블러링(blurring)된 영상을 주파수 필터를 사용하여 선명하게 복원하거나, 영상 통신을 위한 비디오 코딩 방법에 대한 연구가 많이 이루어졌다. 본 논문에서는 블록 정합 알고리즘(Block Matching Algorithm)을 이용하여 자막 영역을 복원하는 방법을 제안하고자한다. 자막 복원을 위한 사전 정보로 자막 영역 정보와 장면 전환 정보를 추출한다. 추출된 자막 정보로부터 자막의 시작 프레임, 끝 프레임, 자막 문자의 구성 요소 정보를 얻을 수 있다. 자막 정보(자막의 시작 프레임, 끝 프레임)와 장면 전환 정보를 이용하여 복원의 방향성 및 복원의 종점을 결정한다. 복원의 방향성에 따라 각 프레임마다 문자의 구성 요소에 대한 블록 정합을 수행하여 원 영상을 복원한다. 실험결과 비교적 움직임이 적은 영상에서는 복원이 잘 됨을 볼 수 있었으며, 복잡한 배경을 갖고 있는 영상의 경우도 복원됨을 볼 수 있었다.

  • PDF

Clairaut의 <대수학 원론>에 나타난 대수 지도 원리에 대한 분석 (Analysis on the Principles for Teaching Algebra Revealed in Clairaut's )

  • 장혜원
    • 대한수학교육학회지:수학교육학연구
    • /
    • 제17권3호
    • /
    • pp.253-270
    • /
    • 2007
  • 18세기 프랑스의 수학자 A.C. Clairaut는 역사발생적 원리에 근거하여 기하 교재에 이어 대수 교재 <대수학 원론>을 집필하였다. 본 논문은 <대수학 원론>을 분석함으로써 대수 지도를 위해 Clairaut가 의도한 원리 및 구체적인 방식의 특징들을 고찰하고, 학교 수학에서 대수 영역의 교수-학습과 비교, 논의함으로써 적용 가능한 교수학적 시사점을 찾는 것을 목표로 한다. 이를 위해 <대수학 원론>의 구성 및 내용에 대해 개관하고 초보자의 정신에 자연스럽게 전개한다는 Clairaut의 의도에서 비롯된 대수 지도 원리의 여섯 가지 특징을 추출한다. 이 중에는 <기하학 원론>에서의 특징과 공통적인 것도 있고 대수라는 내용 영역상의 구별에서 비롯되는 독특한 것도 있다. 그리고 학교 수학의 대수 영역 중 특정 주제-방정식 세우기, 문자식의 계산과 문자의 부호, 곱셈의 부호 규칙, 이차방정식의 해법, 근과 계수와의 일반적 관계-와 관련하여 논의하고 시사점을 찾는다.

  • PDF

실세계 영상에서 경계선과 영상 분할을 이용한 기울기 검출 및 보정 (Extracting the Slope and Compensating the Image Using Edges and Image Segmentation in Real World Image)

  • 백재경;서영건
    • 디지털콘텐츠학회 논문지
    • /
    • 제17권5호
    • /
    • pp.441-448
    • /
    • 2016
  • 본 논문에서는 문자열과 배경이 혼합된 장면에서 영상을 분할하여 기울기를 추출하고 보정하는 방법을 제안한다. 제안된 방법은 모폴로지를 이용하여 전처리를 하고 캐니 연산자를 이용하여 경계선을 검출한다. 그리고 경계선이 검출된 영상을 분할하여 경계선이 포함되어 있지 않는 영역은 배제하고 경계선이 포함되어 있는 영역만을 이용하여 여러 방향의 기울기에 따른 투영 히스토그램을 생성한다. 이를 이용하여 각 영역의 최대 경계선 집중도를 갖는 기울기를 구하고 장면의 기울기를 보정한다. 문자열과 배경이 혼합된 장면의 기울기 검출에서 제안된 방법은 경계선이 없는 무의미한 부분을 배제하기 때문에 기존의 방법보다 0.7% 더 좋은 결과를 얻을 수 있었다.

지각적 표현에 기초한 비음 인식에 관한 연구 (Nasal Consonants Recognition Based on the Perceptual Representation)

  • 김기철;조정완
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1989년도 한글날기념 학술대회 발표논문집
    • /
    • pp.120-125
    • /
    • 1989
  • 음성 신호에는 언어정보이외에 여러 요인에 의한 정보가 포함되어 있어서, 문자와 일대일로 대응되는 분절을 정확하게 검출하기가 어렵다. 본 연구에서는 선형 예측계수 (LPC) 스펙트럼의 첨두 부분을 강조한 이진 (binary) 스펙트럼을 제안하고, 이를 바탕으로 음의 안정영역과 천이영역을 통합하여 음향특징을 추출하고자 한다. 각 영역의 특징은 이진 스펙트럼을 누적하여 구하며, 통합적인 특징은 각 영역의 특징을 결합한 관계적 특징으로 나타낸다. 제 2 차 포르만트 주파수의 궤적을 관계적 특징으로 하여, 양순 비음과 치조 비음을 구별한 결과, 모음의 문맥과 화자에 비교적 독립적인 인식결과를 얻을 수 있었다. 또한 이진 스펙트럼이 원래의 스펙트럼에 포함된 정보를 유지하는지 검토하기 위해, 같은 거리척도 (distance measure) 에 의해 인식 실험한 결과 이진 스펙트럼의 성능이 오히려 우수하게 나타났으며, 관계적 이진 스펙트럼의 경우 화자에 따른 변화가 더욱 적었다. 음성에 백색 잡음 (Gaussian white noise)을 더하여 잡음음성 (noisy speech) 을 만든 뒤, 같은 방법으로 실험한 결과도 유사한 인식결과를 얻을 수 있어 제안된 이진 스펙트럼의 유효성을 확인하였다.

  • PDF

공간의존행렬과 신경망을 이용한 문서영상의 효과적인 블록분할과 유형분류 (An Efficient Block Segmentation and Classification Method for Document Image Analysis Using SGLDM and BP)

  • 김중수;이정환;최흥문
    • 한국정보처리학회논문지
    • /
    • 제2권6호
    • /
    • pp.937-946
    • /
    • 1995
  • 본 논문에서는 공간의존행렬과 신경망을 이용하여 문서영상에서 인식대상 문자가 포함되어 있는 블록들을 좀더 세분해 낼 수 있는 효과적인 방법을 제시 하였다. 제안 된 방법은 명암도 문서블록에서 공간의존행렬을 구하고 7가지 질감 특징을 추출한 뒤 신경망을 이용해 문서블록을 9가지 유형으로 분류할 수 있도록 하였다. 특히 기존에는 비문자영역으로 분류되던 수식, 도표, 순서도 등 주로 문자가 포함되어 있는 블록들을 세분해 낼 수 있도록 하였다. 또한 신경망 학습알고리즘인 BP 를 사용함으로써 기존의 선형분류시에 요구되던 유형별 임계값과 선형면결정지수를 찾는 어려움을 해소하였다. 명암도영상을 이진화하기 전에 먼저 Sobel연산을 적용함으로써 문서 뒷면에 의한 배경 잡음의 영향을 줄일 수 있도록 하였고, 교차 문지르기 후 분할함으로써 블록이 작은 조각으로 나누어지는 것을 방지하도록 하였다. 실험결과 제안한 방법에서는 문자가 포 함되어 있는 블록은 큰 문자, 중간문자, 작은 문자블록 및 수식, 순서도, 도표블록의 6가지로, 그리고 비문자블록은 인물사진, 그래프 등 3가지 유형으로 상세하게 분류 할수 堞있었으며 전체적인 분류성능도 우수함을 확인할 수 있었다.

  • PDF

이동 차량에서의 실시간 자동차 번호판 인식 (Real-time Recognition of Car Licence Plate on a Moving Car)

  • 박창석;김병만;서병훈;김준우;이광호
    • 한국산업정보학회논문지
    • /
    • 제9권2호
    • /
    • pp.32-43
    • /
    • 2004
  • 이동중인 차량에 카메라를 설치하여 주행 중에 정지 또는 주행중인 자동차의 영상을 획득하여, 이를 인식하는 시스템을 제안한다. 주행 중에 획득한 영상에서 번호판 영역을 추출하기 위하여, 번호판 영역에서 나타나는 강한 수직 에지 성분을 이용하여 번호판 후보 영역들을 찾고 이진화 된 영상에서의 배경과 문자의 구성비를 따져 번호판 영역을 추출하는 방법을 사용한다. 자동차 번호판 인식을 위하여 다중 클래스 인식을 지원하는 SVM과 모듈라 신경망 인식 성능을 비교하였으며, 인식률을 높이기 위하여 SVM을 모듈라 신경망과 결합하여 다중 클래스 분류기로 확장하는 방법을 제안하고 실험하였다. 실험결과, 제안하는 분류기를 이용한 방법이 번호판 인식에 우수한 성능을 보임을 확인하였다.

  • PDF