• 제목/요약/키워드: 문자영역추출

검색결과 288건 처리시간 0.035초

연결요소와 색상정보를 이용한 실제적 문서영상 분할 (Practical Page Segmentation using Connected Components and Color Information)

  • 김병기
    • 한국정보처리학회논문지
    • /
    • 제7권1호
    • /
    • pp.273-285
    • /
    • 2000
  • 문서영상의 분할은 문서인식의 전 과정 중에서 인식률에 큰 영향을 미치는 단계이지만 국내에서는 양적${\cdot}$질적으로 이에 대한 실제적인 연구가 부족한 것이 사실이다. 그 결과, 구조가 복잡하거나 칼라로 인쇄된 문서의 분할은 여전히 개선할 점이 많다. 본 논문에서는 불규칙한 다단, 점선, 그래픽, 사진 등의 다양하고 복잡한 요소로 구성된 문서의 실제적인 분할문제들을 살펴보고, 연결요소와 색상정보를 이용하여 이들을 효율적으로 분할하는 실제적 문서영상 분할 기법을 제안한다. 윤곽선 추출을 이용하여 다양한 형태의 모든 연결요소를 추출하고, 추출된 연결요소별 유형판정 및 연결요소 병합기준을 이용함으로써 정확한 문서영상 분할이 가능하다. 또한 색상문서의 경우, 정확한 문서분할과 처리시간 개선을 위하여 먼저 이진화된 문서에 대해서 문자와 비문자 영역으로 분할한 후, 필요에 따라 비문자 영역에 대하여 별도의 칼라별 영역분할을 수행한다. 제안된 방법의 성능을 확인하기 위하여 다양한 구조와 내용을 갖는 180장의 문서영상을 대상으로 문서분할 실험을 수행하였다. 아울러, 6가지 국내외 상용 문서인식 소프트웨어의 문서영상 분할 결과와 비교함으로써 제안한 방법이 복잡한 문서영상의 실제적 분할에 우수한 성능을 보임을 확인하였다.

  • PDF

CCD 기반 바코드 관심대상영역 고속 추출에 관한 연구 (A Study on the High-Speed Extraction of Bar Code ROI based on the CCD)

  • 박문성;최호석;김진석;김혜규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (하)
    • /
    • pp.1103-1106
    • /
    • 2002
  • 현재, 컨베이어 벨트시스템에 소포를 직재하고, 우편번호를 운영자가 입력하여 구분한다. 구분된 소포 중에서 기록관리 대상의 경우에는 바코드를 판독하여 처리하고 있다. 이에 따라, 본 논문에서는 2m/sec 이내로 이송되는 소포를 라인 CCD(Charged Coupled Device) 카메라에 의해 이미지 획득한 후, 바코드 ROI 추출 방법을 위해 $32{\times}32$ 미세블룩 검사 방법을 적용하였다. ROI 추출 절차는 최대-최소 차이값과 동적 인계값 기준으로 바탕면 제거, 문자열과 바코드 영역을 판단하기 위한 대각선(diagonal) 검사방법 적용, 바코드 영역인지 검증하기 위해 수평으로 5 라인을 검사하고 에지의 수와 폭의 변화량 비교 등의 과정으로 수행하였다. 그리고 바코드 ROI 추출은 레이블링 과정에 의해 바코드 영역의 보정과 그룹크기 비교에 의한 ROI 영역의 구체화와 정보 해석을 위하여 ROI 외곽좌표 8개중에서 가장 간 중심축 라인으로 생성하는 방법 등을 적용하였다. ROI 추출과 중심축 시험결과에 의하면 $50{\sim}180msec$이내에 가능하게 되었다. 그리고, ROI 추출의 정확도는 99.994% 이상을 만족한다.

  • PDF

다중 활자체 한글 문자 인식을 위한 유형 분류 (The Type Clustering for the Multi-Font Hangul Character Recognition)

  • 김민기;권영빈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.194-199
    • /
    • 1997
  • 본 논문에서는 글꼴의 변화와 잡영을 흡수할 수 있도록 자소의 탐색 영역을 정의 하였으며 이 영역에 나타나는 횡모음과 종모음의 주획을 추출하는 방법을 기술하였다. 종모음 영역에서 추출한 수직획들과 횡모음 영역에서 추출한 수평획들을 각각 종모음과 횡모음의 주획이 될 수 있는 후보들로써 이들로 부터 종모음과 횡모음의 존재를 파악하는 것이 한글 유형 분류의 주된 내용이다. 그러나 다양한 글꼴에 나타나는 수평획들로부터 곧바로 횡모음의 존재를 파악하는 것은 쉬운 문제가 아니다 본 논문에서는 기존의 트리 분류기를 확장하여 복잡하고 다양한 특징을 단계별로 단순화시키고 트리 분류기의 상위 노드에서 결정된 정보와 제약 조건을 이용하여 유형을 분류하는 방법을 제안하였다. 제안된 방법은 한글 상위 빈도 1405자, 3가지 글꼴에 대하여 99.8 %의 유형 분류율을 보이고 있다.

  • PDF

Watershed 변환을 이용한 효율적인 문자 영상 향상 및 영역 분할 (An Efficient Character Image Enhancement and Region Segmentation Using Watershed Transformation)

  • 최영규;이상범
    • 정보처리학회논문지B
    • /
    • 제9B권4호
    • /
    • pp.481-490
    • /
    • 2002
  • 오프라인 필기체 문자 인식은 동적인 정보를 가지고 있지 않고, 다양한 필기와 자음과 모음의 겹침이 심하며, 획 사이의 잡영을 많이 가지고 있어 불완전한 전처리를 수행하여야 하는 어려움이 있다. 따라서 오프라인 필기체 문자 인식은 다양한 방법의 전처리 즉 이진화 및 세선화에 대한 연구가 필요하다. 본 논문에서는 오프라인 필기체 한글 문자 인식의 전처리로서 워터쉐드 알고리즘의 수행 시간과 결과 영상의 품질을 고려해 그레이 레벨 문자 영상에서의 문자 영역과 배경 영역의 분할을 위한 효과적인 워터쉐드 알고리즘의 적용 방법과 추출된 워터쉐드 영상을 이진화하는 분할 함수를 제안한다. 또한 수행 시간과 골격선의 품질을 고려한 조건 검사 마스크를 통해서 효과적으로 골격선을 추출하는 세선화 방법을 제안하고 기존의 방법과 본 논문 방법을 수행 시간과 품질로써 성능을 평가한다. 실험 결과 기존의 방법은 평균 2.16초, 본 논문 방법은 평균 1.72초의 수행 시간이 걸렸다. 또한 결과 영상의 품질은 본 논문 방법이 문자 획 사이의 잡영을 효과적으로 처리함을 알 수 있었다.

실세계 영상에서 적응적 에지 강화 기반의 MSER을 이용한 글자 영역 추출 기법 (An Extracting Text Area Using Adaptive Edge Enhanced MSER in Real World Image)

  • 박영목;박순화;서영건
    • 디지털콘텐츠학회 논문지
    • /
    • 제17권4호
    • /
    • pp.219-226
    • /
    • 2016
  • 일반 생활 속에서 우리 인간의 눈으로 정보를 인식하고 그 정보를 이용하는 것에는 한계가 없을 만큼 다양하고 방대하다. 그러나 인공지능이 발달한 현재의 기술로도, 인간의 시각 처리 능력에 비하면 턱없이 능력이 부족하다. 그럼에도 불구하고 많은 연구자들은 실생활 속에서 정보를 얻고자 하고 있고, 특히 글자로 된 정보를 인식하는데 많은 노력을 기울이고 있다. 글자를 인식하는 분야에서 일반적인 문서에서 글자를 추출하는 것은 일부 정보처리 분야에서 이용되고 있지만, 실영상에서 문자를 추출하고 인식하는 부분은 아직도 많이 부족하다. 그 이유는 실영상에서는 색깔, 크기, 방향, 공통점 등에서 다양한 특징을 갖고 있기 때문이다. 본 논문에서는 이런 다양한 환경에서 문자 영역을 추출하기 위하여 적응적 에지 강화 기반의 MSER을 적용하여 장면 텍스트 추출을 시도하고, 비교적 좋은 방법임을 실험으로 보인다.

연결요소 특징을 이용한 복잡한 문서영상의 구조 분석 (A new segmentation method for non-manhattan layout document images using connected component)

  • 이상협;이경무
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1997년도 학술대회
    • /
    • pp.71-74
    • /
    • 1997
  • 본 논문은 일반적으로 제약 없는 형식 문서 즉, 논-맨하탄(non-manhattan) 형식의 이진문서영상을 분석하는 기법으로서, 연결요소기법에 기반한 특징추출과 이를 이용한 영역분리 및 분류에 관한 새로운 방법을 제안한다. 제안한 방식은 바텀-업(bottom-up)방식으로서 먼저 처리속도의 고속화와 축소시 특징 영역보존을 위해 임계치 축소기법을 사용하고, 축소된 이진 문서영상내의 각 연결된 검은 화소의 집합을 개체화하고 개체의 특성에 따라 텍스트, 신성분, 해프톤, 도형 그리고 표 등으로 분류한다. 영역분류는 두단계로 이루어지는데, 1차분류에서는 우선, B/W 비, 면적, 외각 테두리의 높이와 너비 비, 테두리선유무 등의 특징을 이용하여 해프톤, 수평 수직선, 테두리(표 및 도형)영역을 분리한다. 이후 2차 분류에서는 문자성분의 수평결합을 통한 텍스트행 성분을 추출한다. 마지막 후처리 과정으로 표분석 알고리듬을 통하여 테두리 영역중 표와 도형을 정확히 구분하고, 또한 도형에 관련한 문서성분을 해당 도형 개체에 연결하는 작업을 수행함으로써 완벽한 영역분류를 한다. 다양한 문서영상을 이용한 시뮬레이션을 통해 제안한 알고리듬의 성능을 입증한다.

  • PDF

Adaptive Multi-threshold를 이용한 자동차 번호판영역의 이진화 (Binarization of Vehicle Plate Region using Adaptive Multi-threshold)

  • 김형재;이도엽;배익성;이철희;차의영
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 1998년도 춘계학술발표논문집
    • /
    • pp.143-147
    • /
    • 1998
  • 카메라 영상에 의한 자동차 번호판 인식시스템은 영상 획득, 번호판 추출, 전처리, 문자 분리, 문자 인식 등 크게 5자기의 핵심 부분으로 구성된다. 따라서 자동차 번호판 인식시스템의 성능을 향상시키기 위해서는 이들 부분들 각각의 성능의 최적화가 필요하다. 본 연구는 자동차 번호판 인식시스템의 여러 단계 중 전처리에 해당하는 번호판 영역의 이진화에 관한 연구로서, 기존의 단일 임계치 방법과 다중 임계치 방법이 해결하지 못했던 부분을 보완하는 새로운 다중 임계치 방법을 제안한다. 본 논문에서 제안하는 다중 임계치 알고리즘(Adaptive Multi-threshold Algorithm)을 사용함으로써 gray-level 번호판 영상에 대해서 보다 깨끗한 이진 영상을 얻을 수 있었으며, 또한 이 알고리즘은 번호판 영역의 밝기값이 고르지 않은 영상에 대해서도 효율적인 알고리즘 임을 알 수 있었다.

  • PDF

호텔링 변환을 이용한 자동차 번호판 인식시스템에 관한 연구 (License Plate Recognition System Using Hotelling Transform)

  • 김태우;강용석
    • 한국정보전자통신기술학회논문지
    • /
    • 제2권1호
    • /
    • pp.29-35
    • /
    • 2009
  • 본 논문에서는 차량의 후면에서 촬영한 영상을 이용하여 효과적으로 번호판을 추출하고, 그 안에 표기된 문자를 인식하는 방법을 제안한다. 기존의 연구방법은 전체영상에 대하여 전처리를 수행하여 에지(edge)영상을 구하여 이진화 한다. 이진화된 영상에서 허프(Hough)변환을 수행하여 수평, 수직선을 구하고, 번호판의 특징을 이용하여 번호판 영역을 추출한다. 이 방법의 문제점은 처리시간이 많이 소요되므로 실시간처리가 곤란하다는 점과 야간관 같이 명암상태가 불규칙하고 영상에서 번호판 테두리가 나타나지 않으면 번호판 영역추출을 할 수 없다는 점이다. 또한 차량의 후면에서 촬영한 영상에서 번호판 영역의 명암값 변화의 특성을 이용하여 번호판 영역에서 숫자폭, 배경영역과 숫자영역의 명암차를 조사하여 숫자영역임을 확인하고, 확인된 숫자와 숫자사이의 거리를 조사하여 번호판 영역을 추출한다. 본 연구는 기존방법의 번호판 테두리 훼손에 따른 번호판 영역추출 실패의 문제점을 해결하고 시간 소요의 문제를 실시간안에 처리 함으로써 실용적 응용이 가능하다. 실험 결과 100장의 샘플영상으로 실험한 결과 멀리 있는 자동차 영상에서도 자동으로 번호판을 판독할 수 있었으며, 번호판 추출에 실패한 영상은 13%를 나타내었고, 문자인식에 실패한 영상은 0.4%의 결과를 나타내었다.

  • PDF

고속처리 자동차 번호판 인식시스템 (A High Performance License Plate Recognition System)

  • 남기환;배철수
    • 한국정보통신학회논문지
    • /
    • 제6권8호
    • /
    • pp.1352-1357
    • /
    • 2002
  • 본 논문에서는 차량의 후면에서 촬영한 영상을 이용하여 효과적으로 번호판을 추출하고, 그 안에 표기된 문자를 인식하는 방법을 제안한다. 기존의 연구방법은 전체영상에 대하여 전처리를 수행하여 에지(edge)영상을 구하여 이진화한다. 이진화된 영상에서 허프(Hough)변환을 수행하여 수평, 수직선을 구하고, 번호판의 특징을 이용하여 번호판 영역을 추출한다 이 방법의 문제점은 처리시간이 많이 소요되므로 실시간 처리가 곤란하다는 점과 야간관 같이 명암상태가 불규칙하고 영상에서 번호판 테두리가 나타나지 않으면 번호판 영역추출을 할 수 없다는 점이다. 또한 차량의 후면에서 촬영한 영상에서 번호판 영역의 명암값 변화의 특성을 이용하여 번호판 영역에서 숫자폭, 배경영역과 숫자영역의 명암차를 조사하여 숫자영역임을 확인하고, 확인된 숫자와 숫자사이의 거리를 조사하여 번호판 영역을 추출한다. 본 연구는 기존방법의 번호판 테두리 훼손에 따른 번호판 영역추출 실패의 문제점을 해결하고 시간 소요의 문제를 실시간 안에 처리함으로써 실용적 응용이 가능하다. 실험 결과 100장의 샘플영상으로 실험한 결과 멀리 있는 자동차 영상에서도 자동으로 번호판을 판독할 수 있었으며, 번호판 추출에 실패한 영상은 13%를 나타내었고, 문자 인식에 실패한 영상은 0.4%의 결과를 나타내었다

변형된 ICM 방식에 의한 영역판별 (Region Decision Using Modified ICM Method)

  • 황재호
    • 대한전자공학회논문지SP
    • /
    • 제43권5호
    • /
    • pp.37-44
    • /
    • 2006
  • MRF (Markov random fields)로 전후 관계가 모델링된 변형된 형태의 ICM 방식을 소개한다. 특징 추출을 위해 부합블록인접의 새로운 MRF 모델을 제시한다. 이 모델은 현재 고려중인 화소를 기점으로 지엽구조인 복수방향의 기하학적 인접화소군들을 발생시켜 집합을 형성한다. 전처리 작업을 통해 산출한 특정 영역 색도분포의 확률적 데이터를 근거로 매 인접화소군 화소들 사이의 색도분포와 인접화소군들 사이의 관련성 여부를 단계별로 확률적으로 비교 판별함으로 해당화소의 영역귀속을 결정한다. 귀속 영역이 판별된 화소에는 특정 색도를 부여하고 타영역의 원소와 차별한다. 이러한 과정을 전 화소들에 확대 적용하면서 관측영상은 영역별로 순차적으로 분류되며 정보가 추출된다. 대상 영상은 탁본영상으로서 바탕영역과 정보영역을 차별적으로 분류, 색도부여를 통해 문자만의 특징을 선별한다. 이 방식은 종래의 ICM 방식의 단점이었던 과/부족 평활 현상을 최소화하는 동시에, 벡터적 판별력 부가에 의한 특정영역 잡음 제거와 얼룩현상 극소화에 효과가 있음이 실험을 통해 확인할 수 있었다. 또한 MICM 방식을 탁본영상의 문자인식에 적용하면 우수한 효과가 있으리라 기대한다.