• 제목/요약/키워드: 문자영역추출

검색결과 288건 처리시간 0.025초

웹 이미지로부터 이미지기반 문자추출 (Locating Text in Web Images Using Image Based Approaches)

  • Chin, Seongah;Choo, Moonwon
    • 지능정보연구
    • /
    • 제8권1호
    • /
    • pp.27-39
    • /
    • 2002
  • 본 논문은 다양한 웹 이미지로부터 문자영역(text block)의 위치를 알아내고 문자영역을 추출하는 방법을 제안한다. 인터넷 사용자관점에서 볼 때, 웹 이미지에 포함되어 있는 문자정보는 중요한 정보이지만 최근까지 이 분야의 연구는 그리 활발하지 못했다. 본 연구에서 제안된 알고리즘은 문자의 경사방향(skew)과 문자의 크기나 폰트에 관한 사전 정보 없이 수행되어 질 수 있도록 제안되었다 폰트 스타일과 크기에 제약되지 않고 문자영역을 적합하게 추출하기 위해 유용한 에지 검출, 문자 클러스터링 영역으로 정의되는 문자의 고유한 특성을 위한 히스토그램을 사용하였다. 다수의 실험을 통하여 제안된 방법을 테스트하고 수용할 만한 결과를 도출했다.

  • PDF

코스트 최소화법에 의한 문자영역의 추출 (On Character Region Extraction by Cost Minimization Method)

  • 김석태
    • 한국정보처리학회논문지
    • /
    • 제3권2호
    • /
    • pp.348-358
    • /
    • 1996
  • 범용성을 지닌 문자 영역의 추출을 위해서는 대상화상에 의존하지 않는 정보를 활용 할 필요가 있다. 본 논문에서는 문장영역의 추출문제를 코스트 최소화 개념으로 접근 하여, 문자의 일반적 특징들을 종합적으로 고려하는 결과를 얻을 수 있는 범용성을 띤 영역추출방법을 제안한다. 구체적으로는, 문자의 형상과 배치에 관한 규칙성을 구하고자 하는 해에 대한 조건으로 설정, 그조건을 충족시키는 해가 최소값을 갖는 코스트 함수로 도입하고, 이 함수를 Simulated Annealing법에 의해 최소화하여 영역추출을 한다. 본 방법은 코스트 함수를 정의한다는 점에서 다른 방법과 확연한 차별성을 갖는다. 본 코스 트 함수를 이용한 영역 추출실험 결과, 실험가설에 부합되는 결론을 얻어 제안방법의 유효 성이 확증되었다.

  • PDF

변형된 Run Length Coding 기법을 이용한 이치화된 자동차 번호판 영상에서의 문자 분리 (Character Segmentation of Binary Vehicle Plate using Modified Run Length Coding)

  • 이도엽;김형재;배익성;이철희;차의영
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 1998년도 춘계학술발표논문집
    • /
    • pp.138-142
    • /
    • 1998
  • 자동차 번호판 인식시스템은 영상획득, 번호판 추출, 전처리(이치화), 문자영역분할, 문자인식 등의 5가지 핵심부분으로 구성되어 있다. 따라서 자동차 번호판 인식시스템의 최종 인식률은 각 단계의 성능에 따라 직접적인 영향을 받는다. 본 논문은 컴퓨터 비젼의 한 분야인 영상처리 기법을 이용한 이치화된 자동차 번호판의 문자영역 추출에 관한 연구로서 문자 인식단계에서 높은 인식률을 확보하기 위해서 가장 중요한 입력 데이터의 상태를 보다 깨끗하게 정확하게 분리하는데 변형된 Run Length Coding 기법을 이용하여 효과적이고 빠른 문자 영역 분리 방법을 제안함으로서 처리속도의 향상은 물론 잡영에도 강한 문자 영역 분리 시스템을 구현하였다.

  • PDF

문서 영상 내 테이블 영역에서의 단어 추출 (Word Extraction from Table Regions in Document Images)

  • 정창부;김수형
    • 정보처리학회논문지B
    • /
    • 제12B권4호
    • /
    • pp.369-378
    • /
    • 2005
  • 문서 영상은 문서 구조 분석을 통하여 텍스트, 그림, 테이블 등의 세부 영역으로 분할 및 분류되는데, 테이블 영역에 있는 단어는 다른 영역의 단어보다 의미가 있기 때문에 주제어 검색과 같은 응용 분야에서 중요한 역할을 한다. 본 논문에서는 문서 영상의 테이블 영역에 존재하는 문자 성분을 단어단위로 추출하는 방법을 제안한다. 테이블 영역에서의 단어 추출은 실질적으로 테이블을 구성하는 셀 영역에서 단어를 추출하는 것이기 때문에 정확한 셀 추출 과정이 필요하다. 셀 추출은 연결 요소를 분석하여 테이블 프레임을 찾아내고, 교차점 검출은 전체가 아닌 테이블 프레임에 대해서만 수행한다. 잘못 검출된 교차점은 이웃하는 교차점과의 관계를 이용하여 수정하고, 최종 교차점 정보를 이용하여 셀을 추출한다. 추출된 셀 내부에 있는 텍스트 영역은 셀 추출 과정에서 분석한 문자성분의 연결 요소 정보를 재사용하여 결정하고, 결정된 텍스트 영역은 투영 프로파일을 분석하여 문자연로 분리된다. 마지막으로 분리된 문자열에 대하여 갭 군집화와 특수 기호 검출을 수행함으로써 단어 분리를 수행한다. 제안 방법의 성능 평가를 위하여 한글 논문 영상으로부터 추출한 총 In개의 테이블 영상에 대해 실험한 결과, $99.16\%$의 단어 추출 성공률을 얻을 수 있었다.

캡션 내 문자와 배경의 명암값 결정 (Determing intensity value of characters and backgrounds on caption)

  • 안권재;김계영
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2010년도 제42차 하계학술발표논문집 18권2호
    • /
    • pp.125-127
    • /
    • 2010
  • 본 논문에서는 동영상에서 비교적 단일 색상의 배경과 문자를 갖는 캡션을 문자인식을 위하여 문자와 배경간의 명암값 결정에 관한 내용이다. 먼저 캡션에 대해 그레이 스케일로 전환을 한 후, Otsu 방법[1]을 이용하여 이진화를 수행한다. 이 후 이진화 영상에서 흰색영역 검은색영역에 대해 각각 최대 내접 정사각형을 산출한다. 다음으로 각각의 영역에서 산출된 최대 내접 정사각형의 분산의 대소를 비교하여 문자영역과 배경영역을 결정한다. 이후 전역적인 잡음을 제거하기 문자영역에 대해 Otsu 방법을 이용하여 최종 문자영역을 결정한다. 제안된 방법의 문자영역의 명암값 결정 정확도는 약 99%로 매우 우수한 성능을 보였다.

  • PDF

디지털 신호 분석 기법을 이용한 다양한 번호판 추출 방법 (An Extraction Method of Number Plates for Various Vehicles Using Digital Signal Analysis Processing Techniques)

  • 양선옥;전영민;정지상;류상환
    • 전자공학회논문지SC
    • /
    • 제45권3호
    • /
    • pp.12-19
    • /
    • 2008
  • 번호판 인식 작업은 번호판 영역분할, 개별문자 추출, 문자인식의 세 단계를 거쳐 이루어진다. 이 가운데 번호판 영역분할은 번호판 인식의 가장 핵심이 되는 부분이면서 또한 처리 시간이 가장 많이 소요되는 부분이다. 본 논문은 다양한 도로 주변 환경을 고려해야하는 불법주정차 무인단속 현장으로부터 획득된 차량영상을 대상으로 번호판 영역을 효과적으로 추출하는 방법에 관해 기술한다. 접근방법은 번호판 영역의 가로 명암 값 변화의 특성을 이용하여 번호판 영역에서 문자 폭, 배경영역과 문자 영역의 명암차를 조사하여 문자 영역임을 확인하고, 문자와 문자 사이의 거리를 조사하여 번호판 영역을 확인한다. 또한 번호판 영역 추출 과정에서 배경영역과 문자 영역의 명암차를 이용하여 번호판의 종류를 구분한다. 본 연구는 새로운 유럽형 번호판을 포함한 국내 번호판에 대하여 번호판 테두리 훼손에 따른 번호판 영역 추출 실패의 문제점을 해결하고 시간 소요의 문제를 실시간으로 처리함으로서 실용적 응용이 가능하도록 하였다.

다단계 영상처리 기법을 이용한 차량번호판 추출방법 (Vehicle License Plate Extraction using Multi-level Image Processing Methods)

  • 안운기;장재건
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (상)
    • /
    • pp.275-278
    • /
    • 2003
  • 자동차 번호판 인식 시스템은 영상획득, 번호판추출, 전처리(이진화), 문자영역 분할, 문자인식 등의 5가지 핵심 부분으로 구성된다. 따라서 자동차 번호판 인식 시스템의 최종 인식율은 각 단계의 성능에 따라 직접적인 영향을 받는다. 본 논문은 영상처리 기법을 이용하여 영상에서 번호판 영역을 추출을 위한 연구로 문자인식 단계에서 높은 인식율을 확보할 수 있도록 빠른 연산속도와 추출 정확성을 높일 수 있는 알고리즘을 제안한다.

  • PDF

DCT와 LVQ를 이용한 차량번호판 인식 시스템 (Vehicle License Plate Recognition System using DCT and LVQ)

  • 한수환
    • 지능정보연구
    • /
    • 제8권1호
    • /
    • pp.15-25
    • /
    • 2002
  • 본 논문에서는 차량 번호판에서 추출된 문자영역의 DCT(Digital Cosine Transform) 계수와 LVQ(Learning Vector quantization) 신경회로망을 이용하여 상대적으로 간결한 구조로 잡음의 영향을 적게 받는 차량 번호판 인식 시스템을 제안하였다. 입력된 차량영상의 RGB칼라정보를 이용하여 번호판 영역을 추출하고 추출된 번호판의 히스토그램과 문자의 상대적 위치정보를 병합하여 문자영역을 추출하였다. 이렇게 추출된 문자영역의 명암도 영상에 DCT를 적용하여 얻은 특징 벡터를 LVQ신경회로망의 입력으로 사용하여 인식 과정을 수행한다. 본 논문의 실험과정에서는 다양한 환경에서 촬영된 109대의 자가용 차량영상에 대하여 제안된 시스템을 실험하였으며 상대적으로 높은 번호판 영역 추출율과 인식률을 보였다.

  • PDF

문자-에지 맵의 패턴 히스토그램을 이용한 자연이미지에서의 텍스트 영역 추출 (Text Region Extraction using Pattern Histogram of Character-Edge Map in Natural Images)

  • 박종천;황동국;이우람;권교현;전병민
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2006년도 추계학술발표논문집
    • /
    • pp.220-224
    • /
    • 2006
  • 자연이미지에 포함된 텍스트는 많은 중요한 정보를 포함하고 있다. 그러므로 자연이미지에서 텍스트를 추출할 수 있다면 다양한 분야에서 활용될 수 있다. 본 논문에서는 문자-에지 맵 패턴 히스토그램 분석함으로서 텍스트 영역을 추출하는 방법을 제안한다. 캐니-에지 검출기로 에지를 추출하여 16가지 에지 맵을 생성하고, 에지 맵을 조합하여 문자 특징을 갖는 8가지 문자-에지 맵을 생성한다. 8가지 문자-에지 맵과 16가지 에지 맵을 이용하여 텍스트 후보 영역을 추출하고, 문자-에지 맵의 패턴 히스토그램 및 텍스트 영역의 구조적 특징을 이용하여 텍스트 후보 영역에 대한 검증을 수행하였다. 제안한 방법은 다양한 종류의 자연이미지를 대상으로 실험하였고, 복잡한 배경, 다양한 글꼴, 다양한 텍스트 컬러로 구성된 자연이미지에서 텍스트 영역을 효과적으로 추출하였다.

  • PDF

자연영상에서 한글 자소 구조 및 유형 특징을 이용한 문자 영역 검출 (Character Region Detection Using Hangul Character Structure and Class Feature in Natural Images)

  • 박종천;권교현;전병민
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2011년도 춘계학술논문집 1부
    • /
    • pp.396-399
    • /
    • 2011
  • 모바일 기기의 보급이 확대됨으로서 모바일 기기에 내장된 카메라로 획득한 영상을 처리하는 다양한 종류의 응용프로그램이 개발되어 사용되고 있다. 대표적인 응용프로그램은 카메라로 찍은 영상의 사물 검색결과를 인터넷 검색엔진과 연계함으로서 키워드 입력 없이 검색할 수 있도록 하는 것이다. 본 연구는 그 중에서 한글 문자가 포함된 영상을 대상으로 영상검색 수행하는 연구로서 영상에서 한글 문자 영역을 검출하는 방법을 제안하였다. 한글 문자 구조 특징으로 한글 자소를 병합하여 후보 문자 영역을 추출하고 병합된 후보 문자 영역을 한글 6가지 문자 유형 특징을 기반으로 문자 영역을 여부를 판별함으로서 최종적인 문자 영역을 검출한다. 실험결과 문자영역 재현률이 향상됨을 알 수 있었다.

  • PDF