• 제목/요약/키워드: 문자 영역 추출

검색결과 288건 처리시간 0.027초

동영상에 삽입된 자막 내 문자영역화소추출 (Extraction text-region's pixel on caption of video)

  • 안권재;김계영
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2011년도 제43차 동계학술발표논문집 19권1호
    • /
    • pp.43-45
    • /
    • 2011
  • 본 논문은 동영상 내 삽입된 자막을 문자인식이 가능하도록 문자영역을 이루는 화소를 추출하는 방법을 제안한다. 최초 자막영상을 통계학적 방법을 이용하여 색상극성을 결정한다. 이 후 색상극성에 따른 잡음제거 방법을 명암값기반과 형태학적기반으로 달리한다. 제안된 방법은 각 색상결정에 따른 적합한 잡음제거를 수행함으로서 추출된 화소들이 이루는 문자영역의 영상을 이용하여 문자인식을 수행하였을 때 기존방법보다 높은 문자인식률을 보였다.

  • PDF

칼라 문서에서 문자 영역 추출믹 문자분리 (The Character Area Extraction and the Character Segmentation on the Color Document)

  • 김의정
    • 한국지능시스템학회논문지
    • /
    • 제9권4호
    • /
    • pp.444-450
    • /
    • 1999
  • 본 논문에서는 칼라로 입력된 문서 영상에서 문자 영역추출을 위하여 k-means을 이용한 클러스트링 알고리즘을 제안하였다. 칼라 영상의 클러스트링을 위해서 HIS 좌표계에 적합한 거리함수를 제안하였다. 이를 인식하기 위한 전처리 단계인 문자분리(segmentation)방법은 연결 화소를 이용한 개별문자 추출 알고리즘을 제안하였다. 본 알고리즘 에서는 문자분리방벙에서 접촉문자 (touching character)또는 겹친 문자(overlapped character)등과 같이 분리가 곤란한 문자를 개별문자로 분리하는 방법이다. 기존의 문자 분리방법에서는 투영(projection)dop 의한 방법과 외곽선(edge)추적에 의한 방법등을 사용하여 왔으나 제안된 방법은 문자열 추출후 한번의 투영으로 연결화소를 이용하여 개별문자를 추출한다. 문자 영역과 비 문자 영역을 구분하여 개발문자 추출을 한 결과 단순한 이진 영상이 아닌 칼라 영상에서의 문서 처리가 큰 의의가 있고 기존의 문서 처리기 보다 향상된 알고리즘인 것을 확인하였다.

  • PDF

카메라 기반 문서영상에서의 문자 추출 (Text extraction from camera based document image)

  • 박희주;김진호
    • 한국산업정보학회논문지
    • /
    • 제8권2호
    • /
    • pp.14-20
    • /
    • 2003
  • 본 논문에서는 카메라로 획득한 문서영상에 대해 조명의 영향에 관계없이 고속으로 문자영역을 추출하는 알고리즘을 제안하였다. 카메라 문서는 스캐너 문서와는 달리 주변 환경이나 조명의 영향으로 인하여 문자영역을 추출하는 것이 매우 어렵다. 먼저 영상 사전처리 단계에서 컬러영상을 명도영상으로 변환한 후 조명의 영향에 무관하게 배경 그림으로부터 문자 영역을 정확히 추출하기 위해서 명도레벨 정규화를 사용하였다. 또한 배경 그림 및 잡음은 제거하고 문자 획의 손실 없이 문자 영역을 추출하기 위하여 국소-적응적-이진화-방법(local adaptive binarization method)을 새롭게 개발하여 문서영상을 이진화시켰다. 문자영역 추출 단계에서는 수평 및 수직 투영과 연결요소 정보에 의해 문자열, 단어 및 개별 문자 영역을 단계적으로 추출하였다. 제안된 방법의 타당성을 검증하기 위하여 ETRI에서 구축한 한글/영어/숫자/특수기호가 혼합된 현장 문서영상 DB를 가지고 실험해 보았다.

  • PDF

기울기 보정과 블록 분할 합병을 통한 문자 추출 (Text Extraction by Skew Normalization and Block Split & Merge)

  • 김도현;차의영;강민경
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.424-426
    • /
    • 2001
  • 신문, 잡지, 공문서, 영수증 등의 문서로부터 필요한 정보를 자동화하여 처리할 수 있는 문서영상 이해 시스템의 구현에 있어서 문서영상에 존재하는 문자를 추출하는 연구는 문자 인식의 전처리 단계로서 매우 중요한 의미를 지니고 있다. 하지만 현 시점에서 문서 자체가 가지는 다양한 형태 및 배경 등에 의하여 범용화되고 일반화된 방법을 찾기란 매우 어려운 실정이다. 본 논문에서는 특히 배경이 선이나 도표 등으로 이루어진 문서 영상에서 Hough Transform을 사용하여 기울어짐을 보정하고 문자들이 선에 겹친 부분을 효과적으로 보정하며 추출된 영역에 대한 분할 및 합병 과정을 거쳐 최종적으로 완전한 문자 영역을 추출하는 방법에 대하여 다룬다.

  • PDF

복잡한 컬러 문서에 대한 문자인식 (A Character Recognition on Complex Color Documents)

  • 양철용;김갑기;김진욱;김항준
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2000년도 하계종합학술대회논문집
    • /
    • pp.233-236
    • /
    • 2000
  • 최근 수많은 인쇄된 문서들이 HTML과 같은 디지털 문서로 바뀌고 있으며 이를 자동으로 변환해 주는 문자인식 기술에 대한 관심이 증가하고 있다. 본 논문에서는 그림과 글자가 공존하는 문서에서 자동으로 문자영역을 추출해서 문자를 인식하는 방법을 제안한다. 우선 입력문서는 유사한 칼라로 이루어진 영역들로 나누어진 뒤 휴리스틱 룰에 의해 문자후보 영역과 비 문자 영역으로 나누어진다. 그 다음 이들 문자후보영역들은 문자인식기를 이용하여 문자 혹은 문자의 일부분으로 인식된다. 제안된 방법으로 여러 문서들에 대하여 실험한 결과를 보이며 그 성능을 평가한다.

  • PDF

래스터 지도상에서 3차원 인접 그래프를 이용한 문자 그룹핑 (Character Grouping using 3-D Neighborhood Graph on Raster Map)

  • 강용빈;옥세영;조환규
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권2호
    • /
    • pp.273-283
    • /
    • 1999
  • 래스터 지도에서 직선 또는 곡선과 중첩되어 있는 경우의 문자는 추출하기가 쉽지 않다. 따라서 본 논문에서는 고립되어 있는 문자뿐만 아니라 문자이외의 요소와 중첩되어 있는 문자도 효과적으로 추출할수 있는 분할 정복(divide and conquer) 개념에 기반한 문자 추출방법을 제시한다. 이를 위해 먼저 이미지의 연결 요소로부터 볼록다각형(convex hull)을 생성한다. 그리고 이 다각형이 충분한게 문자영역만을 포함할때가지 볼록 다각형을 이등분하면서 가장 긴 선분(투사 선분)을 기준으로 두 영역으로 분할한다. 다음으로 문자를 추출하기 위해서 이 선분을 기준으로 연결 요소상의 픽셀의 밀집도를 계산하는 알고리즘(프로파일링)을 적용한다. 또한 지도상에서 추출된 개별적인 문자들을 의미있는 단어들로 묶기(grouping)한 새로운 알고리즘을 소개한다. 특히 지도상에 나타나는 문자의 종류는 매우 다양하고 또한 이 문자들이 놓여있는 방향 역시 일정하지 않기 때문에 이러한 단어를 찾는 kd법은 쉽지 않다. 이를 위해 본 논문에서는 3차원 인접 그래프(3-D neighborhood graph)G를 소개한다. 이 그래프 G에서 각 노드는 하나의 분리된 문자를 나타내며 자신의 크기와 위치에 따라서 3차원 공간상에서 위치하게된다. 따라서, 크기가 큰 (작은)문자들은 보다 큰 (작은) z값을 가지고 되며 이 그래프 G에서 서로 인접한 노드들을 연결함으로써 지도상에 존재하는 서로 다른 종류의 문자 스트링을 추출할수 있다. 실험결과는 서로 다른 지도 이미지에 대해서 약 95% 이상의 단어 추출율을 보여준다.

Morphology를 이용한 문서화상내의 문자열 추출에 관한 연구 (A Study on Extraction of Character String in Document Image Using Morphology)

  • 장희돈;김동현;김석태;남궁재찬
    • 한국통신학회논문지
    • /
    • 제18권1호
    • /
    • pp.123-132
    • /
    • 1993
  • 본 논문은 문서화상으로 부터 문장영역과 도형영역을 분리해 내는 연구이다. 문자영역을 추출하기 위하여 문서화상에 대해 Morphology의 기본연산인 Dilation을 행해 문자를 융합하고 블럭화를 행한 후 문서 화상의 서식을 판정하고 판정된 문자열 서식에 따라 문서화상에서 기울기를 구하여 문서를 보정하며 보정된 문서에서 문자열을 추출하였다. 3개 종류 11개 데이타를 대상으로 실험한 결과 문자열이 대부분 추출됨을 알 수 있었다.

  • PDF

항만 영상정보시스템 구축을 위한 컨테이너 식별자 인식 (A Recognition Method of Container ISO-code for Vision & Information System in Harbors)

  • 구경모;차의영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2007년도 춘계종합학술대회
    • /
    • pp.721-723
    • /
    • 2007
  • 현재 항만의 컨테이너 양하 및 적하 과정에서 획득되는 컨테이너 영상은 크기 및 위치가 정형화되어 있지 않고, Yard Tractor의 정차 차선과 컨테이너의 크기 등의 외부 환경 변화로 인해 인식에 적합한 영상을 획득하기 어렵다. 본 논문에서는 Top-Hat Transform을 이용하여 실시간 영상으로부터 문자의 영역을 추정하고, 카메라의 PAN/TILT/ZOOM 기능을 이용한 시선이동을 통해 문자인식에 적합한 영상을 획득한다. 획득된 컨테이너 영상으로부터 Top-Hat Transform 및 Histogram Projection을 이용하여 식별자 영역을 추출하고 이진화한 뒤, Labeling 된 결과를 토대로 배경과 문자영역을 구분하고 개별 문자들을 추출한다. 이후 오류역전파 알고리즘을 이용하여 추출된 개별 문자들을 인식한다. 실제 부두에 설치하여 제안된 컨테이너 식별자 영상 획득 및 인식 방법이 우수함을 확인하였다.

  • PDF

에지 영상의 방향성분 히스토그램 특징을 이용한 자동차 번호판 영역 추출 (Extraction of Car License Plate Region Using Histogram Features of Edge Direction)

  • 김우태;임길택
    • 한국산업정보학회논문지
    • /
    • 제14권3호
    • /
    • pp.1-14
    • /
    • 2009
  • 본 논문에서는 번호판 영역의 추출에 사용될 수 있는 특징 벡터와 이를 이용하여 문자와 비문자를 판별하고 숫자를 인식하는 방법을 제안한다. 제안하는 특징 벡터는 영상의 기울기 벡터에서 얻어지는 에지 영상의 방향 코드 히스토그램으로부터 추출된다. 추출된 특징 벡터를 MD로 구현되는 문자 및 비문자 인식기에 입력하여 문자와 비문자를 판별함으로써 번호판 영역의 위치를 추정하고, 숫자를 인식한다. 실험 결과 제안하는 방법이 문자와 비문자의 정확한 판별, 번호판 영역의 위치 추정 및 숫자의 인식에 유용하게 적용될 수 있음을 알 수 있었다.

에이다부스트 학습을 이용한 문자 데이터 검출 방법 (A Method of Detecting Character Data through a Adaboost Learning Method)

  • 장석우;변시우
    • 한국산학기술학회논문지
    • /
    • 제18권7호
    • /
    • pp.655-661
    • /
    • 2017
  • 입력되는 정지 또는 동영상에 포함된 문자 정보는 영상의 내용을 대표하는 주요한 핵심 정보를 제공할 수 있기 때문에 다양한 종류의 영상 데이터를 분석하여 영상 내에 포함된 문자 영역들을 정확하게 추출하는 작업은 매우 중요하다. 본 논문에서는 입력되는 영상으로부터 MCT 특징과 에이다부스트(Adaboost) 알고리즘을 이용하여 문자 영역만을 정확하게 검출하는 새로운 방법을 제안한다. 본 논문에서 제안된 방법에서는 먼저 입력 영상으로부터 MCT 특징과 에이다부스트 알고리즘을 이용하여 문자의 후보 영역들을 추출한다. 그런 다음, 기하학적인 특징을 활용하여 추출된 문자의 후보 영역들로부터 비 문자 영역들을 제외하고 실제적인 문제 영역들만을 검출한다. 실험 결과에서는 제안된 방법이 입력되는 다양한 영상으로부터 기존의 방법보다 문자 영역들을 2.1% 보다 강인하게 추출한다는 것을 보여준다. 본 논문에서 제안된 문자 영역 검출 방법은 상점의 간판 인식, 자동차의 번호판 인식 등과 같은 멀티미디어 및 영상 처리와 관련된 실제 응용 분야에서 매우 유용하게 활용될 것으로 기대된다.