• 제목/요약/키워드: 문서의 기울기 검출

검색결과 7건 처리시간 0.024초

문서 영상의 기울기 검출을 위한 기준선 탐색 기법 (Baseline Searching Method for Document Skew Detection)

  • 신명진;김도연;차의영
    • 한국멀티미디어학회논문지
    • /
    • 제10권2호
    • /
    • pp.218-225
    • /
    • 2007
  • 본 논문은 문자 인식 등을 통한 문서 자동 처리 시스템을 위해서 스캔 과정에서 발생할 수 있는 문서의 기울기를 정확하게 검출하는 기법을 제안한다. 제안한 알고리즘은 처리 속도 향상을 위해 영상을 축소한 다음 형태학적 연산과 연결 성분 분석 방법으로 기울기 검출 대상 영역(ROI)을 먼저 설정한 후 설정된 영역 내에서 문서의 기울기 정보를 가지고 있는 기준선을 탐색하는 방법으로 정확하게 기울어진 각도를 검출할 수 있게 하였다. 기존의 형태학적 연산을 기반으로 한 기울기 검출 기법과 비교하고 다양한 종류의 대용량 문서 영상을 대상으로 한 실험 및 분석을 통해 제안한 기울기 검출 방법의 정확도 및 효율성을 증명하였다.

  • PDF

에지를 이용한 문서영상의 기울기 보정 (Skew Correction of Document Images using Edge)

  • 주재현;오정수
    • 한국정보통신학회논문지
    • /
    • 제16권7호
    • /
    • pp.1487-1494
    • /
    • 2012
  • 본 논문에서 선명 화질은 물론 저화질 문서영상에서 에지를 이용해 문서영상의 기울기를 검출하고, 보정하는 알고리즘을 제안한다. 제안된 알고리즘은 영상 복잡도를 이용해 문자영역을 선택하여 에지를 검출하고, 이들을 다양한 방향으로 투영하여 투영 히스토그램들을 생성한다. 그리고 히스토그램들에서 에지 집중도를 평가하여 문서영상의 기울기를 검출하고 기울어진 문서 영상을 보정한다. 고속 기울기 검출을 위해 부표본화와 3단 coarse-to-fine 탐색 알고리즘을 사용한다. 선명 화질과 저화질 영상의 기울기 검출에서 제안된 알고리즘의 최대 검출 오차와 평균오차가 기존 유사 알고리즘의 50% 정도이고, 기울기 검출 시간은 25%정도로 감소된다. 모바일기기로 취득된 밝기 불균일 영상에서는 기존 알고리즘은 적절한 2진 영상을 얻을 수 없어 기울기 검출이 어려우나 제안된 알고리즘의 평균 검출 오차 0.1o 이하로 기울기를 검출한다.

모폴로지 연산을 이용한 문서 이미지의 고속 기울기 검출 기법 (Fast Skew Detection of Document Image Using Morphological Operation)

  • 신명진;김도현;차의영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2006년도 춘계종합학술대회
    • /
    • pp.796-799
    • /
    • 2006
  • 본 논문은 스캔한 문서 및 전자 문서 등과 같은 문서 이미지에서의 기울기를 검출하는 기법을 제안하고 있다. 제안한 알고리즘은 처리 속도 향상을 위해 일정 비율로 축소된 이미지를 사용한다. 하지만 여전히 문서 전체를 대상으로 기울기를 검출하는 것은 많은 계산량을 요구하므로 대상영역(ROI)을 선택한다. 대상 영역은 모폴로지 연산을 통해 문자열을 하나의 긴 component로 연결하고 Labeling 과정을 통해 선택된다. 그리고 원본 이미지에서 문자의 baseline을 바탕으로 대상 영역에서 기울기를 검출한다. 실험결과를 통하여, 제안한 방법은 표나 그래프가 포함된 여러 종류의 문서 이미지에서 빠르고 정확한 기울기 값을 검출함을 확인할 수 있다.

  • PDF

공백행 추출에 의한 기울어진 문서 영상의 보정 (A Skew Correction for Document Images by the Extraction of Blank Lines)

  • 정재영;김문현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.541-543
    • /
    • 1998
  • 본 논문에서는 선형적으로 기울어진 문서 영상의 기울기를 검출하기 위한 단순하면서도 효과적인 알고리즘을 제안한다. 문서 내의 인접한 두 행 사이에는 일정한 두께의 공백 행이 존재하며, 그 공백 행의 기울기는 실제 문서의 기울어진 정도를 반영한다는 사실에 기인한다. 먼저, 간단한 모폴로지 연산을 이용하여 문자행 영역과 공백행 영역을 분리한 후, 이를 일정 간격으로 수직 샘플링하여 수직선 상에 있는 모든 공백행의 중심점(행간점)을 찾는다. 전체 영상으로부터 동일한 공백 행상에 있는 임의의 두 행간점간에 계산된 기울기들의 분포를 보면 실제 문서의 기울기에서 최대 값을 가진다. 제안한 알고리즘을 다양한 형태의 가로쓰기 문서(검출 가능한 최대 기울기 : $\pm$45$^{\circ}$)에 적용하여 0.5$^{\circ}$의 오차범위 내에서 정확한 결과를 얻을 수 있음을 보인다.

  • PDF

문장 사이의 공백 기울기를 이용한 문서 이미지 기울기 보정 (Deskewing Document Image using the Gradient of the Spaces Between Sentences.)

  • 허우형;구은진;김철기;차의영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2013년도 춘계학술대회
    • /
    • pp.379-381
    • /
    • 2013
  • 본 논문에서는 문서 이미지에서 문장 사이에 공백영역의 기울기를 검출하고 보정하는 방법을 제안한다. 제안하는 방법은 문서 이미지에서 에지를 추출한 문장 사이에 가지는 공백들의 기울기 값을 통해 문서 이미지의 기울기를 보정한다. 문서 이미지를 일부의 영역으로 나누어서 처리함으로써 문서 내 외곽의 여백영역, 그림, 다단형식 등에 대해서 강건한 처리 결과를 보여준다. 제안하는 방법은 문자 영역의 픽셀을 이용하는 것이 아닌, 공백영역을 이용함으로써 기존의 방법보다 선명한 화질은 물론 저화질 문서 이미지에서도 효과적으로 보정된다.

  • PDF

공백행의 중심점 추출에 의한 고속 문서 기울기 검출 (Fast Skew Detection of Document Images by Extraction of Center Points of Blank Lines)

  • 정재영;김문현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권11호
    • /
    • pp.1342-1349
    • /
    • 1999
  • 본 논문에서는 문서 내의 인접한 두 행 사이에는 일정한 두께의 공백 행이 존재하며 그 공백 행의 기울기는 실제 문서의 기울어진 정도를 반영한다는 사실에 기반하여, 선형적으로 기울어진 문서 영상의 기울기 추정을 위한 고속의 알고리즘을 제안한다. 먼저, 간단한 모폴로지 연산(dilation)을 이용하여 문자행 영역과 공백행 영역을 분리한 후, 이를 일정 간격으로 수직 샘플링하여 수직선 상에 있는 모든 공백행의 중심점(행간점)을 찾는다. 동일한 공백 행 상에 있는 인접한 두 행간점 간에 기울기를 계산하고, 전체 영상으로부터 이들의 분포를 조사하여 최대 빈도를 가지는 기울기를 입력 문서의 기울기로 추정한다. 실험에서는 제안한 알고리즘을 필기체 및 인쇄체를 포함하는 다양한 형태의 가로쓰기 문서에 적용한 결과를 보인다.Abstract In this paper, we propose a fast algorithm to estimate the skew angle of linearly skewed document images. This paper is based on the fact that there is a blank line with uniform thickness between two adjacent text lines and the slope of the line is the same as that of the document. Firstly, we apply a dilation operation to the image to separate blank lines from text lines, and we detect center points of blank lines along the vertically sampled lines. Then we calculate the slope between neighboring center points in the same blank line. Calculated slopes for the entire image are accumulated on the histogram to display the distribution of them. Finally, the peak in the histogram is detected and estimated as the slope of the document image. In the experiments, we adopted a lot of images of various format with hand-printed or machine-printed document to verify our algorithm.

스캔된 문서에서의 도장 검출 (Seal Detection in Scanned Documents)

  • 유견아;김경혜
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권12호
    • /
    • pp.65-73
    • /
    • 2013
  • 디지털 시대의 도래에 따라 문서들이 기록 보관되기 위해서 혹은 네트워크를 통해 전송되기 위해서 스캔되는 경우가 많아졌다. 스캔된 문서에서 가장 큰 비중을 차지하는 것은 텍스트이며 텍스트 이외에는 문서 작성자를 나타내는데 사용되는 도장이 가장 많이 포함되어 있다. 스캔된 문서의 중요성이 부각되면서 스캔된 문서로부터 텍스트를 인식하는 연구는 많이 진행되어 상용화된 제품도 개발된 것에 비해 문서가 포함하고 있는 도장에 대한 정보는 버려지고 있는 실정이다. 본 논문에서는 도장이 포함된 컬러 혹은 흑백 문서 영상에서 도장 영역을 검출하여 도장 이미지를 저장하는 방법을 연구한다. 스캔된 문서에서 도장의 외곽선 후보만을 남기고 다른 기타 구성 요소를 제거하는 전처리 과정과 도장의 특징을 이용하여 남은 요소 중에 최종 관심 영역을 선정하는 방법을 제안한다. 또한 검출된 관심 영역의 도장 정보가 텍스트와 겹친 이미지인 경우에는 템플릿 매칭을 통해 데이터베이스로부터 가장 유사한 도장을 찾아 대신 저장할 수 있게 한다. 구현된 시스템은 학교에서 일반적으로 생성되는 여러 유형의 문서들을 대상으로 검증하고 그 결과를 분석한다.