• 제목/요약/키워드: 문서영상 분할

검색결과 52건 처리시간 0.025초

문서영상의 낱자 단위 언어 구분 (Language Identification of Character-level in Document Image)

  • 권세광;오일석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.613-615
    • /
    • 2003
  • 본 논문은 문서 구조분석을 통해 얻어진 텍스트 영상에 대해 낱자 단위 분할 과정과 분할된 낱자에 대한 언어 구분 방법을 제안한다. 먼저 8방향 연결 요소를 이용한 레이블링을 수행하고 각 레이블의 거리관계와 한글 종모음의 특징을 이용하여 낱자 분리를 수행한다. 분리가 이루어진 낱자의 언어 구분은 각 낱자에 존재하는 concavity 특징을 이용하여 한글과 영어로 구분하게 된다. Concavity 특징을 찾기 위해 낱자를 이루는 흑화소 중 수직런을 이루는 흑화소 중 일부와 세리프 성분을 제거하며 그 방법을 기술한다. concavity 특징은 분리기를 통해 한글과 영어 두 가지로 분리되며, 분류기는 신경망을 이용한다. 제안된 방법은 20개의 텍스트 영상에 총 7923개의 낱자를 대상으로 실험하였으며, 낱자 분리는 97.20%의 정확도를 보였으며 분리된 낱자에 대한 언어 구분은 92.70%의 정확도를 얻을 수 있었다.

  • PDF

1차원 메디안 필터 기반 문서영상 영역해석 (The Region Analysis of Document Images Based on One Dimensional Median Filter)

  • 박승호;장대근;황찬식
    • 대한전자공학회논문지SP
    • /
    • 제40권3호
    • /
    • pp.194-202
    • /
    • 2003
  • 인쇄문서를 전자문서로 자동변환하기 위해서는 문서영상 영역해석과 문자인식 기술이 필요하다. 이들 중 영역해석은 문서영상을 세부 영역으로 분할하고, 분할한 영역을 문자, 그림, 표 등의 형태로 분류한파. 그러나 문자와 그림의 일부는 크기, 밀도, 화소분포의 복잡도가 비슷하여 정확한 분류가 어렵다. 따라서 영역해석에서의 오 분류는 자동변환을 어렵게 만드는 주된 원인이 된다. 본 논문에서는 분서영상을 문자와 그림영역으로 분할하는 영역해석 방법을 제안한다. 문자와 그림의 분류는 1차원 메디안 필터링을 기반으로 한 방법을 이용하여 언급한 문제점을 해결한다. 또한 메디안 필터링에 의해 발생하는 볼드체 문자와 그래프나 표와 같은 그림영역의 오 분류 문제를 표피 제거 필터와 문자의 최대크기를 이용하여 해결한다. 따라서 상용제품을 포함한 기존의 영역해석 방법보다 그 성능이 우수하다.

연결요소 특징을 이용한 복잡한 문서영상의 구조 분석 (A new segmentation method for non-manhattan layout document images using connected component)

  • 이상협;이경무
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1997년도 학술대회
    • /
    • pp.71-74
    • /
    • 1997
  • 본 논문은 일반적으로 제약 없는 형식 문서 즉, 논-맨하탄(non-manhattan) 형식의 이진문서영상을 분석하는 기법으로서, 연결요소기법에 기반한 특징추출과 이를 이용한 영역분리 및 분류에 관한 새로운 방법을 제안한다. 제안한 방식은 바텀-업(bottom-up)방식으로서 먼저 처리속도의 고속화와 축소시 특징 영역보존을 위해 임계치 축소기법을 사용하고, 축소된 이진 문서영상내의 각 연결된 검은 화소의 집합을 개체화하고 개체의 특성에 따라 텍스트, 신성분, 해프톤, 도형 그리고 표 등으로 분류한다. 영역분류는 두단계로 이루어지는데, 1차분류에서는 우선, B/W 비, 면적, 외각 테두리의 높이와 너비 비, 테두리선유무 등의 특징을 이용하여 해프톤, 수평 수직선, 테두리(표 및 도형)영역을 분리한다. 이후 2차 분류에서는 문자성분의 수평결합을 통한 텍스트행 성분을 추출한다. 마지막 후처리 과정으로 표분석 알고리듬을 통하여 테두리 영역중 표와 도형을 정확히 구분하고, 또한 도형에 관련한 문서성분을 해당 도형 개체에 연결하는 작업을 수행함으로써 완벽한 영역분류를 한다. 다양한 문서영상을 이용한 시뮬레이션을 통해 제안한 알고리듬의 성능을 입증한다.

  • PDF

문서 영상 내 테이블 영역에서의 단어 추출 (Word Extraction from Table Regions in Document Images)

  • 정창부;김수형
    • 정보처리학회논문지B
    • /
    • 제12B권4호
    • /
    • pp.369-378
    • /
    • 2005
  • 문서 영상은 문서 구조 분석을 통하여 텍스트, 그림, 테이블 등의 세부 영역으로 분할 및 분류되는데, 테이블 영역에 있는 단어는 다른 영역의 단어보다 의미가 있기 때문에 주제어 검색과 같은 응용 분야에서 중요한 역할을 한다. 본 논문에서는 문서 영상의 테이블 영역에 존재하는 문자 성분을 단어단위로 추출하는 방법을 제안한다. 테이블 영역에서의 단어 추출은 실질적으로 테이블을 구성하는 셀 영역에서 단어를 추출하는 것이기 때문에 정확한 셀 추출 과정이 필요하다. 셀 추출은 연결 요소를 분석하여 테이블 프레임을 찾아내고, 교차점 검출은 전체가 아닌 테이블 프레임에 대해서만 수행한다. 잘못 검출된 교차점은 이웃하는 교차점과의 관계를 이용하여 수정하고, 최종 교차점 정보를 이용하여 셀을 추출한다. 추출된 셀 내부에 있는 텍스트 영역은 셀 추출 과정에서 분석한 문자성분의 연결 요소 정보를 재사용하여 결정하고, 결정된 텍스트 영역은 투영 프로파일을 분석하여 문자연로 분리된다. 마지막으로 분리된 문자열에 대하여 갭 군집화와 특수 기호 검출을 수행함으로써 단어 분리를 수행한다. 제안 방법의 성능 평가를 위하여 한글 논문 영상으로부터 추출한 총 In개의 테이블 영상에 대해 실험한 결과, $99.16\%$의 단어 추출 성공률을 얻을 수 있었다.

SPIHT 기반 문서 부호화와 복호화 시스템의 성능 향상 (Improvement of SPIHT-based Document Encoding and Decoding System)

  • 장준;이호석
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권7_8호
    • /
    • pp.687-695
    • /
    • 2003
  • 본 논문은 문자가 포함된 영상에서 문자의 가독성은 유지하면서 영상을 압축하고 복원하는 효율적인 방법을 제시한다. 본 논문에서 제시하는 방법은 문서 분할, Quincunx 다운샘플링, (5/3) 웨이블릿 리프팅 그리고 서브밴드별 SPIHT(Set Partitioning In Hierarchical Trees) 부호화 방법을 기반으로 하여 구축되었다. 부호화 과정에서는 Quincunx 다운샘를링과 서브밴드 SPIHT 부호화 방법을 사용하여 부호화 수행 시간을 단축하였으며 산술 부호화를 적용하여 SPIHT 부호기의 비트스트림을 더욱 압축하였다. 실험에서는, 복원된 영상을 제시하여 시스템의 성능을 압축율과 PSNR을 비교하고 분석하였다. 실험에서는, 복원된 영상을 제시하여 시스템의 성능을 확인할 수 있도록 하였으며, 여러 가지 양자화를 적용하여 제안한 SPIHT에 기반한 문서 압축 시스템의 압축율과 PSNR을 비교하고 분석하였다.

문서 영상의 정교한 기하적 구조분석을 위한 지식베이스 시스템 (A Knowledge-based System for Analyzing Sophisticated Geometric Structure of Document Images)

  • 이경호;최윤철;조성배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제28권11호
    • /
    • pp.795-813
    • /
    • 2001
  • 문서 영상으로부터 논리적인 구성 요소를 추출하여 전자 문서를 생성하기 위해서는 정교한 수준의 기하적인 구조 분석이 선행되어야 한다. 본 논문은 과학기술 논문을 대상으로 정교한 수준의 기하적인 구조 분석을 지원하기 위하여 지식베이스에 기반한 방법을 제안한다. 제안된 지식베이스는 과학기술 논문 유형이 공통적으로 갖는 기하적인 특성은 물론이고 출판물 특유의 특성에 대한 지식을 규칙 형태로 표현한다. 제안된 방법은 상향식과 하향식의 복합 기법을 사용하며 영역분할과 식별의 두 단계로 구성된다. 일반적으로 영역분할에 의하여 분할된 영역과 레이아웃을 구성하는 복합 객체사이에는 일-대-일의 대응관계가 존재하지 않는다. 따라서 제안된 방법은 분할된 영역을 추가로 분할하거나 통합하면서 이미지, 드로잉, 그리고 테이블 등의 비 텍스트 객체는 물론이고 텍스트 라인이나 수식과 같은 텍스트객체를 식별한다. 제안된 방법의 평가하기 위하여 IEEE Transactions on Pattern Analysis and Machine Intelligence로부터 스캐닝한 372개의 논문영상으로 실험한 결과, 제안된 방법은 99% 이상의 실험 영상에 대한 기하적인 구조 분석에 성공하여 기존 방법에 비해 정교한 수준의 성능을 보였다.

  • PDF

텍스트 문서 인식을 위한 학습 기반 단어 분할 (Learning-based Word Segmentation for Text Document Recognition)

  • 로말리자쟝피에르;문광석;박한훈
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2018년도 하계학술대회
    • /
    • pp.41-42
    • /
    • 2018
  • 텍스트 문서 영상으로부터 단어를 검출하고, LLAH(locally likely arrangement hashing) 알고리즘을 이용하여 이웃 단어 사이의 기하 관계를 표현하는 특징 벡터를 계산한 후, 특징 벡터를 비교함으로써 텍스트 문서를 효과적으로 인식하거나 검색할 수 있다. 그러나, 이는 문서 내 각 단어가 정확하고 강건하게 검출된다는 전제를 필요로 한다. 본 논문에서는 텍스트 내 각 라인을 검출하고, 각 라인 내에서 단어 사이의 간격과 글자 사이의 간격을 깊은 신경망(deep neural network)을 이용하여 학습하고 분류함으로써, 보다 카메라와 텍스트 문서 사이의 거리나 방향이 동적으로 변하는 조건에서 각 단어를 강건하게 검출하는 방법을 제안한다. 모바일 환경에서 제안된 방법을 구현하였으며, 실험을 통해 단어 사이의 간격과 글자 사이의 간격을 92.5%의 정확도로 구별할 수 있으며, 이를 통해 동적인 환경에서 단어 검출의 강건성을 크게 개선할 수 있음을 확인하였다.

  • PDF

영상 분할을 위한 Context Fuzzy c-Means 알고리즘을 이용한 공간 분할 (Space Partition using Context Fuzzy c-Means Algorithm for Image Segmentation)

  • 노석범;안태천;백용선;김용수
    • 한국지능시스템학회논문지
    • /
    • 제20권3호
    • /
    • pp.368-374
    • /
    • 2010
  • 영상 분할 (Image Segmentation)은 패턴 인식, 환경 인식, 문서 분석을 위한 영상 처리 과정에서 가장 기본적인 단계이다. 영상 분할 방법들 중 Otsu의 영상의 정규화된 히스토그램의 분포 정보를 이용하여 클래스 간의 분산을 최대화 시키는 임계치값을 결정하는 자동 임계치값 선정방법이 가장 잘 알려진 방법이다. Otsu의 방법은 영상의 전 영역에 대한 히스토그램을 분석함으로써 영상의 부분적인 특성을 반영하여 임계치값을 결정하기는 어렵다. 본 논문에서는 이 어려움 해소하기 위하여 Context Fuzzy c-Means 알고리즘을 이용하여 영상을 여러 개의 부분 영역으로 나누고, 정의된 부 영역에 영상 분할 기법을 적용함으로써 부 영역들에 적합한 여러 개의 임계치값을 계산함으로써 영상 분할 성능을 개선하고자 하였다.

손가락 이동에 의해 선택된 영역의 인쇄체 한글 영상 문서화 (Documentation of Printed Hangul Images of the Selected Area by Finger Movement)

  • 백승복;손영선
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2002년도 춘계학술대회 및 임시총회
    • /
    • pp.51-54
    • /
    • 2002
  • 본 논문은 글자 문서를 배경으로 사용자의 손가락 이동에 의하여 일정한 영역을 그린 후, 영역내의 한글영상을 편집 가능한 에디터에 출력하는 시스템을 구현하였다. 영상의 전처리 단계에서는 문서 배경과 손영역을 분리하고 최대 원형 이동법을 이용하여 손의 무게 중심점을 추출한다. 원형 패턴 벡터 알고리즘을 사용하여 손을 인식한 후, 거리 스펙트럼으로 손가락 위치를 찾는다. 손가락의 움직임에 의해 선택되어진 문자 영역을 추출한 후, 한글 자소 간 히스토그램을 이용하여 추출된 문자 이미지 영역에서 문자단위로 분할하고 다양한 크기의 문자를 표준화한다. 퍼지 추론을 적용한 원형 패턴 벡터 알고리즘을 이용하여 표준 패턴문자와 입력문자의 특징벡터를 비교하여 문자를 인식하게 함으로써 사용자가 원하는 영역의 문자들을 수정 가능한 문서로 변환하였다

  • PDF

웨이블릿 리프팅과 비트평면 부호화에 기반한 새로운 문서 코덱 시스템 (A New Document Codec System based on Wavelet Lifting and Bitplane Coding)

  • 이호석
    • 한국멀티미디어학회논문지
    • /
    • 제6권5호
    • /
    • pp.805-815
    • /
    • 2003
  • 본 논문은 문서 분할, 웨이블릿 리프팅, 그리고 비트 평면 부호화에 기반한 문서 압축과 복원 시스템을 제시한다. 압축 과정에서 문자들의 모양을 유지하기 위하여 문서 분할을 사용한다. 웨이블릿 변환 방법으로는 웨이블릿 리프팅을 사용하며 웨이블릿 계수 값에 대하여 비트 평면을 구성하여 중요 서브블럭 단위로 압축을 수행한다. 중요 서브블록 부호화를 통하여 압축율을 높임과 동시에 압축속도 향상도 이룩하였다. 양자화로는 서브밴드 단위의 비 트 쉬프트 방법을 사용하였다. 웨이블릿 리프팅의 전단계로 색차변환, 부표본화를 수행하였으며, 서브블록 부호화의 전단계로 그레이코드 변환을 수행하였다. 여러 영상과 문서를 대 상으로 실험하여 시스템의 성능을 확인하였다.

  • PDF