• 제목/요약/키워드: 문서영상

검색결과 381건 처리시간 0.028초

공간 정보와 투영 프로파일을 이용한 문서 영상에서의 타이틀 영역 추출 (Automatic Title Detection by Spatial Feature and Projection Profile for Document Images)

  • 박효진;김보람;김욱현
    • 융합신호처리학회논문지
    • /
    • 제11권3호
    • /
    • pp.209-214
    • /
    • 2010
  • 본 논문은 형태 처리기법과 연결요소 분석을 이용한 문서 영상의 분할과 구조적인 특징과 투영 프로파일 분석을 이용하여 문서영상에서 제목영역 추출방안을 제안한다. 문서 영상의 처리는 영상 분할과 제목 추출, 두 단계로 이루어진다. 영상 분할의 단계에서는 문서 영상을 구성요소 영역들로 나눈다. 영상 분할이 끝나면 분할된 영역들을 대상으로 구조적인 정보를 이용하여 제목이 될 후보 영역을 추출한다. 제목이 아닌 영역을 제거하여 제목 후보영역을 추출하고 난 후 투영 프로파일을 분석하여 제목 영역을 최종적으로 추출한다. 본 논문에서 제시된 투영 프로파일 분석을 이용한 제목 추출 방법은 다양한 문서 영상의 분할 및 제목 추출 결과를 보였으며, 문서 제목 인식, 멀티미디어 데이터 검색, 실시간 영상처리와 같은 다양한 응용분야에 활용될 것으로 기대된다.

Water flow model에 기반한 문서영상 이진화 방법의 속도 개선 (Speed-up of Document Image Binarization Method Based on Water Flow Model)

  • 오현화;김도훈;이재용;김두식;임길택;진성일
    • 대한전자공학회논문지SP
    • /
    • 제41권4호
    • /
    • pp.75-86
    • /
    • 2004
  • 본 논문에서는 water flow model의 개념을 적용한 문서영상 이진화 방법의 속도를 개선하는 방법을 제안한다. 제안한 방법은 문서영상에서 문자 주위를 관심영역(region of interest: ROI)으로 추출하고 3차원 영상지형에서 물이 뿌려지는 영역을 관심영역 이내로 제한한다. 국부 계곡에 누적되는 물의 양은 계곡의 깊이와 경사를 이용하여 자동으로 결정된다. 그리고 계곡의 최저 지점뿐만 아니라 그 주위에도 가중치를 부여하여 물을 누적함으로써 관심영역에 해당하는 영상지형에 물을 붓는 과정을 한번만 수행하여 충분한 양의 물이 계곡에 채워지도록 한다. 계곡에 형성된 연못의 깊이는 배경과 문자의 밝기 차에 따라 다양하므로 연못의 깊이를 기준으로 문자 분리를 위한 임계치를 적응적으로 결정한다. 실제 문서영상에 대한 실험에서 제안한 방법의 수행속도가 water flow model에 기반 한 이진화 방법과 비교하여 월등히 향상되었으며 이진화 품질도 매우 우수함을 보였다.

카메라 기반 문서영상에서의 문자 추출 (Text extraction from camera based document image)

  • 박희주;김진호
    • 한국산업정보학회논문지
    • /
    • 제8권2호
    • /
    • pp.14-20
    • /
    • 2003
  • 본 논문에서는 카메라로 획득한 문서영상에 대해 조명의 영향에 관계없이 고속으로 문자영역을 추출하는 알고리즘을 제안하였다. 카메라 문서는 스캐너 문서와는 달리 주변 환경이나 조명의 영향으로 인하여 문자영역을 추출하는 것이 매우 어렵다. 먼저 영상 사전처리 단계에서 컬러영상을 명도영상으로 변환한 후 조명의 영향에 무관하게 배경 그림으로부터 문자 영역을 정확히 추출하기 위해서 명도레벨 정규화를 사용하였다. 또한 배경 그림 및 잡음은 제거하고 문자 획의 손실 없이 문자 영역을 추출하기 위하여 국소-적응적-이진화-방법(local adaptive binarization method)을 새롭게 개발하여 문서영상을 이진화시켰다. 문자영역 추출 단계에서는 수평 및 수직 투영과 연결요소 정보에 의해 문자열, 단어 및 개별 문자 영역을 단계적으로 추출하였다. 제안된 방법의 타당성을 검증하기 위하여 ETRI에서 구축한 한글/영어/숫자/특수기호가 혼합된 현장 문서영상 DB를 가지고 실험해 보았다.

  • PDF

스캐닝 과정에서 발생하는 전자문서의 기하학적 변형감지에 관한 연구 (Study on Measuring Geometrical Modification of Document Image in Scanning Process)

  • 오동열;오해석;류성열
    • 한국산학기술학회논문지
    • /
    • 제10권8호
    • /
    • pp.1869-1876
    • /
    • 2009
  • 기존 종이 문서를 영상 파일로 변환하기 위해서 스캐너와 같은 광학기를 사용하게 된다. 스캐닝 과정에서 문서가 제대로 문서 영상으로 생성되었는지를 판단하기 위해서 이미지 품질 검사 과정을 거치게 된다. 이미지 품질검사 과정에서는 스캐너 기기의 특성상 스캐닝 과정에서 발생할 수 있는 문서 영상의 기울기, 노이즈 여부, 문서가 접힌 상태로 스캔되었는지의 여부 등을 체크하게 된다. 이에 본 논문에서는 스캐너를 이용하여 문서 영상을 생성 과정에서 발생하는 기하학적 변형을 평가하기 위한 방법론을 제시한다. 본 연구에서는 품질 검사의 검사 항목에 대해서 영상 처리를 이용하여 각각의 변형 정도를 측정하고 각각의 변형 정도가 실제 문서의 가독성에 얼마나 영향을 미치는지를 OCR 결과 값과 비교한다. OCR 인식 성공 비율과 각 항목별 변형 정도를 나타내는 측정 값 간에 상관관계를 분석하기 위해서 피어슨 상관 계수(Pearson Correlation Coefficient)를 이용하고 이를 기반으로 실제 문서 영상의 변형정도를 평가하기 위한 가중치 값을 산정한다. 제시한 방법으로 평가에서 높은 평가 값으로 계산된 영상 문서는 OCR 인식률에서도 높은 인식 결과를 나타내고 있다.

지역적 엔트로피와 텍스처의 주성분 분석을 이용한 문서영상의 분할 및 구성요소 분류 (Segmentation and Contents Classification of Document Images Using Local Entropy and Texture-based PCA Algorithm)

  • 김보람;오준택;김욱현
    • 정보처리학회논문지B
    • /
    • 제16B권5호
    • /
    • pp.377-384
    • /
    • 2009
  • 본 논문은 지역적 엔트로피 기반의 히스토그램을 이용한 문서영상의 분할과 텍스처 기반의 주성분 분석을 이용한 구성요소인 글자, 그림, 그래프 등의 구성요소 분류방안을 제안한다. 지역적 엔트로피와 히스토그램을 이용함으로써 문서영상의 다양한 변형이나 잡음에 강건하며 빠르고 손쉬운 이진화가 가능하다. 그리고 문서영상 내 존재하는 구성요소들이 각기 다른 텍스처 정보를 가지고 있다는 것에 착안하여 각 분할 영역의 텍스처 정보를 기반으로 주성분분석을 수행하였으며 이를 통해 사전에 구성요소들에 대한 구조정보를 설정할 필요가 없다는 장점을 가진다. 실험결과에서 다양한 문서영상의 분할 및 분류결과를 보였으며, 기존 방법보다 우수한 성능을 가져 그 유효함을 보였다.

카메라 기반 문서 인식을 위한 적응적 이진화 (Adaptive Binarization for Camera-based Document Recognition)

  • 김인중
    • 한국산업정보학회논문지
    • /
    • 제12권3호
    • /
    • pp.132-140
    • /
    • 2007
  • 카메라 영상은 명도의 변화와 부정확한 초점으로 인해 스캐너 영상에 비하여 화질이 저하된다. 본 연구에서는 카메라 영상에서 자주 발생하는 화질 저하에 대한 적응력을 강화하여 카메라기반 문서 인식에 적합한 이진화 방법을 제안한다. 기존의 평가에서 우수하다고 보고된 이진화 방법을 기반으로 하되, 낮은 조도와 부정확한 초점으로 인해 명도 대비가 낮은 영상에 대한 적응력을 강화하였다. 또한 이진화 시 국소 윈도우를 이용하여 기존의 방법에서 뭉개지기 쉬운 문자의 세부 구조를 섬세하게 추출하도록 개선하였다. 실험에서는 기존에 우수하다고 평가된 이진화 방법들과 제안하는 방법을 문서 인식에 적용하여 다양한 카메라 문서 영상에 대한 성능을 비교하였는데, 그 결과 제안하는 방법이 카메라로 입력받은 문서 영상의 인식에 효과적임을 확인하였다.

  • PDF

카메라 문서 영상의 이진화 및 기울어짐 보정 방법 (A Method for Thresholding and Correction of Skew in Camera Document Images)

  • 장대근;전병태
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권3호
    • /
    • pp.143-150
    • /
    • 2005
  • 카메라 영상은 조명에 매우 민감하다. 그 결과 문자 인식을 매우 어렵게 만든다. 또한 카메라로 획득한 문서 영상을 대상으로 문자인식을 수행할 경우 비네팅현상이 발생하며 카메라와 피사체간의 위치와 각도의 불일치에 의해 기학적 왜곡이 발생한다. 비네팅 효과에 의한 문자분리의 어려움과 기하학적 왜곡으로 인한 문자모양의 변형으로 인해 실제로 사용이 가능한 카메라 문자인식 기술의 개발이 쉽지 않았다. 본 논문에서는 양선형 변환을 이용하여 카메라로 획득한 문서영상의 기하학적 왜곡을 보정함으로써 문자인식 성능을 향상시킬 수 있는 방법을 제안한다. 기존에는 카메라의 위치정보 없이 기하하적 왜곡을 보정하기 어려웠으나 제안한 방법은 이진화한 문서영상을 대상으로 문자와 문자줄을 추출하여 상하로는 문자줄의 배열방향을, 좌우로는 문자획의 기울어진 각도를 측정함으로써 문서영상 자체만으로 기하하적 왜곡보정이 가능하다.

  • PDF

SIFT를 이용한 문서 영상에서의 단어 검색 알고리즘 (Word Spotting Algorithms Using SIFT in Document Images)

  • 이득용;전효종;오일석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(A)
    • /
    • pp.488-490
    • /
    • 2011
  • 본 논문에서는 문서 영상에서 글자 분할 및 인식이 필요 없는 단어 검색 알고리즘을 제안한다. 글자 분할을 하지 않고 검색하기 위해 영상 검색에 사용되는 SIFT특징을 이용하였다. 제안하는 알고리즘은 사용자가 입력한 질의어를 질의 영상으로 변환하고, 질의 영상에서 SIFT특징을 추출한다. 추출된 특징은 문서영상에서 추출한 특징과 매칭을 통해 매칭점 쌍을 생성한다. 생성된 매칭점 쌍들을 군집화 조건에 따라 군집화 한다. 군집화는 질의 영상과 지리적 분포가 유사하게 군집화 되도록 설계되었다. 생성된 군집은 군집에 포함된 특징점의 개수가 많을수록 질의 영상과 유사하다. 따라서 N개 이상의 원소를 가지는 군집을 결과로 출력한다. 실험한 결과 제안하는 알고리즘의 가능성을 확인할 수 있었다.

영상 분할을 활용한 화학 구조 문서 이해 (Understanding Documents With Chemical Structures Using Image Segmentation)

  • 양혜윤;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.1297-1300
    • /
    • 2022
  • Document layout analysis는 문서 이미지의 구조와 구성요소를 파악하는 기술이다. 기존 딥러닝을 사용한 학습 기반 방법에는 각 구성 요소를 검출하는 detection 기반 방식이 많으나 이는 다양한 형식의 문서 이미지에 확장될 수 있는 가능성이 낮다는 한계가 존재한다. 특히, 다양한 모양과 크기의 화학 구조를 포함하는 화학 문서 이미지에 적용하기 어렵다. 본 논문에서는 영상분할을 활용하여 화학 구조 문서를 이해하는 연구를 진행하였다. 기존의 블록 단위로 레이블링된 벤치마크와 다르게 객체 단위로 레이블링한 학습 데이터를 가지고 DeepLabv3 구조의 네트워크를 학습하여 화학 문서 이미지를 효과적으로 분할하였다. 객체 단위 레이블링과 영상 분할을 사용한 방식이 문서 이해 및 화학 구조 검출에 준수한 성능을 보이는 것을 확인하였고 이 방식이 다양한 형식의 문서 이미지에 확장될 수 있음을 보였다.

  • PDF

XML 데이터베이스 기반의 영상정보 검색시스템 설계 (A Design of Image Information Retrieval System based on XML Database)

  • 곽길신;주경수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.139-141
    • /
    • 2005
  • 최근 인터넷의 발달에 따라 XML 문서의 사용과 각종 영상정보의 양이 크게 증가되었다. 이에 따라 XML 문서를 관리하기 위한 XML 데이터베이스의 필요성과 메타데이터 표준화에 대한 중요성이 증가되고 있다. XML 데이터베이스는 XML 문서의 특성을 고려하여 그 특성을 효율적으로 지원할 수 있다. 또한 국내에서는 교육정보분야 메타데이터 표준인 KEM 2.0이 제정 되었고 국외에서는 멀티미디어 데이터에 대한 표준으로 MPEG-7이 제정이 되었다. 이에 따라 본 논문에서는 MPEG-7을 기반으로 KEM 2.0을 이용한 영상정보 XML 스키마를 생성하고 이를 이용한 영상정보 검색시스템을 XML 데이터베이스 기반으로 설계하고자 한다. 본 논문에서 설계하는 XML 데이터베이스 기반의 영상정보 검색시스템은 XML 문서에 대한 빠른 저장과 검색이 가능할 것이다. 또한 검색 기능에 있어서는 키워드 기반의 의미기반 검색과 유사 이미지를 통한 내용기반 검색, 그리고 이를 내용기반과 의미기반을 통합한 검색 기능을 제공할 것이며 XML 문서에 대한 강력한 질의 수단인 XQuery 질의를 포함하게 될 것이다.

  • PDF