• 제목/요약/키워드: 문서영상분할

검색결과 50건 처리시간 0.029초

웨이블릿 계수의 통계적 이산 분석을 이용한 문서 영상 분할 (Document Image Segmentation by the Statistical Distribution Analysis of Wavelet Coefficients)

  • 이인수;김민수;김우성;한광록
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (하)
    • /
    • pp.927-930
    • /
    • 2000
  • 본 논문은 문서 영상에 대해 투영을 사용하여 영역을 나누었고 각 영역에 대해 고주파 밴드의 웨이블렛 계수의 통계적 분산과 히스토그램을 기반으로 한 두 가지 특징을 사용하여 문자와 그림으로 분류하였다. 투영으로 나누어진 영역들에 대해 일정 크기의 블록으로 나누고 두 가지 특징에 따라 문자와 그림으로 분류하였다. 따라서 투영에 의해 나뉜 영역 중 문자와 그림이 혼합되어 의미가 모호한 영역에 대해 잘못 분류되는 가능성을 줄일 수 있었다.

  • PDF

공간의존행렬과 신경망을 이용한 문서영상의 효과적인 블록분할과 유형분류 (An Efficient Block Segmentation and Classification Method for Document Image Analysis Using SGLDM and BP)

  • 김중수;이정환;최흥문
    • 한국정보처리학회논문지
    • /
    • 제2권6호
    • /
    • pp.937-946
    • /
    • 1995
  • 본 논문에서는 공간의존행렬과 신경망을 이용하여 문서영상에서 인식대상 문자가 포함되어 있는 블록들을 좀더 세분해 낼 수 있는 효과적인 방법을 제시 하였다. 제안 된 방법은 명암도 문서블록에서 공간의존행렬을 구하고 7가지 질감 특징을 추출한 뒤 신경망을 이용해 문서블록을 9가지 유형으로 분류할 수 있도록 하였다. 특히 기존에는 비문자영역으로 분류되던 수식, 도표, 순서도 등 주로 문자가 포함되어 있는 블록들을 세분해 낼 수 있도록 하였다. 또한 신경망 학습알고리즘인 BP 를 사용함으로써 기존의 선형분류시에 요구되던 유형별 임계값과 선형면결정지수를 찾는 어려움을 해소하였다. 명암도영상을 이진화하기 전에 먼저 Sobel연산을 적용함으로써 문서 뒷면에 의한 배경 잡음의 영향을 줄일 수 있도록 하였고, 교차 문지르기 후 분할함으로써 블록이 작은 조각으로 나누어지는 것을 방지하도록 하였다. 실험결과 제안한 방법에서는 문자가 포 함되어 있는 블록은 큰 문자, 중간문자, 작은 문자블록 및 수식, 순서도, 도표블록의 6가지로, 그리고 비문자블록은 인물사진, 그래프 등 3가지 유형으로 상세하게 분류 할수 堞있었으며 전체적인 분류성능도 우수함을 확인할 수 있었다.

  • PDF

손가락 이동에 의해 선택된 영역의 인쇄체 한글 영상 문서화 (Documentation of Printed Hangul Images of the Selected Area by Finger Movement)

  • 백승복;손영선
    • 한국지능시스템학회논문지
    • /
    • 제12권4호
    • /
    • pp.306-310
    • /
    • 2002
  • 본 논문은 글자 문서를 배경으로 사용자의 손가락 이동에 의하여 일정한 영역을 그린 후, 영역내의 한글 영상을 편집 가능 한 에디터에 출력하는 시스템을 구현하였다. 영상의 전처리 단계에서는 문서 배경과 손 영역을 분리하고 최대 원형 이동법을 이용하여 손의 무게 중심점을 추출한다. 원형 패턴 벡터 알고리즘을 사용하여 손을 인식한 후, 거리 스펙트 럼으로 손가 락 위치를 찾는다. 손가락의 움직임에 의해 선택되어진 문자 영역을 추출한 후, 한글 자소 간 히스토그램을 이용하여 추출 된 문자 이미지 영역에서 문자단위로 분할하고 다양한 크기의 문자를 표준화한다. 퍼지 추론을 적용한 원형 패턴 벡터 알고리즘을 이용하여 표준 패턴문자와 입력문자의 특징벡터를 비교하여 문자를 인식하게 함으로써 사용자가 원하는 영역의 문자들을 수정 가능한 문서로 변환하였다.

기하학적 패턴 벡터를 이용한 한.영 글꼴 문자인식 (Hansel and English Text Font Recognition Using Geometrical Pattern Vector)

  • 석영수;홍창희;조정락;강기섭;민종규;이응주
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.425-428
    • /
    • 2001
  • 본 논문에서는 문서 위의 문자를 Off-Line방식으로 컴퓨터에 저장할 수 있도록 기하학적 패턴 벡터를 이용하여 한·영문자 및 글꼴을 인식하는 알고리즘을 제안하였다. 일반적으로 문서에서는 여러 가지 글꼴에 따라 글자의 형태가 다르므로 대표적인 한·영 세 가지 글꼴을 기하학적 패턴(Geometrical Pattern Vector)을 이용하여 크기와 이동에 인식하도록 하였다. 이진 입력 한영혼용 영상에서 잡음을 제거하고 수평·수직 투영 기법을 이용하여 한 문자를 분할하여 문자의 폭에 따라 기하학적 패턴을 추출한다. 추출한 패턴은 각 합계를 계산하여 기준 패턴 합계와 비교한 후 기준 패턴 문자와 글꼴을 인식하게 된다. 마지막으로 제안한 알고리즘의 성능을 평가하기 위해 크기, 이동 변형이 있는 대표적인 한·영 글꼴(신명조, 궁서, 고딕)체와 영어 Time New Roman체를 대상으로 모의 실험을 수행하였다. 제안한 알고리즘은 기존의 원형 패턴 알고리즘보다 문자인식률과 글꼴 그리고 영어의 대·소문자를 구별하는 우수함을 보였다.

  • PDF

다양한 크기 및 활자체를 갖는 인쇄체 한글 영상의 문서화에 관한 연구 (A Study on Documentization of Printed Hangul Image with Multi-size and Multi-style)

  • 김장욱;김경숙;손영선
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2001년도 추계학술대회 학술발표 논문집
    • /
    • pp.295-298
    • /
    • 2001
  • 본 논문에서는 CCD카메라로 입력 받은 다중 크기 및 활자체로 구성된 한글문서의 화상 데이터를 편집기에서 수정 가능한 문자로 변환시키는 시스템을 구현하였다. 먼저 Dynamic 이 진화 처리 과정을 거친 화상을 흑백 화소의 누적분포에 따라 문자단위로 분할한 후, 다양한 크기로 분할된 문자를 표준패턴 크기로 표준화 시켰다. 한글을 자소 간 공백 위치의 특징에 따라서 6가지 유형으로 분류한 후, 퍼지 이론을 접목시킨 원형 패턴 벡터 알고리즘을 사용해서 표준벡터와 입력된 글자의 특징벡터를 비교하여 문자로 인식하게 하였다. 각 6가지 유형에서 서로 다른 자소로 결합된 문자들을 30개 선정하여 여러 가지 활자체 및 크기에 적용해 본 결과, 모두 문서화가 가능함을 알 수 있었다.

  • PDF

동영상에서 모양 시퀀스를 이용한 동작 검색 방법 (Movement Search in Video Stream Using Shape Sequence)

  • 최민석
    • 한국멀티미디어학회논문지
    • /
    • 제12권4호
    • /
    • pp.492-501
    • /
    • 2009
  • 동영상에서 객체의 동작 정보는 장면의 내용을 분류하고 구분하는 중요한 정보로 이용될 수 있다. 본 논문에서는 동영상에서 객체의 동작을 효과적으로 찾기 위한 모양기반 동작 검색 방법을 제안한다. 객체의 동작 정보는 동영상 프레임에서 객체 영역을 추출하여 연속된 2차원 모양 정보로 표현되고, 각각의 2차원 모양 정보는 모양 기술자를 이용하여 1차원 모양 특정값으로 변환된다. 순서에 따라 나열된 모양 기술자 시퀀스를 이용하여 개별 동작의 분할 과정 없이 문서에서 단어를 검색하듯이 동영상에서 객체의 동작을 검색할 수 있다. MPEG-7 모양 변화 기술자와의 성능 비교 실험을 통하여 제안된 방법이 객체의 동작 정보를 보다 효과적으로 표현할 수 있으며, 동작 검색 및 분석 응용에 적용할 수 있음을 보였다.

  • PDF

교육용 도서 영상을 위한 효과적인 객체 자동 분류 기술 (Efficient Object Classification Scheme for Scanned Educational Book Image)

  • 최영주;김지해;이영운;이종혁;홍광수;김병규
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권7호
    • /
    • pp.1323-1331
    • /
    • 2017
  • 오늘날 저작권 관련 산업이 사회, 경제적으로 큰 영향을 미치는 대규모 산업으로 성장하였음에도 불구하고 저작물에 대한 소유권 및 저작권에 대한 문제가 끊임없이 발생하고 있으며 특히 이미지 저작권과 관련된 연구는 거의 진행되지 않는 상태이다. 본 연구에서는 기존의 문서 영상처리 기술과 딥 러닝 기술을 융합하여 교육용 도서 영상에서의 객체 자동 추출 및 분류 기술 시스템을 제안한다. 제안된 기술은 먼저 잡음을 제거한 후, 시각적 주의(visual attention) 기반 영역 추출 과정을 수행한다. 추출된 영역을 기반으로 블록화 작업을 수행하고, 각 블록을 그림인지 아니면 문자 영역인지를 분류한다. 마지막으로 추출된 그림 영역 주위를 검색하여 캡션 영역을 추출한다. 본 연구에서 진행한 성능 평가 결과, 그림 영역은 최대 97% 정확도를 보이며, 그림 및 캡션 영역 추출에 있어서는 평균 83%의 정확도를 보여 준다.

문서영상의 에지 정보를 이용한 효과적인 블록분할 및 유형분류 (An Efficient Block Segmentation and Classification of a Document Image Using Edge Information)

  • 박창준;전준형;최형문
    • 전자공학회논문지B
    • /
    • 제33B권10호
    • /
    • pp.120-129
    • /
    • 1996
  • This paper presents an efficient block segmentation and classification using the edge information of the document image. We extract four prominent features form the edge gradient and orientaton, all of which, and thereby the block clssifications, are insensitive to the background noise and the brightness variation of of the image. Using these four features, we can efficiently classify a document image into the seven categrories of blocks of small-size letters, large-size letters, tables, equations, flow-charts, graphs, and photographs, the first five of which are text blocks which are character-recognizable, and the last two are non-character blocks. By introducing the clumn interval and text line intervals of the document in the determination of th erun length of CRLA (constrained run length algorithm), we can obtain an efficient block segmentation with reduced memory size. The simulation results show that the proposed algorithm can rigidly segment and classify the blocks of the documents into the above mentioned seven categories and classification performance is high enough for all the categories except for the graphs with too much variations.

  • PDF

체인 정합과 확장된 그룹핑 방법을 사용한 곡선형 텍스트 라인 추출 (Extracting curved text lines using the chain composition and the expanded grouping method)

  • ;윤진선;송영준;김남;김용기
    • 정보처리학회논문지B
    • /
    • 제14B권6호
    • /
    • pp.453-460
    • /
    • 2007
  • 본 논문은 정형화되지 않은 텍스트 라인들을 추출하기 위한 방법을 보여주고 있다. 텍스트 라인들은 각기 다른 각도로 구성되고, 심하게 굴곡이 있는 모양, 그리고 텍스트 라인내의 약간의 단어 사이의 공간이 생기게 된다. 그러한 텍스트 라인들은 포스터, 주소, 그리고 예술 문서 등에서 발견된다. 제안하는 방법은 기존의 직관적인 그룹핑 방법에 기반을 두고 있지만, 하나의 라인에서 발생하는 불충분한 특징점들과 모호한 회전 등을 극복하기 위한 방법을 개발하였다. 본 논문에서 텍스트 라인들은 몇 개의 연결된 성분들로 구성되고, 이 성분들은 하나의 문자 또는 연결된 문자들의 검은색 화소들의 집합이라고 가정하였다. 제안하는 방법은 반복적으로 증가되는 임계값과 가까운 성분들은 하나의 체인으로 병합하게 되고 확장되어 길어진 체인들은 라인의 원시 체인으로서 인지된다. 그때 원시 체인들은 텍스트 라인의 부분적 회전에 따라 좌우로 확장되어 진다. 텍스트 라인의 부분적인 회전은 원시 체인이 확장될 때, 체인들의 각 면에서 재구성될 것이다. 이러한 과정을 통해서 모든 텍스트 라인들이 구성되어 진다. 제안 방법은 로고와 슬로건에서 사용된 곡면으로 쓰여진 텍스트 라인들에 대해서 실험한 결과 직선 텍스트 라인은 98%, 곡선 텍스트 라인은 94%로서 높은 추출율을 보여주고 있다.

임베디드용 JBIG2 부호화기의 하드웨어 설계 (Hardware Design for JBIG2 Encoder on Embedded System)

  • 서석용;고형화
    • 한국통신학회논문지
    • /
    • 제35권2C호
    • /
    • pp.182-192
    • /
    • 2010
  • 본 논문은 이진 영상 압축 표준인 JBIG2의 주요 구성모듈을 하드웨어 IP(Intellectual Property)로 설계 구현을 제안한다. JBIG2가 표준화된 이후 차세대 FAX 하드웨어 개발을 용이하게 하기 위하여 JBIG2 부호화기의 주요 모듈인 심볼 추출부, 허프만 부호화기, MMR 부호화기, MQ 산술부호화기를 하드웨어 IP로 합성하였다. VHDL코드 생성 및 합성을 위해서 ImpulseC Codeveloper와 Xilinx ISE/EDK 프로그램을 사용하였다. 심볼추출시 메모리의 사용을 최소화하기 위해 문서를 128라인씩 분할하여 처리하도록 설계하였다. 합성된 IP들은 Xilinx사의 ML410 개발보드의 Virtex-4 FX60 FPGA에 다운로드하여 성능평가를 수행하였다. 4개의 IP가 FPGA에서 차지하는 면적은 전체 slice의 36.7%를 차지하였다. 동작 검증을 위해 Active HDL 툴을 이용하여 각 IP에 대한 파형 검증을 수행한 결과 정상 동작함을 확인하였다. 아울러 ML410 개발보드 상에서 Microblaze CPU를 이용해 소프트웨어로만 수행한 경우와 동작 속도를 비교 한 결과, 구현된 IP들은 심볼 추출부는 17배, 허프만 부호화기는 10배, MMR 부호화기는 6배, MQ 산술부호화기는 2.2배 이상의 빠른 처리 속도를 나타내었다. 구현된 하드웨어 IP와 연동된 소프트웨어 모듈로 표준 CCITT문서를 압축한 결과 정상적으로 동작함을 확인하였다.