Implementation of JBIG2 CODEC with Effective Document Segmentation

문서의 효율적 영역 분할과 JBIG2 CODEC의 구현

  • Published : 2002.06.01

Abstract

JBIG2 is an International Standard fur compression of Bi-level images and documents. JBIG2 supports three encoding modes for high compression according to region features of documents. One of which is generic region coding for bitmap coding. The basic bitmap coder is either MMR or arithmetic coding. Pattern matching coding method is used for text region, and halftone pattern coding is used for halftone region. In this paper, a document is segmented into line-art, halftone and text region for JBIG2 encoding and JBIG2 CODEC is implemented. For efficient region segmentation of documents, region segmentation method using wavelet coefficient is applied with existing boundary extraction technique. In case of facsimile test image(IEEE-167a), there is improvement in compression ratio of about 2% and enhancement of subjective quality. Also, we propose arbitrary shape halftone region coding, which improves subjective quality in talc neighboring text of halftone region.

JBIG2는 2진 영상과 문서 압축을 위한 국제 표준이다. JBIG2 표준은 2진 영상과 문서를 고압축으로 부호화하기 위해 영역 특징에 따라 세 가지 부호화 모드를 제공한다. MMR이나 산술 부호화를 이용하여 비트맵(bitmap)의 부호화를 위한 제너릭 영역(Generic region) 부호화를 한다. 그리고, 텍스트 영역의 부호화를 위해 패턴 매칭(Pattern Matching) 부호화를 하고, 하프톤 영역(Halftone region) 부호화를 위해 하프톤 패턴 부호화(Halftone Pattern Coding)를 한다. 본 논문에서는 JBIG2 부호화를 위해 문서를 라인아트, 하프톤, 텍스트 영역으로 분할한 후 각 영역에 제너릭 영역 부호화, 심벌 매칭 부호화, 하프톤 패턴 부호화를 하는 JBIG2 CODEC을 구현하였다. 문서의 효율적 영역 분할을 위해 윤곽선 추출법을 이용한 영역분할 방법과 웨이브릿 계수분표를 이용한 영역 분할 방법을 함께 적용하여 facsimile 테스트 영상(IEEE-167a)의 경우 2% 정도의 압축률 개선과 주관적 화질의 향상을 얻었다. 또한 임의 모양 하프톤 영역의 부호화를 제안하여 기존 영역 분할 방법에서 인지할 수 없는 임의 모양 하프톤 영역 주변 텍스트의 주관적 화질을 개선하였다.

Keywords

References

  1. ISO/IEC 14492, JBIG2 Final Draft International Standard
  2. IEEE Trans. on Circuit and System for Video Technology v.8 no.5 The Emerging JBIG2 Standard P.Howard;F.Kossentini;B.Martins;S.Forchhammer;W.Rucklidge;F.Ono
  3. CCITT Rec. T.4 Standardization of Group3 Facsimile Apparatus For Document Transmission
  4. CCITT Rec. T.6 Facsimile Coding Schemes and Coding Control Functions for Group4 Facsimile Apparatus
  5. ISO/IEC International Standard 11544, JBIG Information Technology - Coded Representation of Picture and Audio Information-Progressive Bi-level Image Compression
  6. 한국통신학회 논문집 v.25 no.68 JBIG2 부호화에서 한글의 효율적 처리에 관한 연구 강병택;고형화
  7. IEEE Trans. Image Processing A Fast Segmentation Algorithm for Bi-Level Image Compression using JBIG2 D.Tompkins;F.Kossentini
  8. IEEE Trans. on Image Proc. v.9 no.9 Context-Based Multiscale Classification of Document Images Using Wavelet Coefficient Distribution J.Li;M.Gray
  9. Wavelets and Subband Coding M.Vetterli;J.Kovacevic
  10. Statistical Methods G.Snedecor;W.G.Cochtan