• 제목/요약/키워드: 문서 영상

검색결과 381건 처리시간 0.029초

Noise Removal in Scanned Halftone Images using HOG-based Adaptive Smoothing (HOG 기반의 적응적 평활화를 이용한 스캔된 하프톤 영상의 잡음 제거)

  • Hur, Kyu-Sung;Baek, Yeul-Min;Kim, Whoi-Yul
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 한국방송공학회 2010년도 하계학술대회
    • /
    • pp.256-259
    • /
    • 2010
  • 본 논문에서는 적응적 평활화 필터를 이용한 스캔된 하프톤 문서의 하프톤 잡음 제거 방법을 제안한다. 하프톤 잡음은 잡음의 편차가 커서 에지 영역과 유사한 특성을 나타내므로 일반적인 에지 보존 평활화 필터를 적용할 경우에는 잡음 제거 효과가 떨어진다. 또한 인쇄물에 주로 사용되는 집중형 도트 방식의 하프톤은 컬러 영상에서 채널간의 간섭 현상으로 인해 모아레 패턴을 생성한다. 따라서 본 논문에서는 스캔된 하프톤 문서의 하프톤 잡음과 모아레 패턴을 효과적으로 제거하기 위해 하프톤 잡음의 방향성에 기반한 적응적 평활화 필터 방법을 제안한다. 하프톤 잡음의 경우 영상의 에지와 달리 등방성을 가지므로 영상을 블록 단위로 나누어 지배적인 에지의 크기와 방향성을 살핌으로써 적응적 평활화 필터를 구성할 수 있다. 실험 결과, 제안하는 방법은 다양한 인쇄 매체를 통해 생성된 하프톤 문서에 대하여 효과적으로 하프톤 잡음을 제거하면서도 영상의 에지를 보존하는 것을 확인할 수 있었다.

  • PDF

Word Segmentation Algorithm for Handwritten Documents based on k-means Clustering (k-평균 클러스터링을 이용한 필기 문서 영상의 단어 분리법)

  • Ryu, Jewoong;Cho, Nam Ik
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 한국방송공학회 2014년도 하계학술대회
    • /
    • pp.38-41
    • /
    • 2014
  • 본 논문에서는 필기 문서 영상을 분석하여 단어 단위로 요소들을 분할하는 방법을 제안한다. 일반적으로 인쇄 문서에 비하여 필기 문서에서는 글자 간 간격이 일정하지 않을 뿐만 아니라 필기자 또는 작성된 언어에 따라 특성이 매우 다르게 나타나기 때문에 단어를 분리하는 것은 어려운 문제로 간주되었고 많은 연구가 진행되었다. 제안하는 방법은 이 문제를 해결하기 위하여 글자 획의 두께를 고려하여 정규화시킨 각 연결 요소간 간격과 간격 안에 존재하는 글자 픽셀의 수로 구성된 2 차원의 특징값을 추출하였다. 이 특징값을 바탕으로, 제안하는 방법은 k-평균 클러스터링을 이용하여 각 텍스트라인을 구성하는 연결 요소간 간격을 단어 사이의 간격과 단어 내부 글자간의 간격으로 분류하였다. ICDAR 2013 Handwriting Segmentation Contest 데이터베이스에 대한 실험 결과 제안하는 방법은 가장 우수한 성능을 나타내었다.

  • PDF

문서 영상에서의 테이블 벡터화에 관한 연구

  • 심진보;김우성;박용범;오원근
    • Proceedings of the Korea Database Society Conference
    • /
    • 한국데이타베이스학회 1995년도 제4회 멀티미디어 산업기술 학술대회 논문집
    • /
    • pp.177-182
    • /
    • 1995
  • 본 논문에서는 문서 인식 시스템에서 정확한 문서 인식의 기본이 되고 인식 결과에 중요한 영향을 미치는 전처리 알고리즘 중 테이블 입력의 효율적인 처리 방법을 연구한다. 테이블 내의 문자를 인식하기 위해서는 테두리선과 문자부분을 먼저 분리하는 작업이 필요하다. 왜냐하면, 테이블을 인식하기 위해서는 테두리선에 의해 블록화된 테두리선 안의 문자를 인식해야 하며 또한 테두리선을 효율적으로 벡터화하는 방법이 필요하다. 따라서 테이블을 벡터화하는 방법으로 8방향 체인 코드를 이용하여 테이블 선 성분을 추출하는 방법과 히스토그램을 이용하여 테이블의 수평, 수직 성분을 추출하여 얻어진 교차점을 이용하여 대각선 성분을 찾아내는 방법 및 화소의 run-length를 이용하여 수평, 수직 성분을 추출하여 얻어진 교차점을 이용해 대각선 성분을 찾아내는 방법 등이 있다. 본 논문에서는 문서 영상 내의 테이블을 효율적으로 벡터화하기 위한 방법을 연구한다.

  • PDF

A study on Metadata Modeling using Structure Information of Video Document (비디오 문서의 구조 정보를 이용한 메타데이터 모델링에 관한 연구)

  • 권재길
    • Journal of the Korea Society of Computer and Information
    • /
    • 제3권4호
    • /
    • pp.10-18
    • /
    • 1998
  • Video information is an important component of multimedia system such as Digital Library. World-Wide Web(WWW) and Video-On-Demand(VOD) service system. It can support various types of information because of including audio-visual, spatial-temporal and semantics information. In addition, it requires the ability of retrieving the specific scene of video instead of entire retrieval of video document. Therefore, so as to support a variety of retrieval, this paper models metadata using video document structure information that consists of hierarchical structure, and designs database schema that can manipulate video document.

  • PDF

The Region Analysis of Document Images Based on One Dimensional Median Filter (1차원 메디안 필터 기반 문서영상 영역해석)

  • 박승호;장대근;황찬식
    • Journal of the Institute of Electronics Engineers of Korea SP
    • /
    • 제40권3호
    • /
    • pp.194-202
    • /
    • 2003
  • To convert printed images into electronic ones automatically, it requires region analysis of document images and character recognition. In these, regional analysis segments document image into detailed regions and classifies thee regions into the types of text, picture, table and so on. But it is difficult to classify the text and the picture exactly, because the size, density and complexity of pixel distribution of some of these are similar. Thu, misclassification in region analysis is the main reason that makes automatic conversion difficult. In this paper, we propose region analysis method that segments document image into text and picture regions. The proposed method solves the referred problems using one dimensional median filter based method in text and picture classification. And the misclassification problems of boldface texts and picture regions like graphs or tables, caused by using median filtering, are solved by using of skin peeling filter and maximal text length. The performance, therefore, is better than previous methods containing commercial softwares.

Fingerprint Information Masking Algorithm By Using Multiple LBP Features (다중 LBP 피처를 이용한 지문 정보 마스킹 알고리즘)

  • Kim, Jin-Ho
    • The Journal of the Korea Contents Association
    • /
    • 제17권12호
    • /
    • pp.281-288
    • /
    • 2017
  • Financial service commission notified that fingerprint information of their documents should be deleted till 2019 to the financial industry and the public institution. Business solutions for fingerprint detection and masking in document images are introduced. In this paper, a fingerprint information masking algorithm is proposed by using the multiple LBP features to extract fingerprint's intrinsic characteristics for artificial neural network decision whether the candidate is a true fingerprint or not after segmentation of versatile fingerprint candidates from a document image. The experimental results of the proposed fingerprint masking algorithm for 3,497 document images that are saved in a financial industry show that 96.4% of fingerprint information is masked, hence this fingerprint masking algorithm can be used efficiently in real fingerprint masking tasks.

Advanced Documents Authoring Tool (Advanced Documents 저작 도구)

  • Hong, Kwang-Jin;Jung, Kee-Chul
    • Annual Conference of KIPS
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.903-906
    • /
    • 2005
  • 프로젝션 디스플레이 시스템(PDS)을 사용한 Advanced Paper Document (APD)는 오프라인 문서와 온라인 문서의 장점을 모두 가지고 있다. PDS는 가상의 물체를 실제 세계에 공간적으로 연결하여 줌으로써 사용자에게 더욱 풍부한 정보를 제공할 수 있다. 본 논문은 단순하게 오프라인 문서에 대한 온라인 정보를 보여주는 APD의 기능을 확장한, 사용자가 직접 오프라인 문서에 온라인 정보들을 삽입, 삭제, 수정할 수 있는 Advanced Documents Authoring Tool (ADAT)을 제안한다. ADAT는 PDS 위에 놓여진 실제의 오프라인 문서와 가상의 온라인 정보를 직관적으로 연결해준다. 사용자가 전자펜을 통하여 문서를 선택하면, 작업 공간 위쪽에 설치된 카메라를 통하여 문서의 영상을 입력받고, 해당 문서의 기존에 저장되어있는 정보를 검색한 후, 프로젝터를 통하여 문서 위에 투영해줌으로써, 사용자에게 온라인 정보를 제공한다.

  • PDF

Line Edge-Based Type-Specific Corner Points Extraction for the Analysis of Table Form Document Structure (표 서식 문서의 구조 분석을 위한 선분 에지 기반의 유형별 꼭짓점 검출)

  • Jung, Jae-young
    • Journal of Digital Contents Society
    • /
    • 제15권2호
    • /
    • pp.209-217
    • /
    • 2014
  • It is very important to classify a lot of table-form documents into the same type of classes or to extract information filled in the template automatically. For these, it is necessary to accurately analyze table-form structure. This paper proposes an algorithm to extract corner points based on line edge segments and to classify the type of junction from table-form images. The algorithm preprocesses image through binarization, skew correction, deletion of isolated small area of black color because that they are probably generated by noises.. And then, it processes detections of edge block, line edges from a edge block, corner points. The extracted corner points are classified as 9 types of junction based on the combination of horizontal/vertical line edge segments in a block. The proposed method is applied to the several unconstraint document images such as tax form, transaction receipt, ordinary document containing tables, etc. The experimental results show that the performance of point detection is over 99%. Considering that almost corner points make a correspondence pair in the table, the information of type of corner and width of line may be useful to analyse the structure of table-form document.

JPSearch 기술개요 및 동향조사

  • Jo, Jae-Hun;Kim, Yeong-Seop
    • Proceedings of the Korean Society Of Semiconductor Equipment Technology
    • /
    • 한국반도체및디스플레이장비학회 2007년도 춘계학술대회
    • /
    • pp.271-275
    • /
    • 2007
  • 본 문서는 JPEG(Joint Photographic coding experts group)에서 새로운 분야로 준비중인 JPSearch의 기술개요와 구조를 소개함으로써 텍스트 기반에서 영상 대 영상 검색 시스템의 전환을 제시한다. 또한 영상 대 영상 검색 시스템의 기본적인 기술특징과 JPSearch에서 요구하는 시스템 구조를 설명한다. JPSearch의 영상 검색 시스템이 사용 가능한 다양한 사용자 경우를 제시하였다.

  • PDF

An Adaptive Binarization of Camera Document Image by Image Quality Estimation (화질 분석을 통한 카메라 문서 영상의 적응적 이진화)

  • Kim, In-Jung
    • Journal of KIISE:Software and Applications
    • /
    • 제34권9호
    • /
    • pp.797-803
    • /
    • 2007
  • Adaptive binarization is very important for the camera-based document recognition. This paper proposes a binarization method which can effectively adapt to the variation of image Qualify. Firstly, it analyzes the effect of binarization parameters to the result and proposes a method to measure the image quality. Then, it statistically analyzes the relationship between the image quality and the binarization parameter. Finally, it proposes a binarization method that automatically adapts to the quality of the input image, using the analysis result. The experiment results show that there is a meaningful relationship between the image quality and the binarization parameter, and therefore, the proposed method can effectively adapt to the variation of image quality.