• 제목/요약/키워드: 문서 영상

검색결과 381건 처리시간 0.026초

전자도서관에서의 이진 문서영상 서비스 방안 (A Service Strategy of Binary Document Images in Digital Library)

  • 한영미;허봉식;김민환
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 1998년도 춘계학술발표논문집
    • /
    • pp.154-159
    • /
    • 1998
  • 최근의 전자도서관에서 문서영상 데이터베이스를 구축하여 사용자에게 원하는 정보의 원문을 그대로 서비스하고 있는데, 주로 200 dpi 문서영상에 대해 TIFF 영상포맷에서의 ITU-T T.6 압축방법을 사용하고 있다. 본 연구에서는, 문서영상 데이터베이스의 확장성, 지속성, 효율성 등을 고려하여, 문서 영상의 스캐닝 해상도의 600 dpi가 적당하며, 압축방법은 JBIG이 타당함을 제시하였다. 아울러, 모니터 및 프린터 기반 서비스의 특성을 분석하여 서비스 해상도를 차별화하는 방법인 단계별 서비스 방안을 제시함으로써 JBIG의 단점인 과다한 복구시간 문제를 해결하였다. 대표적인 문서영상들에 대한 실험을 통해, JBIG의 높은 압축율 및 제시된 단계별 서비스 방안의 타당성을 확인하였다.

  • PDF

웹 문서내의 그래픽 영상 수집 및 검색 (Gathering and Retrieval of the graphic images on a Web document)

  • 최진영;이은애;하석운
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2000년도 추계학술발표논문집
    • /
    • pp.607-610
    • /
    • 2000
  • 특정, 컴퓨터 사용자들이 자기가 관심을 가지고 있는 문서에서 어느 한 영상을 일괄 수집(Gathering)하고자 하는 욕구가 생길 수 있다. 그런데, 그래픽 영상(Graphic Image)이 여러 개로 세분화되어 있고, 한 문서 내에 다량으로 존재하기 때문에 선택하는 데 한계가 있다. 따라서, 웹(Web) 문서내의 모든 영상을 일괄 수집할 필요가 있으며 이 수집한 영상 중에서 사용자가 관심을 가지는 영상을 검색(Retrieval)하면 그와 유사한 다른 영상들도 같이 검색할 수 있는 시스템(System)이 필요하다는 생각에서 본 시스템을 구현하였는데, 그래픽영상의 일괄 수집이 가능하였고, 사용자의 관심영상에 대한 유사영상 검색이 가능하였다.

  • PDF

카메라기반의 왜곡이 보정된 흑백 문서 영상 생성 (Distortion Corrected Black and White Document Image Generation Based on Camera)

  • 김진호
    • 한국콘텐츠학회논문지
    • /
    • 제15권11호
    • /
    • pp.18-26
    • /
    • 2015
  • 스캐너 대신 카메라를 이용하여 문서의 사본 영상을 촬영하면 촬영 각도에 따라 기하학적 왜곡이 발생하거나 그림자가 생길 수 있다. 본 논문에서는 카메라로 촬영한 문서 영상으로부터 왜곡을 보정하고 그림자 영향을 제거한 흑백 문서 영상 생성 알고리즘을 제안하였다. 카메라 렌즈의 방사 왜곡으로 인해 휘어진 테두리를 펴거나 촬영 각도에 따라 유입된 문서 외부 영역을 제거하기 위한 기하학적 보정을 위해 2차 미분 필터 기반의 문서 테두리 검출 방안을 마련하였다. 그리고 적응적 이진화 방법으로 그림자를 제거한 흑백 문서 영상을 생성하였다. 제안한 왜곡 보정 흑백 문서 영상 생성 알고리즘을 스마트 폰 카메라로 촬영한 문서 영상들을 대상으로 실험한 결과 우수한 처리 결과를 얻을 수 있었다.

연결요소와 색상정보를 이용한 실제적 문서영상 분할 (Practical Page Segmentation using Connected Components and Color Information)

  • 김병기
    • 한국정보처리학회논문지
    • /
    • 제7권1호
    • /
    • pp.273-285
    • /
    • 2000
  • 문서영상의 분할은 문서인식의 전 과정 중에서 인식률에 큰 영향을 미치는 단계이지만 국내에서는 양적${\cdot}$질적으로 이에 대한 실제적인 연구가 부족한 것이 사실이다. 그 결과, 구조가 복잡하거나 칼라로 인쇄된 문서의 분할은 여전히 개선할 점이 많다. 본 논문에서는 불규칙한 다단, 점선, 그래픽, 사진 등의 다양하고 복잡한 요소로 구성된 문서의 실제적인 분할문제들을 살펴보고, 연결요소와 색상정보를 이용하여 이들을 효율적으로 분할하는 실제적 문서영상 분할 기법을 제안한다. 윤곽선 추출을 이용하여 다양한 형태의 모든 연결요소를 추출하고, 추출된 연결요소별 유형판정 및 연결요소 병합기준을 이용함으로써 정확한 문서영상 분할이 가능하다. 또한 색상문서의 경우, 정확한 문서분할과 처리시간 개선을 위하여 먼저 이진화된 문서에 대해서 문자와 비문자 영역으로 분할한 후, 필요에 따라 비문자 영역에 대하여 별도의 칼라별 영역분할을 수행한다. 제안된 방법의 성능을 확인하기 위하여 다양한 구조와 내용을 갖는 180장의 문서영상을 대상으로 문서분할 실험을 수행하였다. 아울러, 6가지 국내외 상용 문서인식 소프트웨어의 문서영상 분할 결과와 비교함으로써 제안한 방법이 복잡한 문서영상의 실제적 분할에 우수한 성능을 보임을 확인하였다.

  • PDF

문서영상의 레이아웃 분석과 문자 분할 (Page Layout Analysis and Text Segmentation in Document Image)

  • 최재형;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2012년도 하계학술대회
    • /
    • pp.71-74
    • /
    • 2012
  • 본 논문에서는 새로운 문자 분할 알고리즘을 제안한다. 고전적인 문자 분할 알고리즘은 학술적인 문서영상과 같이 단순한 구조를 가진 문서영상을 대상으로 하여 좋은 성능을 보였지만 다양한 문자 크기와 색상, 그림, 복잡한 배경 등으로 구성된 문서영상에서는 좋지 못한 성능을 보인다. 최근에 제안고 있는 방법들은 복잡한 문서영상에서도 좋은 성능을 보이도록 다양한 기법들을 적용하여 우수한 성능을 보이고 있지만, 대부분의 방법들이 영상을 일정한 크기의 블록으로 나누어 문자분할을 하기 때문에 세밀한 부분에서는 성능이 어느 정도 한계를 보인다. 따라서 본 논문에서는 블록의 크기에 제한을 갖지 않는 새로운 방법으로서, watershed 알고리즘을 이용한 문자분할 방법을 제시한다. 구체적으로, watershed 알고리즘을 이용하여 문서영상의 구조(docstrum)를 파악하고 이를 기반으로 문자를 분할한다. 제안하는 방법은 크게 엣지 검출, distance transform, watershed 알고리즘을 이용한 docstrum 분석, 문자 분할의 네 단계를 거친다. 실험 결과 블록에 기반한 기존의 방법들이 놓치는 세밀한 부분에서도 제안된 알고리즘은 올바른 분할결과를 얻을 수 있음을 확인하였다.

  • PDF

4-방향마스크와 프로젝션을 이용한 손상된 문서에서의 숫자 영상 복원 (Restoration of corrupted digit image Using 4-neighborhood mask and projection)

  • 최선아;윤미진;강동구;김도현;차의영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.670-672
    • /
    • 2002
  • 본 논문에서는 잘못된 인쇄로 인한 문서상의 잡영이나 문자 훼손이 있는 문서를 복원 하고자 만다. 제안하는 방법은 스캐너로 읽어들인 문서영상을 잡영 제거론 만 다음 훼손된 숫자 영상에 대해서 프로젝션을 이용하여 숫자 열을 낱낱의 숫자로 분할한다. 각각의 숫자에 대해서 크기가 일정하도록 정규화를 시킨 다음, Backpropagalion을 이용하여 훼손된 숫자를 학습하였다. 학습시킨 다음 원 영상과 훼손된 영상을 각 픽셀단위로 비교하여 4-방향 마스크를 이용하여 원래의 숫자 영상으로 복원하도록 만다.

  • PDF

부분 매칭을 이용한 서식 이해에 관한 연구 (Document Understanding using Partial Matching Method)

  • 변영철;윤성수;김경환;최영우;이일병
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.443-445
    • /
    • 1999
  • 여러 가지 유형의 서식 문서를 자동으로 처리하려면 서식을 이해하는데 필요한 항목 영상을 추출하기에 앞서 서식을 분류(classification)해야 한다. 서식을 분류함에 있어서 서식 영상 전체를 다룰 경우 상당한 시간이 걸릴 수 있다. 왜냐하면 일반적으로 서식 문서 영상의 크기는 일반 문자 영상에 비해 상당히 클 뿐만 아니라 대상 서식 문서의 유형도 많아질 수 있기 때문이다. 본 연구에서는 이러한 문제를 해결하기 위한 방법으로서 DP 매칭에 의한 부분 매칭 방법을 제안하고자 한다. 실험 결과, 제안하는 방법은 서식 문서의 전체가 아닌 일부 영역만을 비교함으로써 인식 시간과 인식률 면에서 서식 문서를 효과적으로 처리할 수 있었다.

  • PDF

전자도서관에서의 JBIG 기반 이전 문서영상 서비스 방안 (A Service Strategy of Binary Document Images based on JBIG in Digital Library)

  • 한영미;김민환
    • 한국멀티미디어학회논문지
    • /
    • 제1권1호
    • /
    • pp.37-44
    • /
    • 1998
  • 최근 SGML을 이용한 문서정보와 구축에 관한 연구가 많이 이루어지고 있으나, 현재 운영되고 있는 전자도서관에서는 기존의 출판물 문서를 이진 문서영상으로 스캐닝하여 사용자에게 그대로 서비스하는 방식을 이용하고 있다. 이때, 주로 200dpi로 스캐닝한 문서영상에 대하 TIFF 영상포맷에서의 ITU-T T.6 압축방법을 사용하여 제공하고 있는데, 이진 문서영상의 질 저하 현상과 낮은 압축율로 인해 어려움을 겪고 있다. 이에, 본 연구에서는 문서영상 데이터베이스의 확장성 및 효용성과 서비스 질의 향상성을 고려하여, 문서영상의 스캐닝 해상도는 600dpi가 적당하며, 압축방법은 JBIG이 타당함을 제시하였다. 아울러, 사용자 장비인 모니터와 프린터를 통한 서비스의 특성을 분석하여 이진 문서영상의 해상도를 단계별로 높여 서비스하는 방안을 제시함으로써, JBIG의 단점인 과다한 복구시간 문제를 해결하였다. 대표적인 문서영상들에 대한 실험을 통해, JBIG의 높은 압축율 및 제시된 단계별 서비스 방안의 타당성을 확인하였다.

  • PDF

에지 방향 히스토그램을 이용한 텍스트 문서 영상의 워터마킹 (A Watermarking for Text Document Images using Edge Direction Histograms)

  • 김영원;오일석
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권2호
    • /
    • pp.203-212
    • /
    • 2004
  • 워터마킹은 멀티미디어 컨텐츠의 저작권을 보호하기 위한 방법이다. 이러한 미디어 중에서 텍스트 문서는 블록/줄/단어의 계층 구조와 배경/전경의 확연한 구분 같은 고유한 특성을 나타내므로, 텍스트 문서를 위한 워터마킹 알고리즘은 이러한 특성을 잘 반영하여 설계하여야 한다. 본 논문은 명암을 갖는 텍스트 문서 영상을 위한 워터마킹 알고리즘을 제안한다. 워터마크 신호는 에지 방향 히스토그램을 통해서 삽입된다. 문서 영상의 부분 영상들은 모두 유사한 성질을 갖는다는 ‘부분 영상 일관성’을 제시한다. 한글 영상, 영문 영상, 한문 문서 영상을 대상으로 부분 영상 일관성을 조사하여, 부분 영상 일관성은 언어에 무관하며 다양한 문서 영상에 적용할 수 있음을 보인다. 워터마크 신호를 삽입하기 위하여 에지방향 히스토그램을 조작하였으며 다양한 실험을 통해 알고리즘의 비 인지성과 강인성을 분석하고 평가하였다.

Active카메라를 이용한 지능형 문서 영상 획득 (Intelligent Document Scanning with Active Camera)

  • 박안진;정기철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.592-594
    • /
    • 2004
  • 문서 영상 획득(document scanning)은 문서 영상 분석과 인식을 위한 중요한 단계이다 최근, 문서 영상 획득 장치로 스캐너(flat scanner)가 가장 많이 이용되고 있지만, 만지면 망가질 것 같은 얇은 고서, 매우 두꺼운 책과 같은 문서를 획득하기에는 어려움이 있다 이런 어려움을 해결하기 위해, 카메라를 이용한 문서 영상 획득에 관한 않은 연구가 진행되고 있으며, 카메라의 저해상도나 잡음과 칼은 문제를 해결하면, 스캐너를 대신하는 입력 장치로 이용할 수 있다. 저해상도 문제를 해결하는 방법으로 기본의 일반적인 레지스트레이션(registration) 방법은, 연결 부분(stitching position)에서 오브젝트(object: text, graphics, image)의 왜곡이 생기는 문제점이 있다. 본 논문에서는 PTZ(pan-tilt-zoom) 카메라를 이용하여 연결 부분에서 왜곡을 최소화하여 오브젝트를 획득하는 컴포넌트 기반의 영상 레지스트레이션(component-based image registration) 방법을 제안한다. 제안한 방법은 연결 부분에서 오브젝트의 수를 최소화하는데 목적이 있으며, 일반적인 레지스트레이션 방법에 비해 연결 부분에서 왜곡을 상당히 줄일 수 있으며, 상대적으로 인식률을 놓일 수 있다.

  • PDF