• 제목/요약/키워드: document image segmentation

검색결과 51건 처리시간 0.027초

교육용 도서 영상을 위한 효과적인 객체 자동 분류 기술 (Efficient Object Classification Scheme for Scanned Educational Book Image)

  • 최영주;김지해;이영운;이종혁;홍광수;김병규
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권7호
    • /
    • pp.1323-1331
    • /
    • 2017
  • 오늘날 저작권 관련 산업이 사회, 경제적으로 큰 영향을 미치는 대규모 산업으로 성장하였음에도 불구하고 저작물에 대한 소유권 및 저작권에 대한 문제가 끊임없이 발생하고 있으며 특히 이미지 저작권과 관련된 연구는 거의 진행되지 않는 상태이다. 본 연구에서는 기존의 문서 영상처리 기술과 딥 러닝 기술을 융합하여 교육용 도서 영상에서의 객체 자동 추출 및 분류 기술 시스템을 제안한다. 제안된 기술은 먼저 잡음을 제거한 후, 시각적 주의(visual attention) 기반 영역 추출 과정을 수행한다. 추출된 영역을 기반으로 블록화 작업을 수행하고, 각 블록을 그림인지 아니면 문자 영역인지를 분류한다. 마지막으로 추출된 그림 영역 주위를 검색하여 캡션 영역을 추출한다. 본 연구에서 진행한 성능 평가 결과, 그림 영역은 최대 97% 정확도를 보이며, 그림 및 캡션 영역 추출에 있어서는 평균 83%의 정확도를 보여 준다.

다중 LBP 피처를 이용한 지문 정보 마스킹 알고리즘 (Fingerprint Information Masking Algorithm By Using Multiple LBP Features)

  • 김진호
    • 한국콘텐츠학회논문지
    • /
    • 제17권12호
    • /
    • pp.281-288
    • /
    • 2017
  • 금융위원회는 2019년도까지 금융기관 및 공공기관 등에서 보유하고 있는 문서에서 지문 정보를 폐기 조치하라고 통보했다. 이를 위해 문서 영상에서 지문 정보를 검출하고 마스킹하기 위한 상용 솔루션들이 발표되고 있다. 본 논문에서는 문서 영상에 다양한 형태로 기록된 지문 후보들을 분할한 다음 인공신경망 분류기로 지문인지 여부를 판단할 때 지문의 특징이 잘 반영된 피처를 추출하기 위해 다중 LBP 피처를 설계하고 이를 이용해서 지문 정보를 마스킹하는 알고리즘을 제안하였다. 제안한 지문 정보 마스킹 알고리즘을 이용하여 금융권에서 보유하고 있는 3,497장의 문서 영상을 대상으로 지문 마스킹 실험을 수행한 결과 96.4%의 지문을 마스킹 할 수 있어서 본 알고리즘이 실제 지문 정보 마스킹 작업에 효과적으로 활용될 수 있음을 확인하였다.

SPIHT 기반 문서 부호화와 복호화 시스템의 성능 향상 (Improvement of SPIHT-based Document Encoding and Decoding System)

  • 장준;이호석
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권7_8호
    • /
    • pp.687-695
    • /
    • 2003
  • 본 논문은 문자가 포함된 영상에서 문자의 가독성은 유지하면서 영상을 압축하고 복원하는 효율적인 방법을 제시한다. 본 논문에서 제시하는 방법은 문서 분할, Quincunx 다운샘플링, (5/3) 웨이블릿 리프팅 그리고 서브밴드별 SPIHT(Set Partitioning In Hierarchical Trees) 부호화 방법을 기반으로 하여 구축되었다. 부호화 과정에서는 Quincunx 다운샘를링과 서브밴드 SPIHT 부호화 방법을 사용하여 부호화 수행 시간을 단축하였으며 산술 부호화를 적용하여 SPIHT 부호기의 비트스트림을 더욱 압축하였다. 실험에서는, 복원된 영상을 제시하여 시스템의 성능을 압축율과 PSNR을 비교하고 분석하였다. 실험에서는, 복원된 영상을 제시하여 시스템의 성능을 확인할 수 있도록 하였으며, 여러 가지 양자화를 적용하여 제안한 SPIHT에 기반한 문서 압축 시스템의 압축율과 PSNR을 비교하고 분석하였다.

망분리 환경에서 파일형식 변환을 통한 안전한 파일 전송 및 포렌식 준비도 구축 연구 (Secure File Transfer Method and Forensic Readiness by converting file format in Network Segmentation Environment)

  • 한재혁;윤영인;허지민;이재연;최정인;홍석준;이상진
    • 정보보호학회논문지
    • /
    • 제29권4호
    • /
    • pp.859-866
    • /
    • 2019
  • 최근의 사이버 보안 위협은 특정 표적을 대상으로 하는 특징이 있으며 보안을 강화시키기 위한 지속적인 노력에도 불구하고 APT 공격에 의한 피해 사례는 계속 발생하고 있다. 인터넷망과 업무망이 분리된 망분리 환경은 외부 정보의 유입을 봉쇄시킬 수 있으나 업무의 효율성과 생산성을 위해서는 현실적으로 외부 정보의 유입을 모두 통제할 수는 없다. 이에 망연계 시스템 등 보안 정책을 강화시키고 파일 내부에 포함된 불필요한 데이터를 제거할 수 있도록 CDR 기술이 적용된 솔루션을 도입하더라도 여전히 보안 위협에 노출되어 있다. 본 연구는 망분리 환경에서 망간 파일을 전송할 때 파일의 형식을 변환하여 전송함으로써 문서삽입형 악성코드의 보안 위협을 방지하는 방안을 제안한다. 또한 포렌식 준비도를 고려하여 문서파일이 원활한 사고대응을 위한 정보를 보관할 수 있는 기능을 포함하여 망 분리 환경에서 활용할 수 있는 시스템을 제안한다.

확장된 퍼지적분을 이용한 문서영상의 컬러낙관 추출 (Color Seal Extraction of Document Images using An Extended Fuzzy Integral)

  • 박인규;최규석
    • 한국인터넷방송통신학회논문지
    • /
    • 제9권1호
    • /
    • pp.31-37
    • /
    • 2009
  • 본 논문은 컬러영상의 특정 클러스터에 해당하는 낙관을 추출하기 위하여 확장된 퍼지적분을 제안하였다. 기존의 퍼지적분은 평가항목에 대한 부정적인 측면을 강조하였다. 제안된 방법은 무게중심법을 통하여 인접정보를 이용하여 평가항목간의 보상적인 측면을 고려하였다. 평가 항목간의 min 연산자로서의 기존의 퍼지적분의 특징에만 기초하는 방법은 낙관 영상의 끊어지는 부분 처리와 전체적인 영상의 유연성을 확보하는 데는 다소 부족한 느낌이 들었다. 그래서 이를 해결하기 위해 무게중심을 이용하여 전체적인 영상의 유연성을 확보 하였다. 그 결과 실 생활의 영수증의 낙관을 분리하는 실질적인 문제에 관한 자료들에 대하여 실험을 수행하였다.

  • PDF

형태 모멘트를 이용한 텍스트 이미지 경사 측정 및 교정 (Skew Estimation and Correction in Text Images using Shape Moments)

  • Choo, Moon-Won;Chin, Seong-Ah
    • 한국콘텐츠학회논문지
    • /
    • 제3권1호
    • /
    • pp.14-20
    • /
    • 2003
  • 문서 이미지 처리에서 텍스트 블록의 수평화 프로세스는 문서 인식 솔루션을 위한 전처리 단계로서 많은 연구가 진행되고 있다. 이 논문에서는 텍스트 이미지 블록의 직교각 속성과 형태 모멘트에 후프 변환을 적용하여 경사진 텍스트 블록을 원래 문서의 텍스트와 수평화된 텍스트 이미지로 변환하는 효율적인 방식을 제안한다. 실험을 통하여 제안된 방식의 비교 성능 결과를 보인다.

  • PDF

문서영상의 레이아웃 분석과 문자 분할 (Page Layout Analysis and Text Segmentation in Document Image)

  • 최재형;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2012년도 하계학술대회
    • /
    • pp.71-74
    • /
    • 2012
  • 본 논문에서는 새로운 문자 분할 알고리즘을 제안한다. 고전적인 문자 분할 알고리즘은 학술적인 문서영상과 같이 단순한 구조를 가진 문서영상을 대상으로 하여 좋은 성능을 보였지만 다양한 문자 크기와 색상, 그림, 복잡한 배경 등으로 구성된 문서영상에서는 좋지 못한 성능을 보인다. 최근에 제안고 있는 방법들은 복잡한 문서영상에서도 좋은 성능을 보이도록 다양한 기법들을 적용하여 우수한 성능을 보이고 있지만, 대부분의 방법들이 영상을 일정한 크기의 블록으로 나누어 문자분할을 하기 때문에 세밀한 부분에서는 성능이 어느 정도 한계를 보인다. 따라서 본 논문에서는 블록의 크기에 제한을 갖지 않는 새로운 방법으로서, watershed 알고리즘을 이용한 문자분할 방법을 제시한다. 구체적으로, watershed 알고리즘을 이용하여 문서영상의 구조(docstrum)를 파악하고 이를 기반으로 문자를 분할한다. 제안하는 방법은 크게 엣지 검출, distance transform, watershed 알고리즘을 이용한 docstrum 분석, 문자 분할의 네 단계를 거친다. 실험 결과 블록에 기반한 기존의 방법들이 놓치는 세밀한 부분에서도 제안된 알고리즘은 올바른 분할결과를 얻을 수 있음을 확인하였다.

  • PDF

웨이블릿 계수의 통계적 이산 분석을 이용한 문서 영상 분할 (Document Image Segmentation by the Statistical Distribution Analysis of Wavelet Coefficients)

  • 이인수;김민수;김우성;한광록
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (하)
    • /
    • pp.927-930
    • /
    • 2000
  • 본 논문은 문서 영상에 대해 투영을 사용하여 영역을 나누었고 각 영역에 대해 고주파 밴드의 웨이블렛 계수의 통계적 분산과 히스토그램을 기반으로 한 두 가지 특징을 사용하여 문자와 그림으로 분류하였다. 투영으로 나누어진 영역들에 대해 일정 크기의 블록으로 나누고 두 가지 특징에 따라 문자와 그림으로 분류하였다. 따라서 투영에 의해 나뉜 영역 중 문자와 그림이 혼합되어 의미가 모호한 영역에 대해 잘못 분류되는 가능성을 줄일 수 있었다.

  • PDF

영상 분할을 활용한 화학 구조 문서 이해 (Understanding Documents With Chemical Structures Using Image Segmentation)

  • 양혜윤;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.1297-1300
    • /
    • 2022
  • Document layout analysis는 문서 이미지의 구조와 구성요소를 파악하는 기술이다. 기존 딥러닝을 사용한 학습 기반 방법에는 각 구성 요소를 검출하는 detection 기반 방식이 많으나 이는 다양한 형식의 문서 이미지에 확장될 수 있는 가능성이 낮다는 한계가 존재한다. 특히, 다양한 모양과 크기의 화학 구조를 포함하는 화학 문서 이미지에 적용하기 어렵다. 본 논문에서는 영상분할을 활용하여 화학 구조 문서를 이해하는 연구를 진행하였다. 기존의 블록 단위로 레이블링된 벤치마크와 다르게 객체 단위로 레이블링한 학습 데이터를 가지고 DeepLabv3 구조의 네트워크를 학습하여 화학 문서 이미지를 효과적으로 분할하였다. 객체 단위 레이블링과 영상 분할을 사용한 방식이 문서 이해 및 화학 구조 검출에 준수한 성능을 보이는 것을 확인하였고 이 방식이 다양한 형식의 문서 이미지에 확장될 수 있음을 보였다.

  • PDF

웹 이미지로부터 이미지기반 문자추출 (Locating Text in Web Images Using Image Based Approaches)

  • Chin, Seongah;Choo, Moonwon
    • 지능정보연구
    • /
    • 제8권1호
    • /
    • pp.27-39
    • /
    • 2002
  • 본 논문은 다양한 웹 이미지로부터 문자영역(text block)의 위치를 알아내고 문자영역을 추출하는 방법을 제안한다. 인터넷 사용자관점에서 볼 때, 웹 이미지에 포함되어 있는 문자정보는 중요한 정보이지만 최근까지 이 분야의 연구는 그리 활발하지 못했다. 본 연구에서 제안된 알고리즘은 문자의 경사방향(skew)과 문자의 크기나 폰트에 관한 사전 정보 없이 수행되어 질 수 있도록 제안되었다 폰트 스타일과 크기에 제약되지 않고 문자영역을 적합하게 추출하기 위해 유용한 에지 검출, 문자 클러스터링 영역으로 정의되는 문자의 고유한 특성을 위한 히스토그램을 사용하였다. 다수의 실험을 통하여 제안된 방법을 테스트하고 수용할 만한 결과를 도출했다.

  • PDF