• 제목/요약/키워드: 카메라 문서 영상

검색결과 36건 처리시간 0.022초

카메라기반의 왜곡이 보정된 흑백 문서 영상 생성 (Distortion Corrected Black and White Document Image Generation Based on Camera)

  • 김진호
    • 한국콘텐츠학회논문지
    • /
    • 제15권11호
    • /
    • pp.18-26
    • /
    • 2015
  • 스캐너 대신 카메라를 이용하여 문서의 사본 영상을 촬영하면 촬영 각도에 따라 기하학적 왜곡이 발생하거나 그림자가 생길 수 있다. 본 논문에서는 카메라로 촬영한 문서 영상으로부터 왜곡을 보정하고 그림자 영향을 제거한 흑백 문서 영상 생성 알고리즘을 제안하였다. 카메라 렌즈의 방사 왜곡으로 인해 휘어진 테두리를 펴거나 촬영 각도에 따라 유입된 문서 외부 영역을 제거하기 위한 기하학적 보정을 위해 2차 미분 필터 기반의 문서 테두리 검출 방안을 마련하였다. 그리고 적응적 이진화 방법으로 그림자를 제거한 흑백 문서 영상을 생성하였다. 제안한 왜곡 보정 흑백 문서 영상 생성 알고리즘을 스마트 폰 카메라로 촬영한 문서 영상들을 대상으로 실험한 결과 우수한 처리 결과를 얻을 수 있었다.

카메라 기반 문서 인식을 위한 적응적 이진화 (Adaptive Binarization for Camera-based Document Recognition)

  • 김인중
    • 한국산업정보학회논문지
    • /
    • 제12권3호
    • /
    • pp.132-140
    • /
    • 2007
  • 카메라 영상은 명도의 변화와 부정확한 초점으로 인해 스캐너 영상에 비하여 화질이 저하된다. 본 연구에서는 카메라 영상에서 자주 발생하는 화질 저하에 대한 적응력을 강화하여 카메라기반 문서 인식에 적합한 이진화 방법을 제안한다. 기존의 평가에서 우수하다고 보고된 이진화 방법을 기반으로 하되, 낮은 조도와 부정확한 초점으로 인해 명도 대비가 낮은 영상에 대한 적응력을 강화하였다. 또한 이진화 시 국소 윈도우를 이용하여 기존의 방법에서 뭉개지기 쉬운 문자의 세부 구조를 섬세하게 추출하도록 개선하였다. 실험에서는 기존에 우수하다고 평가된 이진화 방법들과 제안하는 방법을 문서 인식에 적용하여 다양한 카메라 문서 영상에 대한 성능을 비교하였는데, 그 결과 제안하는 방법이 카메라로 입력받은 문서 영상의 인식에 효과적임을 확인하였다.

  • PDF

Active카메라를 이용한 지능형 문서 영상 획득 (Intelligent Document Scanning with Active Camera)

  • 박안진;정기철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.592-594
    • /
    • 2004
  • 문서 영상 획득(document scanning)은 문서 영상 분석과 인식을 위한 중요한 단계이다 최근, 문서 영상 획득 장치로 스캐너(flat scanner)가 가장 많이 이용되고 있지만, 만지면 망가질 것 같은 얇은 고서, 매우 두꺼운 책과 같은 문서를 획득하기에는 어려움이 있다 이런 어려움을 해결하기 위해, 카메라를 이용한 문서 영상 획득에 관한 않은 연구가 진행되고 있으며, 카메라의 저해상도나 잡음과 칼은 문제를 해결하면, 스캐너를 대신하는 입력 장치로 이용할 수 있다. 저해상도 문제를 해결하는 방법으로 기본의 일반적인 레지스트레이션(registration) 방법은, 연결 부분(stitching position)에서 오브젝트(object: text, graphics, image)의 왜곡이 생기는 문제점이 있다. 본 논문에서는 PTZ(pan-tilt-zoom) 카메라를 이용하여 연결 부분에서 왜곡을 최소화하여 오브젝트를 획득하는 컴포넌트 기반의 영상 레지스트레이션(component-based image registration) 방법을 제안한다. 제안한 방법은 연결 부분에서 오브젝트의 수를 최소화하는데 목적이 있으며, 일반적인 레지스트레이션 방법에 비해 연결 부분에서 왜곡을 상당히 줄일 수 있으며, 상대적으로 인식률을 놓일 수 있다.

  • PDF

교차점 검출과 분류를 통한 카메라 문서영상에서의 테이블 구조 인식 알고리듬 (Table recognition algorithm for camera-captured document images based on junction detection and labeling)

  • 서원교;구형일;이동혁;김상호;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2013년도 하계학술대회
    • /
    • pp.263-266
    • /
    • 2013
  • 표는 중요한 정보를 함축적으로 담고 있는 문서 요소로서 문서 영상에서 표의 내용과 구조를 분석하고 이해하려는 연구가 많이 진행되어 왔다. 이러한 표의 검출과 인식에 관한 기존의 연구들은 평판 스캐너로 취득한 문서 영상을 대상으로 이루어졌는데 최근에는 디지털 카메라와 스마트폰이 보급됨에 따라 평판 스캐너 대신 카메라를 이용한 표 인식의 필요성이 대두되고 있다. 따라서 본 논문에서는 카메라로 획득한 문서 영상에서 표 인식에 대한 알고리듬을 제안한다. 먼저 표가 선들의 집합으로 이루어져 있다는 가정 아래 문서 이미지에 존재하는 선을 이진화와 강인한 곡선 맞춤 알고리듬을 사용하여 검출한다. 검출된 선들의 교차점은 표의 요소일 수도 있으며 오검출의 결과일 수도 있는데 교차점 주변의 관찰 결과와 교차점 사이의 연관 관계를 에너지 식으로 표현하고 이 식을 최소화함으로써 각각의 교차점에 최적의 레이블을 할당한다. 얻어진 레이블은 표로 유일하게 변환되며 표의 구조를 셀 단위까지 추정할 수 있다. 다양한 표 영상에 대한 실험 결과를 통하여 제안한 방법이 문서영상의 기하학적인 왜곡에도 불구하고 영상에 존재하는 표를 성공적으로 인식함을 보여준다.

  • PDF

카메라 문서 영상의 이진화 및 기울어짐 보정 방법 (A Method for Thresholding and Correction of Skew in Camera Document Images)

  • 장대근;전병태
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권3호
    • /
    • pp.143-150
    • /
    • 2005
  • 카메라 영상은 조명에 매우 민감하다. 그 결과 문자 인식을 매우 어렵게 만든다. 또한 카메라로 획득한 문서 영상을 대상으로 문자인식을 수행할 경우 비네팅현상이 발생하며 카메라와 피사체간의 위치와 각도의 불일치에 의해 기학적 왜곡이 발생한다. 비네팅 효과에 의한 문자분리의 어려움과 기하학적 왜곡으로 인한 문자모양의 변형으로 인해 실제로 사용이 가능한 카메라 문자인식 기술의 개발이 쉽지 않았다. 본 논문에서는 양선형 변환을 이용하여 카메라로 획득한 문서영상의 기하학적 왜곡을 보정함으로써 문자인식 성능을 향상시킬 수 있는 방법을 제안한다. 기존에는 카메라의 위치정보 없이 기하하적 왜곡을 보정하기 어려웠으나 제안한 방법은 이진화한 문서영상을 대상으로 문자와 문자줄을 추출하여 상하로는 문자줄의 배열방향을, 좌우로는 문자획의 기울어진 각도를 측정함으로써 문서영상 자체만으로 기하하적 왜곡보정이 가능하다.

  • PDF

인간에게 친밀한 인쇄체 한글 영상의 문서화 시스템 (Human Friendly Documentation System of the Printed Hangul Images)

  • 곽주원;강순대;백승복;박상욱;박정현;박홍선;손영선
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2002년도 추계학술대회 및 정기총회
    • /
    • pp.361-364
    • /
    • 2002
  • 본 논문에서는 일반적인 문서를 CCD 카메라로 입력 받은 후, 사용자가 원하는 영역을 손가락으로 선택하면, 손 인식 알고리즘을 적용하여 사용자의 손가락 움직임을 검출하고, 손가락으로 선택되어진 영역을 인식한 후, 선택되어진 영역으로 카메라를 이동시켜 획득된 영상을 문자 인식 가능한 크기로 확대/축소하며, 확대된 영상에 문자인식 알고리즘을 적용하여 문서로 변환하는 시스템을 구현하였다 최종적으로 사용자가 이 시스템의 존재를 인지하지 못할 만큼 자연스럽게 사용할 수 있는 시스템을 구현하고자 하였다.

카메라 획득 문서영상에서의 글자모양 왜곡보정 (Character Shape Distortion Correction of Camera Acquired Document Images)

  • 장대근;김의정
    • 한국정보통신학회논문지
    • /
    • 제10권4호
    • /
    • pp.680-686
    • /
    • 2006
  • 스캐너로 획득한 문서영상을 대상으로 문자인식을 하는 경우와 달리 카메라로 획득한 문서 영상을 대상으로 문자인식을 수행할 경우 카메라 렌즈의 특성과 카메라와 피사체간의 위치와 각도의 불일치에 의해 글자모양의 왜곡이 발생한다. 따라서 이러한 왜곡들로 인해 실제로 사용이 가능한 카메라 문자인식 기술의 개발이 쉽지 않았다. 본 논문에서는 문서 영상을 카메라로 획득할 때 발생하는 3차원의 비선형적 왜곡을 2차원의 선형 변환을 이용하여 근사화함으로써 왜곡된 글자모양을 교정한다. 또한 변환과정에서 글자와 글자줄을 추출하여 상하로는 글자줄의 배열방향을, 좌우로는 문자획의 기울어진 각도를 측정함으로써 왜곡으로 인해 사변형 형태로 변형된 글자영역 즉 변환영역을 자동으로 설정함으로써 부가적인 정보의 획득 없이 문서영상 자체만으로 기하하적 왜곡보정이 가능하다.

Fuzzy 추론 및 명암차이법을 이용한 카메라 줌, 포커스 자동 조절 시스템 (An Automatic Control System of a Camera Zoom and Focus Using the Fuzzy Inference and the Difference of the Light and Darkness)

  • 박홍선;박상욱;박정현;곽주원;손영선
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2002년도 추계학술대회 및 정기총회
    • /
    • pp.406-409
    • /
    • 2002
  • 본 논문에서는 문자인식이 가능하도록 줌, 포커스를 제어하여 한글 문서 영상을 확대/축소하는 시스템을 구현하였다. 한글 문서 영상에서 확대/축소 할 영역이 지정되면 그 영역의 가로, 세로 거리를 펄스 수로 변환한 후 Step모터를 제어하여 그 위치만큼 카메라를 이동시킨다. 문서 영상이 입력되면 문자인식이 가능한 크기만큼 줌을 제어하고, 피드백 되어진 영상으로부터 조정된 줌에 맞는 포커스로 근접 제어한 후, 더욱 선명한 영상을 얻기 위해 명암 차이에 의한 미세 조정을 하였다. 이 경우, 줌 및 포커스는 퍼지 추론으로 .제어하는 DC모터로 조정하였다.

체인 코드를 이용한 문서 영상의 잡음 제거 방법 (A Noise Removal Method Using Chain Code for Document Images)

  • 김세호;서동환;박재화
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.439-442
    • /
    • 2005
  • 카메라 모바일 폰이 대중화됨에 따라 이제 더 이상 음성 전달 기기로서가 아닌 정보 조작 및 정보 전달 기기로서의 기능이 더욱 중요해졌다. 때문에 이러한 욕구를 충족 시켜주기 위해서는 적시 적소에 정보를 활용할 수 있는 오프라인 문자 인식 시스템이 필요하게 되었다. 하지만, 오프라인 문자 인식 시스템은 카메라를 통해 입력된 영상 중에는 순수 문자 영상뿐만 아니라 배경 이미지나 잡음을 포함한다. 특히, 그림과 함께 삽입 되어져 있는 명함과 같은 텍스트 문서 같은 경우, 삽입되어져 있는 그림 때문에 오인식의 문제가 발생 할 수 있다. 따라서 본 논문에서는 카메라를 통해 입력되는 문서 영상을 문자와 배경 그림을 분리하여 효과적으로 잡음을 제거하는 방법을 제안하였다.

  • PDF

화질 분석을 통한 카메라 문서 영상의 적응적 이진화 (An Adaptive Binarization of Camera Document Image by Image Quality Estimation)

  • 김인중
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권9호
    • /
    • pp.797-803
    • /
    • 2007
  • 카메라 기반 문서 인식을 위해서는 화질 변화에 적응할 수 있는 이진화 기술이 매우 중요하다. 본 논문에서는 화질 분석을 통해 다양한 화질의 카메라 영상에 효과적으로 적응할 수 있는 이진화 방법을 제안한다. 먼저 이진화 파라미터가 이진화 결과에 미치는 영향을 분석하고, 카메라 영상의 화질을 측정하는 방법을 제안한다. 그리고, 측정된 화질과 이진화 파라미터간의 상관 관계를 통계적으로 분석하여 반영함으로써 화질 변화에 자동으로 적응하는 이진화 방법을 제안한다. 실험을 통해 화질과 이진화 파라미터간에는 유의한 상관 관계가 있으며, 제안하는 방법이 화질에 따라 적절한 파라미터를 추정함으로써 화질변화에 적응함을 확인하였다.